Desarrollaré algoritmos de aprendizaje de refuerzo y aprendizaje automático.
Acerca de este Servicio
¡Ey!
Soy un estudiante de maestría que ha trabajado en varios algoritmos de refuerzo profundo y aprendizaje automático.
Aquí te ayudaré a desarrollar diversos algoritmos para resolver problemas complejos en tu aplicación o sitio web según tus necesidades. Soy experto en las siguientes áreas:
· Proceso de decisión de Markov ( MDP )
· Montecarlo ( MC )
· SARSA , SARSA esperado, SARSA lambda
· Diferencia temporal ( TD-0 ), TD semigradiente
· Aprendizaje Q, Aprendizaje Q lambda ,
· Redes Q profundas (DQN)
· Redes Q de doble profundidad ( DDQN )
· optimización de políticas proximales ( PPO ),
· Gradiente de política determinista profunda con retardo gemelo ( TD3 )
¡Y muchos más!
Tengo experiencia en los siguientes frameworks y lenguajes
- Pitón
- Flujo de tensor
- Keras
- PyTorch
- NumPy
- Pandas
- Matplotlib
¡No dudes en enviarme un mensaje si tienes alguna pregunta!
Saludos,
Ibrahim

