Construiré modelos personalizados de reconocimiento de voz o emociones.

Parte de la información se ha traducido automáticamente.

Bangladesh

Hablo Inglés

1 pedido completado

Especialista en IA/ML con habilidades en NLP, visión por computadora y LLMs. Creo sistemas inteligentes de NLP usando modelos multimodales para reconocimiento de emociones en la voz, CNN profundas (VG...
Acerca de este Servicio

Sobre este servicio


Me especializo en construir sistemas multimodales de reconocimiento de voz y emociones combinando modalidades de audio y texto para mejorar el rendimiento y la precisión.

Con experiencia práctica trabajando en conjuntos de datos complejos como IEMOCAP y MELD, he desarrollado modelos híbridos personalizados usando Bi-LSTM y CNN, logrando hasta 85% de precisión en el conjunto de datos IEMOCAP. También estoy explorando activamente Word2Vec y arquitecturas basadas en Transformer para mejorar la comprensión contextual en el reconocimiento de voz.

Puedes consultar mis proyectos y artículos de investigación vinculados abajo para más detalles.


Lo que ofrezco:

  1. Preprocesamiento de conjuntos de datos complejos de audio y texto
  2. Desarrollo de modelos personalizados (LSTM, CNN, Transformers, etc.)
  3. Optimización de hiperparámetros y ajuste de modelos
  4. Soporte para tesis académicas, investigaciones o proyectos industriales
  5. Soluciones listas para integración en apps o APIs



No dudes en enviarme un mensaje antes de hacer tu pedido para discutir tus necesidades específicas.


Experiencia:

Clasificación

Voz y audio

Análisis predictivo

Lenguaje de programación:

Python

Colab

API:

Otros

Herramientas:

Jupyter Notebook

Amazon SageMaker

Colab

Marcos:

Scikit-learn

keras

PyTorch

Panda

TensorFlow

Mi porfolio

Otros servicios de Ciencia de datos y aprendizaje automático que ofrezco

Etiquetas relacionadas