Ofreceré consultoría en reconocimiento automático de voz y conversión de voz a texto

D
djimenez_ml
D
djimenez_ml
David J
Parte de la información se ha traducido automáticamente.

Acerca de este Servicio

Traducción automática

¿Quieres integrar reconocimiento de voz, comandos de voz o IA conversacional en tu proyecto? ¡Estoy aquí para ayudarte! Con experiencia en tecnologías de reconocimiento de voz de vanguardia como Whisper, Wav2vec, Kaldi, Vosk, phi4, MMS, seamless-m4t, DeepSpeech, entre otras, ofrezco asesorías personalizadas para guiarte en la implementación, optimización y resolución de problemas.

Me especializo en:

  • Diseñar e implementar soluciones de reconocimiento de voz
  • Elegir las mejores APIs (Deepgram, AssemblyAI, Gemini, OpenAI, Google Speech-to-Text, etc.)
  • Entrenar y ajustar modelos de reconocimiento de voz de última generación
  • Mejorar la precisión para idiomas o dialectos específicos
  • Abordar desafíos en entornos ruidosos
  • Diarización de hablantes
  • Detección de actividad de voz
  • Detección de eventos sonoros

¡Hablemos de tus necesidades y hagamos realidad tus ideas!

Conoce a David J

David J

Speech Recognition

5.0(7)
  • DeEspaña
  • Miembro desdenov 2024
  • Responde aprox. en:1 día
  • Última entrega1 semana
  • Idiomas

    Español, Inglés
I have +6 year of experience working with machine learning and deep learning applied to speech recognition: - Speech to text, - Diarization, - Voice Activity Detection, - Sound Event Detection, - Denoising, - Audio Signal Processing, - Emotion... in different languages. I have been working with SOTA Automatic Speech Recognition APIs and frameworks: Whisper, Kaldi, Vosk, MMS, DeepSpeech, speechbrain and wav2vec2. I have been working to fine-tuned models to improve WER and speed inference on multiple language. Hugging Face: https://huggingface.co/deepdml Github: https://github.com/djpg

Traducción automática

Mi porfolio

Etiquetas relacionadas