Crearé un conjunto de datos de voz en pashto o dari para entrenamiento de modelos de IA


Acerca de este Servicio
Traducción automática
¿Buscas grabaciones de voz limpias y nativas en pashto o persa/dari para tus proyectos de IA, reconocimiento de voz o NLP?
¡Estás en el lugar correcto!
Voy a grabar frases de alta calidad en pashto o dari con precisión nativa, perfectas para entrenar modelos de IA, speech-to-text (STT) y sistemas de ASR.
Te proporcionaré:
- Audio WAV/MP3 sin ruido
- Acentos nativos en pashto y persa/dari
- Transcripción + etiquetado + metadatos (CSV/Excel)
- Voces múltiples disponibles (a pedido)
Ya sea que necesites un pequeño conjunto de datos inicial o un gran corpus de voz, puedo entregar grabaciones rápidas, confiables y revisadas profesionalmente.
Construyamos tu conjunto de datos de IA con claridad, precisión y confianza!
Conoce a Mansour Sadat
Innovative Frontend Web Developer and Fluent Trilingual Translator
- DeAfganistán
- Miembro desdejul 2024
- Responde aprox. en:1 hora
Idiomas
Inglés, Pashto, Persa
Traducción automática
Mi porfolio
FAQ
Traducción automática
¿Qué exactamente proporcionas en las grabaciones?
Proporciono frases en pashto o persa/dari en audio limpio y sin ruido (WAV/MP3). Dependiendo de tu paquete, también incluyo transcripción, etiquetado y metadatos en formato CSV/Excel.
¿Qué son los metadatos?
Los metadatos son información estructurada sobre cada archivo de audio (por ejemplo, nombre del archivo, texto de la frase, ID del hablante, duración). Esto hace que tu conjunto de datos sea fácil de organizar y usar para proyectos de IA/ML.
¿Qué es la transcripción?
La transcripción es la versión escrita del audio, útil para entrenar modelos de reconocimiento de voz.
¿Qué es el etiquetado?
El etiquetado consiste en marcar el conjunto de datos (por ejemplo, por hablante, género, tipo de frase o categoría) para que los modelos de IA puedan reconocer patrones de manera más efectiva.
¿Puedo solicitar varias voces?
¡Sí! Por defecto, grabo con un hablante nativo, pero puedes pedir el extra de gig de “Voz adicional” para más voces.
¿Qué pasa si necesito un conjunto de datos más grande (miles de frases)?
Por favor, envíame una orden personalizada — puedo ampliar y crear un conjunto de datos adaptado a tu proyecto con la participación de varios hablantes nativos.
¿En qué formatos realizas entregas?
El audio se entrega en WAV o MP3, mientras que el texto/transcripción/metadatos se entregan en TXT, CSV o Excel, según tu preferencia.

