Afinaré llms y construiré pipelines rag para tu app de IA


Acerca de este Servicio
Traducción automática
¿Estás creando una aplicación de IA que necesita un modelo de lenguaje personalizado o un chatbot basado en conocimientos? Estás en el lugar correcto. Soy Yash, ingeniero de ML con más de 6 años de experiencia y trabajo práctico en producción con LLM en Fidelity National Financial, donde afiné LayoutLMv3 (un transformer/LLM multimodal) para inteligencia de documentos con datos empresariales reales.
Lo que construiré para ti:
- Afinar LLMs de código abierto (LLaMA 3, Mistral, Falcon, BERT, LayoutLM) en tu conjunto de datos personalizado usando LoRA / QLoRA / fine-tuning completo
- Las pipelines RAG conectan tu LLM a tu base de conocimientos usando bases de datos vectoriales (Pinecone, ChromaDB, FAISS, Weaviate)
- Chatbots personalizados que responden preguntas de tus documentos, PDFs, bases de datos o APIs
- Evaluación y benchmarking de LLM para medir precisión, tasa de alucinaciones y latencia
- Ingeniería de prompts y optimización de prompts del sistema para resultados consistentes y confiables
¿Por qué contratarme?
- Experiencia real en fine-tuning de LLM en producción (no solo tutoriales)
- Dual Degree en IIT Kharagpur (B.Tech + M.Tech)
- Código limpio, documentado y listo para producción en Python
- Experiencia en despliegue en Azure para inferencia escalable
Conoce a Yash Bhardwaj
I build GenAI apps, LLM pipelines and NLP systems that ship to production
- DeIndia
- Miembro desdeabr 2026
- Responde aprox. en:1 hora
Idiomas
Hindi, Inglés
Traducción automática
FAQ
Traducción automática
¿Necesitas que mis datos sean etiquetados?
Para el fine-tuning, sí — también puedo ayudarte a estructurar y anotar tu conjunto de datos como complemento. Para RAG, los documentos en bruto (PDF, TXT, DOCX) funcionan perfectamente.
¿Con qué LLMs trabajas?
Modelos de código abierto — LLaMA 3, Mistral, Phi-3, BERT y la familia LayoutLM — afinados usando LoRA/QLoRA a través de HuggingFace. También apoyo la API de fine-tuning de OpenAI para modelos basados en GPT.
¿También puedes desplegar el modelo?
Sí — despliego en cualquier plataforma en la nube: AWS SageMaker, Google Cloud Vertex AI, Azure ML o Hugging Face Spaces. También construyo endpoints de inferencia con FastAPI envueltos en Docker, desplegables en cualquier lugar. Para casos de uso móvil o edge, se soporta TensorFlow Lite y exportación a ONNX. El despliegue incluye una API funcional.

