Construiré una pipeline RAG en AWS Bedrock para tus documentos y datos


Acerca de este Servicio
Traducción automática
RAG es fácil de demostrar y difícil de implementar en producción. La mayoría de los proyectos de "hablar con tus documentos" se desmoronan en el momento en que los usuarios reales los usan. La recuperación devuelve fragmentos irrelevantes. Las citas no se vinculan a los documentos fuente. Las ventanas de contexto aumentan el costo por consulta. Las respuestas parecen hallucinarse porque la capa de recuperación nunca fue realmente ajustada. La demo funcionó. La producción no.
Construyo RAG de la misma manera que los ingenieros de backend construyen cualquier sistema de producción. Comienza con un fragmentado real de documentos, no con los divisores predeterminados. Embeddings en pgvector o OpenSearch con una capa de recuperación que puedas depurar. Generación en AWS Bedrock con modelos Claude o Titan. Seguimiento de citas para que las respuestas apunten al origen. Filtrado de metadatos para que los usuarios solo puedan acceder a los documentos que tienen permitido ver.
Tengo experiencia práctica en Bedrock del programa AWS AI and ML Scholars, además de experiencia en backend de producción de más de 4 años manejando sistemas con tráfico real. El código de recuperación y generación es la parte interesante. La infraestructura que lo rodea es la que decide si tu RAG funciona realmente en producción.
Envíame un mensaje con lo que quieres hacer consultable.
Conoce a Iloomnex
Senior backend engineer
- DePakistán
- Miembro desdenov 2023
- Responde aprox. en:1 hora
- Última entrega1 año
Idiomas
Inglés
Traducción automática
Mi porfolio
FAQ
Traducción automática
¿Con qué tipos de documentos puedes trabajar?
PDFs, documentos Word, markdown, texto plano, HTML y datos estructurados como CSV o JSON. He trabajado con conjuntos de documentos mixtos que incluyen documentación técnica, contratos legales, bases de conocimientos internas y archivos de tickets de soporte.
¿Por qué AWS Bedrock en lugar de OpenAI?
Bedrock tiene sentido si ya estás en AWS, necesitas modelos que funcionen en tu VPC por cumplimiento, quieres acceder a varias familias de modelos a través de una sola API (Anthropic Claude, Amazon Titan, Meta Llama, Cohere y otros), o tienes una adquisición empresarial que prefiere AWS.
