Construiré una pipeline RAG en AWS Bedrock para tus documentos y datos

I
iloomnex
I
iloomnex
Iloomnex
Parte de la información se ha traducido automáticamente.

Acerca de este Servicio

Traducción automática

RAG es fácil de demostrar y difícil de implementar en producción. La mayoría de los proyectos de "hablar con tus documentos" se desmoronan en el momento en que los usuarios reales los usan. La recuperación devuelve fragmentos irrelevantes. Las citas no se vinculan a los documentos fuente. Las ventanas de contexto aumentan el costo por consulta. Las respuestas parecen hallucinarse porque la capa de recuperación nunca fue realmente ajustada. La demo funcionó. La producción no.

Construyo RAG de la misma manera que los ingenieros de backend construyen cualquier sistema de producción. Comienza con un fragmentado real de documentos, no con los divisores predeterminados. Embeddings en pgvector o OpenSearch con una capa de recuperación que puedas depurar. Generación en AWS Bedrock con modelos Claude o Titan. Seguimiento de citas para que las respuestas apunten al origen. Filtrado de metadatos para que los usuarios solo puedan acceder a los documentos que tienen permitido ver.

Tengo experiencia práctica en Bedrock del programa AWS AI and ML Scholars, además de experiencia en backend de producción de más de 4 años manejando sistemas con tráfico real. El código de recuperación y generación es la parte interesante. La infraestructura que lo rodea es la que decide si tu RAG funciona realmente en producción.

Envíame un mensaje con lo que quieres hacer consultable.

Conoce a Iloomnex

Iloomnex

Senior backend engineer

5.0(11)
  • DePakistán
  • Miembro desdenov 2023
  • Responde aprox. en:1 hora
  • Última entrega1 año
  • Idiomas

    Inglés
Senior backend engineer, 4+ years shipping production systems. I build Node.js and NestJS backends on AWS serverless. Lambda, SQS, EventBridge, Step Functions. I handle the integrations most devs avoid: Amazon SP-API, Shopify, QuickBooks, Xero, and LLMs via Bedrock, OpenAI, and Claude. Day job is a multi-tenant HRIS and payroll platform running real traffic. On Fiverr as iLoomNex, I take on backend builds, API integrations, and AI features that need to work in production, not just in a demo. Always online. Reply in under an hour. Any timezone.

Traducción automática

Mi porfolio