Crearé modelos personalizados de llm y slm con qlora

Parte de la información se ha traducido automáticamente.

Bangladesh

Hablo Inglés, Ruso

194 pedidos completados

Ingeniero de IA y desarrollador full stack: ¡experto en soluciones de IA escalables!

Ingeniero de IA experimentado y desarrollador full stack con más de 7 años de experiencia en la creación de soluciones inteligentes, escalables y eficientes. Me especializo en aplicaciones impulsadas ...

Acerca de este Servicio

Ajusta finamente un LLM personalizado que conozca TU dominio, no toda internet.

Soy Raihan, ingeniero de IA/ML y CTO en ClarioScope AI. Entreno modelos de lenguaje pequeños desde cero (ORCH 350M3B, MedLLM, ILMA Lang) y ajusto finamente LLMs abiertos con QLoRA con tus datos reales.

Lo que obtienes: Ajuste fino de LLM/SLM en tu conjunto de datos Llama, Mistral, Qwen, Gemma, Phi LoRA / QLoRA / ajuste completo (elijo lo que se adapte a tus datos y presupuesto) Limpieza y formato del conjunto de datos + generación de datos sintéticos Informe de evaluación frente al modelo base (perplejidad, precisión) Preparado para inferencia: Hugging Face, GGUF para Ollama, o un endpoint API Código limpio de PyTorch + documentación

¿Por qué yo, no un gig de 90$? La mayoría de los gigs de “ajuste fino” solo envuelven la API de OpenAI. Yo construyo SLMs reales desde cero, elijo el modelo base y el rango de LoRA adecuados y entrego un modelo que realmente supera al base. Portafolio: raihan-js.github.io

️Proceso: Chat de alcance gratuito, preparación de datos, entrenamiento, evaluación frente al modelo base, entrega y transferencia.

Tus datos permanecen privados. Pesos completos + derechos de uso comercial disponibles.

Envíame primero tu caso de uso para una cotización precisa. ¡Construyámoslo bien!

Pantalla completa

Ver presentación

Lenguaje de programación:

Python

•

JavaScript

•

Pytorch

•

TypeScript

+1 más

Marcos y herramientas de modelos de IA:

+3 más

Tipo de datos:

Texto

•

Audio

•

Datos tabulares

Motor de IA:

GPT

•

DALL-E

•

Stable Diffusion

•

TensorFlow

•

Bloom

•

MUM

+8 más

Clientes con los cuales he trabajado

GNatural Products

All Natural Skincare

I designed and developed Full WordPress Website for this client.

oct 2020

Mi porfolio

Otros servicios de Ciencia de datos y aprendizaje automático que ofrezco

Procesamiento de lenguaje natural
Desde USD 190

FAQ

Traducción automática

¿Entrenas modelos desde cero o solo ajustas finamente los existentes?

Ambos. He entrenado la serie ORCH (350M–3B) y MedLLM desde cero, y ajusto finamente LLMs abiertos a diario. Para la mayoría de los casos, ajustar finamente con QLoRA un modelo base fuerte (Llama 3.1, Mistral, Qwen) ofrece el 80–90% del beneficio a una fracción del costo — recomendaré honestamente según tus datos.

¿Qué modelos base puedes ajustar finamente?

Todos los principales LLMs de código abierto: Llama 3.1/3.2 (1B–13B), Mistral 7B / Mixtral, Qwen 2.5, Gemma 2, Phi-3, DeepSeek, y Code Llama / Code Qwen. También puedo ajustar finamente OpenAI (GPT-4o-mini, GPT-4.1) y Gemini mediante sus APIs de tuning.

¿Cuánta data de entrenamiento necesito?

Para LoRA/QLoRA, con solo 500 ejemplos de alta calidad puede funcionar; 2000–10,000 es el punto ideal. ¿Menos? Genero datos sintéticos para ti (Estándar y Premium). Entrenar un modelo pequeño desde cero requiere un corpus sustancial — lo confirmaremos en la llamada de alcance.

¿Qué hardware se usa y quién paga por el cómputo?

Utilizo Runpod / Vast.ai (GPUs A100 / H100). El costo de cómputo para ejecuciones estándar está incluido en todos los paquetes. Para conjuntos de datos muy grandes o preentrenamiento prolongado, el costo de GPU puede facturarse a costo, como un pequeño extra — siempre acordado por adelantado (normalmente 20–120$).

¿Mis datos y el modelo entrenado permanecerán privados?

Sí. Tus datos se usan solo para tu proyecto y nunca se reutilizan. Recibes los pesos completos, el código y los derechos de uso comercial (incluido en Premium; +180$ en Basic/Standard).

¿Puedes desplegar el modelo para que mi app pueda llamarlo vía API?

Sí — Premium incluye un FastAPI + contenedor Docker con un endpoint compatible con OpenAI, así tu código existente solo cambia la URL base. Los compradores estándar pueden agregar despliegue por +250$.

¿Cuál es la diferencia entre ajuste fino y RAG?

El ajuste fino cambia el comportamiento y conocimiento del modelo en sus pesos. RAG recupera respuestas de tus documentos en el momento de la consulta. ¿Necesitas RAG en su lugar? Ofrezco eso como un gig separado — o envíame un mensaje y te diré cuál se ajusta mejor a tu objetivo.

¿Por qué debería contratarte a ti en lugar de un gig de ajuste fino más barato?

La mayoría de los gigs económicos son solo envoltorios del API de OpenAI. Soy CTO y entreno SLMs reales desde cero (portafolio: raihan-js.github.io) — así que te diré cuándo ajustar finamente no es la mejor opción, escogeré el modelo base y la configuración de LoRA adecuados, y entregaré un modelo que supera claramente al base.

¿Necesitas ser creativo?

¿Buscas expertos en tecnología?

¿Listo para llegar a los consumidores y convertirlos en clientes?

¿Buscas escritores?

Opera tus negocios con más inteligencia

Crearé modelos personalizados de llm y slm con qlora

Acerca de este Servicio

Clientes con los cuales he trabajado

Mi porfolio

Otros servicios de Ciencia de datos y aprendizaje automático que ofrezco

FAQ

Etiquetas relacionadas