Crearé datos de entrenamiento personalizados de dsa para llms problemas en python con razonamiento cot

Parte de la información se ha traducido automáticamente.

India

Hablo Telugu, Hindi, Inglés

Ingeniero de software

Hola, soy Akshay, un desarrollador web con experiencia en frontend. Con mi conocimiento en HTML, CSS y JavaScript, puedo crear interfaces de usuario hermosas y funcionales que dan vida a tu sitio web....
Acerca de este Servicio

Entrena tu modelo de codificación en datos de DSA de calidad de producción, no clones scrapeados de LeetCode

Ofrezco un conjunto de datos de Python DSA original y de alta calidad, diseñado específicamente para entrenamiento, ajuste fino y evaluación de LLM. Cada problema es un ejemplo completo y autónomo, no solo una pregunta y respuesta.

Más de 855 problemas únicos de codificación, cada uno incluyendo:

ComponentDescriptionPrompt

Enunciado detallado con restricciones, especificaciones de entrada/salida y reglas de validación

Razonamiento

Cadena de pensamiento paso a paso que explica el enfoque, la elección del algoritmo y los casos límite

Solución

Implementación funcional en Python

Pruebas

Varios casos de prueba con afirmaciones para verificar la corrección


Por qué este conjunto de datos es diferente

La mayoría de los conjuntos de datos de codificación en línea son:

  • Scrapeados de fuentes públicas (riesgo de derechos de autor / duplicación)
  • Faltan rastros de razonamiento (malo para entrenamiento CoT / RLHF)
  • Triviales o repetitivos (los modelos memorizan, no generalizan)
  • No probados (las soluciones pueden estar equivocadas)

El mío está construido para entrenamiento de IA desde cero:

  • Escenarios originales con problemas de estilo del mundo real (cadena de suministro, optimización de redes, asignación de recursos), no títulos copiados de LeetCode
  • Cadena de razonamiento completa, ideal para entrenar modelos que piensan antes de codificar
  • Soluciones verificadas + pruebas

Etiquetas relacionadas