Enseñaré PySpark de principiante a avanzado con entrenamiento práctico listo para la industria

Parte de la información se ha traducido automáticamente.

India

Hablo Inglés

26 pedidos completados

Ingeniería de datos, análisis de datos, desarrollo web, automatización, desarrollo de IA

Tengo 11 años de amplia experiencia en programación analítica de datos, automatización, marco de calidad de datos, REST APIs, almacenamiento de datos, ingeniería en la nube y desarrollo web. Tengo exp...

Nivel 1

Ha cumplido determinados criterios de rendimiento y muestra un gran potencial en la plataforma.

Acerca de este Servicio

¿Quieres trabajar con big data como los verdaderos ingenieros de datos? Ofrezco entrenamiento paso a paso en PySpark con una hoja de ruta clara, ejemplos prácticos y casos de uso reales utilizados en sistemas de producción.

Hoja de ruta de aprendizaje de PySpark (Principiante a avanzado)

1. Conceptos básicos

Visión general de PySpark, arquitectura de Spark (Driver y Executors), SparkSession, RDD vs DataFrame

Objetivo: Entender cómo funciona Spark

2. DataFrames y I/O

Crear DataFrames, esquema, leer/escribir CSV, JSON, Parquet

Objetivo: Cargar y visualizar datos

3. Operaciones principales

select, filter, withColumn, groupBy, joins, agregaciones

Objetivo: Transformar datos con confianza

4. PySpark SQL

Vistas temporales, consultas SQL, DataFrame vs API SQL

Objetivo: Analizar big data usando SQL

5. Optimización del rendimiento

Particionamiento, cache/persist, joins broadcast, conceptos básicos de shuffle

Objetivo: Escribir trabajos rápidos y eficientes

6. PySpark avanzado

Funciones de ventana, UDFs, manejo de datos anidados/JSON

Objetivo: Resolver problemas complejos de datos

7. Cloud e integración

PySpark con AWS S3, integración con Snowflake

Objetivo: Construir pipelines reales

8. Práctica en el mundo real

pipelines ETL, validación de datos, preparación para entrevistas

Objetivo final: Convertirte en un ingeniero de datos PySpark listo para el trabajo

Idioma:

Inglés

Experiencia técnica:

apache spark

Databricks

Snowflake

Experiencia:

Canalización de datos

Almacenamiento de datos

industria:

Análisis de Datos

Servicios financieros