Diseñaré e implementaré soluciones escalables de plataforma de datos Microsoft Fabric personalizadas

Parte de la información se ha traducido automáticamente.

India

Hablo Inglés

Ingeniero de datos sénior

Soy un Ingeniero de Datos Senior en Arif Pasha Company con varios años de experiencia en el diseño, construcción y optimización de plataformas de datos a gran escala. Mi trabajo se centra en desarroll...
Acerca de este Servicio


  • Trabajando en la configuración de ingestión de datos con Apache SQOOP y FLUME en el HDFS de destino.
  • Con buena exposición a la versión Hadoop-2.0 y Cloudera manager CDH3.
  • Experiencia en implementación en AWS Cloud en EC2, EMR, S3 y otros servicios, Spark SQL con fuente MySQL (JDBC), PySpark RDD Actions y Transformations y API Dataframe.
  • Arquitectura y componentes de Spark: Spark Core y PySpark SQL con Data frames, tecnologías de Big Data: Hadoop (Distribución CDH), framework MapReduce y ecosistema Spark.
  • Lenguajes de alto nivel de Hadoop: Hive 0.8.0. Análisis de datos usando Spark Core, Spark SQL y Spark Streaming.
  • Entregué proyectos de análisis de datos usando herramientas basadas en Hadoop y la pila de ciencia de datos en Python. Interactuando con clientes, manejando sus consultas y resolviendo problemas.
  • Conocimiento del flujo de trabajo completo del proyecto.

Plataforma de destino:

Snowflake

Google BigQuery

Amazon Redshift

Herramientas y plataformas:

Fivetran

Airbyte

Mi porfolio

Etiquetas relacionadas