Cursos de Hadoop para Desarrolladores (4 días)

Algunos de nuestros clientes

Código del Curso

hadoopdev

Duración

28 horas (usualmente 4 días, incluidas las pausas)

Requerimientos

  • Cómodo con el lenguaje de programación de Java (la mayoría de los ejercicios de programación están en java)
  • Cómodo en el ambiente de Linux (ser capaz de navegar por la línea de comandos de Linux, editar archivos utilizando vi / nano)

Entorno de laboratorio

Zero Install: ¡No hay necesidad de instalar el software hadoop en las máquinas de los estudiantes! Se proporcionará un grupo de trabajo hadoop para los estudiantes.

Los estudiantes necesitarán lo siguiente

  • Un cliente SSH (Linux y Mac ya tienen clientes ssh, para Windows Putty se recomienda)
  • Un explorador para acceder al clúster. Recomendamos el navegador Firefox

Descripción General

Apache Hadoop es el marco más popular para procesar Big Data en clústeres de servidores. Este curso presentará un desarrollador a varios componentes (HDFS, MapReduce, Pig, Hive y HBase) Hadoop ecosistema.

Programa del Curso

Sección 1: Introducción a Hadoop

  • Hadoop historia, conceptos
  • Sistema ecológico
  • Distribuciones
  • Arquitectura de alto nivel
  • Mitos hadoop
  • Desafíos de hadoop
  • hardware software
  • Laboratorio: primer vistazo a Hadoop

Sección 2: HDFS

  • Diseño y arquitectura
  • Conceptos (escala horizontal, replicación, localidad de datos, conocimiento de rack)
  • Daemons: Namenode, Namenode secundario, Nodo de datos
  • Comunicaciones / latidos del corazón
  • integridad de los datos
  • Ruta de lectura / escritura
  • Namenode High Availability (HA), Federación
  • Laboratorios: interacción con HDFS

Sección 3: Mapa Reducir

  • Conceptos y arquitectura
  • Daemons (MRV1): jobtracker / tasktracker
  • Fases: driver, mapper, shuffle / sort, reductor
  • Mapa Reduzca Versión 1 y Versión 2 (YARN)
  • Internos del Mapa Reducir
  • Introducción a Java Map Reduce el programa
  • Laboratorios: Ejecutar un programa MapReduce de ejemplo

Sección 4: Cerdo

  • Cerdo vs java mapa reducir
  • Flujo de trabajo porcino
  • Lengua latina del cerdo
  • ETL con cerdo
  • Transformations & Joins
  • Funciones definidas por el usuario (UDF)
  • Laboratorios: escribir scripts Pig para analizar datos

Sección 5: Colmena

  • Arquitectura y diseño
  • tipos de datos
  • Soporte SQL en Hive
  • Creación de tablas Hive y consultas
  • Particiones
  • Se une
  • Procesamiento de texto
  • Laboratorios: varios laboratorios sobre procesamiento de datos con Hive

Sección 6: HBase

  • Conceptos y arquitectura
  • Hbase vs RDBMS vs cassandra
  • API de Java de HBase
  • Datos de series temporales de HBase
  • Diseño del esquema
  • Labs: Interacción con HBase usando shell; Programación en HBase Java API; Ejercicio de diseño de esquemas

Testimonios

★★★★★
★★★★★

Categorías Relacionadas

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

is growing fast!

We are looking to expand our presence in Ecuador!

As a Business Development Manager you will:

  • expand business in Ecuador
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!