Cursos de Big Data

Cursos de Big Data

Big Data es un término que se refiere a soluciones destinadas a almacenar y procesar grandes conjuntos de datos. Desarrollado inicialmente por Google, estas soluciones han evolucionado e inspirado otros proyectos, de los cuales muchos están disponibles como código abierto. Según los informes de Gartner, Big Data es el próximo gran paso en TI justo después del Cloud Computing y será una tendencia líder en los próximos años.
Los cursos locales dirigidos por instructor en vivo de capacitación en Big Data comienzan con una introducción a conceptos elementales, luego avanzan hacia los lenguajes de programación y las metodologías utilizadas para realizar el Análisis de Datos. Las herramientas y la infraestructura para habilitar el almacenamiento de Big Data, el Procesamiento Distribuido y la Escalabilidad se discuten, comparan e implementan en sesiones demostrativas de práctica. La capacitación en Big Data está disponible en dos modalidades: "presencial en vivo" y "remota en vivo"; la primera se puede llevar a cabo localmente en las instalaciones del cliente en Ecuador o en los centros de capacitación corporativa de NobleProg en Ecuador, la segunda se lleva a cabo a través de un escritorio remoto interactivo.

NobleProg -- The World's Local Trainer Provider

Testimonios

★★★★★
★★★★★

Algunos de nuestros clientes

Programa del curso Big Data

Title
Duration
Overview
Title
Duration
Overview
14 hours
Overview
Gol:

Aprender a trabajar con SPSS a nivel de independencia

Los destinatarios:

Analistas, investigadores, científicos, estudiantes y todos aquellos que quieran adquirir la capacidad de utilizar el paquete SPSS y aprender técnicas de minería de datos populares.
7 hours
Overview
Apache NiFi (Hortonworks DataFlow) es una plataforma de procesamiento de eventos y logística de datos integrada en tiempo real que permite mover, rastrear y automatizar los datos entre los sistemas. Está escrito usando programación basada en flujo y proporciona una interfaz de usuario basada en web para administrar flujos de datos en tiempo real.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los fundamentos de la programación basada en flujo a medida que desarrollan una cantidad de extensiones de demostración, componentes y procesadores que usan Apache NiFi.

Al final de esta capacitación, los participantes podrán:

- Comprender los conceptos de arquitectura y flujo de datos de NiFi
- Desarrollar extensiones utilizando NiFi y API de terceros
- Desarrolla a medida su propio procesador Apache Nifi
- Ingerir y procesar datos en tiempo real de formatos de archivo dispares y poco comunes y fuentes de datos

Audiencia

- Desarrolladores
- Ingenieros de datos

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
21 hours
Overview
Apache Drill es un motor de consulta SQL sin columnas, distribuido y en memoria para Hadoop, NoSQL y otros sistemas de almacenamiento en la nube y en la nube. El poder de Apache Drill radica en su capacidad para unir datos de múltiples almacenes de datos con una sola consulta. Apache Drill admite numerosas bases de datos y sistemas de archivos NoSQL, incluidos HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, Azure Blob Storage, Google Cloud Storage, Swift, NAS y archivos locales. Apache Drill es la versión de código abierto del sistema Dremel de Google, que está disponible como un servicio de infraestructura llamado Google BigQuery.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los fundamentos de Apache Drill, luego aprovecharán el poder y la conveniencia de SQL para consultar de manera interactiva big data en múltiples fuentes de datos, sin escribir código. Los participantes también aprenderán a optimizar sus consultas de exploración para la ejecución de SQL distribuido.

Al final de esta capacitación, los participantes podrán:

- Realizar exploración de "autoservicio" en datos estructurados y semiestructurados en Hadoop
- Consultar datos conocidos y desconocidos mediante consultas SQL
- Comprender cómo Apache Drills recibe y ejecuta consultas
- Escribir consultas SQL para analizar diferentes tipos de datos, incluidos datos estructurados en Hive, datos semiestructurados en tablas HBase o MapR-DB, y datos guardados en archivos como Parquet y JSON.
- Utilice Apache Drill para realizar el descubrimiento de esquemas sobre la marcha, evitando la necesidad de complejas operaciones ETL y esquemas
- Integre Apache Drill con herramientas de BI (Business Intelligence) como Tableau, Qlikview, MicroStrategy y Excel

Audiencia

- Analistas de datos
- Científicos de datos
- Programadores de SQL

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
28 hours
Overview
MonetDB es una base de datos de código abierto que fue pionera en el enfoque de la tecnología columna-tienda.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo usar MonetDB y cómo sacar el máximo provecho de ella.

Al final de esta capacitación, los participantes podrán:

- Comprender MonetDB y sus características
- Instalar y comenzar con MonetDB
- Explora y realiza diferentes funciones y tareas en MonetDB
- Acelere la entrega de su proyecto maximizando las capacidades de MonetDB

Audiencia

- Desarrolladores
- Expertos técnicos

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
28 hours
Overview
MemSQL es un sistema de administración de bases de datos SQL distribuidas y en memoria para la nube y las instalaciones. Es un almacén de datos en tiempo real que brinda información de forma inmediata a partir de datos históricos y en vivo.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los elementos esenciales de MemSQL para el desarrollo y la administración.

Al final de esta capacitación, los participantes podrán:

- Comprender los conceptos clave y las características de MemSQL
- Instalar, diseñar, mantener y operar MemSQL
- Optimizar esquemas en MemSQL
- Mejorar las consultas en MemSQL
- Rendimiento de referencia en MemSQL
- Construya aplicaciones de datos en tiempo real usando MemSQL

Audiencia

- Desarrolladores
- Administradores
- Ingenieros de operación

Formato del curso

- Conferencia de parte, discusiaón en parte, ejercicios y práctica práctica
28 hours
Overview
Hadoop es un popular marco de procesamiento Big Data. Python es un lenguaje de programación de alto nivel famoso por su claridad de sintaxis y código.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo trabajar con Hadoop, MapReduce, Pig y Spark utilizando Python, ya que pasan por múltiples ejemplos y casos de uso.

Al final de esta capacitación, los participantes podrán:

- Comprender los conceptos básicos detrás de Hadoop, MapReduce, Pig y Spark
- Utilice Python con Hadoop Distributed File System (HDFS), MapReduce, Pig y Spark
- Utilice Snakebite para acceder mediante programación a HDFS dentro de Python
- Usa mrjob para escribir trabajos de MapReduce en Python
- Escribir programas Spark con Python
- Extienda la funcionalidad del cerdo usando las UDF de Python
- Administrar trabajos de MapReduce y scripts Pig utilizando Luigi

Audiencia

- Desarrolladores
- Profesionales de TI

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
21 hours
Overview
Python es un lenguaje de programación de alto nivel famoso por su claridad de sintaxis y código. Spark es un motor de procesamiento de datos utilizado para consultar, analizar y transformar big data. PySpark permite a los usuarios interactuar con Spark con Python.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Python y Spark juntos para analizar los datos grandes mientras trabajan en ejercicios prácticos.

Al final de esta capacitación, los participantes podrán:

- Aprenda a usar Spark con Python para analizar Big Data
- Trabajar en ejercicios que imitan las circunstancias del mundo real
- Utilice diferentes herramientas y técnicas para el análisis de Big Data utilizando PySpark

Audiencia

- Desarrolladores
- Profesionales de TI
- Científicos de datos

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
35 hours
Overview
Los avances en las tecnologías y la creciente cantidad de información están transformando la forma en que se lleva a cabo la aplicación de la ley. Los desafíos que plantea Big Data son casi tan desalentadores como la promesa de Big Data. Almacenar datos de manera eficiente es uno de estos desafíos; analizarlo efectivamente es otro.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán la mentalidad con la cual abordarán las tecnologías de Big Data, evaluarán su impacto en los procesos y políticas existentes, e implementarán estas tecnologías con el propósito de identificar la actividad delictiva y prevenir el delito. Se examinarán estudios de casos de organizaciones de orden público de todo el mundo para obtener información sobre sus enfoques, desafíos y resultados de adopción.

Al final de esta capacitación, los participantes podrán:

- Combine la tecnología Big Data con procesos tradicionales de recopilación de datos para armar una historia durante una investigación
- Implementar soluciones industriales de almacenamiento y procesamiento de big data para el análisis de datos
- Preparar una propuesta para la adopción de las herramientas y procesos más adecuados para permitir un enfoque basado en datos para la investigación criminal

Audiencia

- Especialistas en aplicación de la ley con experiencia técnica

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Para cumplir con el cumplimiento de los reguladores, los CSP (proveedores de servicios de comunicación) pueden acceder a Big
Análisis de datos que no solo los ayuda a cumplir con el cumplimiento, sino que están dentro del alcance de los mismos
proyecto pueden aumentar la satisfacción del cliente y así reducir el abandono. De hecho desde
el cumplimiento está relacionado con la calidad del servicio vinculada a un contrato, cualquier iniciativa para cumplir
cumplimiento, mejorará la "ventaja competitiva" de los CSP. Por lo tanto, es importante que
Los reguladores deberían ser capaces de asesorar / orientar un conjunto de prácticas analíticas de Big Data para los CSP que
ser de beneficio mutuo entre los reguladores y los CSP.

2 días de curso: 8 módulos, 2 horas cada uno = 16 horas
28 hours
Overview
Una gran cantidad de problemas del mundo real se pueden describir en términos de gráficos. Por ejemplo, el gráfico web, el gráfico de red social, el gráfico de red de tren y el gráfico de lenguaje. Estos gráficos tienden a ser extremadamente grandes; su procesamiento requiere un conjunto especializado de herramientas y procesos; estas herramientas y procesos se pueden denominar Computación de Gráficos.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán sobre las diversas ofertas de tecnología e implementaciones para procesar datos de gráficos. El objetivo es identificar los objetos del mundo real, sus características y relaciones, luego modelar estas relaciones y procesarlas como datos utilizando enfoques de computación gráfica. Comenzamos con una amplia visión general y nos limitamos a herramientas específicas a medida que avanzamos en una serie de estudios de casos, ejercicios prácticos e implementaciones en vivo.

Al final de esta capacitación, los participantes podrán:

- Comprender cómo se conservan y atraviesan los datos de gráfico
- Seleccione el mejor marco para una tarea determinada (desde bases de datos de gráficos hasta marcos de procesamiento por lotes)
- Implemente Hadoop, Spark, GraphX ​​y Pregel para llevar a cabo la computación gráfica en muchas máquinas en paralelo
- Ver problemas de Big Data en el mundo real en términos de gráficos, procesos y recorridos

Audiencia

- Desarrolladores

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
21 hours
Overview
El análisis predictivo es el proceso de usar el análisis de datos para hacer predicciones sobre el futuro. Este proceso utiliza datos junto con la extracción de datos, estadísticas y técnicas de aprendizaje automático para crear un modelo predictivo para pronosticar eventos futuros.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo usar Matlab para construir modelos predictivos y aplicarlos a grandes conjuntos de datos de muestra para predecir eventos futuros basados en los datos.

Al final de esta capacitación, los participantes podrán:

- Crear modelos predictivos para analizar patrones en datos históricos y transaccionales
- Use modelos predictivos para identificar riesgos y oportunidades
- Cree modelos matemáticos que capturen tendencias importantes
- Use datos de dispositivos y sistemas comerciales para reducir el desperdicio, ahorrar tiempo o reducir costos

Audiencia

- Desarrolladores
- Ingenieros
- Expertos de dominio

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) es una plataforma de procesamiento de eventos y logística de datos integrada en tiempo real que permite mover, rastrear y automatizar los datos entre los sistemas. Está escrito usando programación basada en flujo y proporciona una interfaz de usuario basada en web para administrar flujos de datos en tiempo real.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a implementar y administrar Apache NiFi en un entorno de laboratorio en vivo.

Al final de esta capacitación, los participantes podrán:

- Instalar y configurar Apachi NiFi
- Fuente, transformar y gestionar datos de fuentes de datos dispersas y distribuidas, incluidas bases de datos y lagos de datos grandes.
- Automatice los flujos de datos
- Habilitar análisis de transmisión
- Aplicar varios enfoques para la ingestión de datos
- Transformar Big Data y en conocimientos empresariales

Audiencia

- Administradores del sistema
- Ingenieros de datos
- Desarrolladores
- DevOps

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
7 hours
Overview
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los conceptos básicos detrás de MapR Stream Architecture mientras desarrollan una aplicación de transmisión en tiempo real.

Al final de esta capacitación, los participantes podrán construir aplicaciones para productores y consumidores para el procesamiento de datos de flujo en tiempo real.

Audiencia

- Desarrolladores
- Administradores

Formato de la carrera

- Parte de lectura, parte de discusión, ejercicios y práctica práctica

Nota

- Para solicitar un entrenamiento personalizado para esta carrera, contáctenos para organizarlo.
14 hours
Overview
Apache SolrCloud es un motor de procesamiento de datos distribuidos que facilita la búsqueda y la indexación de archivos en una red distribuida.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a configurar una instancia de SolrCloud en Amazon AWS.

Al final de esta capacitación, los participantes podrán:

- Comprender las características de SolCloud y cómo se comparan con las de los clústeres maestros-esclavos convencionales
- Configurar un clúster centralizado de SolCloud
- Automatice procesos como la comunicación con fragmentos, agregue documentos a los fragmentos, etc.
- Utilice Zookeeper junto con SolrCloud para automatizar aún más los procesos
- Use la interfaz para administrar informes de errores
- Balance de carga una instalación de SolrCloud
- Configure SolrCloud para un procesamiento continuo y conmutación por error

Audiencia

- Desarrolladores de Solr
- Gerentes de proyecto
- Administradores del sistema
- Analistas de búsqueda

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
28 hours
Overview
El modelado de bóvedas de datos es una técnica de modelado de bases de datos que proporciona almacenamiento histórico a largo plazo de datos que provienen de múltiples fuentes. Una bóveda de datos almacena una única versión de los hechos, o "todos los datos, todo el tiempo". Su diseño flexible, escalable, consistente y adaptable abarca los mejores aspectos de la tercera forma normal (3NF) y el esquema de estrella.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a construir una Bóveda de datos.

Al final de esta capacitación, los participantes podrán:

- Comprender los conceptos de arquitectura y diseño detrás de Data Vault 2.0 y su interacción con Big Data, NoSQL y AI.
- Utilice las técnicas de bóvedas de datos para habilitar la auditoría, el seguimiento y la inspección de datos históricos en un almacén de datos
- Desarrollar un proceso ETL consistente (consistente) y repetible (Extraer, Transformar, Cargar)
- Construya y despliegue almacenes altamente escalables y repetibles

Audiencia

- Modeladores de datos
- Especialista en almacenamiento de datos
- Especialistas en inteligencia empresarial
- Ingenieros de datos
- Administradores de bases

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Datameer es una plataforma de inteligencia de negocios y análisis construida en Hadoop. Permite a los usuarios finales acceder, explorar y correlacionar datos a gran escala, estructurados, semiestructurados y no estructurados de una manera fácil de usar.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Datameer para superar la pronunciada curva de aprendizaje de Hadoop a medida que avanzan en la configuración y el análisis de una serie de grandes fuentes de datos.

Al final de esta capacitación, los participantes podrán:

- Crea, selecciona e interactivamente explora un lago de datos empresariales
- Acceda a almacenes de datos de inteligencia empresarial, bases de datos transaccionales y otras tiendas analíticas
- Use una interfaz de usuario de hoja de cálculo para diseñar las tuberías de procesamiento de datos de extremo a extremo
- Acceda a funciones preconstruidas para explorar relaciones de datos complejas
- Utilice asistentes de arrastrar y soltar para visualizar datos y crear paneles
- Use tablas, cuadros, gráficos y mapas para analizar los resultados de las consultas

Audiencia

- Analistas de datos

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Tigon es un marco de procesamiento de flujo de fuente abierta, en tiempo real, de baja latencia y alto rendimiento, nativo, que se asienta sobre HDFS y HBase para la persistencia. Las aplicaciones de Tigon abordan casos de uso tales como detección y análisis de intrusiones de red, análisis de mercado de redes sociales, análisis de ubicación y recomendaciones en tiempo real para los usuarios.

Este curso presencial, dirigido por un instructor, presenta el enfoque de Tigon para combinar el procesamiento en tiempo real y por lotes a medida que guía a los participantes a través de la creación de una aplicación de muestra.

Al final de esta capacitación, los participantes podrán:

- Cree aplicaciones potentes de procesamiento de flujo para manejar grandes volúmenes de datos
- Fuentes de flujo de procesos como Twitter y registros de servidor web
- Utilice Tigon para unir, filtrar y agregar secuencias rápidamente

Audiencia

- Desarrolladores

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Apache Ignite es una plataforma informática en memoria que se encuentra entre la aplicación y la capacidad de datos para mejorar la velocidad, la escala y la disponibilidad.

En este entrenamiento en vivo dirigido por un instructor, los participantes aprendieron los principios detrás del almacenamiento persistente y puro en la memoria a medida que avanzan en la creación de un proyecto de ejemplo de computación en memoria.

Al final de esta capacitación, los participantes podrán:

- Utilice Ignite para la memoria en la memoria, la persistencia en disco y una base de datos en memoria puramente distribuida
- Logre la persistencia sin sincronizar los datos a una base de datos relacionales
- Use Ignite para llevar a cabo SQL y Uniones Distribuidas
- Mejore el rendimiento moviendo los datos más cerca de la CPU, usando la RAM como almacenamiento
- Extienda conjuntos de datos en un clúster para lograr la escalabilidad horizontal
- Integre Ignite con RDBMS, NoSQL, Hadoop y procesadores de aprendizaje automático

Audiencia

- Desarrolladores

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Vespa, un motor de procesamiento y publicación de grandes volúmenes de código abierto creado por Yahoo. Se utiliza para responder a las consultas de los usuarios, hacer recomendaciones y proporcionar contenido personalizado y publicidades en tiempo real.

Este entrenamiento en vivo, dirigido por un instructor, presenta los desafíos de servir datos a gran escala y guía a los participantes a través de la creación de una aplicación que puede calcular las respuestas a las solicitudes de los usuarios, en grandes conjuntos de datos en tiempo real.

Al final de esta capacitación, los participantes podrán:

- Use Vespa para calcular rápidamente los datos (almacenar, buscar, clasificar, organizar) en el momento de servir mientras un usuario espera
- Implementar Vespa en aplicaciones existentes que involucran búsqueda de funciones, recomendaciones y personalización
- Integre e implemente Vespa con los sistemas de big data existentes, como Hadoop y Storm.

Audiencia

- Desarrolladores

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
21 hours
Overview
Apache Apex es una plataforma nativa de YARN que unifica la transmisión y el procesamiento por lotes. Procesa big data-in-motion de una manera que es escalable, de rendimiento, tolerante a fallas, con estado, seguro, distribuido y de fácil operación.

Este curso en vivo dirigido por un instructor presenta la arquitectura de procesamiento de flujo unificado de Apache Apex y guía a los participantes a través de la creación de una aplicación distribuida usando Apex en Hadoop.

Al final de esta capacitación, los participantes podrán:

- Comprender los conceptos de canalización de procesamiento de datos, como conectores para fuentes y sumideros, transformaciones de datos comunes, etc.
- Cree, escale y optimice una aplicación Apex
- Procesar flujos de datos en tiempo real de manera confiable y con mínima latencia
- Utilice Apex Core y la biblioteca Apex Malhar para permitir el desarrollo rápido de aplicaciones
- Use la API Apex para escribir y reutilizar el código Java existente
- Integra Apex en otras aplicaciones como un motor de procesamiento
- Sintonizar, probar y escalar aplicaciones Apex

Audiencia

- Desarrolladores
- Arquitectos empresariales

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
7 hours
Overview
Alexio es un sistema de almacenamiento distribuido virtual de código abierto que unifica sistemas de almacenamiento dispares y permite que las aplicaciones interactúen con datos a la velocidad de la memoria. Es utilizado por compañías como Intel, Baidu y Alibaba.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Alexio para unir diferentes marcos de computación con sistemas de almacenamiento y administrar de manera eficiente los datos de escala de varios petabytes mientras avanzan en la creación de una aplicación con Alluxio.

Al final de esta capacitación, los participantes podrán:

- Desarrolle una aplicación con Alluxio
- Conecte aplicaciones y sistemas de big data mientras conserva un espacio de nombres
- Extrae de manera eficiente el valor de los grandes datos en cualquier formato de almacenamiento
- Mejorar el rendimiento de la carga de trabajo
- Implemente y administre Alluxio de forma independiente o en clúster

Audiencia

- Científico de datos
- Desarrollador
- Administrador de sistema

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
28 hours
Overview
Apache Flink es un marco de código abierto para flujo escalable y procesamiento de datos por lotes.

Este curso presencial, dirigido por un instructor, presenta los principios y enfoques detrás del procesamiento distribuido de datos en secuencia y por lotes, y guía a los participantes a través de la creación de una aplicación de transmisión de datos en tiempo real.

Al final de esta capacitación, los participantes podrán:

- Configure un entorno para desarrollar aplicaciones de análisis de datos
- Empaque, ejecute y monitoree las aplicaciones de transmisión de datos basadas en Flink y tolerantes a fallas
- Administrar diversas cargas de trabajo
- Realice análisis avanzados usando Flink ML
- Configurar un clúster Flink multinodo
- Mida y optimice el rendimiento
- Integrar Flink con diferentes sistemas Big Data
- Compare las capacidades de Flink con las de otros marcos de procesamiento de big data

Audiencia

- Desarrolladores
- Arquitectos
- Ingenieros de datos
- Profesionales de analítica
- Gerentes técnicos

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Apache Samza es un marco computacional asíncrono de código abierto casi en tiempo real para el procesamiento de flujos. Utiliza Apache Kafka para mensajería y Apache Hadoop YARN para tolerancia a fallas, aislamiento de procesador, seguridad y administración de recursos.

Esta capacitación en vivo dirigida por un instructor presenta los principios detrás de los sistemas de mensajería y el procesamiento distribuido de flujo, mientras acompaña a los participantes a través de la creación de un proyecto basado en Samza y la ejecución de trabajos.

Al final de esta capacitación, los participantes podrán:

Usa Samza para simplificar el código necesario para producir y consumir mensajes
Desacoplar el manejo de los mensajes de una aplicación
Utilice Samza para implementar cálculos asincrónicos casi en tiempo real
Utilice el procesamiento de flujo para proporcionar un mayor nivel de abstracción en los sistemas de mensajería

Audiencia

- Desarrolladores

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Building Intelligent Systems es una colección de tecnologías capaces de comprender y tomar decisiones inteligentes. Para los proveedores de telecomunicaciones, crear aplicaciones y servicios que puedan usarse para mejorar la operación de los servicios y servicios.

En esta carrera examinamos las diversas tecnologías que componen la IA y los conjuntos de habilidades. A lo largo de la carrera, examinamos las aplicaciones específicas de AI dentro de la industria de las telecomunicaciones.

Audiencia

- Ingenieros de red
- Personal de operaciones de red
- Gerentes técnicos de telecomunicaciones

Formato de la carrera

- Parte de lectura, parte de discusión, ejercicios prácticos
7 hours
Overview
Apache Drill es un motor de consulta SQL sin columnas, distribuido y en memoria para Hadoop, NoSQL y otros sistemas de almacenamiento en la nube y en la nube. El poder de Apache Drill radica en su capacidad para unir datos de múltiples almacenes de datos con una sola consulta. Apache Drill admite numerosas bases de datos y sistemas de archivos NoSQL, incluidos HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, Azure Blob Storage, Google Cloud Storage, Swift, NAS y archivos locales. Apache Drill es la versión de código abierto del sistema Dremel de Google, que está disponible como un servicio de infraestructura llamado Google BigQuery.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a optimizar y depurar Apache Drill para mejorar el rendimiento de las consultas en conjuntos de datos de gran tamaño. El curso comienza con una descripción general de la arquitectura y una comparación de características entre Apache Drill y otras herramientas interactivas de análisis de datos. Luego, los participantes pasan por una serie de sesiones de práctica interactivas y prácticas que incluyen instalación, configuración, evaluación del rendimiento, optimización de consultas, partición de datos y depuración de una instancia de Apache Drill en un entorno de laboratorio en vivo.

Al final de esta capacitación, los participantes podrán:

- Instalar y configurar el Apache Drill
- Comprender la arquitectura y las características de Apache Drill
- Comprender cómo Apache Drills recibe y ejecuta consultas
- Optimizar consultas de exploración para la ejecución de SQL distribuido
- Debug Drilling de depuración

Audiencia

- Desarrolladores
- Administradores de sistemas
- Analistas de datos

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Notas

- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
14 hours
Overview
Magellan es un motor de ejecución distribuida de código abierto para el análisis geoespacial en big data. Implementado sobre Apache Spark, amplía Spark SQL y proporciona una abstracción relacional para el análisis geoespacial.

Esta capacitación en vivo dirigida por un instructor presenta los conceptos y enfoques para implementar el análisis geospacial y guía a los participantes a través de la creación de una aplicación de análisis predictivo utilizando Magellan en Spark.

Al final de esta capacitación, los participantes podrán:

- Consultar, analizar y unir datos geoespaciales de manera eficiente a escala
- Implementar datos geoespaciales en inteligencia empresarial y aplicaciones de análisis predictivo
- Utilice el contexto espacial para ampliar las capacidades de dispositivos móviles, sensores, registros y dispositivos portátiles

Audiencia

- Desarrolladores de aplicaciones

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
14 hours
Overview
Apache Arrow es un marco de procesamiento de datos en memoria de código abierto. A menudo se usa junto con otras herramientas de ciencia de datos para acceder a almacenes de datos dispares para su análisis. Se integra bien con otras tecnologías, como bases de datos de GPU , bibliotecas y herramientas de aprendizaje automático, motores de ejecución y marcos de visualización de datos.

En esta capacitación en vivo dirigida por un instructor en el sitio, los participantes aprenderán cómo integrar Apache Arrow con varios marcos de Data Science para acceder a datos de fuentes de datos dispares.

Al final de esta capacitación, los participantes podrán:

- Instale y configure Apache Arrow en un entorno agrupado distribuido
- Use Apache Arrow para acceder a datos de fuentes de datos dispares
- Use Apache Arrow para evitar la necesidad de construir y mantener tuberías complejas de ETL
- Analice datos a través de fuentes de datos dispares sin tener que consolidarlos en un repositorio centralizado.

Audiencia

- Científicos de datos
- Ingenieros de datos

Formato del curso

- Conferencia parcial, discusión parcial, ejercicios y práctica práctica.

Nota

- Para solicitar una capacitación personalizada para este curso, contáctenos para organizarlo.
7 hours
Overview
This instructor-led, live training (onsite or remote) is aimed at technical persons who wish to learn how to implement a machine learning strategy while maximizing the use of big data.

By the end of this training, participants will:

- Understand the evolution and trends for machine learning.
- Know how machine learning is being used across different industries.
- Become familiar with the tools, skills and services available to implement machine learning within an organization.
- Understand how machine learning can be used to enhance data mining and analysis.
- Learn what a data middle backend is, and how it is being used by businesses.
- Understand the role that big data and intelligent applications are playing across industries.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
14 hours
Overview
Teradata is a popular Relational Database Management System for building large scale data warehousing applications. Teradata achieves this by way of parallelism.

This instructor-led, live training (onsite or remote) is aimed at application developers and engineers who wish to master more sophisticated usages of the Teradata database.

By the end of this training, participants will be able to:

- Manage Teradata space.
- Protect and distribute data in Teradata.
- Read Explain Plan.
- Improve SQL proficiency.
- Use main utilities of Teradata.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 hours
Overview
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
Cursos de Fin de Semana de Big Data, Capacitación por la Tarde de Big Data, Big Data boot camp, Clases de Big Data, Capacitación de Fin de Semana de Big Data, Cursos por la Tarde de Big Data, Big Data coaching, Instructor de Big Data, Capacitador de Big Data, Big Data con instructor, Cursos de Formación de Big Data, Big Data en sitio, Cursos Privados de Big Data, Clases Particulares de Big Data, Capacitación empresarial de Big Data, Talleres para empresas de Big Data, Cursos en linea de Big Data, Programas de capacitación de Big Data, Clases de Big Data

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

is growing fast!

We are looking to expand our presence in Ecuador!

As a Business Development Manager you will:

  • expand business in Ecuador
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!