Never Stop Learning
Slider 1

FUNDAMENTOS DE BIG DATA

SOBRE O CURSO

Um estudo elaborado pela International Data Corporation (IDC) ressalta que poucas organizações serão capazes de contratar todos os membros da equipe com a qualidade necessária o suficiente para alcançar os resultados desejados. A escassez de profissionais qualificados em um mundo que está cada vez mais voltado para os dados leva a uma enorme demanda por perfis de especialistas em análise e engenharia de dados.

As empresas estão começando a entender como os processos de coleta e análise de dados são cruciais para que tomem melhores decisões de negócios. No entanto, existe uma infinidade de tecnologias e conceitos que dificultam muito o início nesse novo paradigma. Por isso, este treinamento foi projetado para transmitir os conceitos, processos e ferramentas que os profissionais precisam dominar para se saírem bem nesse mundo. Ao final desse treinamento o aluno será capaz de identificar problemas de Big Data e descrever e implementar soluções como as tecnologias existentes.

O treinamento fornece uma compreensão profunda da estrutura do Hadoop, incluindo HDFS, YARN e MapReduce e nele o aluno também aprenderá a usar o Hive para processar e analisar grandes conjuntos de dados, Sqoop e Flume para a ingestão de dados. Nele o aluno aprenderá também os conceito de bancos NoSQL com ênfase maior para o HBase, implementará aplicações em Spark e desenvolverá soluções near real time com Kafka e Spark Streaming.

PÚBLICO ALVO

Este curso é voltado para profissionais de business intelligence, analistas e gerentes de negócios, desenvolvedores e demais profissionais que pretendem entrar nesse fantástico mundo de big data.

ASSUNTOS ABORDADOS

Introdução ao Big Data e Hadoop

Entender o que é Big Data, as limitações das soluções existentes para o problema do Big Data e como Hadoop resolve a maioria dos problemas de Big Data.

Apache Sqoop

Introdução ao Sqoop, importação e exportação de dados com o Sqoop.
 
 
 

Apache Hbase

Introdução a banco de dados colunares, histórico do HBase, casos de uso comuns para o HBase, HBase shell, HBase DDL e DML.

Hadoop Distributed File System

Onde o HDFS é adequado e onde não é, o funcionamento dos blocos no HDFS, como este sistema de arquivos é tolerante a falhas e execução de operações de leitura e gravação.
 

Apache Flume

Visão geral e workflow do Flume, arquitetura e fluxo de dados.
 
 
 

Apache Kafka

Kafka e seus componentes, utilização do Kafka para produzir e consumir mensagens de várias fontes e integração do Kafka com Spark.

MapReduce

Visão geral e workflow do MapReduce, fluxo de dados no MapReduce, modelo de programação MapReduce, executando uma tarefa MapReduce.
 
 

Apache Hive

Introdução ao Hive, casos de uso comuns para o Hive, a linguagem e estruturas básicas, arquitetura e componentes, importando manipulando dados com Hive.

Apache Spark

Introdução ao Spark, componentes do Spark, Resilient Distributed Datasets (RDD), DataFrames, criando uma aplicação Spark.

AVALIAÇÕES DO TREINAMENTO

Sempre em busca da melhoria contínua do treinamento Fundamentos de Big Data, os alunos são convidados a responder sobre vários aspectos do treinamento. Segue abaixo os seus níveis de satisfação sobre alguns tópicos.

dos alunos
recomendam

92% dos alunos recomendariam esse treinamento para um amigo.

consideram útil
o treinamento

92% dos alunos avaliam que o treinamento será muito útil em suas carreiras.

tiveram o objetivo
alcançado

83% dos alunos afirmam que os objetivos com o treinamento foram alcançados.

gostaram da
organização

80% dos alunos avaliam que o treinamento estava organizado e fácil de seguir.

DEPOIMENTOS DE EX-ALUNOS

SOBRE O INSTRUTOR

Custom Image

Eduardo é coordenador e arquiteto de projetos de Big Data Analytics na Semantix Brasil, com sólida experiência projetando e implementando soluções de Big Data aplicadas a diferentes indústrias. É formado em Ciência da Computação pela Universidade Federal de Viçosa e mestre em Ciência da Computação pela Universidade Estadual de Campinas, onde trabalhou com modelagem de dados em grafos.

Anteriormente trabalhou como professor da pós-graduação Ciência de Dados e Big Data na PUC Minas e atuou também como arquiteto de Big Data na Datastorm, uma empresa do grupo Stefanini focada em soluções de Big Data Analytics.

CONTATO E NEWSLETTER

Fique a vontade para nos enviar uma mensagem e esclarecer suas dúvidas.

  • contato@nsl.net.br
  • www.nsl.net.br

Cadastre-se no nosso newsletter e receba notícias e promoções.