Inscrições não estão abertas no momento. Inscreva-se para ser informado(a) sobre novas turmas.
Aprenda com o maior time de mentores do Brasil, de empresas como:
O objetivo do curso é que você se torne especialista em Data Engineering, capaz de lidar com grandes quantidades de dados de diversas fontes, preparando-os para projetos de Business Intelligence, Ciência de Dados e de Machine Learning.
Ao concluir o curso, você será capaz de realizar tratamento de dados com Spark, utilizar Kafka e Airflow para orquestrar pipelines de dados, fazer ingestão de dados em Data Lakes e Data Lakehouses e publicar projetos na nuvem usando AWS.
Feita por especialistas, pensada no mundo real
Nós temos um comprometimento com a qualidade de nossos cursos, e nossa grade curricular é a mais completa do mercado sobre o tema. Ela foi criada por especialistas e pensada desde o primeiro dia em sua aplicabilidade prática.
1
Introdução à Engenharia de Dados
Entenda como Data Engineering surgiu, como se relaciona com outros papéis de dados e como se tornou uma das profissões mais disputadas do mercado.
Tudo sobre o Curso!
Vídeo: Bem-vindos(as)!
Roteiro da 1ª Aula
Slides: Introdução à Engenharia de Dados
Prática: Requisitos para Vagas
Tarefa: Reflita sobre o Mercado
Faça após a 1ª Aula
Resumo da Unidade - Introdução à Engenharia de Dados
2
Big Data, Data Lakes e Data Warehouses
Conheça terminologias do armazenamento de dados em larga escala e pratique em ferramentas dedicadas a dados não estruturados e Big Data.
Roteiro da 2ª Aula
Slides: Big Data, Data Lakes e Data Warehouses
Prática: Arquiteturas Modernas de Dados
Tarefa: Pesquisando Arquiteturas
Faça após a 2ª Aula
Resumo da Unidade - Big Data, Data Lakes e Data Warehouses
3
Configurando Ambiente com Docker
Comece pelas bases em infraestrutura de software e dados e monte o ambiente de práticas do curso no gerenciador de containers Docker.
Roteiro da 3ª Aula
Orientações sobre Docker
Slides: Configurando Ambiente com Docker
Prática: Containers Docker
Exercício: Praticando com Docker Hub
Faça após a 3ª Aula
Resumo da Unidade - Configurando Ambiente com Docker
4
Python para Engenharia de Dados
Faça uma revisão da linguagem de programação Python e entre no mundo de bibliotecas e recursos mais utilizados na Engenharia de Dados.
Roteiro da 4ª Aula
Slides: Python para Engenharia de Dados
Prática: Live Coding em Python
Tarefa: Python Basics
Faça após a 4ª Aula
Resumo da Unidade - Python para Engenharia de Dados
5
Iniciando Tratamento de Dados
Aprenda transformação, limpeza, remoção de nulos, normalização e outras técnicas para tratamento de arquivos com dados brutos massivos.
Roteiro da 5ª Aula
Slides: Iniciando Tratamento de Dados
Prática: Data Processing 101
Tarefa: Top Youtubers
Faça após a 5ª Aula
Resumo da Unidade - Iniciando Tratamento de Dados
6
Tratamento com MinIO e MongoDB
Avance no tratamento de dados com MinIO, object storage que usa o protocolo do serviço Amazon AWS S3, e o banco de dados NoSQL MongoDB.
Roteiro da 6ª Aula
Slides: Tratamento com Minio e MongoDB
Prática: MinIO e MongoDB no JupyterLab
Tarefa: Organizar Cidades por Estados
Faça após a 6ª Aula
Resumo da Unidade - Tratamento com MinIO e MongoDB
7
Batch, Diferencial e Kafka Streaming
Crie pipelines para lidar com a carga de dados ingeridos em data storages, seja por meio da importação em lote, calculando diferenças ou em tempo real.
Roteiro da 7ª Aula
Slides: Batch, Diferencial e Kafka Streaming
Prática: Exemplos nas Diversas Técnicas
Tarefa: Data Import Techniques
Faça após a 7ª Aula
Resumo da Unidade - Batch, Diferencial e Kafka Streaming
8
Spark e Fontes de Dados
Trate dados distribuídos e escaláveis com as ferramentas Apache Spark e PySpark e combine dados em diferentes formatos, como Parquet, CSV e JSON.
Roteiro da 8ª Aula
Slides: Spark e Fontes de Dados
Prática: Tratamentos com PySpak
Tarefa: Spark Manipulations
Faça após a 8ª Aula
Resumo da Unidade - Spark e Fontes de Dados
9
Airflow e Orquestração de Processos
Entenda na prática como funciona a orquestração de processos e pipelines de dados por meio da automatização dessas operações com Apache Airflow.
Roteiro da 9ª Aula
Slides: Airflow e Orquestração de Processos
Prática: Pipelines com Airflow
Tarefa: Automatizando Scripts Anteriores
Faça após a 9ª Aula
Resumo da Unidade - Airflow e Orquestração de Processos
10
Projeto I: Preparando a Infra
Comece a construir um projeto end-to-end, em que o objetivo é preparar a infraestrutura de ingestão e armazenamento de um grande volume de dados.
Roteiro da 10ª Aula
Slides: Projeto I: Preparando a Infra
Prática: Big Data Project: Ingestão
Tarefa: Importação Diária de Dados da Covid
Faça após a 10ª Aula
Resumo da Unidade - Projeto I: Preparando a Infra
11
Projeto II: Tratamento
Execute o tratamento massivo dos dados ingeridos, por meio da automatização de extração, limpeza, tratamento e combinação de dados com Airflow.
Roteiro da 11ª Aula
Slides: Projeto II: Tratamento
Prática: Big Data Project: Tratamento
Tarefa: Dados da Covid para Parquet
Faça após a 11ª Aula
Resumo da Unidade - Projeto II: Tratamento
12
Projeto III: Exportação para EDW
Finalize o projeto criando uma pipeline de exportação da carga de dados para um Enterprise Data Warehouse, de onde poderá ser consumido e analisado.
Roteiro da 12ª Aula
Slides: Projeto III: Exportação para EDW
Prática: Big Data Project: Output
Tarefa: Dados da Covid para Postgres
Faça após a 12ª Aula
Resumo da Unidade - Projeto III: Exportação para EDW
13
Fornecendo Dados para Analytics
Entenda as necessidades de pessoas de dados e negócios que irão usar os dados tratados a partir de ferramentas analíticas ou modelos de Machine Learning.
Roteiro da 13ª Aula
Slides: Fornecendo Dados para Analytics
Prática: Reports com Metabase
Tarefa: Report da Covid no Metabase
Faça após a 13ª Aula
Resumo da Unidade - Fornecendo Dados para Analytics
14
AWS I: Introdução à Plataforma
Conheça como funciona a Engenharia de Dados na nuvem na prática, por meio da plataforma Amazon AWS, seus recursos específicos e diferenciais.
Roteiro da 14ª Aula
Slides: AWS I: Introdução à Plataforma
Prática: Demonstrando a AWS
Exercício: Explorando Plataformas
Faça após a 14ª Aula
Resumo da Unidade - AWS I: Introdução à Plataforma
15
AWS II: Publicando Projeto na Nuvem
Replique o projeto end-to-end percorrendo etapas de preparação, automatização do tratamento e exportação de dados usando o ambiente AWS.
Roteiro da 15ª Aula
Slides: AWS II: Publicando Projeto na Nuvem
Prática: Projeto IMDB na AWS
Exercício: Máquina EC2 com Python
Faça após a 15ª Aula
Resumo da Unidade - AWS II: Publicando Projeto na Nuvem
16
Futuro da Engenharia de Dados
Prepare-se para novas tecnologias, técnicas e métodos que continuarão impactando a carreira em Data Engineering e o futuro da área.
Roteiro da 16ª Aula
Slides: Futuro da Engenharia de Dados
Prática: Dinâmica Aberta
Tarefa: Meu Futuro em Data Engineering
Faça após a 16ª Aula
Continue a se Desenvolver!
Resumo da Unidade - Futuro da Engenharia de Dados
Materiais de apoio
Elas ficam gravadas pra você assistir depois. Além disso, você vai ter acesso aos materiais da plataforma – são artigos, vídeo-aulas e outros conteúdos para complementar seu aprendizado.
Receba seu
No total, a carga horária do curso é de 120h. Ao fim do curso você receberá um certificado com o selo da ABED, Associação Brasileira de Ensino à Distância.
O inglês é o idioma estrangeiro mais estudado pelos brasileiros, porém muitas vezes, as pessoas não sabem aplicá-lo a situações reais. As mentorias individuais são uma prática essencial para a prática do vocabulário e gramática com ênfase no mercado de tecnologia, de acordo com as suas demandas profissionais específicas.
Saiba mais sobre Inglês na Awari →Já são milhares de histórias de sucesso com a Awari
Em nossa comunidade você vai participar de eventos exclusivos e encontrar os profissionais que definem o mercado.
Confira todos os depoimentos →Não encontrou sua dúvida abaixo? Nosso time está pronto para te atender:
Fale ConoscoComo funciona o processo de candidatura?
Nosso processo de candidatura consiste em duas etapas: um formulário inicial e uma entrevista com nosso time.
Nosso objetivo é entender seu momento profissional e avaliar se é um fit interessante com o que buscamos para nossa comunidade.
Qual plataforma de ensino é utilizada pela Awari?
O curso é realizado através da nossa própria plataforma de ensino, desenvolvida internamente.
É através dela que você vai agendar mentorias, acessar aulas ao vivo, conferir os materiais de apoio e mais.
Esse é um curso pago?
Sim, você precisa ter um plano ativo da Awari para matricular-se nesse curso e agendar mentorias individuais.
Para consultar os valores e opções de pagamento, entre em contato conosco ou envie sua inscrição.
Qual a política de reembolso?
Você pode solicitar o reembolso total do valor pago no prazo de até 7 (sete) dias corridos após a data de compra.
Como funcionam as mentorias individuais?
As mentorias são chamadas de vídeos realizadas através da nossa plataforma, e têm duração de 30 (trinta) minutos.
Você pode usar as ligações para tirar dúvidas, receber feedback sobre suas tarefas e aprender mais sobre o dia a dia do especialista da área.
Quantas mentorias eu posso agendar?
Isso vai depender do plano que você escolher! Nosso plano base começa com 8 mentorias incluídas, mas também temos a opção de você agendar mentorias ilimitadas.
Qual é a carga horária do curso?
O curso de Engenharia de Dados tem carga horária total de 120 horas.