Databricks com Spark
Explore o mundo do processamento de big data e análises avançadas com nosso curso especializado em Databricks e Spark. A capacidade de lidar com grandes volumes de dados e realizar análises complexas é essencial na era dos dados em grande escala. Este curso prático o preparará para os desafios do processamento de dados em grande escala.
Carga Horária:
Habilidades:
Ferramentas:
Nível:
Sobre o curso
Através de nossa abordagem hands-on, você desenvolverá as habilidades necessárias para criar pipelines de dados eficientes, realizar análises avançadas e aproveitar ao máximo as ferramentas Databricks e Spark. Este é o curso ideal para profissionais que desejam dominar o processamento de big data e se destacar em um cenário de análise de dados em constante evolução.
O que você irá aprender
Para quem é este curso
Um curso essencial para você que deseja:
Conteúdo do curso
1. Introdução ao Databricks
- Boas Vindas
- Download dos Materiais
- Contextualizando nosso projeto
- Visao geral e principais componentes do Databricks
- Cenarios e casos de uso da ferramenta
- Criando um workspace do Databricks
- Navegando e compreendendo a interface
2. Entendendo o Ambiente Databricks na Azure
- Entendendo sobre clusters
- Criando nosso cluster e explorando notebooks
- Comandos mágicos e utilities dos notebooks databricks
- Visão geral da arquitetura Databricks
- Visão geral da arquitetura Spark
- O que é e como criar um Data Lake na nuvem
- Como conectar o seu Data Lake no Databricks Parte I
- Como conectar o seu Data Lake no Databricks Parte II
3. Ingestão, manipulação e preparação de dados
- Aprofundando nos requisitos do projeto
- Lendo dados em CSV e definindo esquemas dos dados
- Aplicando transformações nas colunas e salvando o resultado
- Desafio Realizando o seu primeiro ETL
- Sugestão do instrutor para resolver o desafio
- Lendo dados em JSON
- Lendo dados em múltiplos CSV ao mesmo tempo
- O que é e para que serve o particionamento de dados
4. Workflows no Databricks
- Entendendo a orquestração dos notebooks
- Executando notebooks dentro de outro notebook para melhorar nosso código
- Definindo parâmetros de notebook para o seu código
- O que é e como criar o seu primeiro workflow
- Executando notebooks em sequência via Jobs Databricks
- Monitorando suas execuções
5. Transformações de dados avançadas
- Refinando os requisitos do projeto
- Aplicando filtros nos seus dados
- Unindo dados através de joins
- Desafio/ unindo tabelas e aplicando filtros
- Sugestão do instrutor para resolver o desafio
- Manipulando datas no Databricks
- Principais agregações de dados
- Conhecendo as window functions no Databricks
- Desafio/ realizando agregações através de window functions
6. Databricks SQL
- Introdução ao ecossistema SQL do Databricks
- Executando queries SQL no Databricks
- Diferenças entre tabelas gerenciadas e externas
- Escrevendo os resultados das transformações em tabelas SQL
- Hands-on/ analisando e visualizando resultados com SQL
7. Conectando os seus dados no Power BI
- Disponibilizando os dados do nosso workspace
- Conectando os seus dados no Power BI
- Aplicando a modelagem dimensional
- Criando as visualizações de dados
8. Delta Lake e Unity Catalog
- O que é e quais as vantagens do Delta Lake – Parte I
- O que é e quais as vantagens do Delta Lake – Parte II
- O que é e quais as vantagens do Delta Lake – Parte III
- O que é e quais as vantagens do Unity Catalog
9. Melhores práticas de gestão do ambiente Databricks
- Entendendo a gestão de usuários e grupos
- Como aplicar segurança e acessos a tabelas
- Aplicando segurança de chaves com o Azure Key Vault
10. Tópicos Bônus
- Entendendo a API de dados de futebol
- Lendo dados da API no Databricks
- Introdução ao Azure Data Factory – Companheiro ideal do Databricks
- Introdução ao Machine Learning no Databricks
- Encerramento do curso
11. Feedback
- Pesquisa de Feedback
- Compartilhe sua História
Conheça seu instrutor
Fábio Marquez
Engenheiro de Dados
Fundamentos de Análise de Dados
Ganhe um Certificado de peso da Xperiun e compartilhe sua Conquista no LinkedIn em apenas 1-clique
Este e mais dezenas de outros cursos disponíveis na Formação em Análise de Dados
Comece a formação agora mesmo e conte com um catálogo completo de tudo que você precisa para alcançar o topo da carreira em Análise de Dados.
Voe mais alto com a Formação em Análise de Dados
Comunidade
Participe de um ambiente virtual exclusivo para tirar dúvidas, ter contato direto com empresas e profissionais para fazer Network.
Autonomia
Seja o protagonista do seu aprendizado. Monte o seu cronograma de estudos e escolha qual caminho percorrer!
Portfólio Incomparável
Tenha acesso instantâneo a base de dados de grandes empresas e soluções comentadas de análises, para deixar o seu Portfólio brilhando com Dashboards Premium.
Evolução Constante
Além da Formação completa em Análise de Dados, você tem acesso a novos cursos todo mês. Esteja sempre um passo à frente.
Professores
Estude com uma equipe de professores qualificados, liderados com Leonardo Karpinski. O mestre é altamente reconhecido, certificado pela Microsoft, e já treinou mais de 35 mil alunos.
Gamificação
Teste seus conhecimentos de forma empolgante com desafios práticos e dinâmicos, que vão te deixar cada vez mais próximo do seu objetivo.
Tenha acesso a este e dezenas de outros cursos inscrevendo-se na Formação em Análise de Dados
Pro
- Trilha 1 - Power BI Fundamentals
- Trilha 2 - Data Analyst Professional
- Trilha 3 - Data Solutions Expert
- Trilha 4 - Data & Analytics Specialist
- Certificado reconhecido pelo MEC
- Avaliações, Desafios e Credenciais
- Comunidade no Discord
- Portfólio Integrado
- Marketplace de Profissionais
- Planos de Estudo
- Fórum
- +40 Business Cases
- Biblioteca Ultra com +200h
Faça o upgrade quando desejar.
Mais Popular
Premium
- Trilha 1 - Power BI Fundamentals
- Trilha 2 - Data Analyst Professional
- Trilha 3 - Data Solutions Expert
- Trilha 4 - Data & Analytics Specialist
- Certificado reconhecido pelo MEC
- Avaliações, Desafios e Credenciais
- Comunidade no Discord
- Portfólio Integrado
- Marketplace de Profissionais
- Planos de Estudo
- Fórum
- +40 Business Cases
- Biblioteca Ultra com +200h
Faça o upgrade quando desejar.
Ultra
- Trilha 1 - Power BI Fundamentals
- Trilha 2 - Data Analyst Professional
- Trilha 3 - Data Solutions Expert
- Trilha 4 - Data & Analytics Specialist
- Certificado reconhecido pelo MEC
- Avaliações, Desafios e Credenciais
- Comunidade no Discord
- Portfólio Integrado
- Marketplace de Profissionais
- Planos de Estudo
- Fórum
- +40 Business Cases
- Biblioteca Ultra com +200h
Garantia incondicional
de 7 dias
Faça a sua inscrição, conheça a nossa Plataforma em detalhes, caso entenda que a Formação em Análise de Dados não é para você, nós devolvemos 100% do seu investimento.