De forma geral, os pipelines de dados se enquadram em um dos seguintes modelos: extrair-carregar, extrair-carregar-transformar ou extrair-transformar-carregar. Neste curso, descrevemos qual modelo deve ser usado e quando usá-lo para os dados em lote. Também tratamos de diversas tecnologias de transformação de dados disponíveis no Google Cloud Platform, como o BigQuery, a execução do Spark no Cloud Dataproc, os gráficos de pipeline no Cloud Data Fusion e o processamento de dados sem servidor com o Cloud Dataflow. Na atividade prática do Qwiklabs, os participantes criarão componentes de pipeline de dados no Google Cloud Platform.
Этот курс входит в специализацию ''Специализация Data Engineer, Big Data and ML on Google Cloud em Português'
от партнера
Об этом курсе
от партнера

Google Cloud
We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success.
Программа курса: что вы изучите
Introdução
Neste módulo, apresentaremos o curso e a programação
Introdução aos pipelines de dados em lote
Neste módulo, falaremos sobre os diferentes métodos de carregamento de dados: EL, ELT e ETL, e quando usar cada um deles
Como executar o Spark no Cloud Dataproc
Neste módulo, mostraremos como executar o Hadoop no Cloud Dataproc, como usar o GCS e como otimizar seus jobs do Dataproc
Gerencie pipelines de dados com o Cloud Data Fusion e o Cloud Composer
Neste módulo, mostraremos como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
Processamento de dados sem servidor com o Cloud Dataflow
Neste módulo, explicaremos como usar o Cloud Dataflow para criar pipelines de processamento de dados
Resumo
Neste módulo, revisaremos os temas abordados no curso
Рецензии
- 5 stars78,57 %
- 4 stars14,28 %
- 3 stars7,14 %
Лучшие отзывы о курсе BUILDING BATCH DATA PIPELINES ON GCP EM PORTUGUÊS BRASILEIRO
Apresentação fantastica sobre as principais ferramentas para criação e gerenciamento de pipelines.
Специализация Data Engineer, Big Data and ML on Google Cloud em Português: общие сведения
Nesta especialização on-line intensiva de cinco semanas, os participantes terão uma introdução prática sobre como projetar e criar sistemas de processamento de dados no Google Cloud Platform. Por meio de uma combinação de apresentações, demonstrações e laboratórios práticos, os participantes aprenderão a projetar sistemas de processamento de dados, criar canais completos e análises de dados e desenvolver soluções de aprendizado de máquina. Neste curso, abordamos dados estruturados, não estruturados e de streaming.

Часто задаваемые вопросы
Можно ли ознакомиться с курсом до регистрации?
Что я получу, зарегистрировавшись на курс?
Когда я получу сертификат о прохождении курса?
Почему я не могу прослушать этот курс?
Можно ли получить финансовую помощь?
Остались вопросы? Посетите Центр поддержки учащихся.