Os pipelines de dados geralmente se encaixam em um dos três paradigmas: extração-carregamento, extração-carregamento-transformação ou extração-transformação-carregamento. Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
Этот курс входит в специализацию ''Специализация Data Engineer, Big Data and ML on Google Cloud em Português'
от партнера
Об этом курсе
Чему вы научитесь
Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL (e quando cada um deve ser usado)
Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc
Usar o Dataflow para criar pipelines de processamento de dados
Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer
от партнера
Программа курса: что вы изучите
Introdução
Introdução à criação de pipelines de dados em lote
Como executar o Spark no Dataproc
Processamento de dados sem servidor com o Dataflow
Рецензии
- 5 stars78,57 %
- 4 stars14,28 %
- 3 stars7,14 %
Лучшие отзывы о курсе BUILDING BATCH DATA PIPELINES ON GCP EM PORTUGUÊS BRASILEIRO
Apresentação fantastica sobre as principais ferramentas para criação e gerenciamento de pipelines.
Специализация Data Engineer, Big Data and ML on Google Cloud em Português: общие сведения

Часто задаваемые вопросы
Можно ли ознакомиться с курсом до регистрации?
Что я получу, зарегистрировавшись на курс?
Когда я получу сертификат о прохождении курса?
Почему я не могу прослушать этот курс?
Можно ли получить финансовую помощь?
Остались вопросы? Посетите Центр поддержки учащихся.