Building Batch Data Pipelines on GCP em Português Brasileiro

This course is part of Data Engineer, Big Data and ML on Google Cloud em Português Specialization

Taught in Portuguese (Brazil)

Instructor: Google Cloud Training

Included with Coursera Plus

Learn more

Course

Gain insight into a topic and learn the fundamentals

4.7

(15 reviews)

Intermediate level

Some related experience required

16 hours (approximately)

Flexible schedule

Learn at your own pace

View course modules

What you'll learn

Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL (e quando cada um deve ser usado)
Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc
Usar o Dataflow para criar pipelines de processamento de dados
Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer

Details to know

Shareable certificate

Add to your LinkedIn profile

Assessments

4 quizzes

Course

Gain insight into a topic and learn the fundamentals

4.7

(15 reviews)

Intermediate level

Some related experience required

16 hours (approximately)

Flexible schedule

Learn at your own pace

View course modules

See how employees at top companies are mastering in-demand skills

Learn more about Coursera for Business

Build your subject-matter expertise

This course is part of the Data Engineer, Big Data and ML on Google Cloud em Português Specialization

When you enroll in this course, you'll also be enrolled in this Specialization.

Learn new concepts from industry experts
Gain a foundational understanding of a subject or tool
Develop job-relevant skills with hands-on projects
Earn a shareable career certificate

Earn a career certificate

Add this credential to your LinkedIn profile, resume, or CV

Share it on social media and in your performance review

There are 6 modules in this course

Os pipelines de dados geralmente se encaixam em um dos três paradigmas: extração-carregamento, extração-carregamento-transformação ou extração-transformação-carregamento. Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.

Neste módulo, vamos apresentar o curso e a programação

What's included

1 video

Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL (e quando cada um deve ser usado)

What's included

6 videos1 quiz

Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.

What's included

11 videos1 quiz1 app item

11 videosTotal 48 minutes

Introdução ao módulo0 minutesPreview module
O ecossistema Hadoop4 minutes
Como executar o Hadoop no Dataproc10 minutes
Usar o Cloud Storage em vez do HDFS6 minutes
Como otimizar o Dataproc2 minutes
Como otimizar o armazenamento do Dataproc9 minutes
Como otimizar os modelos e o escalonamento automático do Dataproc5 minutes
Como otimizar o monitoramento do Dataproc3 minutes
Introdução ao laboratório: como executar os jobs do Apache Spark no Dataproc0 minutes
Coursera: Guia inicial do Google Cloud Platform e do Qwiklabs4 minutes
Resumo0 minutes

1 quizTotal 6 minutes

Como executar o Spark no Dataproc6 minutes

1 app itemTotal 60 minutes

Laboratório: como executar os jobs do Apache Spark no Dataproc60 minutes

Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados

What's included

14 videos1 quiz6 app items

14 videosTotal 35 minutes

Introdução ao módulo0 minutesPreview module
Introdução ao Dataflow5 minutes
Por que os clientes valorizam o Dataflow2 minutes
Como criar pipelines do Dataflow no código3 minutes
Principais considerações sobre a criação de pipelines2 minutes
Como transformar dados usando o PTransforms3 minutes
Introdução ao laboratório: como criar um pipeline simples do Dataflow0 minutes
Agregação com o GroupByKey e Combine5 minutes
Introdução ao laboratório: MapReduce no Dataflow0 minutes
Entradas secundárias e janelas de dados4 minutes
Introdução ao laboratório: como praticar usando as entradas secundárias de pipeline0 minutes
Como criar e reutilizar os modelos de pipeline3 minutes
Pipelines de SQL do Dataflow0 minutes
Resumo2 minutes

1 quizTotal 4 minutes

Processamento de dados sem servidor com o Dataflow4 minutes

6 app itemsTotal 540 minutes

Análise de dados sem servidor com o Dataflow: um pipeline simples do Dataflow (Python)90 minutes
Análise de dados sem servidor com o Dataflow: MapReduce no Dataflow (Python)90 minutes
Análise de dados sem servidor com o Dataflow: entradas secundárias (Python)90 minutes
Análise de dados sem servidor com o Dataflow: um pipeline simples do Dataflow (Java)90 minutes
Análise de dados sem servidor com o Dataflow: MapReduce no Dataflow (Java)90 minutes
Análise de dados sem servidor com o Dataflow: entradas secundárias (Java)90 minutes

Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.

What's included

13 videos1 quiz2 app items

13 videosTotal 33 minutes

Introdução ao módulo0 minutesPreview module
Introdução ao Cloud Data Fusion3 minutes
Componentes do Cloud Data Fusion1 minute
IU do Cloud Data Fusion1 minute
Criar um pipeline4 minutes
Saiba mais sobre o uso de dados com o Wrangler1 minute
Introdução ao laboratório: como criar e executar um gráfico de pipeline no Cloud Data Fusion0 minutes
Faça a orquestração do trabalho entre o Google Cloud e o Cloud Composer1 minute
Ambiente do Apache Airflow1 minute
DAGs e operadores7 minutes
Programação do fluxo de trabalho5 minutes
Monitoring e Logging3 minutes
Introdução ao laboratório: uma introdução ao Cloud Composer0 minutes

1 quizTotal 2 minutes

Gerenciamento de pipelines de dados com o Cloud Data Fusion e o Cloud Composer2 minutes

2 app itemsTotal 240 minutes

Laboratório: como criar e executar um gráfico de pipeline com o Data Fusion150 minutes
Laboratório: uma introdução ao Cloud Composer90 minutes

Resumo do curso

What's included

1 video

Instructor

Instructor ratings

5.0 (5 ratings)

Google Cloud Training

Google Cloud

1,307 Courses2,503,669 learners

Offered by

Google Cloud

Recommended if you're interested in Cloud Computing

CertNexus
Extract, Transform, and Load Data
Course

Why people choose Coursera for their career

Felipe M.

Learner since 2018

"To be able to take courses at my own pace and rhythm has been an amazing experience. I can learn whenever it fits my schedule and mood."

Jennifer J.

Learner since 2020

"I directly applied the concepts and skills I learned from my courses to an exciting new project at work."

Larry W.

Learner since 2021

"When I need courses on topics that my university doesn't offer, Coursera is one of the best places to go."

Chaitanya A.

"Learning isn't just about being better at your job: it's so much more than that. Coursera allows me to learn without limits."

New to Cloud Computing? Start here.

Open new doors with Coursera Plus

Unlimited access to 7,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription

Learn more

Advance your career with an online degree

Earn a degree from world-class universities - 100% online

Explore degrees

Join over 3,400 global companies that choose Coursera for Business

Upskill your employees to excel in the digital economy

Learn more

Frequently asked questions

Yes, you can preview the first video and view the syllabus before you enroll. You must purchase the course to access content not included in the preview.

If you decide to enroll in the course before the session start date, you will have access to all of the lecture videos and readings for the course. You’ll be able to submit assignments once the session starts.

Once you enroll and your session begins, you will have access to all videos and other resources, including reading items and the course discussion forum. You’ll be able to view and submit practice assessments, and complete required graded assignments to earn a grade and a Course Certificate.

Building Batch Data Pipelines on GCP em Português Brasileiro

Course

What you'll learn

Details to know

Course

See how employees at top companies are mastering in-demand skills

Build your subject-matter expertise

Earn a career certificate

There are 6 modules in this course

Introdução

What's included

Introdução à criação de pipelines de dados em lote

What's included

Como executar o Spark no Dataproc

What's included

Processamento de dados sem servidor com o Dataflow

What's included

Gerenciamento de pipelines de dados com

What's included

Resumo do curso

What's included

Instructor

Offered by

Recommended if you're interested in Cloud Computing

Extract, Transform, and Load Data

Why people choose Coursera for their career

New to Cloud Computing? Start here.

Open new doors with Coursera Plus

Advance your career with an online degree

Join over 3,400 global companies that choose Coursera for Business

Frequently asked questions

Can I preview a course before enrolling?

When will I have access to the lectures and assignments?

What will I get when I enroll?

More questions