データ パイプラインは通常、Extract-Load(抽出、読み込み)、Extract-Load-Transform(抽出、読み込み、変換)、Extract-Transform-Load(抽出、変換、読み込み)のいずれかの方式に分類されます。このコースでは、どの方式をどのような場合にバッチデータに対して使用すべきかを説明します。また、Google Cloud Platform 上のデータ変換技術(BigQuery など)、Cloud Dataproc での Spark の実行、Cloud Data Fusion でのパイプライン グラフ、Cloud Dataflow によるサーバーレスのデータ処理についても取り上げます。Qwiklabs を使用して、Google Cloud Platform でデータ パイプライン コンポーネントを実際に構築できます。
от партнера
Об этом курсе
от партнера

Google Cloud
We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success.
Программа курса: что вы изучите
はじめに
このモジュールでは、本コースの内容とアジェンダを紹介します
バッチデータ パイプラインの概要
このモジュールでは、EL、ELT、ETL というデータ読み込み方式と、各方式をどのような場合に使うべきかを確認します
Cloud Dataproc での Spark の実行
このモジュールでは、Cloud Dataproc で Hadoop を実行する方法、GCS の活用法、Dataproc ジョブを最適化する方法を説明します。
Cloud Data Fusion と Cloud Composer によるデータ パイプライン管理
このモジュールでは、Cloud Data Fusion と Cloud Composer を使ってデータ パイプラインを管理する方法を説明します。
Cloud Dataflow によるサーバーレスのデータ処理
このモジュールでは、Cloud Dataflow を使ったデータ処理パイプライン構築を取り上げます。
まとめ
このモジュールでは、本コースで学んだトピックを復習します
Часто задаваемые вопросы
Можно ли ознакомиться с курсом до регистрации?
Что я получу, зарегистрировавшись на курс?
Когда я получу сертификат о прохождении курса?
Почему я не могу прослушать этот курс?
Остались вопросы? Посетите Центр поддержки учащихся.