Об этом курсе
Недавно просмотрено: 10,750

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Начальный уровень

Прибл. 19 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Английский

Субтитры: Английский

Чему вы научитесь

  • Check

    Understand the basics of SELECT statements

  • Check

    Understand how and why to filter results

  • Check

    Explore grouping and aggregation to answer analytic questions

  • Check

    Work with sorting and limiting results

Приобретаемые навыки

Apache HiveApache ImpalaData AnalysisBig DataSQL

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Начальный уровень

Прибл. 19 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Английский

Субтитры: Английский

Программа курса: что вы изучите

Неделя
1
3 ч. на завершение

Orientation to SQL on Big Data

...
9 видео ((всего 47 мин.)), 5 материалов для самостоятельного изучения, 2 тестов
9 видео
Review and Preparation4мин
Using the Hue Query Editors7мин
Running SQL Utility Statements6мин
Running SQL SELECT Statements5мин
Understanding Different SQL Interfaces4мин
Overview of Beeline and Impala Shell2мин
Using Beeline8мин
Using Impala Shell3мин
5 материала для самостоятельного изучения
Instructions for Downloading and Installing the Exercise Environment30мин
Troubleshooting the VM5мин
(Optional) What about Spark SQL?10мин
Expectations for Learners10мин
(Optional) Using Other SQL Engines10мин
2 практического упражнения
Week 1 Core Quiz30мин
Week 1 Honors Quiz5мин
Неделя
2
3 ч. на завершение

SQL SELECT Essentials

...
16 видео ((всего 83 мин.)), 4 материалов для самостоятельного изучения, 2 тестов
16 видео
SQL SELECT Building Blocks2мин
Introduction to the SELECT List7мин
Expressions and Operators7мин
Data Types6мин
Column Aliases5мин
Built-In Functions7мин
Data Type Conversion5мин
The DISTINCT Keyword5мин
Introduction to the FROM Clause3мин
Identifiers7мин
Formatting SELECT Statements4мин
Using Beeline in Non-Interactive Mode5мин
Using Impala Shell in Non-Interactive Mode4мин
Formatting the Output of Beeline and Impala Shell4мин
Saving Hive and Impala Query Results to a File5мин
4 материала для самостоятельного изучения
Order of Operations5мин
Division and Modulo Operators15мин
Common String Functions15мин
Case (In)Sensitivity in SQL10мин
2 практического упражнения
Week 2 Core Quiz30мин
Week 2 Honors Quiz5мин
Неделя
3
3 ч. на завершение

Filtering Data

...
14 видео ((всего 85 мин.)), 6 материалов для самостоятельного изучения, 2 тестов
14 видео
About the Datasets4мин
Introduction to the WHERE Clause2мин
Using Expressions in the WHERE Clause9мин
Comparison Operators9мин
Data Types and Precision4мин
Logical Operators7мин
Other Relational Operators4мин
Understanding Missing Values8мин
Handling Missing Values6мин
Conditional Functions9мин
Using Variables with Beeline and Impala Shell7мин
Calling Beeline and Impala Shell from Scripts6мин
Querying Hive and Impala in Scripts and Applications2мин
6 материала для самостоятельного изучения
Data Reference5мин
(Optional) Unicode Characters10мин
Working with Literal Strings15мин
Missing Values with Logical Operators10мин
Missing Values in String Columns5мин
(Optional Exercise) Change VM Desktop Color30мин
2 практического упражнения
Week 3 Core Quiz30мин
Week 3 Honors Quiz5мин
Неделя
4
3 ч. на завершение

Grouping and Aggregating Data

...
15 видео ((всего 82 мин.)), 6 материалов для самостоятельного изучения, 2 тестов
15 видео
Introduction to Aggregation2мин
Common Aggregate Functions2мин
Using Aggregate Functions in the SELECT Statement8мин
Introduction to the GROUP BY Clause6мин
Choosing an Aggregate Function and Grouping Column4мин
Grouping Expressions6мин
Grouping and Aggregation, Together and Separately5мин
NULL Values in Grouping and Aggregation4мин
The COUNT Function7мин
Tips for Applying Grouping and Aggregation7мин
Filtering on Aggregates2мин
The HAVING Clause8мин
Understanding Hive and Impala Version Differences10мин
Understanding Hue Version Differences2мин
6 материала для самостоятельного изучения
COUNT(*) and SUM(1)5мин
Interpreting Aggregates: Populations and Samples10мин
The least and greatest Functions5мин
Why Aggregate Expressions Ignore NULL Values5мин
(Optional) Shortcuts for Grouping10мин
How Grouping and Aggregation Can Mislead10мин
2 практического упражнения
Week 4 Core Quiz30мин
Week 4 Honors Quiz10мин

Преподаватели

Avatar

Ian Cook

Senior Curriculum Developer
Cloudera

О Cloudera

At Cloudera, we believe that data can make what is impossible today, possible tomorrow. We empower people to transform complex data into clear and actionable insights. Cloudera delivers an enterprise data cloud for any data, anywhere, from the Edge to AI. Powered by the relentless innovation of the open source community, Cloudera advances digital transformation for the world’s largest enterprises. ...

О специализации ''Modern Big Data Analysis with SQL'

This Specialization teaches the essential skills for working with large-scale data using SQL. Maybe you are new to SQL and you want to learn the basics. Or maybe you already have some experience using SQL to query smaller-scale data with relational databases. Either way, if you are interested in gaining the skills necessary to query big data with modern distributed SQL engines, this Specialization is for you. Most courses that teach SQL focus on traditional relational databases, but today, more and more of the data that’s being generated is too big to be stored there, and it’s growing too quickly to be efficiently stored in commercial data warehouses. Instead, it’s increasingly stored in distributed clusters and cloud storage. These data stores are cost-efficient and infinitely scalable. To query these huge datasets in clusters and cloud storage, you need a newer breed of SQL engine: distributed query engines, like Hive, Impala, Presto, and Drill. These are open source SQL engines capable of querying enormous datasets. This Specialization focuses on Hive and Impala, the most widely deployed of these query engines. This Specialization is designed to provide excellent preparation for the Cloudera Certified Associate (CCA) Data Analyst certification exam. You can earn this certification credential by taking a hands-on practical exam using the same SQL engines that this Specialization teaches—Hive and Impala....
Modern Big Data Analysis with SQL

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

  • • Windows, macOS, or Linux operating system (iPads and Android tablets will not work) • 64-bit operating system (32-bit operating systems will not work) • 8 GB RAM or more • 25GB free disk space or more • Intel VT-x or AMD-V virtualization support enabled (on Mac computers with Intel processors, this is always enabled; on Windows and Linux computers, you might need to enable it in the BIOS) • For Windows XP computers only: You must have an unzip utility such as 7-Zip or WinZip installed (Windows XP’s built-in unzip utility will not work)

Остались вопросы? Посетите Центр поддержки учащихся.