Об этом курсе
4.7
Оценки: 1,665
Рецензии: 351
Специализация
100% online

100% online

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Часов на завершение

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: 6 hours/week...
Доступные языки

Английский

Субтитры: Английский...

Приобретаемые навыки

Scala ProgrammingBig DataApache SparkSQL
Специализация
100% online

100% online

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Часов на завершение

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: 6 hours/week...
Доступные языки

Английский

Субтитры: Английский...

Программа курса: что вы изучите

Неделя
1
Часов на завершение
12 ч. на завершение

Getting Started + Spark Basics

Get up and running with Scala on your computer. Complete an example assignment to familiarize yourself with our unique way of submitting assignments. In this week, we'll bridge the gap between data parallelism in the shared memory scenario (learned in the Parallel Programming course, prerequisite) and the distributed scenario. We'll look at important concerns that arise in distributed systems, like latency and failure. We'll go on to cover the basics of Spark, a functionally-oriented framework for big data processing in Scala. We'll end the first week by exercising what we learned about Spark by immediately getting our hands dirty analyzing a real-world data set....
Reading
7 видео (всего 105 мин.), 5 материалов для самостоятельного изучения, 3 тестов
Video7 видео
Data-Parallel to Distributed Data-Parallel10мин
Latency24мин
RDDs, Spark's Distributed Collection9мин
RDDs: Transformation and Actions16мин
Evaluation in Spark: Unlike Scala Collections!20мин
Cluster Topology Matters!8мин
Reading5 материала для самостоятельного изучения
Tools setup10мин
Eclipse tutorial10мин
Intellij IDEA Tutorial10мин
Sbt tutorial10мин
Submitting solutions10мин
Неделя
2
Часов на завершение
7 ч. на завершение

Reduction Operations & Distributed Key-Value Pairs

This week, we'll look at a special kind of RDD called pair RDDs. With this specialized kind of RDD in hand, we'll cover essential operations on large data sets, such as reductions and joins....
Reading
4 видео (всего 59 мин.), 2 тестов
Video4 видео
Pair RDDs6мин
Transformations and Actions on Pair RDDs20мин
Joins17мин
Неделя
3
Часов на завершение
1 ч. на завершение

Partitioning and Shuffling

This week we'll look at some of the performance implications of using operations like joins. Is it possible to get the same result without having to pay for the overhead of moving data over the network? We'll answer this question by delving into how we can partition our data to achieve better data locality, in turn optimizing some of our Spark jobs....
Reading
4 видео (всего 57 мин.)
Video4 видео
Partitioning14мин
Optimizing with Partitioners11мин
Wide vs Narrow Dependencies16мин
Неделя
4
Часов на завершение
8 ч. на завершение

Structured data: SQL, Dataframes, and Datasets

With our newfound understanding of the cost of data movement in a Spark job, and some experience optimizing jobs for data locality last week, this week we'll focus on how we can more easily achieve similar optimizations. Can structured data help us? We'll look at Spark SQL and its powerful optimizer which uses structure to apply impressive optimizations. We'll move on to cover DataFrames and Datasets, which give us a way to mix RDDs with the powerful automatic optimizations behind Spark SQL....
Reading
5 видео (всего 133 мин.), 2 тестов
Video5 видео
Spark SQL17мин
DataFrames (1)26мин
DataFrames (2)30мин
Datasets43мин
4.7
Формирование карьерного пути

10%

начал новую карьеру, пройдя эти курсы
Карьерные преимущества

83%

получил значимые преимущества в карьере благодаря этому курсу
Продвижение по карьерной лестнице

12%

стал больше зарабатывать или получил повышение

Лучшие рецензии

автор: CCJun 8th 2017

The sessions where clearly explained and focused. Some of the exercises contained slightly confusing hints and information, but I'm sure those mistakes will be ironed out in future iterations. Thanks!

автор: CRApr 10th 2017

Great introduction to spark. Fun assignments. Since it was the first ever session, there were quite a few kinks with the assignments. But the discussion forums rescued me any time I was stuck.

Преподаватель

Avatar

Dr. Heather Miller

Research Scientist
EPFL

О École Polytechnique Fédérale de Lausanne

О специализации ''Functional Programming in Scala'

Discover how to write elegant code that works the first time it is run. This Specialization provides a hands-on introduction to functional programming using the widespread programming language, Scala. It begins from the basic building blocks of the functional paradigm, first showing how to use these blocks to solve small problems, before building up to combining these concepts to architect larger functional programs. You'll see how the functional paradigm facilitates parallel and distributed programming, and through a series of hands on examples and programming assignments, you'll learn how to analyze data sets small to large; from parallel programming on multicore architectures, to distributed programming on a cluster using Apache Spark. A final capstone project will allow you to apply the skills you learned by building a large data-intensive application using real-world data....
Functional Programming in Scala

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.