Об этом курсе
4.1
Оценки: 154
Рецензии: 29
Специализация
100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Часов на завершение

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: There is about 3-4 hours of video lectures per week. Each week's quiz takes about 30 minutes. ...
Доступные языки

Английский

Субтитры: Английский, Корейский...

Приобретаемые навыки

GraphsDistributed ComputingBig DataMachine Learning
Специализация
100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Часов на завершение

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: There is about 3-4 hours of video lectures per week. Each week's quiz takes about 30 minutes. ...
Доступные языки

Английский

Субтитры: Английский, Корейский...

Программа курса: что вы изучите

Неделя
1
Часов на завершение
3 ч. на завершение

Course Orientation

You will become familiar with the course, your classmates, and our learning environment. The orientation will also help you obtain the technical skills required for the course....
Reading
1 видео (всего 26 мин.), 4 материалов для самостоятельного изучения, 1 тест
Reading4 материала для самостоятельного изучения
Syllabus10мин
About the Discussion Forums10мин
Updating Your Profile10мин
Social Media10мин
Quiz1 практическое упражнение
Orientation Quiz10мин
Часов на завершение
2 ч. на завершение

Module 1: Spark, Hortonworks, HDFS, CAP

In Module 1, we introduce you to the world of Big Data applications. We start by introducing you to Apache Spark, a common framework used for many different tasks throughout the course. We then introduce some Big Data distro packages, the HDFS file system, and finally the idea of batch-based Big Data processing using the MapReduce programming paradigm. ...
Reading
13 видео (всего 108 мин.), 1 материал для самостоятельного изучения, 1 тест
Video13 видео
1.1.2 Apache Spark11мин
1.1.3 Spark Example: Log Mining9мин
1.1.4 Spark Example: Logistic Regression7мин
1.1.5 RDD Fault Tolerance4мин
1.1.6 Interactive Spark4мин
1.1.7 Spark Implementation4мин
1.2.1 Introduction to Distros3мин
1.2.2 Hortonworks23мин
1.2.3 Cloudera CDH2мин
1.2.4 MapR Distro2мин
1.3.1 HDFS Introduction15мин
1.3.2 YARN and MESOS9мин
Reading1 материал для самостоятельного изучения
Module 1 Overview10мин
Quiz1 практическое упражнение
Module 1 Quiz30мин
Неделя
2
Часов на завершение
6 ч. на завершение

Module 2: Large Scale Data Storage

In this module, you will learn about large scale data storage technologies and frameworks. We start by exploring the challenges of storing large data in distributed systems. We then discuss in-memory key/value storage systems, NoSQL distributed databases, and distributed publish/subscribe queues. ...
Reading
24 видео (всего 303 мин.), 1 материал для самостоятельного изучения, 1 тест
Video24 видео
2.1.1 Introduction to MapReduce with Spark3мин
2.1.2 MapReduce: Motivation15мин
2.1.3 MapReduce Programming Model with Spark9мин
2.1.4 MapReduce Example: Word Count9мин
2.1.5 MapReduce Example: Pi Estimation & Image Smoothing15мин
2.1.6 MapReduce Example: Page Rank13мин
2.1.7 MapReduce Summary4мин
2.2.1 Eventual Consistency – Part 110мин
2.2.2 Eventual Consistency – Part 220мин
2.2.3 Consistency Trade-Offs4мин
2.2.4 ACID and BASE19мин
2.2.5 Zookeeper and Paxos: Introduction10мин
2.2.6 Paxos17мин
2.2.7 Zookeeper16мин
2.3.1 Cassandra Introduction27мин
2.3.2 Redis7мин
2.3.3 Redis Demonstration14мин
2.4.1 HBase Usage API15мин
2.4.2 HBase Internals - Part 117мин
2.4.3 HBase Internals - Part 29мин
2.4.4 Spark SQL8мин
2.5.5 Spark SQL Demo8мин
2.5.1 Kafka17мин
Reading1 материал для самостоятельного изучения
Module 2 Overview10мин
Quiz1 практическое упражнение
Module 2 Quiz30мин
Неделя
3
Часов на завершение
4 ч. на завершение

Module 3: Streaming Systems

This module introduces you to real-time streaming systems, also known as Fast Data. We talk about Apache Storm in length, Apache Spark Streaming, and Lambda and Kappa architectures. Finally, we contrast all these technologies as a streaming ecosystem. ...
Reading
18 видео (всего 216 мин.), 1 материал для самостоятельного изучения, 1 тест
Video18 видео
3.1.1 Streaming Introduction9мин
3.1.2 "Big Data Pipelines: The Rise of Real-Time"7мин
3.1.3 Storm Introduction: Protocol Buffers & Thrift15мин
3.1.4 A Storm Word Count Example3мин
3.1.5 Writing the Storm Word Count Example10мин
3.1.6 Storm Usage at Yahoo3мин
3.2.1 Anchoring and Spout Replay17мин
3.2.2 Trident: Exactly Once Processing10мин
3.3.1 Inside Apache Storm9мин
3.3.2 The Structure of a Storm Cluster4мин
3.3.3 Using Thrift in Storm10мин
3.3.4 How Storm Schedulers Work12мин
3.3.5 Scaling Storm to 4000 Nodes14мин
3.3.6 Q&A with Bobby Evans (Yahoo) on Storm32мин
3.4.1 Spark Streaming18мин
3.4.2 Lambda and Kappa Architecture4мин
3.4.3 Streaming Ecosystem24мин
Reading1 материал для самостоятельного изучения
Module 3 Overview10мин
Quiz1 практическое упражнение
Module 3 Quiz30мин
Неделя
4
Часов на завершение
4 ч. на завершение

Module 4: Graph Processing and Machine Learning

In this module, we discuss the applications of Big Data. In particular, we focus on two topics: graph processing, where massive graphs (such as the web graph) are processed for information, and machine learning, where massive amounts of data are used to train models such as clustering algorithms and frequent pattern mining. We also introduce you to deep learning, where large data sets are used to train neural networks with effective results. ...
Reading
18 видео (всего 173 мин.), 1 материал для самостоятельного изучения, 1 тест
Video18 видео
4.1.2 Pregel - Part 17мин
4.1.3 Pregel - Part 211мин
4.1.4 Pregel - Part 36мин
4.1.5 Giraph Introduction6мин
4.1.6 Giraph Example4мин
4.1.7 Spark GraphX15мин
4.2.1 Big Data Machine Learning Introduction13мин
4.2.2 Mahout: Introduction8мин
4.2.3 Mahout kmeans5мин
4.2.4 Mahout: Naïve Bayes9мин
4.2.5 Mahout: fpm6мин
4.2.6 Spark Naïve Bayes2мин
4.2.7 Spark fpm2мин
4.2.8 Spark ML/MLlib11мин
4.2.9 Introduction to Deep Learning20мин
4.2.10 Deep Neural Network Systems17мин
4.3.1 Closing Remarks1мин
Reading1 материал для самостоятельного изучения
Module 4 Overview10мин
Quiz1 практическое упражнение
Module 4 Quiz30мин
4.1

Лучшие рецензии

автор: UNApr 10th 2018

My understanding of Big Data technologies was really enhanced by this course. I have decided to pursue more of these underlying technologies after this course. Good job

автор: MSNov 27th 2017

Very good introduction of application concepts of cloud data computing. Thank You!

Преподавателя

Avatar

Reza Farivar

Data Engineering Manager at Capital One, Adjunct Research Assistant Professor of Computer Science
Department of Computer Science
Avatar

Roy H. Campbell

Professor of Computer Science
Department of Computer Science
Graduation Cap

Start working towards your Master's degree

This курс is part of the 100% online Master of Computer Science in Data Science from University of Illinois at Urbana-Champaign. If you are admitted to the full program, your courses count towards your degree learning.

О University of Illinois at Urbana-Champaign

The University of Illinois at Urbana-Champaign is a world leader in research, teaching and public engagement, distinguished by the breadth of its programs, broad academic excellence, and internationally renowned faculty and alumni. Illinois serves the world by creating knowledge, preparing students for lives of impact, and finding solutions to critical societal needs. ...

О специализации ''Cloud Computing'

The Cloud Computing Specialization takes you on a tour through cloud computing systems. We start in in the middle layer with Cloud Computing Concepts covering core distributed systems concepts used inside clouds, move to the upper layer of Cloud Applications and finally to the lower layer of Cloud Networking. We conclude with a project that allows you to apply the skills you've learned throughout the courses. The first four courses in this Specialization form the lecture component of courses in our online Master of Computer Science Degree in Data Science. You can apply to the degree program either before or after you begin the Specialization....
Cloud Computing

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.