Chevron Left
Вернуться к Поиск структуры в данных

Отзывы учащихся о курсе Поиск структуры в данных от партнера Московский физико-технический институт

4.7
звезд
Оценки: 1,409
Рецензии: 158

О курсе

В машинном обучении встречаются задачи, где нужно изучить структуру данных, найти в них скрытые взаимосвязи и закономерности. Например, нам может понадобиться описать каждого клиента банка с помощью меньшего количества переменных — для этого можно использовать методы понижения размерности, основанные на матричных разложениях. Такие методы пытаются сформировать новые признаки на основе старых, сохранив как можно больше информации в данных. Другим примером может служить задача тематического моделирования, в которой для набора текстов нужно построить модель, объясняющую процесс формирования этих текстов из небольшого количества тем. Такие задачи назвают обучением без учителя. В отличие от обучения с учителем, в них не предполагают восстановление зависимости между объектами и целевой переменной. Из этого курса вы узнаете об алгоритмах кластеризации данных, с помощью которых, например, можно искать группы схожих клиентов мобильного оператора. Вы научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные. Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3....

Лучшие рецензии

PK
3 мая 2018 г.

Отличный вводный курс, как и вся специализация. Доступно и понятно изложены все базовые вещи, которые могут потребоваться в повседневной деятельности в качестве data scientist.

AA
8 янв. 2017 г.

Интересный курс, замечательные преподаватели. Есть моменты когда лекция довольно сложная, а тест простой, это оставляет тревожное ощущение недоученности :)

Фильтр по:

1–25 из 152 отзывов о курсе Поиск структуры в данных

автор: Шаланкин М Д

14 мар. 2019 г.

Курс достаточно старый, возникает много конфликтов версий, данные не обновляют. Ещё пока релевантная информация. UPD: (прошёл 5 курсов из этой специализации, никому не советую проходить больше двух первых, потому что цена - качество не соответсвуют)

автор: Kapitanov A

29 окт. 2019 г.

Курс интересный, но к сожалению есть много жирных минусов:

1) Последняя неделя - преподается скомканно и сумбурно. Лекций много, а практические материалы - недоработаны

2) Задание по программированию на 4 неделе (с gensim) - не адаптировано под современные версии. Для решения задач требуются танцы с бубнами и установка отдельных окружений со старыми версиями (правильную ещё и поискать надо!)

3) Последнее задание, которое не влияет на оценку (Постнауки) также неадаптировано и сделано на коленке. BigARTM это просто ужас. Местами вообще не понятно, что от обучающегося хотят.

4) Сама концепция использоваться старые и заброшенные библиотеки - так себе. В итоге у человека остается осадок в виде "как танцевать с бубном", а не как понижать размерность, кластеризовать данные и прочее.

5) В тетрадках на Python 3 в шапке указывают на каких версиях библиотек проверены задачи. Но по факту - они не проверены. В частности, так и не удалось победить NaN-ы в seaborn pairplot (при этом бОльшая часть сокурсников просто скопипастила чужие решения).

В остальном - курс неплохой, без этой части в ML и DS просто никуда. Отдельное спасибо Соколову Е. и Воронцову К. за качественную подачу материала.

автор: Мария Е Ч

25 июля 2018 г.

Курс всем хорош, но три звезды только за задание с анализом текстов, где нужна была устаревшая версия gensim. Об этом не предупредили в тексте задачи, а грейдер не принимал ответы, выдаваемые новой версией. Потратила много времени.

автор: Рогозин А

9 апр. 2020 г.

Большинство лекторов понятно объясняют материал - иными словами, говорят на человеческом языке. Домашние задания позволяют пощупать разнообразные методы, которые на самом деле применяются на практике - и это круто.

Проблемы с восприятием материала возникают только от лекций Воронцова про тематическое моделирование, так как он большую часть времени кидается формулами и матаном без плавного перехода к ним. Сразу заметен старый стиль преподавания из университета. Благо тема обработки текста лучше раскроется в пятом курсе этой специальности уже с другим лектором)

P.S. BigARTM - тихий ужас, так и не удалось его установить(

автор: Artem G

22 дек. 2019 г.

Все круто! Но хотелось бы использования более новых версий библиотек по тематическому моделированию!

автор: Константин А

31 окт. 2018 г.

Хорошая теоретическая основа, видео. Но задания все пора обновлять. Используются старые версии библиотек. В видео по установке и работе с библиотеками сильно устаревшая информация. Впрочем, это не сильно мешает понять тематическое моделирование.

автор: Mamedov M

19 нояб. 2019 г.

Большая-большая работа. Спасибо преподавателям, МФТИ, Яндексу за возможность изучать предмет таким невероятно крутым способом

автор: Баранов В М

16 нояб. 2020 г.

Начали за здравие, а кончили за упокой. Последняя неделя очень сырая. Большая часть материала проговаривается как заученный текст, без примеров и т.п. одни лишь двухэтажные формулы. ноутбуки с примерами недоделаны. И почему-то никто не хочет переделать задание для актуальной версии gensim. Это конечно опыт, но уж слишком болезненно он дается)

автор: Timur B

13 мая 2018 г.

Первые три недели интересные и методы рассмотрены важные. Тематическое моделирование, на мой взгляд, штука достаточно специфичная и многим она не понадобится совсем. Хотелось бы чего-то более общего. А так курс неплохой.

автор: milo h

22 нояб. 2019 г.

Я прекрасно понимаю, что материал расчитан на широкую аудиторию с разной степенью подготовки, но если вы поверхностно излагаете суть работы того или иного алгоритма, то будте добры не запутывать слушателя еще больше. Не надо вскользь употреблять каких-то глубоких терминов (прям сейчас могу вспомнить только "апостериорная вероятность"), это очень запутывает и демотивирует слушателя. Евгений, какой смысл в лекциях о теории вероятности показывать математические выкладки на слайдах и ничего о них не рассказывать? Вы только еще больше с толку сбиваете. Больше всего подгорает именно от ваших лекций.

Хотел поставить два, но из-за довольно полезных практических занятий ставлю три.

автор: Новоселов Е Д

27 июня 2020 г.

Все время просят установить python 2.7, кошмар, зачем мне ставить эту версию, только для выполнения конкретного задания? могли бы и обновить версию для третьего питона, почему курс не обновляется, до сих пор не понимаю....особенно это касается BigARTM. еще, в целом по пройденным курсам специализации видео с практическими занятиями также на втором питоне, а третьему ничего никакого внимания не уделяется от слова вообще. интересно, когда на это, наконец, обратят внимание авторы специализации, ведь годы материал де-факто не обновляется((

автор: Alex Z

7 июня 2020 г.

Старые версиии библиотек, курс не обновляется. Если не получается установить artm - делайте через гугл колаб, там все просто с установкой. Лекции Воронцова по тематическому моделированию состоят из голой теории, нет практических примеров, хотя тема очень интересная и примеры легко найти или придумать. Задания странные, половина проходится даже без знания курса, фит-предикт сделать на моделях и немного программирования.

автор: A B

16 июня 2020 г.

Старый, не поддерживаемый курс. Старый код, библиотеки, танцы с бубном.

автор: Покровский П В

5 нояб. 2020 г.

Стыдно вообще брать деньги за такое. Курс (особенно четвертая неделя) построен на безнадежно устаревших библиотеках, в заданиях предлагается "присылать на ручную проверку". Чтобы грейдер отработал - нужно неделю возиться с костылями в виде специфических версий библиотек, ставить питон 2.7 (конец 2020 алё!) и еще не факт, что сойдется. Разочарован.

автор: Задойный А

10 июня 2016 г.

После 2 курса здесь почти отдыхаешь (но именно что почти, многие задачи гораздо коварнее, чем кажутся на первый взгляд).

Курс не требует материала из 2, а вот 1 очень пригодится (разве что вы уже хорошо знакомы с python и не успели забыть линейную алгебру и матан со времён ВУЗа).

Курс не для новичков. С наскока не пройти. Но примеры, которые даются в курсе очень жизненные, а потому чувствуешь, что это не сухая академическая наука, а настоящая жизнь, то что применяется каждый день вокруг тебя почти везде: поиск, рекомендации фильмов, контекстная реклама в почте, «с этим товаром покупают» и «выбор редакции».

Отдельно довольно занятно то как с помощью описанных методов удаётся оптимизировать пространство признаков и превратить огромные массивы «информационного мусора» во вполне понятные и интерпретируемые даже человеческим глазом данные, графики, гистограммы, схемы…

Алексей З.

автор: Шляхов А В

9 июля 2020 г.

Отличный курс!

Мне понравился, поскольку задачи подобного характера зачастую нестандартные.

Объяснение тоже понравилось, хоть в 1 задании грейдер ожидал результат по итогу работы более старой версии библиотеки)

автор: Alexander

9 янв. 2017 г.

Интересный курс, замечательные преподаватели. Есть моменты когда лекция довольно сложная, а тест простой, это оставляет тревожное ощущение недоученности :)

автор: Валерия Р

29 мар. 2018 г.

Для меня как новичка в Питоне, было увлекательно, и временами сложно, но оно тог стоило, спасибо!

автор: Dmitry K

23 сент. 2017 г.

Полноценно понравилась только первая неделя с интересным практическим заданием.

На остальных неделях был просто ужасный перегруз теоретической информацией, поэтому лекции прослушивались фактически только "для галочки" и их познавательная ценность стремилась к нулю. Осознать материал из лекций человеку с базовыми знаниями линейной алгебры просто нереально.

Последняя неделя это вообще торжество теории над практикой: при всем моем уважении к Константину Воронцову лекции читались как будто для людей, которые уже потратили пару месяцев на плотную работу с тематическим моделированием. Обилие специфичной терминологии, отсутствие каких-либо полноценных ассоциаций с практическим применением описываемой теории полностью перечеркивают полезность курса.

Практические задания по большей части выполнялись по принципу "китайской комнаты": я что-то пишу по инструкциям, но понимание напрочь отсутствует.

автор: Petr K

10 янв. 2019 г.

По-моему, отличный курс.

Лично для меня последняя неделя по тематическому моделированию оказалась очень длительной для изучения (потратил пару недель, тогда как первые три недели прошел меньше чем за неделю). В принципе, совсем не обязательно было углубляться, но я не устоял перед соблазном и поразбирался с EM-алгоритмом на будущее.

Курс рекомендую - отлично дополняет второй курс про обучение с учителем. Посмотрим, что будет дальше.

автор: Kirill V

2 июня 2017 г.

Хороший курс, все очень понравилось!

Отличное введение в методы кластеризации, отбор признаков, матричные разложения, поиск выбросов, визуализацию и тематическое моделирование.

Немного не хватило практики на 2 и 3 неделях, что, однако, компенсируется очень подробными теоретическими материалами.

Хочу сказать спасибо организаторам и преподавателям! Каждый следующий курс специализации радует все больше!

автор: Natalia A

9 янв. 2018 г.

Курс замечательный, хорошие задания, подводит обновляемость грейдера с учетом новых версий библиотек, и некоторые исполняемые ноутбуки не всегда корректно работают с новыми версиями библиотек. Хотелось бы большем мобильности в обратной связи.

Мне курс в целом понравился, коментарии коллег на форуме курсеры и в Slack помогают разобраться в некоторых тонкостях заданий и тем.

Спасибо!

автор: Anton R

14 сент. 2018 г.

Курс достаточно насыщен. Понятно, что что трудно сделать его полнее без увеличения длительности. Из пожеланий, хотелось бы больше ссылок на описания алгоритмов. Возможно, есть статьи на русском языке. Да, просьба здесь и дальше: в конспектах указывать англоязычные термины и ссылки на базовые статьи. Спасибо))!

автор: Горячев В Д

22 апр. 2019 г.

Все остальное отлично! Преподаватели хорошо рассказывают

Последнее задание c BiaARTM не удалось сделать, т.к. не смог установить данную библиотеку.

И ответы в некоторых заданиях пора изменить, т.к. бывает, что ответы Python 3 не принимаются(рассчитано ведь на Python 2.7)

автор: Радионов А

20 сент. 2017 г.

Отличный курс. Порадовало полномасштабное объяснение того, как и для чего применяется кластеризация.

Тот факт, что затронули байесовские методы, тоже порадовал: они достаточно необычны, и предоставленное здесь объяснение позволит не потеряться в них в дальнейшем.