[БЕЗ_ЗВУКА] Получение и обработка данных в Power Query. В этой части мы познакомимся с одной из составляющих частей Power BI Desktop — инструментом подключения и трансформации данных Power Query. Что подразумевается под трансформацией данных? Здесь мы понимаем изменения информации в широком смысле этого слова, начиная от фильтрации строк и до объединения нескольких массивов в одну таблицу данных. В рамках данного блока мы пройдем несколько областей. Для начала познакомимся с инструментом и разберем, как же он работает, а также изучим его интерфейс. Далее мы освоим базовые приемы очистки и подготовки данных. После этого перейдем к вычислению новых данных с помощью создания дополнительных колонок на основе функции Если и произвольных формул. Затем мы узнаем, как можно объединить несколько таблиц в одну. И в завершении мы разберем принципы организации запросов: о том, как можно изменить имя запроса, добавить его описание и сгруппировать запросы в одну папку. Итак, приступим. Перед нами окно Power BI Desktop. Я создал новый пустой отчет, и для того чтобы начать работать с Power Query, мне необходимо подключиться к одному из источников данных. Для этого я могу воспользоваться соответствующей кнопкой на ленте, на вкладке Главная, или же в случае, если мне необходимо использовать файл Excel, я могу воспользоваться соседней кнопкой с названием Excel ли большой кнопкой в области листа отчета. Абсолютно неважно, какая из этих кнопок будет нажата. Результат будет одинаков. Итак, я подключаюсь к своему файлу Excel ровно так же, как мы делали это ранее. Но теперь в окне Навигатор я выбираю необходимо лист и, вместо того чтобы нажать кнопку Загрузить, нажимаю кнопку Преобразовать данные. После этого открывается новое окно. Прошу обратить ваше внимание, что окно Power Query является отдельным от окна Power BI Desktop, то есть в них можно работать параллельно и независимо. Итак, разворачиваю окно Power Query на весь экран, и давайте познакомимся с интерфейсом данного инструмента. В верхней области экрана уже привычная нам лента кнопок с несколькими вкладками. Во вкладке Главная расположены самые часто используемые функции. Первая из них — эта функция Закрыть и применить. Она позволяет сохранить результат нашего запроса и загрузить данные в отчет в Power BI. Следующая кнопка позволяет создать новый источник данных, то есть новый запрос. Далее мы видим множество кнопок, которые трансформируют данные. Если мы перейдем на вкладку Преобразование, то здесь будут сосредоточены все функции, которые позволяют изменять наши данные, причем как таблицу в целом, так и отдельные ее колонки в частности. Третья вкладка называется Добавление столбца и, конечно же, позволяет нам создавать новые колонки в нашей таблице. Здесь есть несколько возможных вариантов, например, создать колонку на основе произвольной формулы или же использовать условия для создания колонок. Следующая вкладка Просмотр. Здесь мы можем управлять тем, как выглядит наше окно Power Query. Например, мы можем отображать строку формул, которая была применена, или же скрыть ее. Далее на вкладке Инструменты расположены функции для продвинутых пользователей Power Query, которые позволяют отследить производительность выполнения этого запроса, провести диагностику запроса и после этого при необходимости выполнить различные изменения. На первых порах нам эта вкладка не потребуется. И финальной вкладкой является вкладка Справка, на которой сосредоточены кнопки, позволяющие получить дополнительную информацию о работе в Power Query. В левой части экрана расположена вкладка Запросы, которую можно скрыть либо отобразить. В данной вкладке будут расположены все запросы, которые есть в текущем файле Power BI. Кроме этого, здесь можно изменять, копировать, переименовывать и выполнять другие функции по работе с запросом. В центральной части экрана расположена область предпросмотра. Она предназначена для того, чтобы мы могли увидеть, как будут выглядеть наши данные после примененных изменений. Кроме этого, в этой области мы можем непосредственно изменять наши данные, например, открыть фильтр и выбрать необходимые нам страны, нажать кнопку OK, после чего наши данные изменятся. В правой части экрана расположена область Параметры запроса. Здесь мы можем изменить имя нашего запроса, а также посмотреть примененные шаги. Перед тем как мы начнем разбирать область примененных шагов, нам нужно обсудить, что же такое запрос в Power Query. Насколько вы любите планировать, например, поездку или следующую рабочую неделю? Некоторые люди просто обожают этот процесс и его результаты, другие же, напротив, избегают его. Но тем не менее пример планирования следующей рабочей недели отлично позволит нам понять, что же такое запрос в Power Query. Итак, представьте, что в конце рабочей недели вы берете блокнот, ручку и садитесь составлять план на следующую. Предположим, в понедельник вам необходимо заказать буклеты и подготовить еженедельный отчет, а во вторник забрать буклеты из типографии и провести командную встречу. Ну а в среду отправить буклеты вашим партнерам и подготовить макет нового дизайна. Если посмотреть отстранено, то у вас получился список задач в определенной последовательности, причем эту последовательность можно менять. Например, командную встречу лучше провести в среду, а тогда создание нового макета можно перенести в освободившееся окно на вторник. А некоторые задачи менять местами нельзя. Например, у вас не получится забрать макеты в понедельник, если вы закажете их только во вторник. В этой цепочке важен порядок. Итак, план на неделю готов. Можно идти спокойно на выходные, а в понедельник, придя снова на работу, просто заняться его выполнением. А если представить, что в вашем плане участвуют только рутинные задачи, то его можно выполнять каждую неделю — снова и снова, и снова. Аналогичным образом работает и Power Query. Когда мы разрабатываем отчет и создаем запрос на подключение и изменение данных, то мы как бы записываем наш план действий. В нем также может быть множество задач в определенной последовательности. И также некоторые задачи можно менять местами, а некоторые категорически нельзя, ведь тогда нарушится цепочка одного процесса. Этот план, так же как и обычный, легко и просто открыть, дополнить, удалить или переместить местами задачи. Этот план, точно так же как и настоящий, можно запустить в работу, просто нажать кнопку Обновить. И тогда все задачи выполняться строго в том порядке, в котором были записаны. Кроме этого, здесь ситуация обстоит гораздо лучше, чем в реальной жизни, ведь всю работу за вас выполнит Power Query, а вы можете насладиться кружкой чая в компании вашего коллеги. Более того, вам не придется записывать ваш план в блокнот: вам достаточно просто показать, что нужно сделать, а Power Query как секретарь запишет на бумагу все сам. Ну что же, давайте посмотрим, как это работает в реальной жизни. В области Примененные шаги содержится перечень всех задач, которые необходимо выполнить в рамках нашего запроса. Также здесь мы можем просматривать состояние данных на каждом шаге. Например, если кликнуть на первый шаг Источник, то мы увидим, что здесь Power Query подключается к файлу Excel и просматривает его содержимое. Если кликнуть на второй шаг Навигация, то здесь мы увидим, что Power Query подключается к листу с данными под названием Sheet1. Если кликнуть на третий шаг, то мы увидим, как первая строка превращается в заголовки таблицы. Если я кликну на шаг Навигация, то мы сможем увидеть, что в первой строке у нас содержатся заголовки, а заголовки таблицы в Power Query у нас имеют технические названия — просто колонка один, колонка два, колонка три и так далее. После применения шага Повышенные заголовки Значения из первой строки становятся названиями колонок, что позволяет нам удобно работать далее. И так же четвертый шаг — это Измененный тип. Визуально на экране поменялось немного, но этот шаг очень важен. Для начала я заново вернусь на предыдущий шаг, давайте обратим наше внимание на колонку Units Sold, а точнее на пиктограмму слева от этого названия. Здесь мы видим символы ABC и цифры 123. Это означает, что тип данных для этой колонки не определен. Если же мы выполним шаг Измененный тип, то здесь мы увидим пиктограмму 1.2, что означает, что в данной колонке у нас тип данных — число. Типы данных очень важны для Power Query, поскольку именно на основании типов данных Power Query знает, как можно обрабатывать ту или иную колонку. Например, он знает, что колонку с числами можно просуммировать, а к колонке с датами можно применить функцию Dat и, например, узнать, какой год был в конкретную дату. Поэтому присваивать типы данных вашим колонкам очень важно. Благодаря усилиям компании Microsoft этот шаг выполняется автоматически. Теперь давайте добавим новые шаги в наш запрос. Например, я хочу отфильтровать мою таблицу и выбрать все строки, которые относятся к стране Канада. Для этого я открываю выпадающий фильтр кликом на соответствующую кнопку в колонке. Здесь устанавливаю галочку напротив нужной мне страны и нажимаю кнопку OK. Обратите внимание, в правой части экрана в области Примененные шаги у нас появилась новая строка, где написано Строки с примененным фильтром. И также в окне предпросмотра у нас остались только те строки, которые относятся к стране Канада. Далее, мне хочется удалить одну из колонок, допустим, колонка Sale Price мне не нужна. Для того чтобы ее удалить, я кликаю правой кнопкой мыши и выбираю соответствующую функцию. После чего колонка в окне предпросмотра исчезла, а справа в области Примененные шаги появилась еще одна строчка Удаленные столбцы. Теперь попробуем поменять шаги местами. Для того чтобы это сделать, в области Примененные шаги нужно кликнуть левой кнопкой мыши и зажать ее и переместить шаг на нужное место. Например, и теперь я поменял шаги местами, и у меня сначала удаляется столбец, а затем применяется фильтрация. Давайте посмотрим все еще раз детальнее. Итак, мы на шаге Измененный тип. Сейчас в моей таблицы есть колонка Sale Price, и нет фильтрации. Затем я кликаю на шаг Удаленные столбцы, и у меня исчезает один из столбцов, но фильтрации по-прежнему нет. И далее я кликну на шаг Строки с примененным фильтром и увижу, что теперь все строки моей таблицы отфильтрованы. Важно понимать, что в качестве итоговой таблицы по результатам вашего запроса в отчет Power BI будет передана та таблица, которая получается на самом последнем примененном шаге. Вернем нашу таблицу в исходное состояние, для этого мне нужно удалить два последних шага. Чтобы это сделать, в области Примененные шаги напротив нужной строки мне необходимо кликнуть значок крестика, после чего шаги попросту удаляются из нашего запроса. Итак, мы познакомились с интерфейсом программы Power Query, который является классическим для компании Microsoft и интуитивно понятен и хорошо знаком всем пользователям пакета офисных программ. Особую роль в интерфейсе занимает область запросов, которая позволяет управлять ими, а также область Примененные шаги, которая отображает алгоритм запроса или план его выполнения, если говорить другими словами. Power Query позволяет однажды создать запрос и затем многократно его выполнять. Также не составит особого труда изменить уже существующей запрос. В следующем блоке курса мы изучим, с какими источниками данных умеет работать Power Query.