[МУЗЫКА] [МУЗЫКА] В этом видео мы поговорим не совсем о системе ggplot, а о той системе, которая позволяет использовать его возможности в полной мере, получая не просто картинки, а целые документы и презентации. Эти документы могут включать и таблицы, и картинки, и тексты, то есть все, что является составной частью любой презентации. Речь пойдет о так называемом литературном программировании. Вспомните, неужели у вас не было такой ситуации, когда вы создали презентацию, написали текст статьи или отчета, и начальнику не понравилась форма графиков, цвет заливки не понравился, величина шрифта и тому подобное? Надо все переделывать, причем срочно: все переверстать надо под новые формы, дедлайн позавчера, и надо все это было сделать очень быстро. Только вы все картинки переделали в документе, который надо завтра сдавать, приходят еще ваши коллеги и говорят, что они перепроверили данные, внесли некоторые исправления в первичные данные, и все заново надо пересчитывать, и все документы надо срочно переделывать. Полный ужас! Но этого всего избежать можно, зная приемы того, о чем мы будем говорить — литературного программирования. Эти приемы основаны на создании так называемых RMD-файлов. Или другая история. Вы работаете в некоем коллективе над неким совместным проектом, и коллеги, с которыми вы работаете, работают под другими системами, например, у кого-то из коллег Linux стоит, а вы работаете под Windows, а какой-нибудь другой человек из вашей команды предпочитает Macintosh (Mac OS). Продукт вашего совместного творчества должен читаться на любом компьютере. В этой ситуации основа плодотворного сотрудничества — это создание RMD-документов. Те презентации, которые мы используем для нашего курса, порождены именно в таких условиях. Несколько соавторов, которые создавали эти презентации, работали на разных машинах в разных операционных системах, но все это легко и непринужденно было обобщено. И, наконец, самая тяжелая история, если вы исследователь. Вы становитесь перед необходимостью анализировать научные результаты, научные данные, и в этой ситуации вы можете столкнуться с тем, что в статьях, которые вам приходится читать, вы видите лишь некую вершину айсберга, то есть характер данных, процедура анализа, способы построения таблиц или графиков — все это остается в тени. Автор статьи далеко не всегда это выносит на поверхность, и вы часто становитесь перед некоторой проблемой: вас не оставляет чувство сомнения в правоте автора статьи, так как нет возможности воспроизвести те действия с данными, которые произвел автор. Выход из этого — стать сторонником идеи так называемого Reproducible research. Вот про нее мы скажем несколько подробнее, так как мы, будучи исследователями, всецело на стороне этого подхода. Итак, что же такое Reproducible research? Это воспроизводимое исследование, это анализ, который может быть воспроизведен на основе тех же данных любым другим исследователем. То есть если вы сторонник этого подхода, то вы подготавливаете свои презентации так, чтобы все ваши расчеты, все ваши действия могли быть воспроизведены любым другим человеком, который владеет теми же приемами, что и вы. При этом не надо путать воспроизводимые исследования с воспроизводимостью результатов. Это несколько разные вещи. Мы сейчас поговорим именно о воспроизводимом исследовании. Существует несколько критериев воспроизводимого исследования. Во-первых, вы должны предоставить исходные данные так, чтобы они были доступны любому потребителю. В идеале, они должны быть публично доступны. Еще один критерий Reproducible research — это то, что все методы анализа полностью описаны. Еще один важный критерий — то, что весь процесс анализа исходных данных от чтения данных до финального результата полностью должен быть описан и сохранен в виде некоторого текста, так называемого кода анализа. Так вот, лучшее средство для предоставления своих результатов — как раз и есть использование литературного программирования, связанного с созданием RMD-документов.