R хорош тем, что он открыт, и поэтому куча разных людей написали кучу разных дополнительных полезных пакетов. И реальная работа, как правило, начинается с того, что вы загружаете кучу полезных функций, написанных другими людьми, кучу пакетов, и используете их в своей работе. Для того чтобы воспользоваться функциями, написанными другими людьми, надо сначала установить какие-то пакеты. Пакеты устанавливаются через меню Tools, Install Packages. Соответственно, если вы нашли полезный для вас пакет, то вы вот его так ставите. Нам для начала потребуются следующие пакеты. Мы их сейчас ставим с официального репозитория, то есть это такое большое официальное хранилище, сайт в Интернете, которое называется CRAN, и оттуда мы ставим пакеты. dplyr для обработки данных, ggplot2 для красивых картинок, GGally для рисования матриц диаграмм рассеяния, psych для описательных статистик, и, пожалуй, для начала всё, но будьте готовы к тому, что нам могут потребоваться ещё другие пакеты, но устанавливаются они точно так же: через запятую здесь вы пишете их название; можно, в принципе, выбирать из списка. И нажимаете Install. И при этом нужно подключение к Интернету, и, соответственно, через некоторое время пакеты поставятся. Помимо официального репозитория CRAN, где пакеты вот так устанавливаются через «менюшку», есть ещё один большой сайт, который называется GitHub, и там пользователи уже выкладывают пакеты неофициально. Это не означает, что они там хуже по качеству. Они могут быть точно так же полезны, может быть, пользователи просто поленились выложить их на официальный репозиторий. Соответственно, оттуда как ставить пакеты? Если вы знаете имя автора пакета и название пакета, то вы можете поставить пакет с репозитория GitHub. Для этого потребуется вспомогательный пакет devtools для разработчиков. И после того как вы загрузили пакет для разработчиков devtools, то вы можете установить пакеты с репозитория GitHub. Для этого мы воспользуемся пакетом devtools. Нажимаем Ctrl плюс Enter и ставим пакет install_github. То есть мы ставим пакет, для этого мы должны знать не только имя, но и на чьём репозитории он хранится. На своём репозитории я выложил пакет для скачивания статистической информации с сайта «Вышки» sophisthse. Соответственно, bdemeshev/sophisthse название пакета. И мы можем установить пакет с репозитория GitHub. Любое реальное занятие начинается с того, что вы подгружаете необходимые вам пакеты с помощью команды library. Откуда узнать, какие пакеты вам нужны? Проще всего, в «гугле» найти необходимую информацию. То есть вы набираете команду How to solve differential. Как решать дифференциальные уравнения в R. И, соответственно, можно посмотреть документацию и обнаружить, что вот есть пакет deSolve, который позволяет решать дифференциальные уравнения в R. Соответственно, можно установить пакет deSolve и решать дифференциальные уравнения. А в нашем курсе мы, конечно, будем рассказывать, какие пакеты и для чего нам понадобятся. Итак, установив пакеты, их можно загрузить в память компьютера. library ("dplyr") – этот пакет позволяет выполнять манипуляции с данными очень удобным способом. library("ggplot2") – library("ggplot2") – этот пакет позволяет рисовать красивые графики. library("GGally") позволяет рисовать много диаграмм рассеяния за один раз. library("psych") позволяет считать очень удобно описательные статистики. Как найти справку по какой-то команде? Если вы знаете, какая команда вам нужна, скажем, вы уже выяснили, что вам нужна для прогнозирования команда predict, то вы можете почитать справку по ней: написать help(predict), нажать Ctrl плюс Enter и получить справку по этой команде. Здесь будет, соответственно, описание команды с аргументами, и в конце будут обязательно примеры использования. И, обратите внимание, вот здесь вот наверху указано название команды predict и в фигурных скобках пакет, в котором она находится. Соответственно, если я, например, наберу help(describe) – это команда, которая описывает набор данных: считает среднее, минимум, максимум и так далее, – то эта команда, она лежит в пакте psych. То есть для того чтобы использовать команду describe, нужно сначала предварительно установить пакет psych. Соответственно, если вы не знаете, как называется нужная вам команда, то ответ такой: проще всего поискать в Интернете в том же самом «гугле» И помимо «гугла» можно воспользоваться специальным поисковиком по R, который называется rseek.org. Соответственно, это поисковик, который будет искать именно по страницам, которые как-то связаны с R. Соответственно, здесь я могу набрать, скажем, rss и посмотреть, какие вообще команды с R связаны с понятием остаточной суммы квадратов. Также в интернете очень помогают два таких сайта. Один сайт – это stats.stackexchange.com. Это, соответственно, место, где задают вопросы по статистике. Если вы не смогли самостоятельно найти ответ на свой вопрос, который касается анализа данных, эконометрики, статистики, использования R или каких-то алгоритмов анализа данных, то смело задавайте его здесь. Скорее всего, вы получите помощь. И второй момент. Поскольку анализ данных сопряжён иногда с чисто программистскими трудностями, которые вроде как к самому анализу данных отношения не имеют, но, тем не менее, их нужно решить, проблемы, то касательно программистских вопросов может помочь сайт stackoverflow.com. Соответственно, это такое крупное место, где задают вопросы, которые касаются программирования. То есть если первый сайт stats.stackexchange.com посвящён именно алгоритмам статистическим анализа данных, то этот чисто посвящён вопросам программирования. И если вы здесь пометите тегом, что ваш вопрос относится к R, то если вы в вопросе покажете, что вы принимали какие-то усилия по его решению, то вам обязательно помогут. Вот, собственно, несколько интернет-ресурсов, которые вам помогут найти помощь в R. А в самом R вы получаете помощь, когда уже знаете название команды. Набираете help и название команды. Например, команда, которая оценивает модель методом наименьших квадратов, называется lm. И можно посмотреть опции возможные и примеры использования. Также можно нажать здесь на «домик» и почитать Introduction to R или поискать встроенную документацию ко всем функциям на какие-то ключевые слова.