[Специалист] Программирование на языке R. Уровень 1 (2017) [Александр Кораблин]
Целевое предназначение языка программирования R – это статистический анализ данных. Язык содержит широчайший спектр инструментов анализа данных, средств визуализации, создания документов и веб-приложений.
Что удобнее делать в R? В основном отмечают четыре вещи:
Цель курса – дать слушателям знания, которые помогут овладеть базовыми навыками анализа и визуализации данных в среде R.
Курс предназначен для широкого круга специалистов, которым необходимо искать закономерности в большом количестве данных, визуализировать их и строить статистически корректные выводы.
По окончании курса Вы будете уметь:
Скрытое содержимое.
Программирование на языке R. Уровень 1.
Базовые знания. Александр Кораблин
Базовые знания. Александр Кораблин
Целевое предназначение языка программирования R – это статистический анализ данных. Язык содержит широчайший спектр инструментов анализа данных, средств визуализации, создания документов и веб-приложений.
Что удобнее делать в R? В основном отмечают четыре вещи:
- статистический анализ данных;
- создание высококачественной визуализации данных;
- документирование статистических обсчетов;
- cоздание интерактивных веб-приложений.
Цель курса – дать слушателям знания, которые помогут овладеть базовыми навыками анализа и визуализации данных в среде R.
Курс предназначен для широкого круга специалистов, которым необходимо искать закономерности в большом количестве данных, визуализировать их и строить статистически корректные выводы.
По окончании курса Вы будете уметь:
- создавать/модифицировать вектора, табличные данные, матрицы, списки; рассчитывать статистические метрики для наборов данных;
- строить и диагностировать статистически модели: линейная регрессия (от одной и многих переменных), классификация (kmeans, деревья решений, случайный лес);
- визуализировать данные в R (base plotting, ggplot2);
- создавать текстовые документы с модулями исполняющегося кода (отчеты).
- типы данных в R и самые популярные средства инструменты с ними;
- теоретические основы моделей регрессии и классификации; инструменты R для создания таких моделей;
- инструменты визуализации данных, средства документирования отчетов.
Модуль 1. Знакомство с R и RStudio. Основные особенности
- Интерфейс RStudio
- Основные особенности языка R
- RMarkdown
- Практическая работа: Знакомство с интерфейсом RStudio. Создание файлов типа RMarkdown
- Вектора, списки, матрицы, таблицы. И работа с ними
- Загрузка/выгрузка данных в/из R
- Базовые функции R
- Библиотека dplyr
- Условное выполнение кода (if…else)
- Циклы for, while
- Функции семейства *apply
- Практическая работа: Манипуляции с данными в R. Чтение/запись данных
- Простая линейная модель в R
- Линейная модель с несколькими переменными
- Диагностика линейных моделей
- t-тест, непараметрические тесты.
- ANOVA
- Практическая работа: Построение и интерпретация моделей линейной регрессии, А/В тесты, применение метода ANOVA на тестовых данных
- Постановка задачи классификации
- Линейная классификация в R
- Алгоритмы KNN, деревья решений, случайный лес
- Диагностика моделей классификации, ROC-кривая
- Практическая работа: Построение и интерпретация моделей классификации
- Base plotting
- Библиотека ggplot2
- Практическая работа: Визуализация данных с помощью библиотеки ggplot2 и средствами base plotting
http://www.specialist.ru/course/r1