Язык R в задачах науки о данных. Импорт, подготовка, обработка, визуализация и моделирование данных (Уикем Хэдли, Гроулмунд Гарретт)
Авторы книги познакомят вас со всеми стадиями процесса анализа данных, включая импорт, предварительную подготовку, разведочный анализ и моделирование данных, а также демонстрацию результатов. Прочитав книгу, вы получите цельное представление как о процессе анализа данных в целом, так и об основных инструментах, используемых при его проведении.
Основные темы книги:
- Предварительная обработка данных - преобразование наборов данных к виду, удобному для анализа.
- Программирование - освоение мощных инструментов R, упрощающих анализ данных и делающих его более понятным.
- Разведочный анализ - исследование данных, выдвижение и быстрая проверка гипотез.
- Моделирование - предоставление сжатых сводных данных, отражающих выявленные тенденции в наборе данных.
- Обмен информацией - изучение языка R Markdown, обеспечивающего интеграцию описательного текста, кода и результатов анализа.
К числу его разработок относятся пакеты для науки о данных (библиотека tidyverse: ggplot2, dplyr, tidyr, purrr, readr и др.) и инструментальные средства разработки пакетов (roxygen2, testthat, devtools).
Гарретт Гроулмунд - специалист в области статистики, преподаватель и главный инструктор компании RStudio. Он автор известного пакета lubridate, а также книги Hands-On Programming with R.
Формат: PDF
https://privatelink.de/?https://www.labirint.ru/books/626572/