Язык R в задачах науки о данных: импорт, подготовка, обработка, визуализация и моделирование данных (полноцветное издание)

Хэдли Уикем, Гарретт Гроулмунд

R for Data Science: Visualize, Model, Transform, Tidy, and Import Data
Hadley Wickham, Garrett Grolemund
книга Язык R в задачах науки о данных: импорт, подготовка, обработка, визуализация и моделирование данных (полноцветное издание)
(увеличить обложку)

Где купить книгу

Оглавление
Введение
Пролистать книгу
Файлы к книге

Овладейте искусством превращения необработанных первичных данных в плодотворные догадки, гипотезы и новые знания с помощью языка R. Эта книга задумана как введение в вычислительную среду R, среду разработки RStudio и библиотеку tidyverse — коллекцию пакетов, совместное использование которых обеспечивает быстроту и легкость анализа данных. Книга ориентирована на читателей, не имеющих предварительного опыта программирования, и предназначена для того, чтобы помочь им в как можно более короткие сроки начать решать задачи науки о данных.

Авторы книги познакомят вас со всеми стадиями процесса анализа данных, включая импорт, предварительную подготовку, разведочный анализ и моделирование данных, а также демонстрацию результатов. Прочитав книгу, вы получите цельное представление как о процессе анализа данных в целом, так и об основных инструментах, используемых при его проведении.

Основные темы книги:

  • Предварительная обработка данных — преобразование наборов данных к виду, удобному для анализа.
  • Программирование — освоение мощных инструментов R, упрощающих анализ данных и делающих его более понятным.
  • Разведочный анализ — исследование данных, выдвижение и быстрая проверка гипотез.
  • Моделирование — предоставление сжатых сводных данных, отражающих выявленные тенденции в наборе данных.
  • Обмен информацией — изучение языка R Markdown, обеспечивающего интеграцию описательного текста, кода и результатов анализа.

Хэдли Уикем — старший научный сотрудник компании RStudio и член организации R Foundation.

К числу его разработок относятся пакеты для науки о данных (библиотека tidyverse: ggplot2, dplyr, tidyr, purrr, readr и др.) и инструментальные средства разработки пакетов (roxygen2, testthat, devtools).

Гарретт Гроулмунд — специалист в области статистики, преподаватель и главный инструктор компании RStudio. Он автор известного пакета lubridate, а также книги Hands-On Programming with R.

Книга обсуждается в отдельном сообщении в блоге Виктора Штонда.


592, c ил стр., с ил.; ISBN 978-5-9909446-8-8, 978-1-491-91039-9; формат 70x100/16; твердый переплет; тип бумаги: офсетная; серия O'Reilly (Animals); 20.05.2021; Вильямс.



Понравилась книга? Порекомендуйте её друзьям и коллегам:







Разделы каталога:



Оглавление книги "Язык R в задачах науки о данных: импорт, подготовка, обработка, визуализация и моделирование данных (полноцветное издание)"



Предисловие     21
Часть I. Предварительный анализ     39
Глава 1. Визуализация данных с помощью ggplot2     41
Глава 2. Рабочий процесс: основы     83
Глава 3. Преобразование данных с помощью пакета dplyr     89
Глава 4. Организация рабочего процесса: скрипты     127
Глава 5. Предварительный анализ данных     131
Глава 6. Организация рабочего процесса: проекты     165
Часть II. Подготовка данных     173
Глава 7. Создание tibble-фреймов с помощью пакета tibble     175
Глава 8. Импорт данных с помощью пакета readr     183
Глава 9. Аккуратизация данных с помощью пакета tidyr     207
Глава 10. Работа с реляционными данными с помощью пакета dplyr     233
Глава 11. Работа со строками с помощью пакета stringr     259
Глава 12. Работа с факторами с помощью пакета forcats     291
Глава 13. Работа с датами и временем с помощью пакета lubridate     307
Часть III. Программирование     329
Глава 14. Работа с каналами с помощью пакета magrittr     333
Глава 15. Функции     343
Глава 16. Векторы     367
Глава 17. Итерирование с помощью пакета purrr     391
Часть IV. Моделирование     421
Глава 18. Базовое моделирование с помощью пакета modelr     425
Глава 19. Создание модели     459
Глава 20. Обработка множества моделей с помощью пакетов purrr и broom     487
Часть V. Коммуникация     513
Глава 21. Язык разметки R Markdown     515
Глава 22. Обмен графикой с помощью пакета ggplot2     533
Глава 23. Выходные форматы R Markdown     567
Глава 24. Организация работы с R Markdown     579
Предметный указатель     583


Copyright © 1992-2020 Издательская группа "Диалектика-Вильямс"

Rambler  Top100