Переиздание 2019 года, обновленное для Python 3.6. Автор — исследователь ИИ-института Allen Institute for AI и бывший инженер Google.
В этой книге рассматриваются основы линейной алгебры, статистики и теории вероятностей, а также то, как и когда они используются в науке о данных на примерах на Python. Кроме того, даны основы машинного обучения и самых востребованных Data Science моделей, включая нейронные сети.
В отзывах отмечают, что автор фокусируется именно на фундаментальных принципах, а не изучении библиотек Python.
Эта книга тоже для новичков, но фокус здесь больше на инструментах. Пособие включает сразу четыре книги:
Книга от автора Python-библиотеки Pandas, хотя в пособии рассматривается не только она, но и NumPy и IPython. Здесь показаны примеры использования этих инструментов для обработки и анализа данных, а также их визуализации.
Все примеры и файлы данных, с которыми работает автор книги, доступны на GitHub.
У пособия два издания: последнее, 2017 года, актуально для Python 3.6.
Data Science — это не только о Python. Это подтверждается тем фактом, что эта книга находится в топ-6 лучших книг по обработке данных на Amazon и занимает второе место в категории Mathematical & Statistical Software.
Оба автора пособия активно участвуют в разработке языка R. В этой книге они рассказывают, как работать с RStudio и tidyverse — соответственно IDE и набором пакетов R для Data Science.
Пособие подходит даже для тех, кто никогда не программировал.
Это книга для тех, кто уже выучил основы Python и R и теперь хочет прокачиваться в отдельных областях Data Science. В фокусе — статистика. По мнению авторов, это ключевая часть науки о данных, но при этом очень мало дата-сайентистов изучают ее отдельно.
В пособии описывается, как получать качественные наборы данных, анализировать их и работать даже с немаркированными данными. Также рассмотрены статистические методы машинного обучения.
Примеры кода сначала пишутся на R, а потом дублируются на Python.
Реальные Data Science проекты важно не только успешно разрабатывать, но и деплоить. Эта книга — как раз практическое пособие по тому, как работать с Amazon Web Services. Авторы учат быстро и эффективно работать в облаке. Среди рассматриваемых тем:
Ваша цель — дорасти до лида команды Data Science? Эта книга для вас. Авторы — экс-управляющие командами данных в LinkedIn — делятся советами по управлениями небольшим количеством людей и даже построению стратегий для целой компании.
Книга совсем свежая — 2021 года. В отзывах отмечают, что это отличное пособие по построению карьеры, даже если вы еще в самом начале пути как дата-сайентист.
Последняя книга в этой подборке — бестселлер на Amazon, который также поможет построить вам карьеру в Data Science. В ней собран 201 вопрос, который задают на собеседованиях в FAANG.
Авторы — бывшие сотрудники Facebook. В книге они делятся не только вопросами, но и подробными ответами, с объяснением самых важных концепций и решений.