Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

  • Главная
  • Data Science: топ-8 пособий, чтобы прокачаться в науке о данных
Shape Image One
Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Data Science from Scratch: First Principles with Python, Joel Grus

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Переиздание 2019 года, обновленное для Python 3.6. Автор — исследователь ИИ-института Allen Institute for AI и бывший инженер Google.

В этой книге рассматриваются основы линейной алгебры, статистики и теории вероятностей, а также то, как и когда они используются в науке о данных на примерах на Python. Кроме того, даны основы машинного обучения и самых востребованных Data Science моделей, включая нейронные сети.

В отзывах отмечают, что автор фокусируется именно на фундаментальных принципах, а не изучении библиотек Python.

Data Science for Beginners: 4 books in 1, Andrew Park

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Эта книга тоже для новичков, но фокус здесь больше на инструментах. Пособие включает сразу четыре книги:

  1. Python for Beginners. Основы языка, от установки и переменных до работы с файлами. Есть упражнения и примеры кода.
  2. Python for Data Analysis. Основы Python-библиотек, которые используются для обработки данных: PyTorch, Pandas и другие.
  3. Python Machine Learning. Как работать с машинным обучением на Python. Здесь же: нейронные сети.
  4. Python Data Science. Углубленное изучение алгоритмов Data Science и примеры реальных приложений.

Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, Wes McKinney

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Книга от автора Python-библиотеки Pandas, хотя в пособии рассматривается не только она, но и NumPy и IPython. Здесь показаны примеры использования этих инструментов для обработки и анализа данных, а также их визуализации.

Все примеры и файлы данных, с которыми работает автор книги, доступны на GitHub.

У пособия два издания: последнее, 2017 года, актуально для Python 3.6.

R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, Hadley Wickham, Garrett Grolemund

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Data Science — это не только о Python. Это подтверждается тем фактом, что эта книга находится в топ-6 лучших книг по обработке данных на Amazon и занимает второе место в категории Mathematical & Statistical Software.

Оба автора пособия активно участвуют в разработке языка R. В этой книге они рассказывают, как работать с RStudio и tidyverse — соответственно IDE и набором пакетов R для Data Science.

Пособие подходит даже для тех, кто никогда не программировал.

Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, Peter Bruce, Andrew Bruce, Peter Gedeck

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Это книга для тех, кто уже выучил основы Python и R и теперь хочет прокачиваться в отдельных областях Data Science. В фокусе — статистика. По мнению авторов, это ключевая часть науки о данных, но при этом очень мало дата-сайентистов изучают ее отдельно.

В пособии описывается, как получать качественные наборы данных, анализировать их и работать даже с немаркированными данными. Также рассмотрены статистические методы машинного обучения.

Примеры кода сначала пишутся на R, а потом дублируются на Python.

Data Science on AWS: Implementing End-to-End, Continuous AI and Machine Learning Pipelines, Chris Fregly, Antje Barth

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Реальные Data Science проекты важно не только успешно разрабатывать, но и деплоить. Эта книга — как раз практическое пособие по тому, как работать с Amazon Web Services. Авторы учат быстро и эффективно работать в облаке. Среди рассматриваемых тем:

  • автоматизированное машинное обучение с помощью SageMaker Autopilot;
  • использование NLP на основе BERT;
  • потоковая аналитика с помощью Amazon Kinesis и Managed Streaming для Apache Kafka;
  • обеспечение безопасности проектов.

How to Lead in Data Science, Jike Chong, Yue Cathy Chang

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Ваша цель — дорасти до лида команды Data Science? Эта книга для вас. Авторы — экс-управляющие командами данных в LinkedIn — делятся советами по управлениями небольшим количеством людей и даже построению стратегий для целой компании.

Книга совсем свежая — 2021 года. В отзывах отмечают, что это отличное пособие по построению карьеры, даже если вы еще в самом начале пути как дата-сайентист.

Ace the Data Science Interview, Nick Singh, Kevin Huo

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

Последняя книга в этой подборке — бестселлер на Amazon, который также поможет построить вам карьеру в Data Science. В ней собран 201 вопрос, который задают на собеседованиях в FAANG.

Авторы — бывшие сотрудники Facebook. В книге они делятся не только вопросами, но и подробными ответами, с объяснением самых важных концепций и решений.

Добавить комментарий