Что это такое
Python Data Science Handbook — репозиторий с полной версией книги Jake VanderPlas в виде Jupyter Notebook. Это учебный маршрут по Python-стеку анализа данных: IPython/Jupyter, NumPy, pandas, Matplotlib, scikit-learn и смежные инструменты. Ценность в том, что текст и исполняемый код лежат рядом.
Репозиторий появился в 2016 году и стал удобной точкой входа для людей, которые хотят не просто читать про анализ данных, а запускать примеры. Материалы можно открыть на сайте, скачать как notebooks, запустить в Google Colab или через Binder.
Что внутри
Внутри — каталог notebooks, индекс книги, текстовые материалы и примеры. Книга предполагает базовое знание Python и ведет читателя от интерактивной среды к массивам, таблицам, визуализации и машинному обучению. Это не набор случайных заметок, а цельный учебный текст.
Мини-пример из духа книги
Фрагмент показывает типичную учебную механику: данные создаются или загружаются, превращаются в таблицу, затем сразу анализируются в notebook.
import pandas as pd
data = pd.DataFrame({
"city": ["Almaty", "Berlin", "Tokyo"],
"temperature": [22, 18, 27],
})
print(data.sort_values("temperature", ascending=False))
Где полезен
Репозиторий полезен студентам, аналитикам, разработчикам и преподавателям, которым нужен последовательный ввод в Python для данных. Он особенно хорош для самостоятельной работы: можно читать главу, менять код, ломать пример и сразу видеть результат.
Ограничения
Часть программной среды изменилась с момента написания книги: версии Python, pandas, scikit-learn и Jupyter ушли вперед. Поэтому примеры стоит запускать в современном окружении внимательно. Но как фундаментальный учебный маршрут по идеям и базовым инструментам репозиторий все еще ценен.