← Ко всем open source проектам

pandas

pandas-dev/pandas

pandas — библиотека Python для табличных данных, временных рядов, очистки, агрегации и анализа.

Форки 20,006
Автор pandas-dev
Язык Python
Лицензия BSD-3-Clause
Обновлено 2026-06-10

Что это такое

pandas — базовая библиотека Python для работы с табличными и размеченными данными. Если NumPy дает быстрые массивы, то pandas добавляет более прикладной слой: индексы, имена колонок, пропущенные значения, группировки, временные ряды, объединения таблиц и чтение десятков форматов. Для аналитика это часто первый инструмент после загрузки данных.

Проект был создан в 2008 году Wes McKinney во время работы с финансовыми данными, а публичный репозиторий появился в 2010 году. Сейчас pandas — часть научной Python-экосистемы вместе с NumPy, Jupyter, Matplotlib, SciPy, scikit-learn и другими проектами. Его поддерживает широкое сообщество, а развитие связано с NumFOCUS.

Что внутри репозитория

Репозиторий содержит ядро DataFrame и Series, операции индексирования, ввод-вывод, обработку дат, группировки, слияния, расширяемые типы данных, тесты и документацию. Большая часть повседневной магии pandas — это не одна функция, а согласованность: данные можно прочитать, очистить, агрегировать и передать дальше без постоянного переписывания структуры.

Минимальный анализ таблицы

Пример показывает типичный путь: загрузить CSV, привести дату, сгруппировать продажи по месяцу и получить компактную таблицу для графика или отчета.

Язык: Python
import pandas as pd

df = pd.read_csv("orders.csv", parse_dates=["created_at"])
monthly = (
    df.assign(month=df["created_at"].dt.to_period("M"))
      .groupby("month", as_index=False)["total"]
      .sum()
)
print(monthly.tail())

Где полезен

pandas используют в аналитике, научных расчетах, финансовых моделях, подготовке данных для машинного обучения, разовых отчетах и внутренних инструментах. Он хорошо подходит для данных, которые помещаются в память одной машины и требуют гибкой ручной работы.

Сильные стороны и ограничения

Сильная сторона pandas — выразительность. Одной цепочкой можно описать чтение, фильтрацию, группировку и преобразование. Ограничение — масштаб и сложность: для очень больших потоков, распределенной обработки и строгих схем могут лучше подойти Polars, DuckDB, Spark, SQL-хранилище или специализированная витрина. pandas остается отличным центром для исследования и подготовки данных, но не обязан быть единственным вычислительным движком.