Статья Автор: Деникина Н.В., Деникин А.В.

Статистические функции в Numpy

Статистические функции используются для анализа данных в больших массивах данных.

Главное правило: Почти все функции принимают параметр axis (ось).

  • axis=0 — вычисление по столбцам (вертикально)
  • axis=1 — вычисление по строкам (горизонтально)
  • axis=None — вычисление по всему массиву (по умолчанию для многих функций)
ункция / Метод Что делает? Пример кода Результат для 
arr = np.array(
[[1, 2, 3],
[4, 5, 6]] )
np.sum(arr)
arr.sum()
Сумма всех элементов np.sum(arr) 21
np.mean(arr)
arr.mean()
Среднее арифметическое всех элементов np.mean(arr) 3.5
np.min(arr)
arr.min()
Минимальный элемент в массиве np.min(arr) 1
np.max(arr)
arr.max()
Максимальный элемент в массиве np.max(arr) 6
np.median(arr) Медиана (середина отсортированного массива) np.median(arr) 3.5
np.std(arr)
arr.std()
Стандартное отклонение (мера разброса данных) np.std(arr) ≈1.707
np.var(arr)
arr.var()
Дисперсия (квадрат стандартного отклонения) np.var(arr) ≈2.916
np.percentile(arr, q) q-й процентиль (значение, ниже которого находится q% данных) np.percentile(arr, 50)
(медиана)
3.5
np.argmin(arr)
arr.argmin()
Индекс минимального элемента в плоском массиве np.argmin(arr) 0 (индекс числа 1)
np.argmax(arr)
arr.argmax()
Индекс максимального элемента в плоском массиве np.argmax(arr) 5 (индекс числа 6)
 

🔧 Важное дополнение: Параметр axis

axis — это самая важная настройка! Она говорит функции, как именно проводить вычисления.

Параметр axis Как вычисляет? Пример для arr:
np.sum(arr, axis=?)
Результат
axis=None
(по умолчанию для многих функций)
По всему массиву (как будто он "развернут" в одну строку). np.sum(arr, axis=None) 21
axis=0
(столбцы)
По вертикали (каждый столбец — это один результат).
«Суммируй числа в каждом столбце».
np.sum(arr, axis=0) [5 7 9]
(1+4, 2+5, 3+6)
axis=1
(строки)
По горизонтали (каждая строка — это один результат).
«Суммируй числа в каждой строке».
np.sum(arr, axis=1) [6 15]
(1+2+3, 4+5+6)
 

🧠 Как это запомнить?

  • axis=0 — сжимаем строки. Остаются столбцы. Действие применяется к каждому столбцу.

  • axis=1 — сжимаем столбцы. Остаются строки. Действие применяется к каждой строке.

Для axis=0 (сумма по столбцам):

         [1, 2, 3]    -> Сумма по 0-axis -> [5, 7, 9]
         [4, 5, 6]    (складываем вертикально)
           ↓  ↓  ↓
Столбец 0: 1+4 = 5
Столбец 1: 2+5 = 7
Столбец 2: 3+6 = 9

Для axis=1 (сумма по строкам):

         [1, 2, 3]    -> Сумма по 1-axis -> [6, 15]
         [4, 5, 6]    (складываем горизонтально)
           → → → 
Строка 0: 1+2+3 = 6
Строка 1: 4+5+6 = 15
Печать