Статистические функции используются для анализа данных в больших массивах данных.
Главное правило: Почти все функции принимают параметр axis
(ось).
axis=0
— вычисление по столбцам (вертикально)
axis=1
— вычисление по строкам (горизонтально)
axis=None
— вычисление по всему массиву (по умолчанию для многих функций)
ункция / Метод |
Что делает? |
Пример кода |
Результат для
arr = np.array(
[[1, 2, 3],
[4, 5, 6]] ) |
np.sum(arr)
arr.sum() |
Сумма всех элементов |
np.sum(arr) |
21 |
np.mean(arr)
arr.mean() |
Среднее арифметическое всех элементов |
np.mean(arr) |
3.5 |
np.min(arr)
arr.min() |
Минимальный элемент в массиве |
np.min(arr) |
1 |
np.max(arr)
arr.max() |
Максимальный элемент в массиве |
np.max(arr) |
6 |
np.median(arr) |
Медиана (середина отсортированного массива) |
np.median(arr) |
3.5 |
np.std(arr)
arr.std() |
Стандартное отклонение (мера разброса данных) |
np.std(arr) |
≈1.707 |
np.var(arr)
arr.var() |
Дисперсия (квадрат стандартного отклонения) |
np.var(arr) |
≈2.916 |
np.percentile(arr, q) |
q -й процентиль (значение, ниже которого находится q% данных) |
np.percentile(arr, 50)
(медиана) |
3.5 |
np.argmin(arr)
arr.argmin() |
Индекс минимального элемента в плоском массиве |
np.argmin(arr) |
0 (индекс числа 1) |
np.argmax(arr)
arr.argmax() |
Индекс максимального элемента в плоском массиве |
np.argmax(arr) |
5 (индекс числа 6) |
🔧 Важное дополнение: Параметр axis
axis
— это самая важная настройка! Она говорит функции, как именно проводить вычисления.
Параметр axis |
Как вычисляет? |
Пример для arr :
np.sum(arr, axis=?) |
Результат |
axis=None
(по умолчанию для многих функций) |
По всему массиву (как будто он "развернут" в одну строку). |
np.sum(arr, axis=None) |
21 |
axis=0
(столбцы) |
По вертикали (каждый столбец — это один результат).
«Суммируй числа в каждом столбце». |
np.sum(arr, axis=0) |
[5 7 9]
(1+4, 2+5, 3+6) |
axis=1
(строки) |
По горизонтали (каждая строка — это один результат).
«Суммируй числа в каждой строке». |
np.sum(arr, axis=1) |
[6 15]
(1+2+3, 4+5+6) |
🧠 Как это запомнить?
Для axis=0
(сумма по столбцам):
[1, 2, 3] -> Сумма по 0-axis -> [5, 7, 9]
[4, 5, 6] (складываем вертикально)
↓ ↓ ↓
Столбец 0: 1+4 = 5
Столбец 1: 2+5 = 7
Столбец 2: 3+6 = 9
Для axis=1
(сумма по строкам):
[1, 2, 3] -> Сумма по 1-axis -> [6, 15]
[4, 5, 6] (складываем горизонтально)
→ → →
Строка 0: 1+2+3 = 6
Строка 1: 4+5+6 = 15