Статья Автор: Сухолита Артемий

Итоговая работа, научный анализ базы данных

Итоговый проект
Научный анализ базы данных "Daily SunSpot Data (1818 - 2019)"
Сухолита Артемий
28.04.2026

Выбранный dataset:

Daily SunSpot Data (1818 to 2019). Это данные о солнечной активности за последние 200 лет. Взят с www.kaggle.com. В нем более 70000 строк, 9 столбцов. Меня зацепило то, что раньше (до начала развития энергосистем) исследование активности солнца не приносило абсолютно никакой практической пользы, однако люди собирали статистические данные о солнце и
находили закономерности.


Разведочный анализ:

Строк: 73718
Столбцов: 9
Типы данных: float64 в 2 столбцах, int64 в 7 столбцах

Пропуски есть в столбцах “Number of Sunspots”, “Standard Deviation”, “Observations”, в 3247 строках и в “Indicator” в 123 строках.

Среднее количество солнечных пятен в день: 83.09
Медиана: 63.00
Минимум: 0.00

Максимум: 528.00

Границы нормы количества пятен: [0; 287.00]
Выбросов: 1290 (1.83%)

Примеры (топ-5 по величине):
1870-08-26: 528.00
1870-08-27: 520.00
1870-08-29: 518.00
1957-12-24: 503.00
1957-12-25: 503.00
 


Гистограмма распределения количества солнечных пятен и столбчатая диаграмма для количества измерений в день:


Гипотезы:
 
  1. Эволюция наблюдений: Количество наблюдений в день (Observations) растёт со временем — особенно после 1950-х и с запуском спутников.
 
  1. Стандартное отклонение положительно коррелирует с количеством пятен — в периоды высокой активности разброс значений больше.
 
  1. Количество солнечных пятен следует циклическому паттерну с периодом ~11 лет (цикл Швабе) — чередование максимумов и минимумов.


Графики:

1. Для доказательства первой гипотезы можем рассмотреть такой график:



Из него видно, что до 1849 года часто по некоторым дням измерения не проводились. Далее до 1980 года практически каждый день проводилось по 1 измерению, и только после начала эры спутникового мониторинга (1980) количество измерений в день резко выросло (примерно в 23 раза за 14 лет). Также можем заметить крупный скачок после 2013 года, когда количество измерений за день выросло более чем в 2 раза за 4 года). Таким образом понимаем, что гипотеза была частично верна, рост количества наблюдений произошел не после 1950-х, а после 1970-х.

2. Для доказательства второй гипотезы рассмотрим такой график:



Из него понимаем, что и правда, стандартное отклонение растет при росте солнечной активности. Это наглядно представлено на красной пунктирной прямой, которая усредняет все значения, представленные точками на графике. Таким образом, гипотеза была полностью верна.

 

3. Для доказательства третьей гипотезы рассмотрим следующий график:



На нем заметим, что и правда, каждые примерно 10 – 12 лет наблюдаются   всплески активности, которые превышают по активности года с затишьем примерно в 10 – 20 раз. Из этого понимаем, что гипотеза была полностью верна, солнечная активность и правда следует циклу с периодом примерно в 11 лет.

Вывод:

Первая гипотеза оказалась верной частично, ошибка была в годах, рост количества наблюдений произошел не после 1950-х, а после 1970-х. Остальные 2 гипотезы были полностью верны.

Источник:

qwen ai - https://chat.qwen.ai/
Загрузка...
Чтобы оставить комментарий, необходимо авторизоваться
💬
Пока нет комментариев. Будьте первым!
Печать