Модуль: Работа с таблицами в Pandas


Описание данных для Pandas (Серии 07-11)


Данные для заданий

В последующих заданиях вы будете работать с таблицей user, которая использовалась в рамках предыдущих заданий. Однако в таблицу была добавлена новая колонка «last_visited»:

user

id gender birthday grade region last_visited
1 М 13.12.2006 11 Город Москва 01.09.2023 17:51:33
2 М 21.11.2009 8 Краснодарский край 10.09.2023 09:29:47
3 Ж 07.03.2010 7 Нижегородская область 28.08.2023 14:37:18
4 М 09.04.2006 null Город Москва 11.09.2023 18:24:10
5 Ж 14.09.2009 8 Новосибирская область 10.09.2023 21:11:57
6 Ж 23.07.2008 9 Новосибирская область 11.09.2023 22:39:43
 

В колонке «last_visited» содержится информация о том, в какой момент времени пользователь последний раз заходил на платформу.

Модифицированная схема таблицы выглядит следующим образом:

 
Колонка Тип данных Пропуски Первичный ключ
id Целое число False True
gender Строка False False
birthday Момент времени False False
grade Целое число True False
region Строка False False
last_visited Момент времени False False
 

Также в данных представлена таблица course, в которой содержится информация о курсах образовательной платформы.

 

course

id subject date_started mean_score max_score
1 Математика 01.05.2023 103.5 134
2 Биология 01.07.2023 null 110
3 Биология 01.09.2023 null null
 

В таблице представлены следующие колонки:

  1. «id» — идентификатор курса на платформе.
  2. «subject» — предмет, к которому привязан этот курс. По одному и тому же предмету может быть несколько разных курсов.
  3. «date_started» — дата, когда курс был запущен.
  4. «mean_score» — средний балл, который набирают ученики за курс. Если курс в данный момент ещё идёт, то значение в колонке будет пропущено.
  5. «max_score» — максимальный балл, который можно набрать за курс. Если в данный момент ученикам в курсе для изучения доступны не все темы, то значение в колонке будет пропущено. Максимальный балл всегда является целым числом.

Схема таблицы выглядит следующим образом:

 
Колонка Тип данных Пропуски Первичный ключ
id Целое число False True
subject Строка False False
date_started Момент времени False False
mean_score Вещественное число True False
max_score Целое число True False

Также вам будет дана таблица user_course_progress, в которой содержится информация о прогрессе учеников на курсах, на которые они были записаны.

user_course_progress

user_id course_id progress
3 1 122.5
3 2 99.8
1 3 22.3
5 3 59.7
2 1 91.5
4 3 43.4
6 3 0.0
 

В таблице представлены следующие колонки:

  1. «user_id» — идентификатор пользователя на платформе.
  2. «course_id» — идентификатор курса на платформе.
  3. «progress» — суммарное число баллов, которые ученик заработал на данном курсе.

Схема таблицы выглядит следующим образом:

 
Колонка Тип данных Пропуски Первичный ключ
user_id Целое число False True
course_id Целое число False True
progress Вещественное число False False