Обновите ваш браузер для правильного отображения этого сайта. Обновить мой браузер
17.12.2024
Сетевое событие проходило с 18 по 29 ноября 2024 года по инициативе МБОУ СОШ №135 г. Снежинска.
В событии приняли участие команды из школ:
МБОУ СОШ № 22 г. Ковров,
МАОУ «Ангарский лицей №2 им. М.К. Янгеля» г. Ангарск,
МБОУ «Ливадийская СШ» г. Ливадия, г.о. Ялта,
МОУ «Гимназия №21» г. Электросталь,
МБОУ Гимназия №2 г. Саров,
МАОУ «Лицей №56» г. Новоуральск,
МБОУ «СОШ №109» г. Трехгорный,
МБОУ СОШ №135 г. Снежинск,
МАОУ СОШ №1 г. Заречный Свердловской области,
МБОУ «СОШ № 110» г. Трехгорный,
ГБОУ СОШ №54 имени Ю.А. Гагарина г. Севастополь,
МБОУ «СШ №15» им. В.Н. Рождественского г. Глазов,
МБОУ «СОШ №60 имени героев Курской битвы» г. Курск,
МБОУ Гимназия №2 г. Курчатов,
МАОУ Лицей №1 г. Балаково,
МАОУ «Школа №30 им. Л. Л. Антоновой» г. Нижний Новгород.
В общей сложности участниками события стали 81 участник и 24 наставника.
Сетевое образовательное событие «Впечатляющие данные» было посвящено анализу данных и профессии аналитик данных.
На первой встрече 20 ноября у участников состоялось знакомство с самыми простыми, но эффективными инструментами анализа данных – описательными статистиками. Разобравшись в отличиях среднего арифметического, медианы и размаха, участники получили для исследования первый набор описательных статистик по реальным данным.
В ходе встречи участники сами корректировали знания и выводы друг друга, а в результате получили первый набор инструментов для анализа данных. В качестве первого самостоятельного задания командам предстояло выполнить данные об экологической ситуации в их регионах (кстати, если Вам интересно, то на платформе можно найти те датасеты, которые анализировали наши участники).
Через два дня команды представили свой первый самостоятельный опыт после первичного знакомства с описательными статистиками по набору данных. И тут же появились первые успехи. Оказывается, имея лишь максимальные, минимальные и средние значения по данным, можно провести небольшое, но довольно глубокое исследование. Многие участники порадовали тем, что поработали с такими понятиями как «квартиль», «среднеквадратичное отклонение» и «дисперсия». С заданием, данными и ответами участников можно познакомиться по ссылке.
На второй встрече команды совместно освоили два новых инструмента для анализа данных: сводные таблицы и библиотеки pandas и matplotlib для анализа данных с помощью языка программирования python. Тренировались на известном наборе данных о пассажирах Титаника. Второе задание было связано с анализом не только описательных статистик, но и самих данных. Участники смогли выбрать один из пяти датасетов, распределенных по 3 уровням сложности (ссылка на датасеты).
В каждом из датасетов нужно было с помощью освоенных инструментов найти закономерности и сформулировать три гипотезы, которое могли быть проверены с помощью данных из выбранного набора.
Результаты работ были представлены на сетевой конференции исследователей данных 27 ноября. Каждая команда выступала как в роли выступающих, так и в роли оппонентов. Оппоненты заранее получили тезисы выступающих и смогли проверить или опровергнуть их самостоятельно.
Конференция проводилась по следующим четырем направлениям, соответствующим наборам данных, по которому работали команды: «Титаник», «Исследование телефонной зависимости пользователей телефонов на андроид и IOS», «Исследование сердечной недостаточности», «Исследование популярности музыки на основе данных сервиса Spotify» (с наборами данных и заданием можно познакомиться по ссылке).
В ходе конференции часть тезисов оказались опровергнуты. Некоторые авторам удалось отстоять свои исследования, но иногда у оппонентов были железные аргументы.
Каждая команда стала автором исследования. Работы представлены по ссылке.
Рефлексия была проведена в формате видео, где участники рассказали о профессии аналитика данных и о тех результатах, которые получили сами. Видео размещены в группе события на стене.
В результате оценки работ первое место разделили две команды: МБОУ «СШ №15» им. В.Н. Рождественского г. Глазов и МАОУ «Лицей №56» г. Новоуральск.
Второе место заняла команда из МБОУ СОШ №110 города Трехгорного.
Третье месторазделили три команды: МБОУ СОШ №22 г. Ковров, МБОУ Гимназия №2 города Сарова, МБОУ СОШ №135 г. Снежинска.
Некоторые отзывы участников:
Команда из Глазова: «Было очень необычно и интересно работать с большими данными на языке Python. Это был наш первый опыт работы в таком формате. Нам очень понравилось, и мы хотим дальше пробовать себя в деятельности аналитиков».
Команда из Сарова: «Получилось разобраться с работой на доске, сами переформулировали код для того, чтобы лучше самим его понять. Было интересно разбираться с графиками и зависимостями».
Звездина А.А., наставник команды г. Снежинск: «Хорошее событие, с интересным материалом и с возможностью вынести для себя новые навыки и знания, проба себя в роли аналитика».
Видеозаписи всех встреч, представление работ, промежуточных результатов можно найти в сообществе ВК события.
Результаты исследований представлены здесь.
Спасибо всем участникам за проделанную колоссальную работу по освоению новых инструментов анализа данных и за проведенные исследования! В ходе события вы выступили в роли аналитиков и экспертов (скажем так, анализировали анализ данных), попробовали даже анализировать данные «на ходу». Получалось не у всех, но это ведь только проба!
Как результат, участники узнали разные интересные факты о трагедии с Титаником, выяснили, что мужчины и женщины в равной степени подвержены телефонной зависимости, но вот в отношении сердечных заболеваний не все так однозначно. Японское RnB не так популярно, как RnB на других языках, а популярность композиций можно оценивать разными способами, все зависит от того, что именно хотим узнать. Еще участники узнали, что график BoxPlot иногда называют не только ящик с усами, но и чемодан с лапками, а в данные для анализа иногда вкрадываются ошибки и выбросы.
Всем участникам спасибо большое за работу и включенность!