• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

© Высшая школа экономики

В этом году участники Всероссийской олимпиады школьников по искусственному интеллекту впервые смогут зачесть ее результаты при поступлении в вузы. Елена Кантонистова, председатель методической комиссии олимпиады и академический руководитель онлайн-магистратуры факультета компьютерных наук «Машинное обучение и высоконагруженные системы», рассказала новостной службе «Вышка.Главное» о том, как ученые ВШЭ составляли задания для соревнований 2023 года, откуда взялась задача об уссурийских тиграх и почему школьникам полезно осваивать ИИ.

Во Всероссийской олимпиаде школьников по искусственному интеллекту могут участвовать ученики 8–11-х классов. Первые два этапа, отборочный и основной, проходят онлайн. Лучшие 50 участников, отобранные по их результатам, приезжают в Москву на заключительный очный финал.

В олимпиаде есть задания по математике, алгоритмам, машинному обучению. В 2023 году в отборочном и основном этапах было по два задания по каждому направлению. В отборочном этапе задания несложные и доступные всем участникам, добросовестно изучившим школьную программу по математике и информатике. В основном этапе задания уже сложнее, а в заключительном — всего две задачи по машинному обучению, но обе довольно непростые.

Елена Кантонистова

В прошлом году большинство членов методической комиссии, которая разрабатывает задания, были сотрудниками факультета компьютерных наук Вышки.

Расскажу подробнее о заданиях по машинному обучению, так как они представляют наибольший интерес и являются основными в олимпиаде. В 2023 году в отборочном этапе была классическая задача регрессии, то есть прогноз на основе набора данных с различными признаками. Участникам нужно было предсказать стоимость домов по различным характеристикам.

Вторая задача была посвящена несложному и интересному анализу данных. Летом один из российских заповедников предоставил нам данные о наблюдениях за животными: например, где и когда видели северных оленей, волков, уссурийских тигров, что они при этом делали и так далее. Участникам нужно было ответить на вопросы по этим данным, от несложных (сколько пропусков в данных, какой зверь встречается людям чаще всего) до довольно хитрых (например, какое животное было замечено осенью 2022 года ближе всего к центру Москвы или какое животное чаще всего уличают в кражах).

Такие несложные, но содержательные по смыслу задачи — очень хорошее подспорье, чтобы заинтересовать школьников, только начинающих свой путь в анализе данных. Для решения не нужно знать никаких сложных алгоритмов, но при этом придется поизучать данные и их особенности, чтобы получить ответ.

В основном этапе задачи были уже сложнее. Одна задача требовала построения рекомендательной системы: на основе информации о пользователях «ВКонтакте» нужно было порекомендовать им группы, которые могут им понравиться. Вторая задача тоже была нестандартная: по описанию вакансии спрогнозировать среднюю зарплату, которую будет получать сотрудник. Для решения этих задач уже нужно иметь опыт в решении разнообразных задач машинного обучения.

© Высшая школа экономики

Все задачи подобраны таким образом, чтобы от тура к туру их сложность возрастала. Кроме того, нам не хотелось повторяться в темах, поэтому все задачи были разнотипными и из разных областей. Наконец, самое непростое: так как олимпиада имеет статус всероссийской, то в ней не могут использоваться стандартные открытые наборы данных (датасеты). Необходимо было найти новые датасеты для задач, а это всегда большая проблема. В итоге, конечно, все разрешилось: какие-то данные члены методической комиссии собрали сами, а какие-то предоставили коллеги из больших технологических компаний (а также заповедник).

В заключительном этапе была одна относительно несложная задача — предсказать вероятность клика по рекламному объявлению (на табличных данных) — и одна очень интересная: image-text matching. Здесь нужно было обучить модель, которая по паре (картинка и текст) предсказывает степень их смыслового соответствия. Разработчики задач пытались поставить участников в ситуацию из реальной жизни, где данные не идеальны. Особенностями обеих задач был умышленный data leak (утечка данных). При нахождении утечки можно было значительно улучшить качество прогноза в задаче и подняться на первые позиции в рейтинге.

В итоге многие ребята успешно справились с задачами, и участники из топа рейтинга показали очень хорошие результаты.

Для школьников участие в этой олимпиаде не только интересно, но и полезно. Перед каждым этапом проходят подготовительные вебинары — их тоже проводила по большей части команда преподавателей ФКН. После окончания этапов проводились разборы заданий. Также участникам предоставили список материалов для изучения, чтобы им легче было справиться с заданиями олимпиады.

У команды разработчиков было много трудностей. Одна из основных — составить задачи так, чтобы их нельзя было решить современными генеративными моделями (речь, в частности, о ChatGPT). То есть сами задачи не должны быть стандартными, а также должны иметь формулировки, в которых разберется человек, но пока не разбираются генеративные модели. В прошлом году нам удалось составить такие задания. Дальше, конечно, будет сложнее.

В этом году олимпиада примет еще большие масштабы, так как ее результаты можно будет учесть для поступления в вузы. Мы надеемся поучаствовать в составлении заданий и для следующих олимпиад.

Вам также может быть интересно:

Вышка провела заключительный этап Московской предпрофессиональной олимпиады школьников в продуктовом секторе

15–16 марта Высшая школа экономики принимала будущих инженеров — учащихся 8–11-х классов, прошедших в заключительный этап Московской предпрофессиональной олимпиады школьников в продуктовом секторе. 15 марта в корпусах университета в Строгино, где располагается Московский институт электроники и математики ВШЭ, и на Мясницкой улице финалисты решали междисциплинарные задачи по математике, физике и информатике, которые позволили им продемонстрировать базовые знания и логическое мышление и подготовили к практическому этапу финала.

Открыта регистрация на отборочный этап Международной олимпиады по финансовой безопасности

Олимпиада организована Росфинмониторингом совместно с Минобрнауки и  Минпросвещения России, а также вузами Международного сетевого института в сфере ПОД/ФТ, включая Высшую школу экономики. В этом году эксперты НИУ ВШЭ приняли методическое участие в разработке заданий пригласительного этапа. К участию допускаются школьники и студенты, зарегистрировавшиеся на отборочный этап до 30 марта.

В финале НТО школьники разработали алгоритм для анализа соцсетей

Стали известны имена победителей и призеров профиля «Большие данные и машинное обучение» Национальной технологической олимпиады (НТО), проектный офис которой работает в НИУ ВШЭ. Ими стали 30 школьников 8–11-х классов из 12 регионов. Заключительный этап олимпиады проходил в Санкт-Петербурге на базе Университета ИТМО. Партнерами профиля выступают компания «Яндекс», VK Education, а также платформа All Cups.

В Вышке стартовали открытые семинары «ИИ в индустрии»

Институт искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ запустил цикл открытых семинаров. Встречи посвящены актуальным вопросам внедрения искусственного интеллекта в различные отрасли экономики. Семинары проводятся еженедельно в 18:00 в кампусе на Покровском бульваре. Для участников также предусмотрена онлайн-трансляция.

Ученые представили новый метод для работы с несбалансированными данными

Специалисты факультета компьютерных наук НИУ ВШЭ и Лаборатории искусственного интеллекта Сбера разработали геометрический метод расширения данных — Simplicial SMOTE. Тесты на разных наборах данных показали, что он значительно улучшает качество работы AI. Метод особенно полезен в ситуациях, когда редкие случаи очень важны, например в борьбе с мошенничеством или при диагностике редких болезней. Результаты исследования доступны в открытом архиве Arxiv.org и будут представлены на Международной конференции по обнаружению знаний и анализу данных (KDD) летом 2025 года в Торонто.

Кто зажжет «Факел»: стартовало народное голосование премии НТО

Стартовало народное голосование за соискателей премии «Факел» Национальной технологической олимпиады (НТО), проектный офис которой работает в Высшей школе экономики. Премия для выпускников НТО организована впервые в честь 10-летнего юбилея самых крупных командных инженерных соревнований для школьников и студентов в России. Отдать голос можно на официальном сайте премии до 31 марта 2025 года.

«Люди, делающие новое»: более 4000 школьников из разных стран стали участниками PROD

В Москве завершился заключительный этап первой в России олимпиады по промышленной разработке PROD среди школьников от Центрального университета, Т-Банка и НИУ ВШЭ. В ней приняли участие более 4 тысяч старшеклассников из всех регионов России, Беларуси и 22 стран мира, включая Великобританию, Германию, Францию, Канаду, Китай и даже Перу.

В Вышке рассчитали экономический эффект от внедрения технологий ИИ в России

Институт статистических исследований и экономики знаний НИУ ВШЭ оценил потенциальный экономический эффект от внедрения и использования технологий искусственного интеллекта в отраслях российской экономики до 2035 года. Эксперты также предположили, каким должен быть объем ресурсов, которые потребуются организациям для освоения данного класса технологий.

«Хорошее настроение и уверенность в победе»: завершился заключительный этап «Высшей пробы»

Всероссийская олимпиада школьников «Высшая проба» в этом учебном году была проведена в 39 городах России по 29 профилям, не считая профиля «Анализ данных» в формате Национальной олимпиады по анализу данных DANO. Общее число регистраций превысило 274 тыс., а число зарегистрировавшихся школьников — 68 тыс. человек, что соответственно на 14,5 тыс. и на 2 тыс. больше, чем в предыдущем году.

НТО и «Роскосмос» определили лучших школьников в космических технологиях

1 марта в Москве состоялось торжественное закрытие финалов космических профилей Национальной технологической олимпиады (НТО), проектный офис которой работает в НИУ ВШЭ. Названы имена победителей и призеров сразу по трем направлениям: «Аэрокосмические системы», «Анализ космических снимков и геопространственных данных» и «Спутниковые системы». Лучшим стал 21 школьник из 13 регионов России. Соревнования традиционно проходили при поддержке Госкорпорации «Роскосмос».