Разбор задачи SQuAD
Описание
Между 2 этапом и финальной задачей мы предложили участникам Олимпиады Кружкового движения НТИ по профилю "Искусственный интеллект" потренировать свои навыки на одном базовых наборов для машинного чтения, который является русскоязычным аналогом Стэнфордского датасета с ответами на вопросы (SQuAD).
Датасет включает в себя фрагменты статей из Википедии, вопросы к ним, заданные разметчиками, и правильные ответы. Правильным ответом на каждый вопрос является сегмент из соответствующего фрагмента Википедии.
Попробовать себя в решении этой задачи можно в открытом соревновании по ссылке: http://competitions.codalab.org/competitions/28852
Ссылка на презентацию: http://github.com/AI-Front/NTI/blob/main/SQUAD_QA_systems.pdf
Ссылка на безлайн: http://github.com/AI-Front/NTI/blob/main/Train_SQuaD_tutorial.ipynb
Для тех, кто только начинает разбираться в теме, рекомендуем посмотреть вводный вебинар по вопросно-ответным системам: http://youtu.be/guPAeY10CEc
Комментарии