Поздравляем с третьим и четвертым местом на datathon 2023 “Научи искусственный интеллект читать на кыргызском” студентов 1го курса команды “Devs”:
1. Ташбаев Байтур MIN-1-22
2. Курбанов Амит MIN-1-22
3. Догдурбаев Эмирлан MIN-1-22
4. Самсаев Рустам WIN-1-22
5. Асанбаев Байтемир AIN-1-22
6. Бердикожоев Санжар AIN-1-22
7. Алмазбеков Бексултан AIN-2-22
8. Бактыбеков Нурсултан WIN-1-22
Задача состояла в том, что нужно было создать модель, которая будет разбивать кыргызские слова на морфемы, например, аталар -> ата - ROOT, лар - AFFIX. В лингвистике эта задача называется морфологический анализ слова. А в AI - задача классификации.
Было загружено 130 сабмишнов! Все результаты оценивались автоматически с помощью метрики F1 score.
каждой команде был выдан DataSet который состоял из 35916 слов.
Помимо этого DataSet был разделен
на train = 24640 слов, на которых обучается модель
test = 11276 слов, на которых модель будет тестироваться.