Македонски студенти со меѓународна награда за развој на првиот отворен ВИ модел за македонски јазик

Голем успех за македонската наука и технологија – студенти и истражувачи од Факултетот за електротехника и информациски технологии (ФЕИТ) при УКИМ ја освоија наградата за најдобар научен труд на престижната меѓународна конференција „Slavic NLP Workshop“, одржана во рамки на 63-тото издание на водечката светска конференција за обработка на природен јазик – ACL (Association for Computational Linguistics) во Виена, Австрија.

Наградениот труд, со наслов „Towards Open Foundation Language Model and Corpus for Macedonian: A Low-Resource Language“, го потпишуваат Стефан Крстески, Борјан Саздов и Матеа Ташковска, под менторство на професорите Бранислав Геразов и Христијан Ѓорески. Тимот направи значаен придонес кон дигитализацијата и технолошкиот развој на македонскиот јазик и вештачката интелигенција (ВИ) во земјава.

Во рамки на истражувањето биле развиени четири клучни ресурси:

  • Голем јазичен ВИ модел (LLM) специјализиран за македонски јазик – domestic-yak-8B, најдобар во својата категорија.
  • Најголемиот јавно достапен текстуален корпус за македонски јазик.
  • Множество инструкции на македонски за развој на големи јазични модели.
  • Систем за евалуација на перформансите на јазичните модели на македонски јазик.

Овие ресурси, достапни на www.lvstck.org, претставуваат прва отворена инфраструктура за развој на големи јазични модели и апликации базирани на вештачка интелигенција на македонски јазик. Нивната цел е да станат основа за понатамошни истражувања, развој на јазични алатки и нивна примена во различни сектори – од образованието до индустријата.

„Овој успех претставува меѓународно признание за македонските истражувачи и чекор кон дигитална иднина во која македонскиот јазик ќе има поддршка и видливост во глобалниот развој на јазични технологии“, се наведува во соопштението на ФЕИТ.

ACL е водечка глобална конференција во областа на обработката на природен јазик со традиција од 63 години. „Slavic NLP Workshop“, која годинава го одбележа своето десетто издание, е посветена на истражувања на сите словенски јазици.

Зачлени се на нашиот е-билтен