Dvikalbis automatinis terminų atpažinimas, Nr. P-MIP-20-282
Projekto Nr. P-MIP-20-282
Projekto pavadinimas: „Dvikalbis automatinis terminų atpažinimas”
Projekto vykdymo laikotarpis: nuo 2019-05-01 iki 2022-06-30
Projekto vykdytojas: Vytauto Didžiojo universitetas
Projekto dalies koordinatorius MRU: prof. dr. Sigita Rackevičienė.
Santrauka: Projekto tikslas – sukurti metodiką, kuri leistų automatiniu būdu lygiagrečiajame ir palyginamajame tekstynuose atpažinti angliškus ir lietuviškus specialios srities terminus, bei sudaryti empiriniais duomenimis paremtą dvikalbę tos srities terminų bazę, viešai prieinamą internete. Šiam tyrimui pasirinkta specialioji sritis – kibernetinio saugumo terminija. Sprendžiama mokslinė problema. Projekto metu sprendžiama mokslinė problema – tai automatinis terminografinės medžiagos rinkimas iš dvikalbių duomenų, t. y. iš lygiagrečiųjų ir palyginamųjų tekstynų, kai viena iš kalbų yra neturinti daug kalbinių išteklių ir yra morfologiškai turtinga. Įgyvendinant projekto tikslą, bus sukurta inovatyvi metodika, kuri, mūsų žiniomis, Lietuvoje dar nebuvo taikyta. Kuriant ją, planuojama ištirti galimybes naudoti naujausius besimokančių sistemų algoritmus ir neuroninius tinklus dvikalbių terminų atpažinimui. Kibernetinio saugumo (KS) sritis. KS sritis pasirinkta dėl jos ypatingo aktualumo šiandieninėje informacinėje visuomenėje. Ši sritis ypač dinamiška – nuolat atsiranda nauji KS srities dokumentai, juose formuojamos naujos sąvokos, kurių pavadinimai lietuvių kalba dar nenusistovėję, vartojami keliais variantais, dažnai originalo (anglų) kalba arba kaip hibridai (anglų ir lietuvių kalbų leksinių vienetų junginiai). Todėl KS terminų bazė šiuo metu itin reikalinga tiek teisės bei administracinių aktų rengėjams ir jų vertėjams, tiek informacinių technologijų specialistams, tiek plačiajai visuomenei.
Siekiamas rezultatas: Projekto metu bus sukurti ir atverti visuomenei (paskelbti CLARIN saugykloje) dvikalbiai (anglų-lietuvių kalbų) kibernetinio saugumo srities tekstynai – lygiagretusis ir palyginamasis. Jie atspindės kibernetinio saugumo terminų vartoseną įvairių žanrų ir tipų tekstuose nacionalinėje ir tarptautinėje aplinkoje. Iš tekstynų surinkta terminografinė medžiaga bus skelbiama atviroje anglų ir lietuvių kalbų kibernetinio saugumo terminų duomenų bazėje. Ši bazė galėtų tapti modeliu ir kitų sričių terminų bazių kūrimui, pasitelkus moderniausias technologijas, įgalinančias automatizuoti terminografinės medžiagos rinkimo procesus.
Projektas vykdomas pagal Lietuvos mokslo tarybos (LMT) remiamą veiklos kryptį „Mokslininkų grupių projektai“.