Teisinių dokumentų automatinio semantinio anotavimo tyrimas

Technorama 2018

Lietuvos Respublikos teisinių dokumentų sistema yra labai plati, analizuojant teisinius dokumentus ir norint atpažinti pagrindines teisės normas straipsniuose, susiduriama su rankiniu anotavimu, kuris reikalauja didelės laiko investicijos.

Siekiant optimizuoti bei palengvinti su teisės sritimi susijusių žmonių darbą, siūlomas sprendimas – automatinis semantinis teisinių dokumentų anotavimas. Tai sukurtas sistemos prototipas, į kurį patalpinus pasirinkto kodekso straipsnį, straipsnis automatiškai suanuotajamas pagal sukurtas anotacijų taisykles. Anotacijų taisyklės kuriamos pagrindinėms teisės normoms atpažinti: hipotezei, sankcijai ir dispozicijai, bei teisių ir pareigų išskyrimui dispozicijose. Taisyklės aprašomos pagal žodžių lemas ir morfologijas, kurios gaunamos kreipiantis į semantika.lt saityno paslaugą (angl. web service).

Atlikus automatinį anotavimą, sistemos lange atvaizduojamas tekstas, kuris yra išskaidytas skirtingomis spalvomis, atitinkamai pagal rastas anotacijas. Teksto pažymėjimas spalvomis palengvina teisės normų atpažinimą vartotojui.

Svarbu paminėti, kad kiekvienas kodeksas turi savitą struktūrą ir tematiką, todėl anotacijų taisyklės teisės normoms rasti turi būti kuriamos išanalizavus kiekvieną kodeksą individualiai.

Pateikiamas automatiškai suanotuotas Administracinių nusižengimų kodekso, specialiosios dalies, 12 skyriaus, 99 straipsnis.

Trukmė:
2018 - 2018