Ekspertai mano, kad kalba turi specialią vietą tarp kitų komunikacinių sistemų – ji yra visiškai žmogiška ir tik ji garantuoja visavertį žmonių bendravimą. Lingvistė, habilituota humanitarinių mokslų daktarė Rūta Petrauskaitė įsitikinusi: žmonėms geriausia informaciją kurti, kaupti ir perteikti žmonių kalbos tekstu, kad ir koks sudėtingas ir painus informacijos būdas tai būtų.
Šiandien kompiuteriui suprantama tik sterili ir ganėtinai primityvi kalba, be dviprasmybių, neaiškumų. Tai trukdo išnaudoti kompiuterį tokiose darbo srityse, kuriose žmogus sugaišta daug daugiau laiko, nei jeigu tai atliktų pasitelkdamas kompiuterį. Žmogaus ir mašinos bendravimas taip, kad būtų patogu žmogui, o ne kompiuteriui, jo gimtąja, natūralia, nė kiek neapribota kalba, yra laikomas didžiausiu informacinės visuomenės privalumu. Prie to dirba mokslininkai, kurie plečia dirbtinio intelekto galimybes.
Lietuvoje būtent su lietuvių kalba ir jos pritaikymu kompiuteriui dirba Vytauto Didžiojo universiteto (VDU) Kompiuterinės lingvistikos centras – prieš du dešimtmečius jis pirmasis pradėjo tokio pobūdžio veiklą Lietuvoje. „Tokia sudėtinga ir mažai gimtakalbių turinti kalba, kokia yra lietuvių, turi daug mažiau galimybių išlikti, todėl jos kompiuterizavimas ypač aktualus. Jis svarbus ne tik siekiant išsaugoti kalbą, bet ir dėl daugelio kitų priežasčių“, – teigia mokslininkė R. Petrauskaitė.
Pritaikomumo galimybės tik didėja
Kompiuterinės lingvistikos taikymas leidžia ne tik efektyviau ieškoti informacijos, naudotis mašininiu vertimu, mokytis kalbų , bet ir automatiškai užrašyti šneką. Pavyzdžiui, Olandijoje gydytojui nieko nereikia rašyti. Gydytojai informaciją apie paciento būklę diktuoja kompiuteriui, o jis viską suveda į ligos kortelę. Kompiuteris taip įdarbintas, kad net nusiunčia gydytojo receptą į vaistinę, o pacientui reikia tik nueiti ir nusipirkti vaistus. Tuo tarpu Jungtinėse Amerikos Valstijose kompiuterinė lingvistika pasitelkiama sekimo ir šnipinėjimo tikslams – taip sekami ir analizuojami teroristų, nusikaltėlių susirašinėjimai ir aptinkami jų tinklai. Visose šalyse kompiuterinės lingvistikos galimybės naudojamos nustatant mokslinių darbų, ir ne tik jų, plagiatus, norint sudaryti didžiulių tekstų santraukas ar išgaunant informaciją ir nagrinėjant tekstų, vaizdų ir garso įrašų turinio ypatybes.
Pasak lingvistės R. Petrauskaitės, visuomenėje vyrauja klaidinga nuomonė, kad filologas negali mokėti programuoti, o informatikas – kompiuteriu analizuoti kalbos. „Kompiuterinė lingvistika yra tarpdalykinė veiklos sritis. Čia susiduria dviejų skirtingų mokslų atstovų, kalbininkų ir informatikų, požiūris į kalbą. Dėl tokio bendradarbiavimo galima nagrinėti daug įvairių dalykų, pavyzdžiui, šiuo metu VDU Kompiuterinės lingvistikos centras vykdo vieną įdomų projektą – internetinių straipsnių komentarų analizę. Toks komentarų tyrimas gali padėti nuspėti bendras visuomenės nuotaikas, nustatyti patyčias, netgi grėsmes, padeda identifikuoti komentatorių tipažus“, – atskleidė VDU dėstytoja.
Pasak jos, šiandienė informacijos priemonių stebėsena, kurią užsisako didžiosios kompanijos, norinčios žinoti, koks jų įvaizdis vyrauja viešojoje erdvėje, dažnai nėra išsami arba tiksli. „Galima teigti, kad dabar esančios kokybinės spaudos analizės priemonės nėra tobulos, nes įrankiai, kuriais jie naudojasi, nėra išbaigti. Norint, kad kokybinė analizė būtų tiksli, reikia atlikti vadinamąją sentimentų analizę, įvertinti tiriamojo teksto toną ir kitus dalykus, neužtenka tik surašyti tiriamos kompanijos paminėjimus ir pagal tai daryti vertinimus“, – įsitikinusi kompiuterinės lingvistikos ekspertė.
Lietuvių kalba – iššūkis kompiuteriui
Jau seniai kompiuterinės lingvistikos galimybės leidžia ne tik taisyklingai sukirčiuoti žodžius, išsiaiškinti nežinomo žodžio reikšmę, morfologiškai išnagrinėti bet kokią kalbos dalį ar sudaryti tam tikrą veiksmažodžio formą, bet ir tą žodį ar netgi visą tekstą pagal skirtingus parametrus įvairiapusiškai išanalizuoti. Kalbos analizės programos atlieka daug funkcijų: skaičiuoja ženklus, žodžius, sakinius, sakinio ir žodžio ilgį, automatiškai nustato kalbos dalis, sakinio ribas, nustato sustabarėjusius žodžių junginius, verčia ir net kuria tekstus. Lygiagretusis tekstynas palengvina vertimą, nes iš jo galima perimti atitikmenis. Svetainėje http://tekstynas.vdu.lt/ esanti vertimo sistema verčia kur kas geriau ir tiksliau nei tuo pačiu metu kurtas „Google“ vertėjas, nors visada yra ką patobulinti.
Vienu didžiausių savo pasiekimų Kompiuterinės lingvistikos centro mokslininkai laiko analogų Lietuvoje neturinčio Dabartinės lietuvių kalbos tekstyno suformavimą ir kalbinių bei semantinių technologijų vystymo projekto kodiniu pavadinimu „Semantika LT“ įgyvendinimą. Nors galutiniai projekto „Semantika LT“ tikslai buvo kalbos ir semantinėmis technologijomis grįstų viešųjų paslaugų sukūrimas, bet tai pavyko padaryti tik įvykdžius esminį proveržį lietuvių rašytinės kalbos analizės technologijose. To anksčiau nebuvo įmanoma atlikti dėl riboto valstybės finansavimo ir mažo dėmesio šiai sričiai.
„Įvykdžius projektą, Lietuva pagaliau priartėjo prie Europos kalbos technologijų išvystymo vidurkio, nuo kurio buvo atsilikusi daugiau nei aštuoneriais metais. Pasinaudodami projekto rezultatais, vartotojai viešai ir nemokamai prieinama informacine sistema galės atlikti sintaksinę-semantinę tekstų analizę, surasti ir koreguoti rašybos bei gramatines klaidas, atpažinti interneto žiniasklaidos kalbos naujoves, atlikti interneto žiniasklaidos sintaksinę-semantinę analizę. Tai ne tik skatins taisyklingos lietuvių kalbos vartojimą elektroninėje erdvėje, bet ir palengvins informacijos lietuvių kalba suradimą bei jos analizę“, – rezultatais džiaugiasi mokslininkė R. Petrauskaitė.
Rimgailė Dikšaitė