Archeologai bei lingvistai sugebėjo iššifruoti beveik visas žmonių naudotas kalbas; mokslininkų vertinimu, tik maždaug aštuonios kalbos dar išliko nesuprantamos. Iki šiol tyrinėtojai šiam darbui daugiausia naudojosi žmogiškąja logika ir intuicija, tačiau Masačiusetso technologijos instituto darbuotojai sukūrė kompiuterinę sistemą, kuri, analizuodama nežinomą kalbą, sėkmingai imituoja žmogaus mąstymą.
Jų pasiūlytas metodas remiasi keliomis kertinėmis prielaidomis:
- tiriama kalba turi sąsajų su kuria nors žinoma kalba;
- yra įmanoma susieti vienos kalbos abėcėlę su kitos kalbos abėcėle;
- nežinoma kalba turi pagrindinių žodžių, kurie yra panašūs į žinomos kalbos žodžius;
- nežinomos kalbos žodžiai gali turėti panašias žodžių dalis, tokias kaip priešdėliai, priesagos.
Kalbos turi savo pirmtakes, todėl net išnykusi kalba yra panaši į tą, kuri vis dar naudojama. Pavyzdžiui, romanų kalbos, kaip ispanų ar prancūzų, yra kilusios iš lotynų kalbos, todėl, žinant vieną iš jų, galima šiek tiek suprasti bei lengviau išmokti kitą.
Kompiuteriai paprastai negali padaryti tokių prielaidų, nes jie dirbdami remiasi visiškai tiksliais duomenimis, o žmogus gali greitai susieti faktą su kontekstu ir daryti išvadas, kokios kompiuteriui būtų visiškai neįkandamos.
Būtent šią problemą ir sprendė Masačiusetso technologijos instituto mokslininkai, mėgindami priversti kompiuterį ne tik skaičiuoti, bet ir interpretuoti.
Savo sukurtą algoritmą jie išmėgino analizuodami ugaritų kalbą – tai viena iš semitų prokalbių, dabar jau išnykusi, tačiau jau iššifruota. Kompiuteris vos per kelias valandas sugebėjo išversti šios kalbos tekstą į hebrajų kalbą.
Pasirodė, kad kompiuteris iš 30 ugaritų abėcėlės raidžių teisingai atpažino 29 ir susiejo jas su atitinkamomis hebrajų raidėmis. Maždaug 30 procentų ugaritų pagrindinių žodžių turi panašią šaknį kaip ir hebrajų žodžiai, ir sistema iš jų teisingai atpažino 60 procentų.
Tokia kompiuterio programa galėtų padėti archeologams perskaityti senųjų kalbų tekstus, kurie iki šios dienos lieka paslaptimi, be to, pagelbėtų ir automatinio vertimo sistemoms, tokioms kaip „Google Translate“, kuri šiuo metu gali versti iš 57 kalbų.
Sistemos algoritmo principai bei jų matematinis modelis aprašyti šioje publikacijoje.