Kalifornijos universiteto Berklyje mokslininkai sukūrė naują interneto paieškos sistemą „Infovell“, kuri esą sugeba atrasti tai, ką praleidžia tokie paieškos gigantai, kaip „Google“ ar „Yahoo“.
Nors „Infovell“ galimybės turėtų pralenkti beveik etalonu tapusį „Google“ paieškos variklį, visgi naujoji sistema neskirta plačiajai rinkai ir konkuravimui su komercinėmis paieškos sistemomis. Tuo labiau, jog ir naujoji paieškos sistema buvo kuriama iš esmės mokslininkų poreikiams – tikslios, rimtos ir specifinės informacijos paieškai.
Kūrėjų manymu tokio tipo informacijos tradicinės paieškos sistemos praktiškai nesugeba net suindeksuoti – mokslininkų teigimu šiuo metu internetu prieinamos mokslinės informacijos dabartiniu indeksavimas siekia tik 0,2% . Likę 99,8% yra „šešėlyje“, vadinamajame giliajame internete (deep web), ir paieškos robotai jos tiesiog nepasiekia (dėl pačių įvairiausių priežasčių, pvz., registracijos ar kitos papildomos sistemos apsaugos).
Šis neindeksuotas informacijos lobynas ypatingai svarbus mokslininkams, nes jame dažniausiai slepiasi specializuota informacija. Ji neturi gražios vartotojo sąsajos, laikoma mažai lankomame tinklalapyje, tačiau yra vertinga ir naudinga. „Infovell“ kūrėjai akcentuoja, kad yra susidaręs savotiškas ratas: nedideli ir neoptimizuoti tinklalapiai yra nemėgstami paieškos sistemų, tad jie niekaip nepakyla į viršutinius užklausos rezultatus. Tai reiškia, kad jie sulaukia nedaug lankytojų ir gauna nedidelį paieškos sistemų įvertinimo balą. O tai vėl juos stumia į paieškos rezultatų dugną.
Tad mokslininkai, norėdami surasti naudingą straipsnį, paprastai būna užverčiami nereikalinga ir net nesusijusia informacija, o padidinus raktažodžių skaičių, paieškos sistema rezultatų apskritai neberanda.
Štai tokia situacija paskatino Kalifornijos universiteto mokslininkus, dirbančius ties žmogaus genomo projekto šifravimu (Human Genome Project), kurti naują paieškos variklį. Reikėtų pažymėti įdomų faktą – genomo tyrinėtojams neatsitiktinai šovė į galvą mintis, jog jie pajėgūs sukurti tokią sistemą. Juk tyrinėjant genomą tenka apdoroti milžiniškus duomenų kiekius ir juose surasti atskiras genomo grandines, kurios nėra pažymėtos jokiais raktažodžiais. Tad per ilgą laiką mokslininkai susikūrė savus originalius paieškos algoritmus, kuriuos dabar nusprendė pritaikyti bendros informacijos paieškai internete.
Štai taip gimė sistema „Infovell“, sugebanti aptikti reikiamą informaciją bet kokia kalba ir net užkoduotą bet kokia kita simbolių sistema. Pasak kūrėjų, vienintelis reikalavimas ieškomam dokumentui – jis turi būti skaitmeninės formos.
Nuo tipinių paieškos sistemų „Infovell“ skiriasi dar ir tuo, jog ji ieško ne tik pagal raktažodžius, bet ir pagal raktažodžių frazes, pažymi sistemos kūrėjai. Sistema gali ieškoti atitikmenų pagal atskirus dominančio teksto paragrafus ar ištisus dokumentus arba net dokumentų rinkinius. Vienintelis užklausos apribojimas yra jos dydis – ji neturi viršyti 25 tūkstančių žodžių. Ir, kaip jau minėjome, paieškos sistemai jokios įtakos neturi užklausos kalba – ji suras visus atitinkamus dokumentus anglų, kinų ar prancūzų kalba, jei tik jie egzistuoja.
Kadangi sistemos algoritmui nesvarbi kalba, todėl į paieškos lauką galima įvesti tiesiog chemines formules ar matematines lygtis.
Be viso to, sistema yra valdoma labai lengvai – kaip ir kitos populiarios tradicinės sistemos.
Taigi, išvardintų pliusų labai daug, belieka laukti naujų sistemos bandymo rezultatų. Kol kas ji buvo pademonstruota „DEMOfall08“ parodoje.