Internetas vis labiau panėšėja į Holivudą. Sėkmės sulaukę filmai kopijuojami, tas pats vyksta ir paieškos sistemų rinkoje. „Google“ uždirba pinigų ir, metų viduryje išleidusi akcijų emisiją, jų pritrauks dar daugiau, taigi paieškos sistemos staiga tapo svarbiausiu reiškiniu. Tačiau, kitaip nei Holivude, kur kopijos dažniausiai nebūna tokios sėkmingos kaip originalai, paieškos sistemos vartotojams pateikia vis geresnių įrankių.
„Google“ pradžia – unikali svetainių reitingavimo koncepcija, pagal kurią tinklapio populiarumas nustatomas pagal nuorodų į jį iš kitų svetainių skaičių. Prieš „Google“ paieškos sistemų lyderė buvo „AltaVista“, kuri smuko „Compaq“ įsigijus ją prižiūrėjusią bendrovę „Digital Equipment Corp.“. Prieš ir po „AltaVista“ pasirodė ir dingo keletas tarpinių lyderiukų. Tikrasis pradininkas – „WebCrawler“. Populiarus buvo ir „Yahoo!“, kuris veikė katalogo pagrindu, paiešką pateikdamas kaip papildomą įrankį.
Ko gero, būtent „Yahoo!“ liks vienintelė bendrovė, nenukentėsianti nuo artėjančių mūšių, nebent pati į juos įsipainios. Didžiausias triukšmadarys bus „Microsoft“, staiga pradėjusi mąstyti, jog tai yra ir jos verslas. Bendrovė ketina pristatyti naują paieškos tarnybą, naudojančią užklausas natūralia kalba, panašiai kaip „Ask Jeeves“. Ši niekada manęs nežavėjo, o juk jau kelerius metus plėtoja šią idėją. Ką „Microsoft“ ketina daryti kitaip?
Paieška natūralia kalba reiškia, kad, užuot ieškodami informacijos, kuriems žurnalams aš rašau, įrašysite ne „Dvorak writer magazine“ (t. y. raktažodžius), o „What magazine does John C. Dvorak write for“ (t. y. klausimą), kitaip tariant „Jei Johnas C. Dvorakas rašo žurnalams, kokie tai žurnalai, kur juos galima rasti ir kaip su jais galima susisiekti“. Jei šią procedūrą atliksite „Ask Jeeves“ sistemoje, gausite rėmėjo nuorodą į svetainę, kurioje įsigysite telefonų katalogo CD. Taip pat rasite du raginimus prenumeruoti žurnalus ir nuorodą į svetainę „Dvorako knygos“. Žemiau – nuorodos į painius dienoraščius, kuriuose minimos Dvorako skiltys. Šlamštas.
Jei norite įsitikinti, kaip prastai veikia natūralios kalbos apdorojimas, naudokitės „Google“ vertimo įrankiu. Jei įmonės nesugeba sukurti geros vertimo sistemos, kaip užklausoms jos gali naudoti natūralią kalbą? Tačiau „Microsoft“ padarys tai, ką daro geriausiai, neskaitant pagrindinės veiklos, - sudrums vandenį.
Tačiau ne viskas prarasta. Masačūsetso technologijos instituto leidžiamame „Technology Review“ numeryje aprašoma keletas naujų požiūrių į paiešką, pavyzdžiui, grupavimo metodologija, kurią naudoja „Mooter“ (www.mooter.com). Čia gausite ne paieškos rezultatų sąrašą, o jų grupes, kiek primenančias keistoką „Kartoo“ (www.kartoo.com).
Straipsnyje minima paieškos sistema, su kuria pažaidžiau ir pats – „Teoma“ (www.teoma.com). Ironiška, bet ji priklauso tam pačiam „Ask Jeeves“. Ši sistema dažnai aplenkia „Google“ tikslumu ir reikalingas nuorodas patalpina rezultatų sąrašo viršūnėje. Iš dalies taip atsitiko galbūt dėl to, jog „Google“ atsisakė savo reitingavimo metodologijos, išsigandusi paplitusio nereikalingo nuorodų persipynimo, dėl kurio daugelis kaltina beveik 5 mln. nerūpestingų dienoraščių rašytojų.
Tačiau „Google“ vis tiek lenkia konkurentus, ir pirmiausia dėl savo Voratinklio saugyklos. Negali nekelti susižavėjimo, kiek daug internete jau nebesančių svetainių dar galima rasti išsaugotas „Google“ atmintinėje. Jei neatsiras naujų sistemų su šia galimybe, „Google“ tiesiog negali būti nustumta nuo viršūnės.
Galiausiai kyla klausimas dėl giliojo Voratinklio, dažnai vadinamo paslėptu ar nematomu. Taip dažniausiai apibūdinamos svetainės, kurių pagrindas – duomenų bazės ir turinio valdymo sistemos, ir kurių negali indeksuoti paieškos sistemų “siurbliai”. Štai kodėl, ieškodami Johno C. Dvorako, rasite tik keletą iš šimtų mano parašytų skilčių.
Ne viena bendrovė dabar sprendžia šią problemą: bandoma naudoti daugialypes sistemas (atakuojančias įvairiausias nedidukes sistemas ir sujungiančias rezultatus) arba specialias paieškos sistemas, pavyzdžiui, „All Academic“ (www.allacademic.com). Nesvarbu, kuo tai baigsis, tačiau dėl vieno aš tikras: turėsime daugybę įvairiausių paieškos įrankių, ir tik taip įmanoma susidoroti su visa šia informacija. Padrąsinkite tokius žmones.
“Naujoji komunikacija”