Ips je... Svrha i funkcije informacijskih tražilica

Teško je zamisliti modernog čovjeka život bez internet i gotovo trenutni pristup izvorima informacija. Korisnik rijetko razmišlja o tome kako tražiti željeni sadržaj na mreži. Ali to je vrlo zanimljivo.

Informacijska i tražilica (IPS) složen je softverski i hardverski kompleks koji odabire informacije na zahtjev korisnika. Informacije se pohranjuju na poslužiteljima digitalno, kao što su knjige prethodno stajale na policama knjižnica. Sustav se sastoji od mnogih podsustava. Svaka obavlja svoj zadatak u procesu obrade zahtjeva korisnika i pružanja informacija u tekstualnom ili zvučnom obliku. Mnoštvo zadataka koje treba riješiti i zbog složenosti arhitekture modernog IPS-a (kratica za informacijsku i tražilicu). Vrsta "crna kutija": na ulazu-tekst zahtjeva, što je unutra-nepoznato, na izlazu-sveobuhvatne informacije.

Kartoteka u stvarnom životu

Ulazni tokovi

Zahtjevi za dobivanje informacija koje osoba formira u tekstualnom obliku na zaslonu svog gadgeta čine mali dio upita koje obrađuje tražilica. Glavni nizovi upita za pretraživanje formiraju roboti koji prihvaćaju ljudski zahtjev i provode višestupanjsko pretraživanje i povratne informacije s korisnikom. Informacijske i tražilice uključuju poznate svima, "Jandeks" i drugi koji svakodnevno obrađuju milijune zahtjeva.

Izvorni objekti pretraživanja

Skup izvornih objekata od interesa za pretraživanje su dokumenti, zapisi, videozapisi, slike i još mnogo toga. Stvoreni su izvan IPS-a. Opći sustav za pohranu i pretraživanje informacija trebao bi imati ugrađeni bibliografski sustav – svojevrsni katalog koji vam omogućuje pretraživanje bilo koje vrste predmeta.

Objekti ili njihove digitalne transformacije postaju "resurs za prijavu" u IPS-u. Među njima odabiru informacije koje su korisniku potrebne.

Pronalaženje informacija

Vanjski izvori

U prikazu izbora informacija koriste se vanjski izvori znanja. To su informacije koje korisnik traži. Naslov filma, citat iz knjige i još mnogo toga. Za računalno pretraživanje ove se informacije moraju prevesti u zahtjev na algoritamskom jeziku. U IPS-u se to postiže pomoću bloka za stvaranje, indeksiranje i razvoj upita.

Idealno bi bilo da se ova tri procesa – predstavljanje, indeksiranje i razvoj upita –oslanjaju na identične izvore znanja, ali u praksi to nije moguće postići.

Izvori znanja moraju se stalno revidirati i ažurirati, a ažuriranje mora biti identično i sinkronizirano. A vanjski izvor znanja uvijek kronološki prethodi njegovoj upotrebi u tražilicama za upit, ponekad i nekoliko godina.

Sustav pretraživanja informacija

Podnesci

Prikazi izvornih objekata sastavljaju se od ulaznih podataka u neku kombinaciju ili se pretvaraju u skladu s pravilima i algoritmima određene informacije-tražilice.

Prikazi su više ili manje pretvorene kopije izvornog objekta pretraživanja. U zbirci neuređenih cjelovitih tekstova svaki je tekst vlastiti prikaz. U zbirci predmeta muzejskih eksponata i artefakata prikaz može biti transformirani opis predmeta s njegovom slikom. U nekim se slučajevima prikaz može djelomično izvesti iz izvornog objekta, a dijelom iz opisa: u bibliografskim sustavima pretraživanja prikazi su izvedenice iz objekta – na primjer, naslov, ime autora kombinirat će se s napomenom djela.

Pronalaženje pravog

Indeks koji se može pretraživati

Budući da se informacije u tražilicama informacija pohranjuju u obliku prikaza, logično je pretpostaviti da se pretraživanje vrši prema prikazu i nakon odabira izdaje korisniku. U praksi to nije slučaj. Na primjer, trenutni direktoriji mrežnih knjižnica obično ograničavaju pretraživanje na više polja: autora, naslova i podnaslova unutar prikaza koji sadrži druge polja koja ne pretražuju. To je dovoljan razlog zašto je potrebno razlikovati prikaz i indeks koji se može pretraživati, a koji je dio prikaza za pretraživanje. Definira sve, što bi trebalo biti Pretraživ. Indeks koji se može pretraživati, poput prikaza i izvornog objekta, može se podijeliti u zasebne podindekse kako bi se omogućilo preciznije, ciljano pretraživanje

Tražilice obično imaju sintetičku strukturu za usporedbu valjanih rezultata pretraživanja. Ova je struktura druga komponenta indeksa koja se može pretraživati.

Proceduralno se postupak indeksiranja može implementirati na različite načine: indeks koji se može pretraživati može se dobiti:

  • doslovno kopiranje prikaza koji se može pretraživati;
  • kopiranjem detalja prikaza. To može biti dio ili svi prikazi koji fizički postoje samo kao fragmenti raspoređeni prema pravilima stvaranja indeksa za pretraživanje koje će se prikupljati po potrebi.
Upravljanje pretraživanjem

Pravila dizajna upita i formalni upiti

Razvoj upita je značajka koja posreduje između korisničkog upita i formalnog upita. Transformira korisnički upit usklađujući ga s rječnicima naredbi za dohvaćanje, specifikacijom indeksa i indeksom prije dohvaćanja. U zoru razvoja IPS-a, ova je uloga tradicionalno bila dodijeljena kvalificiranim stručnjacima za televiziju.

Razvoj računalnih upita koji mogu preslikati upite u rječnik u indeks pretraživog sustava obično se naziva modulom "unos rječnika". Automatizacija ove značajke je obećavajuća i nudi mogućnosti za stručne i probabilističke metode pretraživanja.

Formalni upit postaje takav nakon pretvorbe korisničkog upita. Primjeri takvih formalnih transformacije uključuju skraćivanje, zamjenu, normalizaciju, vektorizaciju i druge transformacije "vanjski" prikazi u "unutarnje" prikazi računalnih IPS-a (dekodiranje-informacijska i tražilica).

Izdvojeni skupovi veza do dokumenata

Rezultirajući skup izvora informacija logično je podskup prikaza, stvoren prema pravilima podudaranja primijenjenim na formalni upit indeksom koji se može pretraživati.

Obično, ali ne nužno, postoji zaseban postupak sortiranja oporavljenog skupa informacija. Mrežni katalozi knjižnica obično preuređuju rezultirajuće skupove abecednim redom po autoru prije prikazivanja. U sustavima za pronalaženje informacija koji proizvode strogo rangiranje, poredak ranga prethodi bilo kojem preuređivanju.

Analiza podataka

Izlazni tokovi

Izlaz rezultata pretraživanja tradicionalno se vrši na zaslon, češće kao tok objekata koji će se koristiti negdje drugdje ili u neke druge svrhe, dovršava glavnu petlju pretraživanja.Takvi se tokovi mogu usmjeriti na uređaje za snimanje, pohranu za kasniju obradu ili koristiti kao ulazne tokove u druge usluge odabira.

Informacijske i tražilice omogućuju povratne informacije o izlazu bilo kojeg postupka odabira. Izlaz bilo kojeg procesa može predstavljati povratne informacije o drugim procesima. Povratne informacije mogu pružiti temelj za stručne prosudbe u bilo kojoj fazi.

Članci o toj temi