-
[Sebastian Thrun] Dakle, koji je vaš dio u razvoju internet pretraživača,
-
već ste jednoga napravili, zar ne?
-
[Sergey Brin - Suosnivač, Google] Da. Mislim da je najvažnija stvar
-
ako želiš napraviti internet pretraživač
-
imati dobar kodeks za početak.
-
U našem slučaju, koristili smo internet (www), koji je tada bio značajno manji nego li je danas.
-
Ali je također bilo nešto novo i uzbudljivo.
-
Postojalo je puno različitih i neočekivanih stvari.
-
[David Evans] Dakle, cilj za prva tri poglavlja ovog tečaja je napraviti kodeks.
-
I mi želimo napraviti kodeks za naš pretraživač
-
tzv. puzanjem (crawling) mrežom i to je ono što mrežni puzavac (web crawler) radi.
-
Što je mrežni puzavac? To je program koji skuplja sadržaj sa mreže.
-
Ako uzmemo na primjer web stranicu koju gledaš u svome pregledniku, imaš stranicu koja izgleda ovako.
-
I mi koristimo Udacity stranicu kao primjer web stranice.
-
Ima puno sadržaja, ima neke slike, ima nešto teksta.
-
Sve ovo dolazi u tvoj internet preglednik kada otvoriš stranicu.
-
Važna stvar koju ima su poveznice (linkovi).
-
I što je poveznica? To je nešto što nas povezuje sa drugom stranicom.
-
Tako imamo poveznicu prema čestim pitanjima,
-
imamo poveznicu prema CS 101 stranici.
-
Postoje i još neke poveznice na stranici.
-
I ta poveznica se može prikazati u tvom pregledniku kao podcrtani tekst,
-
ili ne mora, ovisno o postavkama preglednika.
-
Ali važna stvar koju radi,
-
je ta da pokazuje na neku drugu web stranicu.
-
I te druge web stranicu također imaju poveznice
-
tako da imamo nove poveznice na ovoj stranici.
-
Recimo moje ime, možeš me slijediti do moje osobne stranice.
-
I sve stranice koje možemo pronaći sa našim mrežnim puzavcem
-
su pronađene prateći poveznice.
-
Dakle neće pronaći baš svaku stranicu na mreži.
-
Ako počnemo sa dobrom osnovnom stranicom
-
pronaći ćemo dobar dio stranica.
-
I ono što će puzavac napraviti je da će početi sa jednom stranicom,
-
pronaći sve poveznice na toj stranici, slijediti ih da bi pronašao druge stranice
-
i onda na tim stranicama opet će slijediti poveznice do drugih stranica
-
i onda će i na tim stranicama biti dosta poveznica.
-
I konačno ćemo imati kolekciju sa puno stranica na mreži.
-
Dakle, to je ono što želimo napraviti, mrežni puzavac.
-
Moramo pronaći način za startanje od jedne osnovne stranice,
-
izvući poveznice na toj stranici,
-
slijediti te poveznice do drugih stranica.
-
tada sakupiti poveznice sa tih drugih stranica,
-
slijediti njih, sakupiti ih sve.
-
Čini nam se da imamo puno posla.
-
Neće to sve učiniti na ovom prvom tečaju.
-
Ono što želimo napraviti u ovom prvom poglavlju je izvaditi poveznicu.
-
Dakle, počet ćemo sa određenom količinom teksta.
-
Taj tekst će sadržavati poveznicu sa URL-om (ime stranice).
-
Ono što želimo pronaći je taj URL,
-
tako da možemo zatražiti sljedeću stranicu.
-
Cilj drugog poglavlja
-
je omogućiti nastavak rada.
-
Ako postoji više poveznica na jednoj stranici, željet ćeš mogućnost da ih sve pronađeš.
-
Dakle, to je ono što želimo napraviti u 2. poglavlju.
-
Saznati način kao nastaviti vaditi sve te poveznice sa stranice.
-
U trećem poglavlju, želimo ići izvan samo jedne stranice.
-
Tako da do kraja drugog poglavlja budemo u mogućnosti ispisati sve poveznice sa jedne stranice.
-
Za poglavlje 3 želimo sakupiti sve te poveznice, tako da možemo nastaviti,
-
i slijediti naš mrežni puzavac koji će sakupiti puno, puno stranica.
-
Tako da ćemo do kraja trećeg poglavlja napraviti mrežni puzavac.
-
Imat ćemo način za razvijanje našeg kodeksa.
-
Onda ćemo u preostala tri poglavlja vidjeti kako stvarno odgovoriti na upite.
-
Dakle, u četvrtom poglavlju ćemo saznati kako dati pravi odgovor.
-
Tako ako pretražuješ ključnu riječ, želiš dobiti odgovor koji je lista stranica
-
gdje se ta ključna riječ pojavljuje.
-
I saznat ćemo u petom poglavlju kako to učiniti, tu ljestvicu, ako imamo veliki kodeks.
-
I onda ćemo u šestom poglavlju saznati kako ne želimo samo pronaći listu,
-
želimo pronaći najbolju.
-
Saznat ćemo kako rangirati sve stranice gdje se ta ključna riječ pojavljuje.
-
Dakle, trenutno idemo previše prema naprijed,
-
jer sve što želimo napraviti u prvom poglavlju,
-
je saznati način kako izvući poveznicu sa stranice.
-
I internet pretraživač koji ćemo napraviti do kraja ovoga tečaja
-
će biti funkcionalni internet pretraživač.
-
Imat će osnovne komponente koje internet pretraživač kao Google ima.
-
Sigurno neće biti tako moćan kao što je Google,
-
jer želimo održati stvari što jednostavnijima.
-
Želimo imati malu količinu napisanog programskog koda.
-
I moramo zapamtiti da naš stvarni cilj
-
nije toliko razvoj internet pretraživača,
-
koliko je iskoristiti razvoj pretraživača kao sredstvo
-
za učenje o kompjuterskoj znanosti
-
i učenje o programiranju
-
tako da nam stvari koje naučimo radeći ovo
-
omoguće rješavanje puno drugih problema.