Return to Video

Udacity CS 101 Poglavlje 1-2: Mrežni puzavac

  • 0:00 - 0:02
    [Sebastian Thrun] Dakle, koji je vaš dio u razvoju internet pretraživača,
  • 0:02 - 0:03
    već ste jednoga napravili, zar ne?
  • 0:03 - 0:06
    [Sergey Brin - Suosnivač, Google] Da. Mislim da je najvažnija stvar
  • 0:06 - 0:08
    ako želiš napraviti internet pretraživač
  • 0:08 - 0:12
    imati dobar kodeks za početak.
  • 0:12 - 0:19
    U našem slučaju, koristili smo internet (www), koji je tada bio značajno manji nego li je danas.
  • 0:19 - 0:21
    Ali je također bilo nešto novo i uzbudljivo.
  • 0:21 - 0:23
    Postojalo je puno različitih i neočekivanih stvari.
  • 0:23 - 0:26
    [David Evans] Dakle, cilj za prva tri poglavlja ovog tečaja je napraviti kodeks.
  • 0:27 - 0:30
    I mi želimo napraviti kodeks za naš pretraživač
  • 0:30 - 0:32
    tzv. puzanjem (crawling) mrežom i to je ono što mrežni puzavac (web crawler) radi.
  • 0:32 - 0:36
    Što je mrežni puzavac? To je program koji skuplja sadržaj sa mreže.
  • 0:36 - 0:40
    Ako uzmemo na primjer web stranicu koju gledaš u svome pregledniku, imaš stranicu koja izgleda ovako.
  • 0:40 - 0:43
    I mi koristimo Udacity stranicu kao primjer web stranice.
  • 0:43 - 0:47
    Ima puno sadržaja, ima neke slike, ima nešto teksta.
  • 0:47 - 0:51
    Sve ovo dolazi u tvoj internet preglednik kada otvoriš stranicu.
  • 0:51 - 0:53
    Važna stvar koju ima su poveznice (linkovi).
  • 0:53 - 0:57
    I što je poveznica? To je nešto što nas povezuje sa drugom stranicom.
  • 0:57 - 1:00
    Tako imamo poveznicu prema čestim pitanjima,
  • 1:00 - 1:02
    imamo poveznicu prema CS 101 stranici.
  • 1:02 - 1:04
    Postoje i još neke poveznice na stranici.
  • 1:04 - 1:07
    I ta poveznica se može prikazati u tvom pregledniku kao podcrtani tekst,
  • 1:07 - 1:09
    ili ne mora, ovisno o postavkama preglednika.
  • 1:09 - 1:11
    Ali važna stvar koju radi,
  • 1:11 - 1:13
    je ta da pokazuje na neku drugu web stranicu.
  • 1:13 - 1:16
    I te druge web stranicu također imaju poveznice
  • 1:16 - 1:19
    tako da imamo nove poveznice na ovoj stranici.
  • 1:19 - 1:23
    Recimo moje ime, možeš me slijediti do moje osobne stranice.
  • 1:23 - 1:26
    I sve stranice koje možemo pronaći sa našim mrežnim puzavcem
  • 1:26 - 1:29
    su pronađene prateći poveznice.
  • 1:29 - 1:31
    Dakle neće pronaći baš svaku stranicu na mreži.
  • 1:31 - 1:33
    Ako počnemo sa dobrom osnovnom stranicom
  • 1:33 - 1:35
    pronaći ćemo dobar dio stranica.
  • 1:35 - 1:37
    I ono što će puzavac napraviti je da će početi sa jednom stranicom,
  • 1:37 - 1:41
    pronaći sve poveznice na toj stranici, slijediti ih da bi pronašao druge stranice
  • 1:41 - 1:45
    i onda na tim stranicama opet će slijediti poveznice do drugih stranica
  • 1:45 - 1:48
    i onda će i na tim stranicama biti dosta poveznica.
  • 1:48 - 1:51
    I konačno ćemo imati kolekciju sa puno stranica na mreži.
  • 1:51 - 1:54
    Dakle, to je ono što želimo napraviti, mrežni puzavac.
  • 1:54 - 1:56
    Moramo pronaći način za startanje od jedne osnovne stranice,
  • 1:56 - 1:59
    izvući poveznice na toj stranici,
  • 1:59 - 2:01
    slijediti te poveznice do drugih stranica.
  • 2:01 - 2:03
    tada sakupiti poveznice sa tih drugih stranica,
  • 2:03 - 2:05
    slijediti njih, sakupiti ih sve.
  • 2:05 - 2:07
    Čini nam se da imamo puno posla.
  • 2:07 - 2:09
    Neće to sve učiniti na ovom prvom tečaju.
  • 2:09 - 2:12
    Ono što želimo napraviti u ovom prvom poglavlju je izvaditi poveznicu.
  • 2:12 - 2:14
    Dakle, počet ćemo sa određenom količinom teksta.
  • 2:14 - 2:17
    Taj tekst će sadržavati poveznicu sa URL-om (ime stranice).
  • 2:17 - 2:19
    Ono što želimo pronaći je taj URL,
  • 2:19 - 2:21
    tako da možemo zatražiti sljedeću stranicu.
  • 2:21 - 2:23
    Cilj drugog poglavlja
  • 2:23 - 2:25
    je omogućiti nastavak rada.
  • 2:25 - 2:28
    Ako postoji više poveznica na jednoj stranici, željet ćeš mogućnost da ih sve pronađeš.
  • 2:28 - 2:30
    Dakle, to je ono što želimo napraviti u 2. poglavlju.
  • 2:30 - 2:32
    Saznati način kao nastaviti vaditi sve te poveznice sa stranice.
  • 2:32 - 2:36
    U trećem poglavlju, želimo ići izvan samo jedne stranice.
  • 2:36 - 2:40
    Tako da do kraja drugog poglavlja budemo u mogućnosti ispisati sve poveznice sa jedne stranice.
  • 2:40 - 2:44
    Za poglavlje 3 želimo sakupiti sve te poveznice, tako da možemo nastaviti,
  • 2:44 - 2:47
    i slijediti naš mrežni puzavac koji će sakupiti puno, puno stranica.
  • 2:47 - 2:50
    Tako da ćemo do kraja trećeg poglavlja napraviti mrežni puzavac.
  • 2:50 - 2:52
    Imat ćemo način za razvijanje našeg kodeksa.
  • 2:52 - 2:57
    Onda ćemo u preostala tri poglavlja vidjeti kako stvarno odgovoriti na upite.
  • 2:57 - 3:01
    Dakle, u četvrtom poglavlju ćemo saznati kako dati pravi odgovor.
  • 3:01 - 3:08
    Tako ako pretražuješ ključnu riječ, želiš dobiti odgovor koji je lista stranica
  • 3:08 - 3:10
    gdje se ta ključna riječ pojavljuje.
  • 3:10 - 3:15
    I saznat ćemo u petom poglavlju kako to učiniti, tu ljestvicu, ako imamo veliki kodeks.
  • 3:15 - 3:19
    I onda ćemo u šestom poglavlju saznati kako ne želimo samo pronaći listu,
  • 3:19 - 3:21
    želimo pronaći najbolju.
  • 3:21 - 3:24
    Saznat ćemo kako rangirati sve stranice gdje se ta ključna riječ pojavljuje.
  • 3:24 - 3:27
    Dakle, trenutno idemo previše prema naprijed,
  • 3:27 - 3:30
    jer sve što želimo napraviti u prvom poglavlju,
  • 3:30 - 3:32
    je saznati način kako izvući poveznicu sa stranice.
  • 3:32 - 3:35
    I internet pretraživač koji ćemo napraviti do kraja ovoga tečaja
  • 3:35 - 3:37
    će biti funkcionalni internet pretraživač.
  • 3:37 - 3:40
    Imat će osnovne komponente koje internet pretraživač kao Google ima.
  • 3:40 - 3:43
    Sigurno neće biti tako moćan kao što je Google,
  • 3:43 - 3:44
    jer želimo održati stvari što jednostavnijima.
  • 3:44 - 3:46
    Želimo imati malu količinu napisanog programskog koda.
  • 3:46 - 3:48
    I moramo zapamtiti da naš stvarni cilj
  • 3:48 - 3:50
    nije toliko razvoj internet pretraživača,
  • 3:50 - 3:52
    koliko je iskoristiti razvoj pretraživača kao sredstvo
  • 3:52 - 3:55
    za učenje o kompjuterskoj znanosti
  • 3:55 - 3:56
    i učenje o programiranju
  • 3:56 - 3:58
    tako da nam stvari koje naučimo radeći ovo
  • 3:58 -
    omoguće rješavanje puno drugih problema.
Title:
Udacity CS 101 Poglavlje 1-2: Mrežni puzavac
Description:

Profesor David Evans daje kratki pregled tečaja CS 101.

more » « less
Video Language:
English
Duration:
04:03
Gundega edited Croatian subtitles for 01-02 Web Crawler
zoran.sikavica added a translation

Croatian subtitles

Revisions