Return to Video

Udacity CS 101 oppitunti 1-2: Hakurobotti

  • 0:00 - 0:02
    [Sebastian Thrun] Miten hakukone pitäisi sinun mielestäsi tehdä,
  • 0:02 - 0:03
    olet tehnyt sellaisen aiemmin, eikö totta?
  • 0:03 - 0:06
    [Sergey Brin - yksi Googlen perustajista] Kyllä. Minusta tärkein asia
  • 0:06 - 0:08
    hakukonetta rakentaessa
  • 0:08 - 0:12
    on aloittaa todella hyvän kieliaineiston kanssa.
  • 0:12 - 0:19
    Me käytimme WWW:tä, joka siihen aikaan todella oli pienempi, mitä nykyään.
  • 0:19 - 0:21
    Mutta se oli myös hyvin uusi ja jännittävä.
  • 0:21 - 0:23
    Siellä oli kaikenlaisia yllättäviä asioita.
  • 0:23 - 0:26
    [David Evans] Joten ensimmäisen kolmen oppitunnin aiheena on rakentaa tämä kieliaineisto.
  • 0:27 - 0:30
    Haluamme rakentaa tämän aineiston hakukonettamme varten
  • 0:30 - 0:32
    käymällä verkkoa läpi, mikä on hakurobotin tehtävä.
  • 0:32 - 0:36
    Hakurobotti on ohjelma, joka kerää verkkosivuilta sisältöä.
  • 0:36 - 0:40
    Ajattele webbisivua selaimessasi, se näyttää tältä.
  • 0:40 - 0:43
    Käytämme udacityn sivustoa esimerkkinä webbisivusta.
  • 0:43 - 0:47
    Siellä on paljon sisältöä, muutamia kuvia ja jonkin verran tekstiä.
  • 0:47 - 0:51
    Kaikki tämä tulee selaimeesi, kun pyydät sivua.
  • 0:51 - 0:53
    Tärkeä asia on, että sivulla on linkkejä.
  • 0:53 - 0:57
    Linkki view toiselle sivulle.
  • 0:57 - 1:00
    Joten meillä on linkki usein kysyttyihin kysymyksiin,
  • 1:00 - 1:02
    ja linkki CS 101 sivulle.
  • 1:02 - 1:04
    Ja myös joitain muita linkkejä.
  • 1:04 - 1:07
    Linkki voi näkyä selaimessasi alleviivattuna,
  • 1:07 - 1:09
    tai ei, riippuen selaimesi asetuksista.
  • 1:09 - 1:11
    Mutta tärkeintä on,
  • 1:11 - 1:13
    että se ohjaa jollekin toiselle sivulle.
  • 1:13 - 1:16
    Ja noilla muilla sivuilla voi myös olla linkkejä,
  • 1:16 - 1:19
    joten meillä on uusi linkki.
  • 1:19 - 1:23
    Se on ehkä nimeni, jota voit seurata kotisivulleni.
  • 1:23 - 1:26
    Ja kaikki sivut mitä löydämme hakurobotillamme
  • 1:26 - 1:29
    löytyvät linkkejä seuraamalla.
  • 1:29 - 1:31
    Ei ole tarpeen löytää jokaista sivua webistä.
  • 1:31 - 1:33
    Jos aloitamme hyvällä siemensivulla,
  • 1:33 - 1:35
    löydämme kuitenkin paljon sivuja.
  • 1:35 - 1:37
    Ja robotti aloittaa yhdeltä sivulta,
  • 1:37 - 1:41
    etsii kaikki linkit sillä sivulla, seuraa niitä muille sivuille
  • 1:41 - 1:45
    ja etsii niillä olevat linkit
  • 1:45 - 1:48
    löytääkseen taas uusia sivuja, joilla on paljon lisää linkkejä.
  • 1:48 - 1:51
    Ja lopulta meillä on suuri kokoelma sivuja webissä.
  • 1:51 - 1:54
    Tämän me haluamme tehdä rakentamalla hakurobotin.
  • 1:54 - 1:56
    Haluamme keksiä jonkin tavan aloittaa siemensivulta,
  • 1:56 - 1:59
    erottaa sivun linkit,
  • 1:59 - 2:01
    seurata noita linkkejä muille sivuille,
  • 2:01 - 2:03
    sitten kerätä linkit näiltä sivuilta,
  • 2:03 - 2:05
    seurata niitä, kerätä tämä kaikki.
  • 2:05 - 2:07
    Tämä kuulostaa isolta tehtävältä.
  • 2:07 - 2:09
    Emme käy kaikkea läpi tällä ensimmäisellä oppitunnilla.
  • 2:09 - 2:12
    Tällä kertaa vain erottelemme yhden linkin.
  • 2:12 - 2:14
    Joten aloitetaan tekstinpätkällä.
  • 2:14 - 2:17
    Siinä on linkki URL:n kera.
  • 2:17 - 2:19
    Haluamme löytää tämän URL:n,
  • 2:19 - 2:21
    jotta voimme pyytää seuraavaa sivua.
  • 2:21 - 2:23
    Toisen oppitunnin tavoite
  • 2:23 - 2:25
    on pystyä jatkamaan tästä.
  • 2:25 - 2:28
    Jos yhdellä sivulla on monta linkkiä, haluat pystyä löytämään ne kaikki.
  • 2:28 - 2:30
    Joten sen teemme toisella oppitunnilla.
  • 2:30 - 2:32
    Keksimme miten voimme jatkaa kaikkien keräämiseksi.
  • 2:32 - 2:36
    Kolmannella tunnilla jatkamme yhdestä sivusta eteenpäin.
  • 2:36 - 2:40
    Toisen oppitunnin jälkeen voimme tulostaa kaikki linkit yhdellä sivulla.
  • 2:40 - 2:44
    Kolmannella keräämme kaikki nämä linkit jatkaaksemme,
  • 2:44 - 2:47
    ja päädymme keräämään, monia, monia sivuja.
  • 2:47 - 2:50
    Joten kolmannen oppitunnin jälkeen olemme rakentaneet hakurobotin.
  • 2:50 - 2:52
    Meillä on keino kieliaineiston rakentamiseksi.
  • 2:52 - 2:57
    Loppujen kolmen oppitunnin aikana tutkimme miten vastata kyselyihin.
  • 2:57 - 3:01
    Joten neljännen tunnin jälkeen mietimme miten antaa hyvä vastaus.
  • 3:01 - 3:08
    Joten jos etsit hakusanalla, haluat vastauksen joka on lista sivuja,
  • 3:08 - 3:10
    joilla tämä hakusana esiintyy.
  • 3:10 - 3:15
    Viidennellä oppitunnilla mietimme miten voimme tehdä tämän laajemmin, jos meillä on iso aineisto.
  • 3:15 - 3:19
    Ja kuudennella tunnilla haluamme, no, emme halua vain listan,
  • 3:19 - 3:21
    vaan haluamme parhaan vastauksen.
  • 3:21 - 3:24
    Joten meidän pitää miettiä miten voimme järjestää kaikki sivut, joilla hakusana esiintyy.
  • 3:24 - 3:27
    Edistämme nyt vähän tässä,
  • 3:27 - 3:30
    koska kaikki mitä teemme tällä tunnilla,
  • 3:30 - 3:32
    on miettiä miten saamme erotettua yhden linkin sivulta.
  • 3:32 - 3:35
    Kaiken lopuksi rakentamamme hakukone
  • 3:35 - 3:37
    tulee olemaan toimiva.
  • 3:37 - 3:40
    Siinä on kaikki samat osat mitä Googlen kaltaisessa hakukoneessa on.
  • 3:40 - 3:43
    Se ei tule kylläkään olemaan yhtä tehokas kuin Google,
  • 3:43 - 3:44
    koska haluamme pitää asiat yksinkertaisina.
  • 3:44 - 3:46
    Haluamme kirjoittaa vain pienen määrän koodia.
  • 3:46 - 3:48
    Ja meidän pitää muistaa, että päämäärämme
  • 3:48 - 3:50
    ei ole hakukoneen rakentaminen,
  • 3:50 - 3:52
    vaan tietojenkäsittelyn oppiminen
  • 3:52 - 3:55
    rakentamisen ohessa.
  • 3:55 - 3:56
    Ja ohjelmoinnin opettelu,
  • 3:56 - 3:58
    jotta tekemällä oppimamme asiat
  • 3:58 -
    antavat meille kyvyn ratkaista monia, monia muita ongelmia.
Title:
Udacity CS 101 oppitunti 1-2: Hakurobotti
Description:

Professori David Evans selostaa kurssin CS 101 tavoitteet.

more » « less
Video Language:
English
Duration:
04:03
Gundega edited Finnish subtitles for 01-02 Web Crawler
tpievila added a translation

Finnish subtitles

Revisions