0:00:00.630,0:00:04.030 歡迎來到 CS101 課程,[br]我是 Dave Evans,這個旅程的指導者 0:00:04.030,0:00:07.047 這個課程將向你介紹計算的基本觀念 0:00:07.047,0:00:09.563 而且教導你,如何讀寫自己的電腦程式 0:00:09.563,0:00:13.063 我們要做的事,會藉由建立搜尋引擎 (search engine)[br]的來龍去脈來達成 0:00:13.063,0:00:16.363 我猜這裡的每個人,至少用過一個搜尋引擎 0:00:16.363,0:00:19.562 這門課的前三單元,目標是建立一個網頁蜘蛛 (web crawler) 0:00:19.562,0:00:22.129 他們將為我們的搜尋引擎,從網路上收集資料 0:00:22.129,0:00:24.663 藉由建立網頁蜘蛛,也會學到計算的重要觀念 0:00:24.663,0:00:29.680 在第一單元,我們從擷取網頁上第一個連結 (link) 開始 0:00:29.680,0:00:32.730 網頁蜘蛛會為我們的搜尋引擎尋找網頁 0:00:32.730,0:00:37.797 從種子頁面 (seed page) 開始,[br]然後跟隨著頁面上的連結 (link),找到其他的網頁 0:00:37.797,0:00:43.930 每一個連結 (link) 通往某些新網頁,[br]這些新網頁本身也可能有 links 通往其他網頁 0:00:43.930,0:00:46.507 當我們跟隨這些 links,我們會發現更多、更多的網頁 0:00:46.507,0:00:50.232 這些網頁形成了資料庫,我們將在搜尋引擎中做運用 0:00:50.479,0:00:54.712 網頁 (web page) 實際上只是一大塊文字,[br]從網際網路 (internet) 來到你的網頁瀏覽器 0:00:54.712,0:00:56.580 我們將在第四單元討論更多關於網頁的運作方式 0:00:56.580,0:00:59.563 但是現在,重要的是要瞭解 0:00:59.563,0:01:02.497 link 實際上只是網頁中一種特殊的文字 0:01:02.497,0:01:07.347 當你點擊瀏覽器中的 link,它會引導你到新網頁 0:01:07.347,0:01:09.496 你可以繼續跟隨這些 links 0:01:09.496,0:01:14.213 在這個單元中,我們要做的事,[br]就是寫一個程式,從網頁中擷取第一個 link 0:01:14.213,0:01:18.213 在後面的單元,我們要知道如何擷取所有的 links,[br]並且為我們的搜尋引擎蒐集資料