1 00:00:00,630 --> 00:00:04,030 歡迎來到 CS101 課程, 我是 Dave Evans,這個旅程的指導者 2 00:00:04,030 --> 00:00:07,047 這個課程將向你介紹計算的基本觀念 3 00:00:07,047 --> 00:00:09,563 而且教導你,如何讀寫自己的電腦程式 4 00:00:09,563 --> 00:00:13,063 我們要做的事,會藉由建立搜尋引擎 (search engine) 的來龍去脈來達成 5 00:00:13,063 --> 00:00:16,363 我猜這裡的每個人,至少用過一個搜尋引擎 6 00:00:16,363 --> 00:00:19,562 這門課的前三單元,目標是建立一個網頁蜘蛛 (web crawler) 7 00:00:19,562 --> 00:00:22,129 他們將為我們的搜尋引擎,從網路上收集資料 8 00:00:22,129 --> 00:00:24,663 藉由建立網頁蜘蛛,也會學到計算的重要觀念 9 00:00:24,663 --> 00:00:29,680 在第一單元,我們從擷取網頁上第一個連結 (link) 開始 10 00:00:29,680 --> 00:00:32,730 網頁蜘蛛會為我們的搜尋引擎尋找網頁 11 00:00:32,730 --> 00:00:37,797 從種子頁面 (seed page) 開始, 然後跟隨著頁面上的連結 (link),找到其他的網頁 12 00:00:37,797 --> 00:00:43,930 每一個連結 (link) 通往某些新網頁, 這些新網頁本身也可能有 links 通往其他網頁 13 00:00:43,930 --> 00:00:46,507 當我們跟隨這些 links,我們會發現更多、更多的網頁 14 00:00:46,507 --> 00:00:50,232 這些網頁形成了資料庫,我們將在搜尋引擎中做運用 15 00:00:50,479 --> 00:00:54,712 網頁 (web page) 實際上只是一大塊文字, 從網際網路 (internet) 來到你的網頁瀏覽器 16 00:00:54,712 --> 00:00:56,580 我們將在第四單元討論更多關於網頁的運作方式 17 00:00:56,580 --> 00:00:59,563 但是現在,重要的是要瞭解 18 00:00:59,563 --> 00:01:02,497 link 實際上只是網頁中一種特殊的文字 19 00:01:02,497 --> 00:01:07,347 當你點擊瀏覽器中的 link,它會引導你到新網頁 20 00:01:07,347 --> 00:01:09,496 你可以繼續跟隨這些 links 21 00:01:09,496 --> 00:01:14,213 在這個單元中,我們要做的事, 就是寫一個程式,從網頁中擷取第一個 link 22 00:01:14,213 --> 00:01:18,213 在後面的單元,我們要知道如何擷取所有的 links, 並且為我們的搜尋引擎蒐集資料