歡迎來到 CS101 課程, 我是 Dave Evans,這個旅程的指導者 這個課程將向你介紹計算的基本觀念 而且教導你,如何讀寫自己的電腦程式 我們要做的事,會藉由建立搜尋引擎 (search engine) 的來龍去脈來達成 我猜這裡的每個人,至少用過一個搜尋引擎 這門課的前三單元,目標是建立一個網頁蜘蛛 (web crawler) 他們將為我們的搜尋引擎,從網路上收集資料 藉由建立網頁蜘蛛,也會學到計算的重要觀念 在第一單元,我們從擷取網頁上第一個連結 (link) 開始 網頁蜘蛛會為我們的搜尋引擎尋找網頁 從種子頁面 (seed page) 開始, 然後跟隨著頁面上的連結 (link),找到其他的網頁 每一個連結 (link) 通往某些新網頁, 這些新網頁本身也可能有 links 通往其他網頁 當我們跟隨這些 links,我們會發現更多、更多的網頁 這些網頁形成了資料庫,我們將在搜尋引擎中做運用 網頁 (web page) 實際上只是一大塊文字, 從網際網路 (internet) 來到你的網頁瀏覽器 我們將在第四單元討論更多關於網頁的運作方式 但是現在,重要的是要瞭解 link 實際上只是網頁中一種特殊的文字 當你點擊瀏覽器中的 link,它會引導你到新網頁 你可以繼續跟隨這些 links 在這個單元中,我們要做的事, 就是寫一個程式,從網頁中擷取第一個 link 在後面的單元,我們要知道如何擷取所有的 links, 並且為我們的搜尋引擎蒐集資料