1
00:00:00,630 --> 00:00:04,030
歡迎來到 CS101 課程，
我是 Dave Evans，這個旅程的指導者

2
00:00:04,030 --> 00:00:07,047
這個課程將向你介紹計算的基本觀念

3
00:00:07,047 --> 00:00:09,563
而且教導你，如何讀寫自己的電腦程式

4
00:00:09,563 --> 00:00:13,063
我們要做的事，會藉由建立搜尋引擎 (search engine)
的來龍去脈來達成

5
00:00:13,063 --> 00:00:16,363
我猜這裡的每個人，至少用過一個搜尋引擎

6
00:00:16,363 --> 00:00:19,562
這門課的前三單元，目標是建立一個網頁蜘蛛 (web crawler)

7
00:00:19,562 --> 00:00:22,129
他們將為我們的搜尋引擎，從網路上收集資料

8
00:00:22,129 --> 00:00:24,663
藉由建立網頁蜘蛛，也會學到計算的重要觀念

9
00:00:24,663 --> 00:00:29,680
在第一單元，我們從擷取網頁上第一個連結 (link) 開始

10
00:00:29,680 --> 00:00:32,730
網頁蜘蛛會為我們的搜尋引擎尋找網頁

11
00:00:32,730 --> 00:00:37,797
從種子頁面 (seed page) 開始，
然後跟隨著頁面上的連結 (link)，找到其他的網頁

12
00:00:37,797 --> 00:00:43,930
每一個連結 (link) 通往某些新網頁，
這些新網頁本身也可能有 links 通往其他網頁

13
00:00:43,930 --> 00:00:46,507
當我們跟隨這些 links，我們會發現更多、更多的網頁

14
00:00:46,507 --> 00:00:50,232
這些網頁形成了資料庫，我們將在搜尋引擎中做運用

15
00:00:50,479 --> 00:00:54,712
網頁 (web page) 實際上只是一大塊文字，
從網際網路 (internet) 來到你的網頁瀏覽器

16
00:00:54,712 --> 00:00:56,580
我們將在第四單元討論更多關於網頁的運作方式

17
00:00:56,580 --> 00:00:59,563
但是現在，重要的是要瞭解

18
00:00:59,563 --> 00:01:02,497
link 實際上只是網頁中一種特殊的文字

19
00:01:02,497 --> 00:01:07,347
當你點擊瀏覽器中的 link，它會引導你到新網頁

20
00:01:07,347 --> 00:01:09,496
你可以繼續跟隨這些 links

21
00:01:09,496 --> 00:01:14,213
在這個單元中，我們要做的事，
就是寫一個程式，從網頁中擷取第一個 link

22
00:01:14,213 --> 00:01:18,213
在後面的單元，我們要知道如何擷取所有的 links，
並且為我們的搜尋引擎蒐集資料