[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.63,0:00:04.03,Default,,0000,0000,0000,,欢迎来到CS101课程。我是戴维.埃文斯。我将指导你完成这门课程。 Dialogue: 0,0:00:04.03,0:00:07.05,Default,,0000,0000,0000,,这门课程将为你介绍计算的基本概念 Dialogue: 0,0:00:07.05,0:00:09.56,Default,,0000,0000,0000,,以及教你读写你自己的计算机程序 Dialogue: 0,0:00:09.56,0:00:13.06,Default,,0000,0000,0000,,这些都将在创建一个搜索引擎的任务中完成。 Dialogue: 0,0:00:13.06,0:00:16.36,Default,,0000,0000,0000,,相信诸位都至少使用过搜索引擎。 Dialogue: 0,0:00:16.36,0:00:19.56,Default,,0000,0000,0000,,该课程的前3个单元便是创建一个网络爬虫。 Dialogue: 0,0:00:19.56,0:00:22.13,Default,,0000,0000,0000,,网络爬虫能从网络上收集信息,以为我们的搜索引擎所用。 Dialogue: 0,0:00:22.13,0:00:24.66,Default,,0000,0000,0000,,并借此获得一个关于计算的大概念。 Dialogue: 0,0:00:24.66,0:00:29.68,Default,,0000,0000,0000,,在第一单元,我们从解析网页的第一个链接开始。 Dialogue: 0,0:00:29.68,0:00:32.73,Default,,0000,0000,0000,,网络爬虫为我们的搜索引擎寻找网页, Dialogue: 0,0:00:32.73,0:00:37.80,Default,,0000,0000,0000,,从一个“种子”页面开始,并跟踪该页面上的链接来发现其他页面。 Dialogue: 0,0:00:37.80,0:00:43.93,Default,,0000,0000,0000,,这些链接引向一些新的网页,这些新的网页上又有链接,引向其他网页。 Dialogue: 0,0:00:43.93,0:00:46.51,Default,,0000,0000,0000,,当我跟踪这些链接,我们可以发现越来越多的网页。 Dialogue: 0,0:00:46.51,0:00:50.23,Default,,0000,0000,0000,,我们为我们的搜索引擎创建这些数据的集合。 Dialogue: 0,0:00:50.48,0:00:54.71,Default,,0000,0000,0000,,一个网页其实就是一段来自网络的文本,在你的浏览器中显示。 Dialogue: 0,0:00:54.71,0:00:56.58,Default,,0000,0000,0000,,我们将在第四单元中讲述这是个怎样的过程。 Dialogue: 0,0:00:56.58,0:00:59.56,Default,,0000,0000,0000,,但现在,最需要你了解的事情是 Dialogue: 0,0:00:59.56,0:01:02.50,Default,,0000,0000,0000,,一个链接其实只是网页中一个特殊的文本类型。 Dialogue: 0,0:01:02.50,0:01:07.35,Default,,0000,0000,0000,,当你在浏览器中点击了一个链接,它会将你引向一个新的页面。 Dialogue: 0,0:01:07.35,0:01:09.50,Default,,0000,0000,0000,,然后,你可以继续跟随这些链接 Dialogue: 0,0:01:09.50,0:01:14.21,Default,,0000,0000,0000,,这个单元我们要做的是写一段程序去解析获取网页上的第一个链接。 Dialogue: 0,0:01:14.21,0:01:18.21,Default,,0000,0000,0000,,在后面的单元中,我们会向你展示如何去解析获取所有链接,并集合这些数据为我们的搜索引擎所用。