WEBVTT 00:00:00.630 --> 00:00:04.030 Bem-vindo ao CS 101. Eu sou Dave Evans. Eu guiarei vocês nesta jornada. 00:00:04.030 --> 00:00:07.047 Este curso introduzirá vocês para as idéias fundamentais em computação 00:00:07.047 --> 00:00:09.563 e ensinará ler e escrever seus próprios progragamas de computador. 00:00:09.563 --> 00:00:13.063 Nós vamos fazer tudo no contexto de construir uma (search engine) ferramenta de pesquisa na Web. 00:00:13.063 --> 00:00:16.363 Eu estou supondo que todos aqui tenham usado uma ferramenta de pesquisa. 00:00:16.363 --> 00:00:19.562 O objetivo das primeiras três unidades desse curso é construir um (Web crawler) rastreador Web. 00:00:19.562 --> 00:00:22.129 Eles colecionarão dados da Web para sua ferramenta de pesquisa. 00:00:22.129 --> 00:00:24.663 E aprender sobre as grandes idéias da computação fazendo isso. 00:00:24.663 --> 00:00:29.680 Na Unidade 1, nós iniciaremos extraindo o primeiro link em uma página web. 00:00:29.680 --> 00:00:32.730 Um rastreador Web (Web crawler) procura páginas web para sua ferramenta de pesquisa 00:00:32.730 --> 00:00:37.797 iniciando de uma página "semeada" e seguindo links naquela página para encontrar outras páginas. 00:00:37.797 --> 00:00:43.930 Cada um desses links leva a alguma nova página web, a qual pode ter links que levam a outras páginas. 00:00:43.930 --> 00:00:46.507 Como nós seguimos esses links, nós encontraremos mais e mais páginas Web 00:00:46.507 --> 00:00:50.232 construindo uma coleção de dados que usaremos para nossa ferramenta de pesquisa. 00:00:50.479 --> 00:00:54.712 Uma página web é realmente só um pedado de texto que vem da Internete para o seu navegador Web. 00:00:54.712 --> 00:00:56.580 Nós falaremos mais sobre como isso funciona na Unidade 4. 00:00:56.580 --> 00:00:59.563 Mas, por agora, a coisa importante a compreender é que 00:00:59.563 --> 00:01:02.497 um link é somente um pedaço especial do texto na página Web. 00:01:02.497 --> 00:01:07.347 Quando você clica em um link no seu navegador, ele o direcioina para uma nova página. 00:01:07.347 --> 00:01:09.496 E você pode permanecer seguindo esses links (...) 00:01:09.496 --> 00:01:14.213 O que nós faremos nessa Unidade é escrever um programa para extrair aquele primeiro link da página Web. 00:01:14.213 --> 00:01:18.213 Nas próximas unidades, nós vamos descobrir como extrair todos os link e construir a coleção para nossa ferramenta de busca.