0:00:00.630,0:00:04.030 Bem-vindo ao CS 101. Eu sou Dave Evans. Eu guiarei vocês nesta jornada. 0:00:04.030,0:00:07.047 Este curso introduzirá vocês para as idéias fundamentais em computação 0:00:07.047,0:00:09.563 e ensinará ler e escrever seus próprios progragamas de computador. 0:00:09.563,0:00:13.063 Nós vamos fazer tudo no contexto de construir uma (search engine) ferramenta de pesquisa na Web. 0:00:13.063,0:00:16.363 Eu estou supondo que todos aqui tenham usado uma ferramenta de pesquisa. 0:00:16.363,0:00:19.562 O objetivo das primeiras três unidades desse curso é construir um (Web crawler) rastreador Web. 0:00:19.562,0:00:22.129 Eles colecionarão dados da Web para sua ferramenta de pesquisa. 0:00:22.129,0:00:24.663 E aprender sobre as grandes idéias da computação fazendo isso. 0:00:24.663,0:00:29.680 Na Unidade 1, nós iniciaremos extraindo o primeiro link em uma página web. 0:00:29.680,0:00:32.730 Um rastreador Web (Web crawler) procura páginas web para sua ferramenta de pesquisa 0:00:32.730,0:00:37.797 iniciando de uma página "semeada" e seguindo links naquela página para encontrar outras páginas. 0:00:37.797,0:00:43.930 Cada um desses links leva a alguma nova página web, a qual pode ter links que levam a outras páginas. 0:00:43.930,0:00:46.507 Como nós seguimos esses links, nós encontraremos mais e mais páginas Web 0:00:46.507,0:00:50.232 construindo uma coleção de dados que usaremos para nossa ferramenta de pesquisa. 0:00:50.479,0:00:54.712 Uma página web é realmente só um pedado de texto que vem da Internete para o seu navegador Web. 0:00:54.712,0:00:56.580 Nós falaremos mais sobre como isso funciona na Unidade 4. 0:00:56.580,0:00:59.563 Mas, por agora, a coisa importante a compreender é que 0:00:59.563,0:01:02.497 um link é somente um pedaço especial do texto na página Web. 0:01:02.497,0:01:07.347 Quando você clica em um link no seu navegador, ele o direcioina para uma nova página. 0:01:07.347,0:01:09.496 E você pode permanecer seguindo esses links (...) 0:01:09.496,0:01:14.213 O que nós faremos nessa Unidade é escrever um programa para extrair aquele primeiro link da página Web. 0:01:14.213,0:01:18.213 Nas próximas unidades, nós vamos descobrir como extrair todos os link e construir a coleção para nossa ferramenta de busca.