-
1
00:00:00,630 --> 00:00:04,030
Bienvenidos a CS 101. Me llamo Dave Evans y seré vuestro guía en este viaje.
-
2
00:00:04,030 --> 00:00:07,047
En este curso, presentaremos los conceptos fundamentales de la informática
-
3
00:00:07,047 --> 00:00:09,563
y os enseñaremos a leer y escribir vuestros propios programas informáticos.
-
4
00:00:09,563 --> 00:00:13,063
Y lo haremos en el marco de la construcción de un buscador de Internet.
-
5
00:00:13,063 --> 00:00:16,363
Entiendo que todos habréis usado antes al menos un buscador de Internet.
-
6
00:00:16,363 --> 00:00:19,562
El objetivo de las tres primeras unidades del curso será construir una araña Web (Web crawler).
-
7
00:00:19,562 --> 00:00:22,129
Las arañas recopilan datos de la Web para nuestro buscador.
-
8
00:00:22,129 --> 00:00:24,663
Y así, aprenderemos los grandes conceptos de la Informática.
-
9
00:00:24,663 --> 00:00:29,680
En la Unidad 1, empezaremos extrayendo el primer enlace de una página web.
-
10
00:00:29,680 --> 00:00:32,730
La araña Web encuentra páginas web para nuestro buscador
-
11
00:00:32,730 --> 00:00:37,797
a partir de una página "semilla" (seed), siguiendo los enlaces de dicha página para encontrar otras.
-
12
00:00:37,797 --> 00:00:43,930
Cada uno de esos enlaces lleva a una nueva página web, que a su vez puede tener enlaces a otras páginas.
-
13
00:00:43,930 --> 00:00:46,507
Siguiendo estos enlaces, vamos descubriendo más páginas web,
-
14
00:00:46,507 --> 00:00:50,232
y recopilando una colección de datos que usaremos para nuestro buscador.
-
15
00:00:50,479 --> 00:00:54,712
En realidad, una página web no es más que un fragmento de texto que llega al navegador a través de Internet.
-
16
00:00:54,712 --> 00:00:56,580
Ya veremos cómo funciona en la Unidad 4.
-
17
00:00:56,580 --> 00:00:59,563
Por ahora, lo importante es entender que
-
18
00:00:59,563 --> 00:01:02,497
un enlace no es más que un tipo especial de texto en una página web.
-
19
00:01:02,497 --> 00:01:07,347
Si hacemos clic en un enlace en el navegador, iremos a una nueva página.
-
20
00:01:07,347 --> 00:01:09,496
Y podemos continuar siguiendo dichos enlaces (...)
-
21
00:01:09,496 --> 00:01:14,213
Lo que haremos en esta unidad es escribir un programa para extraer el primer enlace de la página web.
-
22
00:01:14,213 --> 00:01:18,213
En las siguientes unidades, veremos cómo extraer todos los enlaces y recopilar una colección para nuestro motor de búsqueda.