1 00:00:00,630 --> 00:00:04,030 1 00:00:00,630 --> 00:00:04,030 Bienvenidos a CS 101. Me llamo Dave Evans y seré vuestro guía en este viaje. 2 00:00:04,030 --> 00:00:07,047 2 00:00:04,030 --> 00:00:07,047 En este curso, presentaremos los conceptos fundamentales de la informática 3 00:00:07,047 --> 00:00:09,563 3 00:00:07,047 --> 00:00:09,563 y os enseñaremos a leer y escribir vuestros propios programas informáticos. 4 00:00:09,563 --> 00:00:13,063 4 00:00:09,563 --> 00:00:13,063 Y lo haremos en el marco de la construcción de un buscador de Internet. 5 00:00:13,063 --> 00:00:16,363 5 00:00:13,063 --> 00:00:16,363 Entiendo que todos habréis usado antes al menos un buscador de Internet. 6 00:00:16,363 --> 00:00:19,562 6 00:00:16,363 --> 00:00:19,562 El objetivo de las tres primeras unidades del curso será construir una araña Web (Web crawler). 7 00:00:19,562 --> 00:00:22,129 7 00:00:19,562 --> 00:00:22,129 Las arañas recopilan datos de la Web para nuestro buscador. 8 00:00:22,129 --> 00:00:24,663 8 00:00:22,129 --> 00:00:24,663 Y así, aprenderemos los grandes conceptos de la Informática. 9 00:00:24,663 --> 00:00:29,680 9 00:00:24,663 --> 00:00:29,680 En la Unidad 1, empezaremos extrayendo el primer enlace de una página web. 10 00:00:29,680 --> 00:00:32,730 10 00:00:29,680 --> 00:00:32,730 La araña Web encuentra páginas web para nuestro buscador 11 00:00:32,730 --> 00:00:37,797 11 00:00:32,730 --> 00:00:37,797 a partir de una página "semilla" (seed), siguiendo los enlaces de dicha página para encontrar otras. 12 00:00:37,797 --> 00:00:43,930 12 00:00:37,797 --> 00:00:43,930 Cada uno de esos enlaces lleva a una nueva página web, que a su vez puede tener enlaces a otras páginas. 13 00:00:43,930 --> 00:00:46,507 13 00:00:43,930 --> 00:00:46,507 Siguiendo estos enlaces, vamos descubriendo más páginas web, 14 00:00:46,507 --> 00:00:50,232 14 00:00:46,507 --> 00:00:50,232 y recopilando una colección de datos que usaremos para nuestro buscador. 15 00:00:50,479 --> 00:00:54,712 15 00:00:50,479 --> 00:00:54,712 En realidad, una página web no es más que un fragmento de texto que llega al navegador a través de Internet. 16 00:00:54,712 --> 00:00:56,580 16 00:00:54,712 --> 00:00:56,580 Ya veremos cómo funciona en la Unidad 4. 17 00:00:56,580 --> 00:00:59,563 17 00:00:56,580 --> 00:00:59,563 Por ahora, lo importante es entender que 18 00:00:59,563 --> 00:01:02,497 18 00:00:59,563 --> 00:01:02,497 un enlace no es más que un tipo especial de texto en una página web. 19 00:01:02,497 --> 00:01:07,347 19 00:01:02,497 --> 00:01:07,347 Si hacemos clic en un enlace en el navegador, iremos a una nueva página. 20 00:01:07,347 --> 00:01:09,496 20 00:01:07,347 --> 00:01:09,496 Y podemos continuar siguiendo dichos enlaces (...) 21 00:01:09,496 --> 00:01:14,213 21 00:01:09,496 --> 00:01:14,213 Lo que haremos en esta unidad es escribir un programa para extraer el primer enlace de la página web. 22 00:01:14,213 --> 00:01:18,213 22 00:01:14,213 --> 00:01:18,213 En las siguientes unidades, veremos cómo extraer todos los enlaces y recopilar una colección para nuestro motor de búsqueda.