0:00:00.630,0:00:04.030 1[br]00:00:00,630 --> 00:00:04,030[br]Bienvenidos a CS 101. Me llamo Dave Evans y seré vuestro guía en este viaje. 0:00:04.030,0:00:07.047 2[br]00:00:04,030 --> 00:00:07,047[br]En este curso, presentaremos los conceptos fundamentales de la informática 0:00:07.047,0:00:09.563 3[br]00:00:07,047 --> 00:00:09,563[br]y os enseñaremos a leer y escribir vuestros propios programas informáticos. 0:00:09.563,0:00:13.063 4[br]00:00:09,563 --> 00:00:13,063[br]Y lo haremos en el marco de la construcción de un buscador de Internet. 0:00:13.063,0:00:16.363 5[br]00:00:13,063 --> 00:00:16,363[br]Entiendo que todos habréis usado antes al menos un buscador de Internet. 0:00:16.363,0:00:19.562 6[br]00:00:16,363 --> 00:00:19,562[br]El objetivo de las tres primeras unidades del curso será construir una araña Web (Web crawler). 0:00:19.562,0:00:22.129 7[br]00:00:19,562 --> 00:00:22,129[br]Las arañas recopilan datos de la Web para nuestro buscador. 0:00:22.129,0:00:24.663 8[br]00:00:22,129 --> 00:00:24,663[br]Y así, aprenderemos los grandes conceptos de la Informática. 0:00:24.663,0:00:29.680 9[br]00:00:24,663 --> 00:00:29,680[br]En la Unidad 1, empezaremos extrayendo el primer enlace de una página web. 0:00:29.680,0:00:32.730 10[br]00:00:29,680 --> 00:00:32,730[br]La araña Web encuentra páginas web para nuestro buscador 0:00:32.730,0:00:37.797 11[br]00:00:32,730 --> 00:00:37,797[br]a partir de una página "semilla" (seed), siguiendo los enlaces de dicha página para encontrar otras. 0:00:37.797,0:00:43.930 12[br]00:00:37,797 --> 00:00:43,930[br]Cada uno de esos enlaces lleva a una nueva página web, que a su vez puede tener enlaces a otras páginas. 0:00:43.930,0:00:46.507 13[br]00:00:43,930 --> 00:00:46,507[br]Siguiendo estos enlaces, vamos descubriendo más páginas web, 0:00:46.507,0:00:50.232 14[br]00:00:46,507 --> 00:00:50,232[br]y recopilando una colección de datos que usaremos para nuestro buscador. 0:00:50.479,0:00:54.712 15[br]00:00:50,479 --> 00:00:54,712[br]En realidad, una página web no es más que un fragmento de texto que llega al navegador a través de Internet. 0:00:54.712,0:00:56.580 16[br]00:00:54,712 --> 00:00:56,580[br]Ya veremos cómo funciona en la Unidad 4. 0:00:56.580,0:00:59.563 17[br]00:00:56,580 --> 00:00:59,563[br]Por ahora, lo importante es entender que 0:00:59.563,0:01:02.497 18[br]00:00:59,563 --> 00:01:02,497[br]un enlace no es más que un tipo especial de texto en una página web. 0:01:02.497,0:01:07.347 19[br]00:01:02,497 --> 00:01:07,347[br]Si hacemos clic en un enlace en el navegador, iremos a una nueva página. 0:01:07.347,0:01:09.496 20[br]00:01:07,347 --> 00:01:09,496[br]Y podemos continuar siguiendo dichos enlaces (...) 0:01:09.496,0:01:14.213 21[br]00:01:09,496 --> 00:01:14,213[br]Lo que haremos en esta unidad es escribir un programa para extraer el primer enlace de la página web. 0:01:14.213,0:01:18.213 22[br]00:01:14,213 --> 00:01:18,213[br]En las siguientes unidades, veremos cómo extraer todos los enlaces y recopilar una colección para nuestro motor de búsqueda.