1 00:00:00,118 --> 00:00:02,898 Así que, ahora, vamos a ver un ejemplo en una red real, 2 00:00:02,898 --> 00:00:06,181 y trataremos de ver como es el aspecto de una CPD, 3 00:00:06,181 --> 00:00:07,738 cuál es el comportamiento que obtenemos, 4 00:00:07,738 --> 00:00:09,488 y cómo podríamos aumentar la red 5 00:00:09,488 --> 00:00:11,238 para incluir cosas adicionales. 6 00:00:11,238 --> 00:00:12,802 Ahora, déjenme advertirles por adelantado 7 00:00:12,802 --> 00:00:14,656 que se trata de una red de juguete, 8 00:00:14,656 --> 00:00:16,263 no es una red real, 9 00:00:16,263 --> 00:00:19,622 aunque es lo suficientemente compacta como para mirarla, pero 10 00:00:19,622 --> 00:00:22,918 aún lo suficientemente interesante como para obtener algunos comportamientos no triviales. 11 00:00:24,579 --> 00:00:26,593 Por lo tanto, para explorar la red, 12 00:00:26,593 --> 00:00:28,854 vamos a utilizar un sistema llamado SAMIAM. 13 00:00:28,854 --> 00:00:31,662 Fue producido por Adnan Darwiche y su grupo de la UCLA, 14 00:00:31,662 --> 00:00:32,640 y es bueno 15 00:00:32,640 --> 00:00:36,151 porque en realidad funciona en todo tipo de plataformas diferentes, 16 00:00:36,151 --> 00:00:38,911 así que puede ser utilizado por cualquiera. 17 00:00:38,911 --> 00:00:41,537 Así que echemos un vistazo a un problema particular: 18 00:00:41,537 --> 00:00:43,616 Imaginemos que somos una compañía de seguros 19 00:00:43,616 --> 00:00:44,888 y estamos tratando de decidir 20 00:00:44,888 --> 00:00:46,438 para una persona que llega 21 00:00:46,438 --> 00:00:49,002 si se le da seguro o no. 22 00:00:49,002 --> 00:00:51,746 Así, el aspecto operativo para tomar esa decisión 23 00:00:51,746 --> 00:00:54,369 es cuanto nos va a costar la póliza, 24 00:00:54,369 --> 00:00:55,892 es decir, cuánto vamos a tener que pagar 25 00:00:55,892 --> 00:00:58,915 en el transcurso de un año para asegurar a esta persona. 26 00:00:58,915 --> 00:01:02,287 Por lo tanto hay una variable llamada "Cost". 27 00:01:02,287 --> 00:01:06,847 Vamos a hacer clic sobre él para ver qué propiedades tienen esa variable. 28 00:01:06,847 --> 00:01:08,507 Y podemos ver que en este caso, 29 00:01:08,507 --> 00:01:11,952 hemos decidido dar sólo dos valores para la variable "Cost", 30 00:01:11,952 --> 00:01:13,772 Bajo y Alto. 31 00:01:13,772 --> 00:01:16,790 Esto es claramente una aproximación muy de grano grueso 32 00:01:16,790 --> 00:01:18,472 y no una que vayamos a utilizar en la práctica. 33 00:01:18,472 --> 00:01:20,303 En realidad, es probable que 34 00:01:20,303 --> 00:01:22,135 ésta sea una variable continua 35 00:01:22,135 --> 00:01:25,887 cuyo entendimiento depende de varios aspectos del modelo. 36 00:01:25,887 --> 00:01:27,783 Sin embargo, para los propósitos de nuestro ejemplo, 37 00:01:27,783 --> 00:01:29,559 vamos a utilizar esta distribución discreta 38 00:01:29,559 --> 00:01:31,273 que sólo tiene valores Bajo y Alto. 39 00:01:31,273 --> 00:01:32,647 Está bien. 40 00:01:32,647 --> 00:01:36,855 Así que ahora, vamos a construir esta red mediante la técnica de 41 00:01:36,855 --> 00:01:39,504 "ampliar la conversación" que mencionamos antes. 42 00:01:39,504 --> 00:01:44,224 Así que, ¿cuál es el factor determinante más importante 43 00:01:44,224 --> 00:01:46,740 en cuanto a costos que la compañía de seguros tiene que pagar? 44 00:01:46,740 --> 00:01:50,647 Bueno, probablemente si la persona tiene accidentes 45 00:01:50,647 --> 00:01:51,977 y qué tan severos son. 46 00:01:51,977 --> 00:01:57,005 Así que aquí tenemos una red que tiene dos variables: 47 00:01:57,005 --> 00:01:59,724 una es "Accident" y la otra es "Cost". 48 00:01:59,724 --> 00:02:02,645 Y en este caso hemos decidido seleccionar 49 00:02:02,645 --> 00:02:05,701 tres valores posibles para la variable "Accident", 50 00:02:05,701 --> 00:02:09,031 Ninguno, Leve y Severo, 51 00:02:09,031 --> 00:02:14,442 y con las probabilidades que ven en la lista. 52 00:02:14,442 --> 00:02:17,447 Y lo que se ve abajo es la variable "Cost". 53 00:02:17,447 --> 00:02:18,759 Y abrimos la CPD 54 00:02:18,759 --> 00:02:24,845 de la variable "Cost" dada la variable "Accident". 55 00:02:24,845 --> 00:02:26,946 Y podemos ver que, en este caso, 56 00:02:26,946 --> 00:02:29,169 tenemos una tabla de probabilidad condicional 57 00:02:29,169 --> 00:02:33,358 de "Cost" dado "Accident". 58 00:02:33,358 --> 00:02:35,485 Noten que esto en realidad está invertido 59 00:02:35,485 --> 00:02:38,542 respecto a la notación que hemos utilizado en la clase anterior, 60 00:02:38,542 --> 00:02:41,713 porque acá los casos condicionados son columnas, 61 00:02:41,713 --> 00:02:44,545 mientras que en los ejemplos que hemos dado 62 00:02:44,545 --> 00:02:45,754 han sido filas. 63 00:02:45,754 --> 00:02:49,189 Pero eso está bien, es la misma cosa, sólo invertida. 64 00:02:49,650 --> 00:02:51,102 Y así vemos, por ejemplo, 65 00:02:51,102 --> 00:02:54,418 que si la persona no tiene accidentes, 66 00:02:54,418 --> 00:02:56,765 es muy probable que los costos sea muy bajos. 67 00:02:56,765 --> 00:03:01,581 Accidentes leves incurre en distribuciones diferentes sobre los costos. 68 00:03:01,581 --> 00:03:03,173 Y los accidentes graves tienen 69 00:03:03,173 --> 00:03:05,789 una probabilidad de 0,9 de tener alto costo 70 00:03:05,789 --> 00:03:08,414 y 0,1 de tener un bajo costo. 71 00:03:09,060 --> 00:03:11,749 Así que ahora, vamos a seguir ampliando la conversación 72 00:03:11,749 --> 00:03:14,088 y preguntar que depende de "Accident". 73 00:03:14,088 --> 00:03:17,207 Y parece ser que uno de los factores obvios 74 00:03:17,207 --> 00:03:20,409 es si la persona es un buen conductor o no. 75 00:03:20,409 --> 00:03:22,661 Y así podríamos esperar que la calidad del conductor 76 00:03:22,661 --> 00:03:23,965 sea un padre de "Accident". 77 00:03:23,965 --> 00:03:25,214 Pero hay otras cosas 78 00:03:25,214 --> 00:03:27,853 que también afectan no sólo la presencia de un accidente, 79 00:03:27,853 --> 00:03:29,911 sino también la gravedad del accidente. 80 00:03:29,911 --> 00:03:33,909 Así, por ejemplo, el tamaño del vehículo afectaría 81 00:03:33,909 --> 00:03:37,117 la gravedad de un accidente porque 82 00:03:37,117 --> 00:03:40,788 si están conduciendo una SUV de gran tamaño, entonces 83 00:03:40,788 --> 00:03:43,599 es probable que no tengan un accidente tan grave, 84 00:03:43,599 --> 00:03:45,685 pero a su vez quizás podría aumentar 85 00:03:45,685 --> 00:03:47,374 la probabilidad de tener un accidente global, 86 00:03:47,374 --> 00:03:51,830 ya que a lo mejor un coche grande es más difícil de manejar. 87 00:03:52,615 --> 00:03:56,381 Y entonces, el año del vehículo podría afectar las posibilidades de un accidente 88 00:03:56,381 --> 00:03:59,509 debido a la presencia o ausencia de ciertas características de seguridad 89 00:03:59,509 --> 00:04:02,037 como los frenos antibloqueo y airbags. 90 00:04:02,037 --> 00:04:03,814 Así que vamos a abrir la CPD de "Accident" 91 00:04:03,814 --> 00:04:05,173 y vemos como luce 92 00:04:05,173 --> 00:04:07,325 ahora que tenemos todos los padres para ella. 93 00:04:07,325 --> 00:04:10,213 Y podemos ver acá que tenemos, 94 00:04:10,213 --> 00:04:13,165 en este caso, ocho casos condicionados, 95 00:04:13,165 --> 00:04:18,317 correspondiente a tres variables, dos valores cada uno. 96 00:04:18,317 --> 00:04:22,757 Y acá, sólo para ver una una de las muestra 97 00:04:22,757 --> 00:04:26,046 de la distribución, por ejemplo, 98 00:04:26,046 --> 00:04:30,749 si se trata de un vehículo bastante nuevo (después de 2000) 99 00:04:30,749 --> 00:04:32,398 y es una SUV, 100 00:04:32,398 --> 00:04:35,725 la probabilidad de tener un accidente grave es muy baja, 101 00:04:35,725 --> 00:04:38,813 y la probabilidad de tener un accidente leve es moderada, 102 00:04:38,813 --> 00:04:44,774 y la probabilidad de no tener accidentes es de 0,85. 103 00:04:44,774 --> 00:04:48,525 Mientras que si se compara con la entrada correspondiente 104 00:04:48,525 --> 00:04:52,053 cuando mantenemos todo fijo, excepto que ahora es un coche compacto, 105 00:04:52,053 --> 00:05:00,509 vemos que la probabilidad de tener un accidente leve es menor, 106 00:05:00,509 --> 00:05:03,045 pero la probabilidad de no tener accidentes es mayor, 107 00:05:03,045 --> 00:05:08,059 representando patrones de conducción diferentes, por ejemplo. 108 00:05:08,506 --> 00:05:11,649 Bien, entonces con esta red 109 00:05:11,649 --> 00:05:13,649 podemos empezar a hacer preguntas simples. 110 00:05:14,695 --> 00:05:17,145 Así que, para dar algún ejemplo de inferencia causal, 111 00:05:17,145 --> 00:05:20,559 vamos a instanciar, por ejemplo, "Driving_quality" en Bueno, 112 00:05:21,574 --> 00:05:23,936 y en Malo. 113 00:05:23,936 --> 00:05:27,054 Y podemos ver que para un mal conductor 114 00:05:27,054 --> 00:05:31,397 la probabilidad de un costo bajo es 81%. 115 00:05:31,397 --> 00:05:36,325 Y para un buen conductor de la probabilidad de un costo bajo es 87%. 116 00:05:36,325 --> 00:05:38,381 Si nos fijamos en los accidentes 117 00:05:38,381 --> 00:05:41,278 se puede ver que para un buen conductor 118 00:05:41,278 --> 00:05:44,800 hay una probabilidad de 87,5% de no tener accidentes 119 00:05:44,800 --> 00:05:46,431 y 10% de tener un accidente leve. 120 00:05:46,431 --> 00:05:50,957 Y la probabilidad de no tener accidentes baja para un mal conductor, 121 00:05:50,957 --> 00:05:53,422 y accidentes leves sube, 122 00:05:53,422 --> 00:05:55,453 y accidentes graves también se va hacia arriba. 123 00:05:55,453 --> 00:05:59,077 Ahora, tengan en cuenta que muchas de estas diferencias son muy sutiles. 124 00:05:59,077 --> 00:06:02,054 Hay una diferencia de un par de puntos porcentuales de una manera u otra. 125 00:06:02,054 --> 00:06:04,038 Y se podría pensar que, 126 00:06:04,038 --> 00:06:05,326 si estuvieran diseñando una red, 127 00:06:05,326 --> 00:06:09,245 les gustaría que estos cambios de probabilidad sean realmente extremos 128 00:06:09,245 --> 00:06:11,485 cuando se instancias valores distintos. 129 00:06:11,485 --> 00:06:13,790 Pero en muchos casos esto no es realmente cierto, 130 00:06:13,790 --> 00:06:15,052 y estas diferencias sutiles 131 00:06:15,052 --> 00:06:17,643 son en realidad muy importante para una compañía de seguros 132 00:06:17,643 --> 00:06:19,819 que asegura cientos de miles de personas. 133 00:06:19,819 --> 00:06:22,495 Un par de puntos porcentuales en la probabilidad de un accidente 134 00:06:22,495 --> 00:06:24,855 puede hacer una gran diferencia a la propia rentabilidad. 135 00:06:25,809 --> 00:06:26,972 Así que ahora vamos a pensar en 136 00:06:26,972 --> 00:06:29,519 cómo podríamos expandir esta red aún más. 137 00:06:30,196 --> 00:06:33,244 El tamaño de vehículo y año del vehículo son cosas 138 00:06:33,244 --> 00:06:35,851 que podemos observar en el foro de seguros. 139 00:06:35,851 --> 00:06:39,070 Pero la calidad del conductor es muy difícil de observar. 140 00:06:39,070 --> 00:06:41,829 No se puede preguntarle a alguien: "Oh, ¿eres un buen conductor?" 141 00:06:41,829 --> 00:06:43,451 Porque todo el mundo va a decir: 142 00:06:43,451 --> 00:06:45,123 "Claro, soy el mejor conductor!". 143 00:06:45,123 --> 00:06:49,272 Por lo tanto no va a ser una cuestión de gran utilidad. 144 00:06:49,272 --> 00:06:53,147 Entonces, ¿qué evidencias podemos observar que nos 145 00:06:53,147 --> 00:06:57,148 podrían indicar el valor de la calidad de conductor? 146 00:06:57,148 --> 00:07:01,491 Una obvia es el registro de conducir de la persona. 147 00:07:01,491 --> 00:07:03,556 Es decir, si ha tenido accidentes anteriores 148 00:07:03,556 --> 00:07:05,355 o infracciones anteriores. 149 00:07:05,832 --> 00:07:08,412 Por lo tanto, vamos a pensar en añadir una variable 150 00:07:08,412 --> 00:07:09,880 que representa la historia de conducción. 151 00:07:10,665 --> 00:07:13,507 Y así vamos a introducir esa variable. 152 00:07:13,507 --> 00:07:16,315 Por lo tanto, puede hacer clic en este botón 153 00:07:16,315 --> 00:07:17,697 que nos permite crear un nodo. 154 00:07:17,697 --> 00:07:19,841 El nodo ahora se llama "variable1" 155 00:07:19,841 --> 00:07:21,036 por lo que tenemos que darle un nombre. 156 00:07:21,036 --> 00:07:24,787 Así, por ejemplo, vamos a llamarlo "DrivingHistory". 157 00:07:26,079 --> 00:07:28,074 Y ese es su identificador, 158 00:07:28,074 --> 00:07:30,620 y también tenemos el nombre de la variable, 159 00:07:30,620 --> 00:07:32,246 que es generalmente el mismo. 160 00:07:32,246 --> 00:07:35,195 Y vamos a darle dos valores, 161 00:07:35,195 --> 00:07:37,725 digamos PreviousAccident y NoPreviousAccident. 162 00:07:41,586 --> 00:07:45,760 Ahora, ¿dónde vamos a poner esta variable en la red? 163 00:07:45,760 --> 00:07:48,828 Uno podría pensar inicialmente que hay que 164 00:07:48,828 --> 00:07:53,228 colocar "DrivingHistory" como padre de "Driver_quality" 165 00:07:53,228 --> 00:07:57,150 porque el historial de conducción puede influenciar 166 00:07:57,150 --> 00:07:59,044 nuestras creencias sobre la calidad del conductor. 167 00:07:59,044 --> 00:08:01,290 Ahora, es verdad que la observación del historial de conducción 168 00:08:01,290 --> 00:08:03,651 cambia nuestra probabilidad de la calidad del conductor, 169 00:08:03,651 --> 00:08:07,443 pero si piensan en la propia estructura causal de esta situación, 170 00:08:07,443 --> 00:08:11,878 lo que realmente tenemos es que la calidad del conductor es un factor causal 171 00:08:11,878 --> 00:08:13,968 tanto de un accidente anterior 172 00:08:13,968 --> 00:08:16,765 como un accidente posterior. 173 00:08:16,765 --> 00:08:18,327 Y lo que si queremos mantener es 174 00:08:18,327 --> 00:08:20,421 la estructura causal intuitiva del dominio, 175 00:08:20,421 --> 00:08:28,095 algo más adecuado es añadir "DrivingHistory" como hijo 176 00:08:28,095 --> 00:08:29,972 en lugar de padre de "Driver_quality". 177 00:08:29,972 --> 00:08:32,187 Pueden preguntarse por qué es importante, 178 00:08:32,187 --> 00:08:33,864 y en este ejemplo muy sencillo 179 00:08:33,864 --> 00:08:36,874 los dos modelos son, en cierto sentido equivalentes 180 00:08:36,874 --> 00:08:38,851 y podríamos haberlas colocado de cualquier manera, 181 00:08:38,851 --> 00:08:44,076 excepto que la CPD de la calidad del conductor dado el historial de conducción 182 00:08:44,076 --> 00:08:46,006 puede ser un poco menos intuitivo. 183 00:08:46,006 --> 00:08:49,955 Pero si tuviéramos otros indicadores de calidad del conductor, 184 00:08:49,955 --> 00:08:52,436 por ejemplo, una infracción anterior, 185 00:08:52,436 --> 00:08:55,661 entonces en realidad tiene mucho más sentido 186 00:08:55,661 --> 00:08:58,559 tener todos ellos como hijos de la calidad del conductor 187 00:08:58,559 --> 00:09:00,925 en vez de padres de la calidad del conductor. 188 00:09:01,802 --> 00:09:02,680 Está bien. 189 00:09:02,680 --> 00:09:07,481 Esto nos muestra cómo podemos añadir una variable a la red. 190 00:09:07,481 --> 00:09:09,764 Y ahora vamos a abrir una red mucho más grande 191 00:09:09,764 --> 00:09:13,007 que incluye estas variables y otras. 192 00:09:13,007 --> 00:09:15,971 Miramos ahora en esta red más grande, 193 00:09:15,971 --> 00:09:17,347 y podemos ver 194 00:09:17,347 --> 00:09:20,237 que hemos añadido algunas variables diferentes a la red. 195 00:09:20,237 --> 00:09:23,211 Hemos añadido atributos del vehículo, 196 00:09:23,211 --> 00:09:27,284 por ejemplo, si el vehículo tenía frenos antibloqueo y airbag, 197 00:09:27,284 --> 00:09:28,787 que nos va a permitir dar 198 00:09:28,787 --> 00:09:31,483 probabilidades más informativas sobre el accidente. 199 00:09:31,483 --> 00:09:35,227 También hemos introducido aspectos del conductor, 200 00:09:35,227 --> 00:09:38,243 por ejemplo, si ha tenido una ruta de entrenamiento extra, 201 00:09:38,243 --> 00:09:40,084 que va a aumentar la calidad de conducción, 202 00:09:40,084 --> 00:09:41,684 si es joven o viejo, 203 00:09:41,684 --> 00:09:42,952 donde se supone 204 00:09:42,952 --> 00:09:45,883 que las personas más jóvenes tienden a ser conductores más imprudentes, 205 00:09:45,883 --> 00:09:50,373 y si el conductor es enfocado o fácilmente distraído, 206 00:09:50,373 --> 00:09:52,848 que a su vez va a afectar a la calidad de conducción. 207 00:09:53,648 --> 00:09:58,681 Ahora bien, como el tipo de personalidad es difícil de observar, 208 00:09:58,681 --> 00:10:03,155 añadimos otra variable que es "Good_student" 209 00:10:03,155 --> 00:10:05,654 lo que podría indicar el tipo de personalidad. 210 00:10:05,654 --> 00:10:08,862 Así que vamos a abrir la CPD para este, 211 00:10:11,293 --> 00:10:14,071 y así podemos ver acá que, por ejemplo, 212 00:10:14,071 --> 00:10:20,999 si sos una persona enfocada y joven, 213 00:10:20,999 --> 00:10:23,720 es mucho más probable que seas un buen estudiante, 214 00:10:23,720 --> 00:10:28,439 mucho más que si no sos una persona enfocada y joven. 215 00:10:28,439 --> 00:10:32,303 Si sos viejo, no es muy probable que seas un estudiante, 216 00:10:32,303 --> 00:10:38,021 por lo que esta probabilidad básicamente dice que si sos viejo, 217 00:10:38,021 --> 00:10:39,883 no es muy probable que seas un estudiante, 218 00:10:39,883 --> 00:10:41,322 y por lo tanto no es probable ser un buen estudiante. 219 00:10:42,014 --> 00:10:47,608 Así que, ahora que hemos añadido todas estas variables a la red, 220 00:10:47,608 --> 00:10:51,161 vamos a seguir adelante y ejecutar algunas consultas para ver qué pasa. 221 00:10:51,161 --> 00:10:56,918 Y vamos a empezar por mirar la probabilidad a priori de "Accident" 222 00:10:56,918 --> 00:10:59,942 antes de observar nada. 223 00:10:59,942 --> 00:11:04,299 Podemos ver que la probabilidad de ningún accidente es cercana al 79,5%. 224 00:11:04,299 --> 00:11:07,065 La probabilidad de accidente grave es de aproximadamente 3%. 225 00:11:07,065 --> 00:11:10,077 Ahora vamos a seguir adelante y decirle al sistema 226 00:11:10,077 --> 00:11:11,837 que tenemos un buen estudiante en cuestión. 227 00:11:11,837 --> 00:11:13,608 Así que vamos a observar 228 00:11:13,608 --> 00:11:15,978 que el estudiante es un buen estudiante, 229 00:11:15,978 --> 00:11:17,567 y vamos a ver qué pasa. 230 00:11:18,059 --> 00:11:19,695 Podemos ver, sorprendentemente, 231 00:11:19,695 --> 00:11:20,807 que a pesar de que se observa 232 00:11:20,807 --> 00:11:21,887 que alguien es un buen estudiante, 233 00:11:21,887 --> 00:11:23,954 la probabilidad de ningún accidente 234 00:11:23,954 --> 00:11:27,699 se redujo de 79,5% a 78%, 235 00:11:27,699 --> 00:11:29,582 y la probabilidad de accidentes graves 236 00:11:29,582 --> 00:11:32,819 subió de 3,5% a 3,67%. 237 00:11:32,819 --> 00:11:33,880 Ustedes pueden decir: 238 00:11:33,880 --> 00:11:35,986 "Bueno, pero me dijo que es un buen estudiante, 239 00:11:35,986 --> 00:11:38,138 ¿No debería bajar la probabilidad de accidentes?" 240 00:11:38,307 --> 00:11:41,972 Así que echemos un vistazo a algunos caminos activos en este grafo. 241 00:11:41,972 --> 00:11:46,461 Un camino activo pasa desde "Good_student" a "Focused", 242 00:11:46,461 --> 00:11:48,928 a "Driver_quality", 243 00:11:48,928 --> 00:11:49,939 a "Accident". 244 00:11:49,939 --> 00:11:53,602 Y es bastante seguro que, si tenemos en cuenta ese camino de forma aislada, 245 00:11:53,602 --> 00:11:58,378 probablemente va a hacer que la probabilidad de ningún accidente sea mayor. 246 00:11:58,378 --> 00:12:00,204 Sin embargo, tenemos otro camino activo. 247 00:12:00,204 --> 00:12:04,058 Tenemos el camino activo que va de "Good_student" hasta "Age", 248 00:12:04,058 --> 00:12:07,085 y luego hacia abajo, a través de "Driver_quality". 249 00:12:07,085 --> 00:12:09,921 Por lo tanto, para ver esto, vamos a desmarcar en buen estudiante 250 00:12:09,921 --> 00:12:11,281 y ver qué pasa. 251 00:12:11,281 --> 00:12:15,767 Noten que inicialmente la probabilidad de que el conductor sea joven era del 25%, 252 00:12:15,767 --> 00:12:17,710 pero cuando observé un buen estudiante, 253 00:12:17,710 --> 00:12:20,538 subió a cerca de 95%. 254 00:12:20,538 --> 00:12:23,143 Y eso fue suficiente para contrarrestar la influencia 255 00:12:23,143 --> 00:12:27,446 a lo largo de este camino activo más evidente. 256 00:12:27,831 --> 00:12:31,551 Así que, para demostrar que esto es precisamente lo que está pasando, 257 00:12:31,551 --> 00:12:35,783 hagamos click para 258 00:12:35,783 --> 00:12:38,415 instanciar el hecho de que el estudiante es joven, 259 00:12:38,415 --> 00:12:43,446 y podemos ver que la probabilidad de accidente grave subió hasta el 3,7% 260 00:12:43,446 --> 00:12:47,967 y ningún accidente bajó un poco por debajo del 77%. 261 00:12:47,967 --> 00:12:51,559 Y ahora vamos a observar buen estudiante y ver qué pasa. 262 00:12:51,559 --> 00:12:53,174 Así que ahora observamos buen estudiante, 263 00:12:53,174 --> 00:13:01,656 y la probabilidad de ningún accidentes se fue a 78%, 264 00:13:01,656 --> 00:13:07,036 a diferencia del anterior, cuando era 77%. 265 00:13:07,036 --> 00:13:10,558 Y la razón de esto 266 00:13:10,558 --> 00:13:12,773 es que ahora hemos bloqueado este camino 267 00:13:12,773 --> 00:13:15,871 que va de buen estudiante, a través de la edad, a la calidad del conductor 268 00:13:15,871 --> 00:13:17,917 mediante la observación de esta variable que bloquea el camino. 269 00:13:17,917 --> 00:13:20,624 Así podemos ver que los patrones de razonamiento 270 00:13:20,624 --> 00:13:24,981 en una red bayesiana a veces son sutiles. 271 00:13:24,981 --> 00:13:28,640 Y hay diferentes caminos que pueden afectar a las cosas 272 00:13:28,640 --> 00:13:31,748 y interactúan entre sí de diferentes maneras. 273 00:13:31,748 --> 00:13:34,698 Y de esta manera, es útil tomar el modelo 274 00:13:34,698 --> 00:13:36,315 y jugar con diferentes consultas 275 00:13:36,315 --> 00:13:37,734 y diferentes combinaciones de evidencias 276 00:13:37,734 --> 00:13:40,026 para entender el comportamiento de una red. 277 00:13:40,026 --> 00:13:41,341 Y especialmente si están diseñando 278 00:13:41,341 --> 00:13:43,786 dicha red para una aplicación particular, 279 00:13:43,786 --> 00:13:46,290 es útil para probar las diferentes consultas 280 00:13:46,290 --> 00:13:48,053 y ver si el comportamiento que se obtiene 281 00:13:48,053 --> 00:13:49,706 es el comportamiento que desean conseguir. 282 00:13:49,706 --> 00:13:52,076 Y si no, entonces necesitan preguntarse 283 00:13:52,076 --> 00:13:55,962 ¿cómo puedo modificar esta red para obtener un comportamiento 284 00:13:55,962 --> 00:14:00,498 que es más similar a la conducta deseada?. 285 00:14:00,498 --> 00:14:03,755 Esta red está disponible para que jueguen 286 00:14:03,755 --> 00:14:06,005 y puedan probar diferentes cosas 287 00:14:06,005 --> 00:14:08,961 y ver qué comportamientos se obtienen.