Unidad IV: Teoría elemental de probabilidades Contenidos 4.1 Análisis combinatorio 4.2 Definición clásica de probabilidad 4.3 Definición de espacio de probabilidad 4.4. Probabilidad de sucesos. 4.5 Probabilidad condicional 4.6 Teorema de Bayes 4.1 Análisis combinatorio Por lo general las palabras “análisis combinatorio” en un curso de Probabilidad debería significar ciertas técnicas para poder saber “cuántos elementos tiene un determinado conjunto”. Entendiendo que este conjunto es el espacio de todos los posibles resultados de un determinado fenómeno aleatorio, y justamente su interés radica en saber con qué frecuencia ocurrirá un determinado resultado de este conjunto. Lo que sucede a veces, y es un pecadillo que tienen, en mayor o menor medida, algunas ramas de las matemáticas, que se le da mayor interés a las técnicas de conteo que al conjunto mismo, y muchas veces nuestros alumnos calculan con una rapidez asombrosa el factorial de un número, o las permutaciones de una ristra de elementos, pero son incapaces de aplicar estos cálculos en situaciones cotidianas, y menos hablar de situaciones enmarcadas en el campo de su futura profesión. Es posible que se pueda aducir el argumento de que el alumno no tiene capacidad de abstracción, entendiendo esto como la propiedad de conocer formulas abstractas y luego poder aplicarlas a situaciones concretas. Puede que este argumento sea válido. Pero olvidamos que la generación de resultados abstractos nace de situaciones concretas, de problemas concretos de alto interés científico. De otra forma, es clásico la utilización de modelos de urnas para esquematizar ciertos resultados de conteo, pero si a este modelo de urnas no lo asociamos a una situación concreta y de real interés, solo conseguiremos que nuestros alumnos aprendan a contar bolitas rojas y negras, o de cualquier color, pero sean incapaces de asociarlas, a manera de ejemplo, a la herencia genética establecida por Gregorio Mendel, o a problemas profundos de la Teoría Económica. Cuando el conteo es simplemente conteo, sin asociación a problemas reales, creo que abusamos en la confianza de que el estudiante tendrá la capacidad de abstracción. Digamos que es el eterno problema entre la ciencia de día y la ciencia de noche. La ciencia de noche es errática, se avanza a tientas, se tiene que escribir a oscuras, no hay luz que ilumine un resultado, es un trabajo a tientas, a tropezones por doquier. Pero llega un momento que se hace la claridad, tenue al principio. Se ha llegado a una conclusión que empieza a iluminar la pieza donde estamos trabajando, asoman los resultados que nos llevarán a la teoría correcta. Se ha iluminado el problema, y entonces podemos avanzar sin temor. Pues bien, qué hacemos con nuestros resultados. Es entonces que aplicamos la metodología de la ciencia de día. Borramos todos nuestro errores, inventamos una axiomática que traza el camino exacto que antes, durante la oscuridad, no veíamos. Los resultado aparecen diáfanos y limpios, inmaculados. Renegamos de nuestros errores. De otra forma renegamos de la ciencia de noche y nos mostramos como seres limpios y libres de todo error. 1 Pues bien, vamos a iniciar ciertas técnicas de conteo mediante problemas que le dieron luz a la Teoría de la Probabilidad. Hablaremos más de la ciencia de noche que la de día. 4.1.1 El teorema fundamental del conteo Suponga usted que tenemos las letras T, A, C y G (que en realidad corresponden a las bases timina, adenina, citosina y guanina). ¿De cuantas maneras diferentes podemos formar una secuencia de longitud 4 ocupando estas cuatro bases, sin repetir ninguna base? Por ejemplo, un resultado sería justamente TACG, otro sería CGTA. Ahora bien, cuántas de estas secuencias podemos formar? Vamos a suponer que una secuencia en particular la podemos ubicar en los siguientes cuatro casilleros Notemos que en el primer casillero podemos ubicar una de las cuatro bases, de modo que tenemos 4 formas de llenar este casillero; ahora bien, sea la base que sea que hayamos elegido para el primer casillero, nos quedan tres bases no seleccionadas, de modo que el segundo casillero podrá llenarse de tres maneras diferentes. Hasta el momento, entonces, hemos utilizado 2 bases, nos faltan las dos restantes, de modo que el tercer casillero se puede llenar de dos maneras diferentes. Una vez llenado el tercer casillero, queda una sola base que deberá ser ubicada en el cuarto casillero. De modo que el total de formas diferentes de llenar estos cuatro casilleros es Observemos que en este caso el orden de elección tiene mucha importancia (en rigor, el orden de una secuencia de nucleótidos es fundamental en la traducción para la formación de las proteinas), esto quiere decir que el resultado TACG es absolutamente diferente al ATCG. Esto último lo queremos aclarar con un ejemplo. Supongamos que queremos formar una secuencia de nucleótidos1 de longitud 6. ¿De cuántas maneras diferentes lo podemos hacer? En este problema estamos incluyendo que las bases se pueden repetir, por ejemplo una secuencia pedida es TTTAAA, que es de longitud 6 y solo hemos utilizado las bases T y A. Es decir en este caso se pueden repetir las bases. El principio para contar es el mismo, en efecto, supongamos que los seis casilleros siguientes representan una secuencia de base de longitud seis, 1 Abusaremos del lenguaje al hablar de secuencia de nucleótidos o secuencia de bases, toda vez que un nucleótido se diferencia de otro por la secuencia de sus bases ya que las dos estructuras adicionales de la molécula de azúcar y el grupo fosfato son siempre los mismos. 2 De manera que el primer casillero tiene 4 opciones de ser llenado con una de las cuatro bases, lo mismo el segundo casillero tendrá 4 opciones de ser llenado, y así sucesivamente, de modo que el total de secuencias de bases para una hebra de longitud 6 es Hay 4096 formas de tener una hebra de ADN de longitud 6 (no le parece espectacular este resultado). Gregorio Mendel sabía mucha algo de matemática (y botánica) cuando en su tiempo en que no se tenía idea de la molécula de ADN ni de genes inicia sus célebres trabajo de genética mediante la experimentación con los guisantes. Ahora que sabemos genética (algo) nos parece un juego de niños sus cálculos de conteo para saber la distribución de las generaciones cruzadas cuyos “padres” tenían las unidades de herencia RR y Rr por ejemplo. Ya dedicaremos un capítulo especial a la Estadística Molecular. Vamos a ejemplo que nos prepararán el camino a situaciones más serias y de aplicación inmediata. Suponga que se tiene una urna con bolitas rojas, bolitas azules. Y supongamos que sacamos una bolita de esa urna (sin mirar la urna). ¿De cuantas maneras diferentes podemos obtener un resultado particular? En primer lugar necesitamos saber la cantidad de bolitas rojas y azules que tenemos en la urna. Supongamos que tenemos N1 y N2 bolitas rojas y bolitas azules respectivamente, lo que hace un total de N = N1 + N2 bolitas. Luego la manera de seleccionar una bolita (sea del color que sea) es precisamente N. En rigor es un casillero que debemos llenarlo con algún tipo de bolitas que hay en la urna. Supongamos ahora que debemos seleccionar (de la misma urna) dos bolitas. ¿De cuántas maneras podemos hacer esta selección? Antes de responder a esta pregunta (digamos que entes de aplicar el teorema fundamental del conteo) debemos aclarar el experimento. Esto es si sacamos la primera bolita la devolvemos o no a la urna antes de sacar la segunda bolita. Si sacamos la primera bolita y la devolvemos a la urna se llama extracción con reposición (o con reemplazo); si no la devolvemos entonces se llama extracción sin reposición (o sin reemplazo). Esta aclaración es fundamental. De modo que vamos a contestar la pregunta para ambos casos. a) con reposición: En efecto, hay N maneras de llenar el primer casillero, cualquiera sea la bolita elegida esta es devuelta a la urna, de manera que en la segunda extracción se tiene igual N maneras de sacar la segunda bolita. b) Sin reposición 3 En efecto, la primera extracción tiene N maneras de ser seleccionada, una vez realizada esta extracción no se devuelve la bolita a la urna, de modo que en la segunda extracción hay N – 1 maneras diferentes de seleccionar una bolita. Ahora bien, sobre la misma urna nos interesa saber de cuantas maneras podemos obtener en dos extracciones con reposición dos bolitas rojas. La solución se entrega en el siguiente diagrama En efecto, si queremos que la primera bolita sea roja ella debe ser extraída entre todas las rojas, que son N1, se devuelve esta bolita a la urna de tal manera que también hay N1 maneras de elegir una bolita roja en la segunda extracción. ¿De cuantas maneras podemos extraer dos bolitas blancas sin reposición? La respuesta sin explicaciones esta dada por Este problema lo podemos extender a situaciones levemente más complicadas. Veamos el siguiente ejemplo. Tenemos una urna con cinco bolitas rojas, tres blancas y dos azules. Se sacan tres bolitas con reposición. ¿De cuantas maneras podemos sacar tres bolitas que sean del mismo color? Observemos que la pregunta realmente consiste en tres problemas, a saber, ¿de cuántas maneras posemos sacar tres bolas rojas, tres bolas blancas, y tres bolas azules? (Nota: las extracciones son sin reposición, de manera que está la factibilidad de que tres bolas extraídas sean azules a pesar de tener dos bolas azules en la urna, si el problema fuese extracción sin reposición no habría manera de obtener tres bolitas azules). Entonces para responder a la pregunta debemos estudiar cada uno de los tres caso en particular, y puesto que cada uno de los casos es excluyente, la suma de las maneras para los tres casos no entregará la solución. Esta se esquematiza en el esquema de la página siguiente. Cada una de las filas nos entrega el resultado para cada color, luego se suma los resultados para cada uno de los colores. 4 Con el teorema fundamental del conteo se pueden obtener resultados de mucha aplicación. Pensemos nuevamente en las letras T, A, C, G. Esta vez no las consideremos como bases de la molécula del ADN, sino como simplemente cuatro objetos diferentes. Nuestro interés es ordenar estas cuatro letras de manera diferente, por ejemplo TACG, ATCG, son dos ordenamientos diferentes. Pues bien, de cuántas maneras podemos ordenar estos cuatro elementos. En rigor, en las secuencias TACG y ATCG, podemos notar que hemos permutado, en este caso, la letra A por la letra T en la primera secuencia para así obtener la segunda secuencia. De otra forma ¿de cuántas maneras diferentes podemos permutar la secuencia TACG? En rigor este problema se asemeja a sacar sin reposición cuatro objetos de un total de cuatro objetos. Resolvemos este problema de la manera habitual (con las casillas) En efecto, el primer casillero es para ubicar la primera letra entre cuatro opciones, si se elige una entonces el segundo casillero tendrá solo tres opciones, una vez elegida esta letra quedan 2 opciones para llenar el tercer casillero, y finalmente queda una letra que deberá ser ocupada en el cuarto casillero. Y esta metodología responde a la pregunta de cuántas maneras podemos permutar n objetos diferentes. El primer casillero lo podemos llenar de n maneras diferentes, luego nos quedan (n – 1) objetos que servirán para llenar el segundo casillero, luego en el tercer casillero nos quedan (n – 2) objetos para ser elegidos, en el cuarto casillero tendremos (n – 3) objetos, y así sucesivamente, en el casillero n- ésimo solo habrá una opción para elegir, el objeto sobrante. De manera que n objetos se pueden permutar de 5 maneras diferentes. La expresión anterior se denota por ! y se lee “n factorial”. De modo que, a manera de ejemplo, la secuencia ABC admite 3! Permutaciones, esto es 6 permutaciones, a saber: ABC, ACB, BAC, BCA, CAB y CBC. En este ejemplo fue fácil la descripción de las permutaciones porque 3! = 6 es un número aceptable en la búsqueda de las permutaciones. Sin embargo ¿puede usted describir todas las permutaciones de la secuencia ABCDEFGHIJ ? Sin embargo, sabemos el número de permutaciones posibles, que es 10! = 3628800 (Le faltaría cuaderno para anotar todas las permutaciones). Ahora imagínese la secuencia del nucleótido TACGTGCGTA de longitud 10. Las maneras de permutar estas diez bases es precisamente de tres millones seiscientos veintiocho mil ochocientas maneras (aquí se consideran que los 10 elementos son diferentes en cuanto entidad física si bien los que tienen la misma letra son iguales en su estructura química). Veamos otro problema que lo podemos seleccionar con el teorema fundamental del conteo. Supóngase que se tienen 5 elementos diferentes, por ejemplo A, B, C, D y E. Y nuestro interés es elegir tres elementos diferentes, digamos seleccionar (que no extraer, puesto que la extracción denota un orden de selección). ¿Entiende la situación? Es como decir, de entre los alumnos Astudillo, Bahamondes, Cereceda, Dominguez y Esculapio debemos elegir tres alumnos para que sean interrogados. Aquí no importa el orden de selección, elegir a Bahamondes primero, a Cereceda segundo y Astudillo tercero da lo mismo que elegir a Astudillo primero, Bahamondes segundo y Cereceda tercero, el hecho es que tres de ellos deben ser elegidos para la interrogación. ¿Cómo resolvemos el problema? Atento al razonamiento. En primer lugar resuelvo la manera de extraer 3 elementos de 5, y sabemos que la respuesta es: 5*4*3 (Nota: aquí importa el orden de extracción sin reposición). Es decir, podemos obtener los resultados Astudillo, Esculapio y Cereceda; y el resultado de Esculapio, Astudillo y Cereceda; que para nosotros es lo mismo. Pero no importa, hemos calculado la forma de sacar por orden tres alumnos sin repetición (sin reposición). Calcularemos de otra manera este mismo número. Supongamos que el número de seleccionar estos tres alumnos para la interrogación es a(3), que es un número desconocido hasta ahora. Sin embargo para cada una de estas triadas de alumnos podemos permutarlos entre ellos, y cada permutación de tres alumnos es 3!. De manera que se tiene la igualdad ! Es decir, el número de seleccionar tres alumnos diferentes de 5 alumnos, sin importar el orden de selección es 6 ! De manera general. Supongamos que tenemos N elementos distintos, y queremos seleccionar k elementos distintos de estos N (k < N). En primer lugar notemos que si queremos extraer una muestra de tamaño k sin reposición las maneras diferentes son: es decir maneras diferentes. Ahora es claro que este número no es la solución a nuestro problema, puesto que allí hay repetidas frecuencias que solo difieren en el orden de extracción. Por otro lado, supongamos que el número de maneras de seleccionar k objetos diferentes de N objetos es el número a(k), que de momento es desconocido. Ahora por cada colección de k objetos hacemos todas las posibles permutaciones, que sabemos que son k!, de modo que el número de maneras de extraer k objetos sin reposición de un total de N es también a(k).k!. Es decir ! Por ejemplo, las maneras de seleccionar 3 objetos diferentes de 5 objetos es ! ! 3!2! Generalizando ! ! ! ! Podemos entonces hacer la siguiente definición ! !(N - k)! y se lee “N sobre k” , y desde ahora en adelante significará el número de manera que podemos seleccionar k objetos diferentes de un total de N objetos diferentes (sin importar el orden de elección) Bien, hemos entregado lo medular de los fundamentos del análisis combinatorio. ¿Qué podemos hacer para que no se nos olvide? Ejercicios útiles y prácticos relacionados con el campo de la salud y la biología. 7 Cada par de cromosomas homólogos consta de dos moléculas de ADN casi iguales. Un gen de un determinado cromosoma es el encargado de la fabricación de una proteína especifica (en el proceso llamado traducción). Ahora bien, un gen en un cromosoma no necesariamente es igual al correspondiente gen del otro cromosoma, y la ubicación geométrica de un gen (en rigor del par de genes que ahora llamaremos alelos) se llama locus (y su plural el loci). De manera que en determinado locus tanto los cromosomas del padre como de la madre tienen dos alelos cada uno, y ellos aportarán uno y solo un alelo al hijo. Por ejemplo el par de alelos del padre es (A,B), donde A es el alelo ubicado en el primer cromosoma homólogo y B el alelo en el segundo cromosoma homólogo; y supongamos que (C,D) es el par de alelos de la madre, donde igual que antes el alelo C está en el primer cromosoma de la madre y D en el segundo cromosoma (recalcamos que ambos pares de alelos están en el mismo locus), entonces el hijo, en el mismo locus, tendrá un par de genes (E,F) donde E es algún alelo del par de cromosomas del padre o de la madre, y F es algún alelo que no proviene del alelo que está en el cromosoma de donde tomó el valor el alelo F. Por ejemplo, (A,B) padre y (C,D) madre pueden generar (D,B). De manera más precisa, si definimos la operación * que significa fecundación entonces los posibles resultados para la combinación (A,B)*(C,D) son: (A, C); (A,D); (B, C); (B, D); (C, A); (C, B); (D, A); (D, B)Ocho posibles combinaciones posibles como máximo, donde la primera componente indica la posición en el primer cromosoma, y la segunda componente en el cromosoma homólogo. Llamaremos al par (A,B) genotipo, y la notación AB llamaremos fenotipo, donde AB es el mismo fenotipo que BA,2 no significando que (A,B) es igual a (B,A). De manera que la combinación (A,B)*(C,D) puede producir a lo más 8 genotipos y a lo más 4 fenotipos.3 Si ocurre que el padre o la madre es (A,A) se dice que es homocigoto en ese locus, y para (A,B) con A distinto de B es heterocigoto. Para no complicarse con la posición de los alelos del nuevo gen es más sencillo establecer el fenotipo que el genotipo. La generación del fenotipo mediante la operación * es como se indica en la siguiente tabla * A B C AC BC D AD BD De manera que la herencia en un determinado locus se puede modelar mediante un par de urnas donde en cada urna hay dos bolas, posiblemente de diferente color si es heterocigoto o del mismo color si es homocigoto. Y lo que hace el hijo o la hija, es seleccionar de cada urna uno y solo un alelo, y conforme a estas extracciones ubicar cada alelo en cada cromosoma homólogo del locus correspondiente. Este hecho trivial tiene repercusiones fundamentales en el fenotipo heredado. En efecto, suponga que en la urna del padre, la urna I, están los alelos R y r, y en la urna II de la madre están los alelos R y r también. Entonces es claro que el hijo o la hija puede tener tres fenotipos posibles, a saber RR, rR y rr. Pero es claro que la manera de obtener el fenotipo rR es dos, a saber el r en la primera urna y el R 2 Es decir los genotipos (A, B) y (B, A) producen el mismo fenotipo AB La expresión “a lo más” ocurre cuando hay a lo menos tres alelos distintos involucrados, en ese caso hay cuatro posibilidades de fenotipos distintos. 3 8 de la segunda urna, o, el R de la primera urna y el r de la segunda urna. Y la manera de ser homocigoto RR es única, R de la primera urna y R de la segunda urna; o ser homocigoto rr es también única, r de la primera urna y r de la segunda urna. Bueno, este fue el razonamiento consecuente de Gregorio Mendel que obtuvo con sus experimentos con los guisantes, en la que definió la unidad física responsable de la herencia genética muchos años antes de que se descubriera que esa unidad física era el gen. En resumen, y bajo el contexto que estamos hablando, en el inicio de nuestra vida para poder “cubrirnos” con los fenotipos que heredaremos de nuestros padres, digamos que existen aproximadamente 150.000 pares de urnas homólogas (150.000 pares de alelos) ubicadas a cada lado de un camino donde transitamos y de forma aleatoria sacamos una bola y solo una bola de cada urna. Pasaremos a otro ejemplo más trivial y alejado de la genética. El juego del Kino. Este juego consiste en acertar a 15 número de un total de 25. Supongamos entonces que hay un hombre inmensamente millonario y que quiere ser más millonario todavía. Contrata agentes a lo largo de Chile para que compren los cartones de Kino y esperar que entre ellos se encuentre el ganador del premio máximo (él desecha los premios de 11, 12, 13 y 14 aciertos, él quiere el premio mayor). La pregunta es ¿cuántos son los cartones diferentes que el debe tener para asegurarse que tendrá el premio mayor? Este es un problema de combinatoria, y consiste en averiguar de cuántas maneras podemos seleccionar 15 números diferentes de un total de 25 números numerados del 1 al 25. La respuesta es obvia: ! 3268760 10!15! ¡la friolera de tres millones doscientos sesenta y ocho mil setecientos sesenta! cartones diferentes. “Vaya “, dice el millonario, “si fuese solo acertar 10 números tendría más opción”. ¿Qué piensa usted del razonamiento del millonario? (que claramente no sabía estadística). Y la otra pregunta es ¿porqué acertar 11 números en el KINO es un premio secundario si es más difícil obtenerlo? En efecto, las combinaciones posibles de seleccionar 11 números diferentes entre 25 numerados del 1 al 25 son 4457400 ¡la friolera de cuatro millones cuatrocientos cincuenta y siete mil cuatrocientos formas de seleccionar 11 números de un total de 25! Este millonario hizo un concurso más difícil (según él), adivinar un número entre 25. ¿qué opina? Y una última pregunta, ¿cuál es la combinación más numerosa de obtener en el juego del KINO? 9 Nota sobre el KINO: Si usted mira la reglamentación del concurso le puede confundir. En efecto, dice: “En cada sorteo se extraerán al azar 15 bolillas sin reposición de una tómbola que contiene 25 bolillas numeradas del 1 al 25”. Luego agrega, “son ganadores los cartones cuyas combinaciones impresas obtengan 15, 14, 13, 12 y 11 coincidencias de los 15 números extraídos”. De manera que se puede considerar que el número de maneras de obtener cartones con 15 números diferentes es por el procedimiento indicado, esto es 4274473667 143680000 Cantidad exorbitantemente grande, lo que pasa es que al usar la tómbola permite “indicar” el número premiado (pues es evidente que con esa forma incluye a un exceso de cartones repetidos con la misma combinación, aunque cada combinación que utilice los mismos números sabemos que se repite con la misma frecuencia, en rigor 15!, (¿o no?). Perfectamente se puede indicar el número premiado de otra forma, por ejemplo hacer una lista de todos las combinaciones distintas de , que un niño pequeño apunte con el dedo, al azar, un número de la lista, ¿no me cree? Veamos ahora un problema que tiene implicancias en asuntos judiciales, y se conoce como la falacia del interrogador. Suponga usted que un testigo vio la escena que describiremos a continuación y que es crucial para determinar un juicio en la corte: en el jardín ubicado en el frontis de la casa, estaba el papá regando, la mamá podando las flores, una niña saltando la cuerda, y detrás de un pequeño arbusto estaba una pequeña persona, que era el otro hijo, pero el testigo no puede determinar el sexo de esta pequeña persona que estaba detrás el arbusto. Para resolver el caso favorable a la fiscalía es fundamental que el sexo de la persona fuera hombre, esto es un niño. El defensor alega de la siguiente manera: “Es una incertidumbre como lanzar una moneda, pues todos sabemos que un vástago puede ser hombre o mujer, de manera que para que sea hombre tiene una sola posibilidad entre dos”. Sin embargo el fiscal responde: “En esta familia sabemos positivamente que tiene dos hijos, ahora bien, sabemos el sexo de uno de los hijos, que es mujer, por otro lado las posibles combinaciones de tener dos hijos son las siguientes, jerarquizando en primer lugar el vástago mayor: (hombre, mujer), (mujer, hombre), (mujer, mujer) y (hombre, hombre)”, y dirige la mirada al jurado que aprueba este razonamiento lógico, y continua, “pero sabemos que la opción (hombre, hombre) no puede ocurrir, toda vez que sabemos que uno de los hijos es mujer, de manera que solo nos quedan tres opciones, (hombre, mujer), (mujer, hombre) y (mujer, mujer); por lo tanto las formas posibles que la persona detrás del arbusto sea hombre es de dos opciones entre tres opciones” ¿Qué opina usted? Quién tiene más razón, el fiscal o el abogado defensor. Pues bien, esta anécdota tiene repercusiones en el ámbito judicial que incluso toca problemas de identificación mediante el ADN. 4.2 Definición clásica de Probabilidades La sección anterior tuvo como objetivo último el saber calcular cuántos elementos tiene un determinado conjunto finito. Piense usted en el número de cartillas del juego Kino, resulta imposible describir cartilla por cartilla todas las posibilidades de seleccionar 15 números de un total de 25, sin embargo sabemos el número de elementos que tiene ese conjunto, ¿cuál 10 conjunto?, el conjunto de todas las posibles cartillas ganadores del juego del Kino. Ahora bien, supongamos que hemos conocido el número de elementos de un determinado conjunto A, y además supongamos que este conjunto A representa todos los posibles resultados de un experimento aleatorio (como obtener el premio del Kino, por ejemplo), y supongamos además que cada resultado del conjunto A es igualmente preferible que el resto. Por ejemplo pensemos en el lanzamiento de un dado, en este caso el conjunto tiene seis posibles resultados y si el dado no está cargado, ningún número del dado es preferible al otro. De igual manera, la tómbola que indica el ganador del Kino no marca preferencia o tendencia por uno o por algunos números determinados entre el 1 y el 25. Pues bien, si este es el caso, es decir, si los posibles resultados aleatorios correspondientes a un experimento aleatorio descritos en el conjunto A son igualmente preferibles uno que otro, se define una medida de incertidumbre para cada posible resultado, como: (1) donde , indica la cardinalidad del conjunto A, es decir el número de elementos que tiene A. Esta definición de probabilidad, es de una potencia increíble. Podemos decir que esta simple propiedad ha permitido el avance de todas las ciencias. Einstein dijo una vez “Dios no juega a los dados”, en un contexto que significaba que de momento una parte de la Física debería contentarse con explicar sus resultados con los fundamentos de la Teoría de la Probabilidad, en particular con la llamada Mecánica Estadística, en espera de una teoría “más sólida”, más determinística, y que, en definitiva, la teoría de la probabilidad tendría una permanencia temporal. Pues, como en pocas ocasiones, Einstein se equivocaba. Al parecer a Dios sí le gusta jugar a los dados. La expresión (1), que se llama probabilidad uniforme discreta finita, tiene aplicaciones extraordinarias. En rigor, una gran parte de fenómenos con resultados finitos se modelan con esta probabilidad. Observemos que hemos definido una medida de incertidumbre, o probabilidad, a cada posible resultado del conjunto de todos los posibles resultados. Parece natural extender esta definición a una variedad de resultados de todos los posibles resultados. Supongamos que tenemos una serie de resultados de interés agrupados en un conjunto B, que está contenido en A. Por ejemplo pensemos en el resultado de los números pares al lanzar un dado, esto significa que estamos interesados en el conjunto B = {2, 4, 6}. Pues bien, sobre cualquier subconjunto B del conjunto A, se define la probabilidad de B como: (2) Con esta sencilla definición podemos concluir que la probabilidad de A, es decir la probabilidad de todos los resultados, es 1; podemos concluir que si el conjunto B no tiene 11 elementos entonces su probabilidad es 0; y podemos concluir entonces que la probabilidad de cualquier subconjunto B se encuentra entre los valores de 0 y 1. Por otro lado, el conjunto Bc, el complemento de B, tiene la propiedad de que su cardinalidad es igual a la cardinalidad de A menos la cardinalidad de B, es decir entonces (3) que es un resultado fundamental en teoría de la probabilidad y se llama probabilidad del complemento. De otra forma Si observamos atentamente la expresión anterior (2), la probabilidad de B se parece a la definición de frecuencia relativa, donde viene a ser el número de observaciones que hemos considerado, y viene a ser el número de observaciones que caen dentro de un intervalo de clases de interés. La diferencia radica en que la frecuencia relativa en un intervalo de clase es un calculo de observaciones realizadas, mientras que el valor de la probabilidad es un cálculo teórico basado en una “suposición”, en una creencia que nos permite decir: “esa será, al parecer, la frecuencia de aparición de los resultados que están en B”. Veamos unos ejemplos. El lanzamiento de una moneda. Supongamos que lanzamos una moneda al aire. Entonces el conjunto de todos los posibles resultados es {cara, sello}. Luego, si pensamos que la moneda es correcta, entonces podemos definir Pr{cara}=Pr{sello}=1/2 La coincidencia en el cumpleaños ¿Sabe usted que es altamente probable que de entre unas 40 personas haya dos que coincida la fecha de su cumpleaños? Lo confirmaremos en el siguiente desarrollo. El año tiene 365 días aproximadamente (nos echaremos al bolsillo los años bisiestos), luego una persona nace indistintamente en alguno de esos días del año. Vamos a suponer que los días del año los numeramos del 1 al 365. Luego si tenemos un grupo de n personas, de ¿cuántas maneras estas n personas tienen su día de cumpleaños? El razonamiento para determinar estas maneras es como sigue. La primera persona “elige” su día de cumpleaños entre cualquier valor de los 365 días; la segunda persona también “elegirá” su día de cumpleaños entre cualquier número de los 365 días; y así sucesivamente hasta la n – ésima persona. En definitiva, los posibles resultados de los n cumpleaños de estas n personas son 365n. De otra forma el espacio de los n cumpleaños tiene 365n maneras de manifestarse. De tal modo que la probabilidad de tener una particular sucesión de n fechas de cumpleaños es de 12 Ahora bien, de todos estos resultados, estaremos interesados en que no se repita ninguna fecha de cumpleaños, es decir debemos encontrar el número de maneras de que las n personas no coincidan en su día de cumpleaños. El razonamiento es el siguiente. La primera persona, cualquiera de ellas, tiene 365 opciones de celebrar su cumpleaños, luego una segunda persona debe tener su cumpleaños en cualquier día excepto en el día que la primera persona lo tiene, es decir esta segunda persona tiene 364 = 365 – 1 opciones. Una tercera persona entonces tendrá 363 = 365 – 2, para no coincidir con las dos fechas anteriores. Una cuarta persona tendrá 362 = 365 – 3 opciones para no coincidir con las anteriores. Finalmente la n – ésima persona tendrá disponibles 365 – (n-1) días para no coincidir con las anteriores. Utilizando el teorema fundamental del conteo se tiene que la cardinalidad del conjunto de resultados en que no coincidan los n cumpleaños es de De manera que en virtud de (2) la probabilidad de que n personas no coincidan en el día de su cumpleaños es de Esta cantidad la podemos arreglar algebraicamente de la manera siguiente: De manera que la probabilidad del conjunto B = {n personas no coincidan en el día de su cumpleaños} es ,4 donde Por otro lado, el complemento del conjunto B = {n personas no coincidan en el día de su cumpleaños} es Bc = {a lo menos dos personas coincidan en el día de su cumpleaños}, de modo que 4 Utilizamos la expresión Q(n) porque en definitiva es una probabilidad que depende del número n de personas involucradas. 13 Los cálculos para estas probabilidades dependiendo del número n de personas se entregan en la tabla 1. n 4 8 12 16 20 22 23 24 28 32 40 48 56 64 Q(n) 0.984 0.926 0.833 0.716 0.589 0.524 0.493 0.462 0.346 0.247 0.109 0.039 0.012 0.003 Tabla 1 P(n) 0.016 0.074 0.074 0.284 0.411 0.476 0.507 0.538 0.654 0.753 0.891 0.961 0.988 0.997 De manera que nos encontramos con la sorpresa de que en una curso de cuarenta alumnos, es altamente probable, 0.891, que a lo menos haya dos personas que coincidan en el día de su cumpleaños. ¿Qué le parece? ¿será cierto? Los guisantes de Gregorio Mendel. Supongamos que las unidades físicas de herencia definidas por Mendel son, para un guisante, Rr y para el otro guisante Rr, y que ellas se combinan de la manera que indica la tabla 2 R r R RR rR r Rr rr Tabla 2 De manera que el guisante hijo puede tener los genotipos indicados en la tabla, y que inducen a tres fenotipos. Vamos a suponer que este gen es causante del color de la flor, donde RR es rojo, rr es blanco y Rr es rojo, por ser r recesivo. Pues bien, los posibles resultados genéticos para el guisante hijo son cuatro como podemos observar en la tabla, ahora cada uno de esos resultados está asociado al fenotipo color de la flor, de modo que tenemos lo siguiente RR Rr rR rojo rojo rojo 14 rr blanco Para esta situación, en que el genotipo resultante del guisante hijo es un resultado aleatorio, podemos definir la probabilidad Pr{RR}=Pr{Rr}=Pr{rR}=Pr{rr}=1/4 De modo que si asociamos los resultados fenotípos a los resultados genotípos, tiene sentido preguntarse ¿cuál es la probabilidad de que en el guisante hijo sus flores sean rojas? Es decir, nos preguntan por la probabilidad del conjunto {Rr, rR, RR}, que es Pr{Rr, rR, RR}=3/4. Además la probabilidad de que su color sea blanco es Pr{rr} = 1/4. Observemos que podemos replantear estas probabilidades sin cambios sustanciales más que leves cambios en el espacio de los resultados. En efecto, si consideramos el color que pueda obtener este guisante entonces para cada color asignamos las siguientes probabilidades Pr{rojo} = ¾ Pr{blanco} = ¼ Probabilidades que no son exactamente del tipo que definimos anteriormente en (1), puesto que el espacio que estamos utilizando es {rojo, blanco} y cada una de las probabilidades asociada a cada uno de estos resultados no es uniforme (es decir no tiene el valor de ½ para cada color). Pero es claro que no existe contradicción con las probabilidades definidas en (1), más aún de esos valores uniformes es que las probabilidades de los colores dejan de ser iguales. No obstante, este ejemplo nos advierte de que la definición de probabilidad dada en (1) hay que extenderla de manera más general, en el sentido de que hay resultados de un determinado experimento que no necesariamente son equiprobables (equiprobables significa la expresión dada en (1)). Damos entonces una definición más general de probabilidad. Sea el espacio A = {a1, a2, ... , an} el conjunto de todos los posibles resultados de un determinado experimento aleatorio. Se dice que existe una probabilidad asociada a este espacio si existen n números no negativos {p1, p2, ..., pn} tal que . Y si este es el caso, se le asigna a cada ai el valor de pi. De otra forma Pr{ai} = pi De manera tal que para un espacio de resultados del tipo A = {a1, a2, ..., an} uno puede definir infinidades de probabilidades, el problema es definir adecuadamente una probabilidad que pueda predecir correctamente los resultados del fenómeno aleatorio, pues al fin y al cabo una probabilidad es una medida de “adivinanza de unos resultados que interesan”. El problema de saber si la probabilidad que se ha propuesto es la mejor que describe los resultados de un experimento aleatorio pertenece al campo de la Inferencia Estadística, que será estudiado más adelante. La definición de esta probabilidad nos permite sacar algunas conclusiones fundamentales, en primer lugar que si B es un conjunto subconjunto de A, digamos que B = {a1, a2, a3} 15 entonces Pr(B) = p1 + p2 + p3. Además si B y C son dos subconjuntos de A, y además b y C son disjuntos5, entonces es claro que es decir la probabilidad de unión disjunta es simplemente la suma de las probabilidades de cada conjunto de la unión. Cuando la unión no es disjunta, no resulta complicado demostrar que Supongamos que tenemos un experimento que solo puede tener dos resultados, digamos “está bien” o “está mal”, que denotaremos esos valores por 1 y 0 respectivamente. Por ejemplo, podemos pensar en el éxito (1) o fracaso (0) de una determinada droga; en el lanzamiento de una moneda donde obtener cara (1) es un éxito y obtener sello (0) es un fracaso; en la revisión de calidad de una máquina, en donde aprobar el control es éxito (1), y reprobar el control es fracaso (0). De manera que el espacio de los posibles resultados es A = {0, 1}. De manera arbitraria asignemos la siguiente probabilidad a cada uno de estos resultados, para p un número comprendido entre 0 y 1, definamos (4) Este espacio de probabilidad, es decir el espacio A = {0, 1 } con la probabilidad Pr{1} = p y Pr{0} = 1 – p, se llama ensayo o experimento de Bernoulli. Más adelante veremos aplicaciones de esta probabilidad, de momento podemos asegurar que esta probabilidad está asociada a decisiones diarias como por ejemplo la resolución tardía de la duda de Hamlet: Ser (1) o no ser (0), he ahí el problema... Con un espacio de probabilidad de Bernoulli que lo replicamos varias veces podemos formar un interesante espacio de probabilidad. Supongamos que tenemos el espacio A = {0, 1}, que tiene asociada una probabilidad como la dada en (4). Ahora bien, vamos a formar un conjunto un poco extraño, que lo definiremos por Es decir este conjunto está constituido por las n – uplas donde cada componente tiene el valor de 1 o el valor 0. Por ejemplo, un elemento para el espacio A3 puede ser (1, 0, 0). Ahora bien, porqué hemos formado este espacio. Suponga usted que vamos a revisar un equipo mediante un control de calidad, donde 1 es “aprobado” y 0 es “reprobado”. Ahora bien, lo que hacemos es revisar n equipos, de manera que la revisión para cada equipo no 5 Significa que los conjuntos B y C no tienen elementos comunes. 16 dependa de los resultados anteriores ni posteriores,6 entonces un posible resultado de esos n equipos puede ser la n- upla (1, 1, 0, ..., 0,1) donde los “unos” indican que el equipo revisado en la posición correspondiente fue “aprobado” y los “ceros” indican que el equipo revisado en la correspondiente revisión fue “reprobado”. Ahora bien, en cada revisión hay una probabilidad p de aprobar y una probabilidad 1 – p de reprobar. Vamos a definir ahora una probabilidad para el espacio An. Supongamos que de manera que el esa n-upla hay k “unos” y n – k “ceros”, entonces (5) Para fijar ideas consideremos el espacio A4, entonces el elemento (1, 0, 0, 1, 1) tiene la probabilidad Ahora bien, la duda es si lo que definimos en (5 ) es efectivamente una probabilidad (¿o basta que lo diga el profesor?) Lo que hemos definido en (5) es un número positivo asociado a una n – upla que está constituida por ceros y unos, entonces debemos demostrar que la suma de todos esos números, de las probabilidades de cada resultado, sea igual a 1. Ahora tendremos tantos números de la forma dada en (5) como elementos tenga el espacio An, y entonces ¿cuantos elementos tiene este espacio? El método para saberlo es sencillo. Vamos a clasificar las n – uplas de acuerdo al siguiente criterio, primero todas las n – uplas que no tengan ningún 1. La única posibilidad es la n-upla nula que describiremos a continuación con su probabilidad asociada Ahora contaremos todas las n – uplas que tengan uno y solo un “uno”. Es claro que hay n elementos de este tipo, a saber todos aquellos que tienen un uno en cada una de las n posiciones, y esto además es equivalente a calcular de cuantas maneras podemos seleccionar 1 elemento entre n elementos. La respuesta es ahora, ¿cuántos elementos de An existen con solo dos “unos”?. Esto equivale a calcular las formas de seleccionar 2 elementos de un total de n, es decir 6 Se dice que los ensayos de Bernoulli son independientes, o la repetición de esos ensayos son independientes. 17 En general, ¿cuántos elementos de An existen con exactamente k “unos”? Nuevamente equivale a calcular de cuántas maneras podemos seleccionar k elementos de un total de n, y cada uno de ellos tendrá la misma probabilidad, esto es Este último razonamiento es válido para todo k = 1, ..., n. De manera que el total de “probabilidades” que debemos sumar para verificar si nos da 1, está indicada por la suma de los coeficientes de la forma , con k = 0, 1, ..., n, y donde además cada coeficiente para cada valor k indica las veces en que se repite el valor de la probabilidad al obtener k éxitos, esto es . En definitiva debemos probar que la suma vale uno. Y eso es evidente para un profesor de matemática o un alumno con primer año aprobado en matemáticas en la universidad.7 Con todo el desarrollo anterior podemos concluir que si tenemos n revisiones tipo Bernoulli, con probabilidad p de éxito y (1- p) de fracaso, entonces la probabilidad de tener k éxitos está dada por (5) Esta probabilidad se llama probabilidad binomial, en el entendido que la expresión {k} significa que todas las n – uplas que contengan exactamente k “unos”. Antes de ver un ejemplo de aplicación de la probabilidad binomial, haremos notar que la probabilidad dada en (5) depende de dos parámetros, de n y de p. Donde el primer parámetro indica la cantidad de repeticiones del ensayo de Bernoulli, y el segundo parámetro es la probabilidad de éxito en el ensayo de Bernoulli. Supongamos que se lanza 5 veces una moneda al aire y deseamos calcular la probabilidad de obtener exactamente 4 caras en dichos lanzamientos. En este caso cada lanzamiento tiene dos resultados posibles: cara (1) y sello (0), y la probabilidad de obtener cara es ½. Por otro lado cada lanzamiento es independiente de los otros lanzamientos (digamos que un , donde a = p y b = 1 – p. 7 Es en realidad el teorema del binomio 18 determinado resultado de un lanzamiento no afecta ningún otro), de manera que la probabilidad de obtener cuatro caras está dada por 0.15625 Sobre el mismo ejemplo, deseamos calcular la probabilidad de obtener a lo menos 3 caras. Esto significa que debemos calcular la probabilidad de la unión de los siguientes conjuntos: {obtener 3 caras}, {obtener 4 caras}, {obtener 5 caras}, y donde cada uno de estos conjuntos son claramente disjuntos; de manera que la probabilidad está dada por Pr{obtener 3 caras} + Pr{obtener 4 caras} + Pr{obtener 5 caras} que es igual a 4.3 Espacio de probabilidad (discretos) Lo que hemos visto hasta ahora en probabilidades tiene soporte en un espacio de resultados finito. Sin embargo hay resultados de muchos fenómenos aleatorios en que el espacio de los resultados es infinito, e incluso puede ser infinito numerable o infinito no numerable. Un ejemplo de espacio infinito numerable es el conjunto {0, 1, 2, ...}. Digamos que un espacio es infinito numerable si no tiene una cota superior y sus elementos se pueden numerar (es decir se puede identificar el primer elemento, el segundo elemento, etcétera). Un ejemplo de espacio infinito no-numerable es el intervalo [0, 1]. En efecto, este intervalo tiene infinitos elementos, a saber todos los números comprendidos entre el 0 y el 1, y además no se puede establecer un orden de numeración, por ejemplo ¿cuál es el segundo elemento que viene después del 0? Si alguien está tentado en decir el 0,1 podemos replicar que antes está el 0, 05, y antes de ese número el 0,025 y así sucesívamente. De manera que no existe manera de numerar este intervalo, como ningún intervalo de la forma [a, b], o (a, b], y en . El problema que surge, general cualquier tipo de intervalo, incluido el intervalo entonces, es ¿podemos definir probabilidades sobre este tipo de conjuntos? La respuesta es afirmativa toda vez que hagamos una buena definición más general de probabilidad. Vamos a dar una definición separada para ambos tipos de conjunto. Primero, cuando A es un conjunto infinito numerable. Sin perdida de generalidad supongamos que A = {0, 1, 2, ...}. Diremos que existe una probabilidad para A si existe una colección infinita numerable de números no negativos , tal que . Si este es el caso, entonces definimos la función 19 , como y además definimos la función Pr{B}, para cualquier De otra forma, se dice que la probabilidad del conjunto B es la suma de las probabilidades de cada elemento de B. 8 Es claro que si A = {0, 1, 2, ...} no hay manera de encontrar una probabilidad cuyos valores de probabilidad para cada i = 0, 1, 2, ... sea constante. Es decir, no existe una probabilidad sobre A = {0, 1, 2,...} tal que Pr{i} = a, con 0 < a <1. ¿Por qué? Por lo tanto, si se define una probabilidad sobre el espacio A = {0, 1, 2,...}, es claro que algunos puntos de A serán más probables que otros. Para la búsqueda de una probabilidad sobre el espacio A = {0, 1, 2,...}, basta encontrar una serie infinita de números no negativos, tal que la suma de esta serie sea finita. Nos explicaremos con algunos ejemplos. La probabilidad geométrica No resulta complicado demostrar que para (6) De manera que en virtud de la propiedad (6) podemos definir una probabilidad sobre el espacio A = {0, 1, 2,...} de la manera siguiente: (7) ¿Qué interpretación tiene esta probabilidad? Digamos que es una probabilidad que indica la “carrera de éxitos”. Vamos a explicar esto. Suponga usted que se revisará un determinado producto elaborado, que se le realizará un determinado control de calidad, y este control solo tiene dos opciones: bueno o malo, la probabilidad de que el producto este malo es p, y por lo tanto 1 - p será la probabilidad de encontrarlo bueno (en este caso, encontrar el primer producto malo es un "éxito"). Se considera que la revisión de los productos son independientes, es decir que un determinado producto esté bueno o malo no incide en los resultados de la revisión de los productos posteriores o anteriores. Se revisará tantos productos (uno a uno) hasta el momento que se encuentre una malo. De manera que si definimos la variable aleatoria X como "el número de productos revisados antes de encontrar uno malo", entonces esta variable aleatoria tomará valores en el conjunto 8 Es probable que reciba muchas recriminaciones por intentar definir de esta manera el concepto de probabilidad. 20 En efecto, la opción X = 0, significa que el primer producto revisado fue malo (no se alcanzó a encontrar uno bueno), y esto ocurre con probabilidad p. Si X = 1, significa que el primer producto revisado fue bueno y el segundo fue malo, y esto ocurre con probabilidad p(1 - p). En general, la probabilidad del suceso X = n, significa que el producto (n + 1)ésimo se encontró malo, y esto ocurre con probabilidad Observe que el factor es la probabilidad de que los primeros n productos estén buenos. A manera de ejemplo más práctico imagínese que usted lanzará una moneda hasta que obtenga una cara (éxito). Que le salga cara a la primera, ocurrirá con una probabilidad de 1/2. Que le salga cara al segundo lanzamiento, significa que en el primer lanzamiento obtuvo un sello (que también ocurre con probabilidad 1/2, y se considera un fracaso), y en el segundo lanzamiento obtiene una cara, de manera que obtener por primera vez una cara en el segundo lanzamiento es que ha realizado antes un lanzamiento fallido, y así sucesivamente. De otra forma el suceso X = n, significa que hubo n lanzamientos fallidos y en el lanzamiento (n +1) se encontró "el éxito". La probabilidad definida según (7) se llama probabilidad geométrica. La probabilidad de Poisson Otra búsqueda de probabilidad sobre el conjunto {0, 1, 2, ...} es aprovechando la conocida serie siguiente: ! de manera que se concluye que ! Por lo tanto podemos definir la siguiente probabilidad ! (8) La probabilidad definida en (8) se llama probabilidad de Poisson, y es muy frecuente en la naturaleza, a veces se llama la ley de los raros eventos. 21 Veamos algunos ejemplos de cálculo. Supongamos que una variable aleatoria X, toma valores en el conjunto {0, 1, 2, ...} con probabilidad de Poisson de parámetro , es decir ! Es relativamente sencillo con una calculadora realizar los cálculos para distintos valores de k, sin embargo puede ser divertido utilizar el programa que se entrega en la siguiente ubicación: http://es.geocities.com/riotorto/tabl/tabl_poisson/tabl_poisson.htm. (pulse aquí). En esa página el parámetro es m, y el valor k se denota por r. Diviértase! Más adelante veremos aplicaciones de esta probabilidad, y el significado del parámetro . Por lo general la probabilidad de Poisson modela fenómenos que denotan la llegada de clientes a una fila en una determinada unidad de tiempo (por ejemplo cada una hora, o cada 10 minutos, etcétera), otras veces puede denotar el número de vehículos que una puede encontrar en un segmento de carretera de longitud determinada (por ejemplo, cada de longitud un kilómetro). La probabilidad de Poisson también puede modelar el número de organismos que se pueden encontrar en un área determinada, por ejemplo en un área de un kilómetro cuadrado en el mar, y se quiere ubicar el número de tiburones que se puede encontrar en esa área en períodos de una hora. Una hermosa modelación de esta situación se puede encontrar en el sitio: http://www.ideamas.cl/cursoProb/javaEstat/poisson_distribution/Poisson.html Haga clic allí y diviértase comprendiendo la probabilidad de Poisson. 4.4 Espacio de Probabilidad Continuo Hasta ahora hemos definido y trabajado con probabilidades definidas en un conjunto finito de resultados aleatorios, o en un conjunto infinito numerable de resultados aleatorios. Sin embargo existen resultados de experimentos aleatorios que pueden asumir cualquier valor en la recta real o en una parte de la recta real, por ejemplo los reales positivos, o en un intervalo real de la forma [a, b]. En estos casos, ¿cómo podemos definir una probabilidad sobre estos conjuntos cuyos elementos son incontables? Recuerde que era fundamental que los elementos de un conjunto de resultados fuera finito o infinito numerable, pues así podríamos darle un "peso" probabilístico a cada valor de resultado, con la condición que la suma de esos "pesos" fuera 1. Pero esta técnica no la podemos realizar en conjuntos infinitos no numerables. Se hace necesario entonces extender el concepto de probabilidad para los números reales. Sea el conjunto de los números reales, diremos que existe una probabilidad para este conjunto si existe una función P tal que: 1. Para todo subconjunto A, que "usted pueda imaginar", de números reales se cumple que 2. Si A y B son dos subconjuntos de números reales que "usted se pueda imaginar", tal que la intersección entre ellas es vacía, entonces 3. Y finalmente, 22 Observe que del postulado 2 y 3 se desprende que . La anterior definición es válida si restringimos la definición a un intervalo real, es decir si reemplazamos por un intervalo de la forma [a. b], o por el intervalo , solamente modificando las condiciones de que los subconjuntos deben estar en estos espacios y que la probabilidad sobre estos intervalos debe ser 1. Veamos sobre la marcha un ejemplo muy utilizado de probabilidad sobre el intervalo [a, b]. Probabilidad uniforma sobre [0, 1] Definamos para cualquier intervalo (a, b) contenido en [0, 1] la función De otra forma es una función que mide la longitud de cualquier intervalo contenido en el intervalo [0,1]. No resulta complicado constatar que esta función satisface los tres postulados anteriores. En efecto, es claro que para cualquier intervalo (a, b) contenido en [0, 1], se tiene que y en particular Si tenemos dos intervalos [a,b] y [c,d] tal que, sin perdida de generalidad b < c, para que sean disjuntos, entonces Esta probabilidad le da un "peso" positivo a cualquier intervalo, sin embargo no le da ningún "peso", en rigor le da probabilidad cero, a un punto de ese intervalo. En efecto, sea x cualquier número comprendido entre 0 y 1, entonces de manera que, para este tipo de probabilidad, la probabilidad de un punto (de un número) es cero, luego podemos concluir que los intervalos (a, b], [a, b], [a,b) y (a, b) tienen la misma probabilidad puesto que un valor o un par de valores ni quita ni pone para esta probabilidad uniforme. Esta definición de probabilidad es fundamental para ciertos procesos de simulación. En efecto. Suponga usted que se tiene una urna en que hay 5 bolitas rojas, 3 blancas y 2 negras. Se saca una bolita al azar. Y queremos repetir este procedimiento unas mil veces (reponiendo la bolita para cada vez, se entiende). ¿Cómo podríamos realizar estas mil simulaciones? Muy sencillo, le decimos al computador que saque un número al azar que esté entre 0 y 1. Si el número elegido está entre 0 y 0.5, en rigor en el intervalo [0, 0.5] entonces interpretamos el resultado de "se extrajo una bolita roja"; ahora si el número seleccionado al azar está en el intervalo (0.5, 0.8] interpretamos el resultado como "se extrajo una blanca", pero si el número seleccionado al azar está entre (0.8, 1], decimos que 23 se "extrajo" una bola negra (que equivale a decir que el número seleccionado al azar no cayó en ninguno de los dos primeros intervalos). Observe que la longitud de cada uno de los intervalos es proporcional a la distribución de los colores de las bolitas. Muy bien, hemos definido una probabilidad sobre el intervalo [0, 1]. La pregunta ahora es, ¿podemos definir una probabilidad sobre la recta real? La respuesta es afirmativa. La más "normal" de las probabilidades en la recta real Sobre cualquier intervalo real (a, b) contenido en , definimos la siguiente función Pues bien, ¡esta es una probabilidad definida sobre !, y depende de los parámetros y . La gráfica de la expresión anterior, llamada también campana de Gauss, es de la forma: Observemos que si y , entonces no se "suaviza" la fórmula como En particular si , se tiene Nos vamos a detener en esta última fórmula. En rigor la expresión F(x), no es nada más que el cálculo del "área bajo la curva", que va desde el punto x hasta el valor "menos infinito". necesariamente vale 1, puesto que es la probabilidad de todo Por otro lado el valor de el espacio de los números reales, es decir 24 de modo que el área bajo la curva comprendida desde "menos infinito" a "más infinito" debe ser 1. Observe por otro lado, en que sin resolver la integral, nos podemos dar cuenta que F(-a) = F(a). De modo que la curva, o función F(x), es simétrica respecto del eje 0 (observe la campana de Gauss). Todo lo anterior se resume en el gráfico siguiente: Visite este sitio: http://personal5.iddeo.es/ztt/Tem/t21_distribucion_normal.htm (Nota, desde aquí "plagiamos" las gráficas de esta sección) 25