Tablas de doble entrada

Anuncio
Unidad IV: Teoría elemental de probabilidades
Contenidos
4.1 Análisis combinatorio
4.2 Definición clásica de probabilidad
4.3 Definición de espacio de probabilidad
4.4. Probabilidad de sucesos.
4.5 Probabilidad condicional
4.6 Teorema de Bayes
4.1 Análisis combinatorio
Por lo general las palabras “análisis combinatorio” en un curso de Probabilidad debería
significar ciertas técnicas para poder saber “cuántos elementos tiene un determinado
conjunto”. Entendiendo que este conjunto es el espacio de todos los posibles resultados de
un determinado fenómeno aleatorio, y justamente su interés radica en saber con qué
frecuencia ocurrirá un determinado resultado de este conjunto. Lo que sucede a veces, y es
un pecadillo que tienen, en mayor o menor medida, algunas ramas de las matemáticas, que
se le da mayor interés a las técnicas de conteo que al conjunto mismo, y muchas veces
nuestros alumnos calculan con una rapidez asombrosa el factorial de un número, o las
permutaciones de una ristra de elementos, pero son incapaces de aplicar estos cálculos en
situaciones cotidianas, y menos hablar de situaciones enmarcadas en el campo de su futura
profesión. Es posible que se pueda aducir el argumento de que el alumno no tiene
capacidad de abstracción, entendiendo esto como la propiedad de conocer formulas
abstractas y luego poder aplicarlas a situaciones concretas. Puede que este argumento sea
válido. Pero olvidamos que la generación de resultados abstractos nace de situaciones
concretas, de problemas concretos de alto interés científico. De otra forma, es clásico la
utilización de modelos de urnas para esquematizar ciertos resultados de conteo, pero si a
este modelo de urnas no lo asociamos a una situación concreta y de real interés, solo
conseguiremos que nuestros alumnos aprendan a contar bolitas rojas y negras, o de
cualquier color, pero sean incapaces de asociarlas, a manera de ejemplo, a la herencia
genética establecida por Gregorio Mendel, o a problemas profundos de la Teoría
Económica. Cuando el conteo es simplemente conteo, sin asociación a problemas reales,
creo que abusamos en la confianza de que el estudiante tendrá la capacidad de abstracción.
Digamos que es el eterno problema entre la ciencia de día y la ciencia de noche.
La ciencia de noche es errática, se avanza a tientas, se tiene que escribir a oscuras, no hay
luz que ilumine un resultado, es un trabajo a tientas, a tropezones por doquier. Pero llega un
momento que se hace la claridad, tenue al principio. Se ha llegado a una conclusión que
empieza a iluminar la pieza donde estamos trabajando, asoman los resultados que nos
llevarán a la teoría correcta. Se ha iluminado el problema, y entonces podemos avanzar sin
temor. Pues bien, qué hacemos con nuestros resultados. Es entonces que aplicamos la
metodología de la ciencia de día. Borramos todos nuestro errores, inventamos una
axiomática que traza el camino exacto que antes, durante la oscuridad, no veíamos. Los
resultado aparecen diáfanos y limpios, inmaculados. Renegamos de nuestros errores. De
otra forma renegamos de la ciencia de noche y nos mostramos como seres limpios y libres
de todo error.
1
Pues bien, vamos a iniciar ciertas técnicas de conteo mediante problemas que le dieron luz
a la Teoría de la Probabilidad. Hablaremos más de la ciencia de noche que la de día.
4.1.1 El teorema fundamental del conteo
Suponga usted que tenemos las letras T, A, C y G (que en realidad corresponden a las bases
timina, adenina, citosina y guanina). ¿De cuantas maneras diferentes podemos formar una
secuencia de longitud 4 ocupando estas cuatro bases, sin repetir ninguna base? Por ejemplo,
un resultado sería justamente TACG, otro sería CGTA. Ahora bien, cuántas de estas
secuencias podemos formar?
Vamos a suponer que una secuencia en particular la podemos ubicar en los siguientes
cuatro casilleros
Notemos que en el primer casillero podemos ubicar una de las cuatro bases, de modo que
tenemos 4 formas de llenar este casillero; ahora bien, sea la base que sea que hayamos
elegido para el primer casillero, nos quedan tres bases no seleccionadas, de modo que el
segundo casillero podrá llenarse de tres maneras diferentes. Hasta el momento, entonces,
hemos utilizado 2 bases, nos faltan las dos restantes, de modo que el tercer casillero se
puede llenar de dos maneras diferentes. Una vez llenado el tercer casillero, queda una sola
base que deberá ser ubicada en el cuarto casillero. De modo que el total de formas
diferentes de llenar estos cuatro casilleros es
Observemos que en este caso el orden de elección tiene mucha importancia (en rigor, el
orden de una secuencia de nucleótidos es fundamental en la traducción para la formación de
las proteinas), esto quiere decir que el resultado TACG es absolutamente diferente al
ATCG.
Esto último lo queremos aclarar con un ejemplo. Supongamos que queremos formar una
secuencia de nucleótidos1 de longitud 6. ¿De cuántas maneras diferentes lo podemos hacer?
En este problema estamos incluyendo que las bases se pueden repetir, por ejemplo una
secuencia pedida es TTTAAA, que es de longitud 6 y solo hemos utilizado las bases T y A.
Es decir en este caso se pueden repetir las bases. El principio para contar es el mismo, en
efecto, supongamos que los seis casilleros siguientes representan una secuencia de base de
longitud seis,
1
Abusaremos del lenguaje al hablar de secuencia de nucleótidos o secuencia de bases, toda vez que un
nucleótido se diferencia de otro por la secuencia de sus bases ya que las dos estructuras adicionales de la
molécula de azúcar y el grupo fosfato son siempre los mismos.
2
De manera que el primer casillero tiene 4 opciones de ser llenado con una de las cuatro
bases, lo mismo el segundo casillero tendrá 4 opciones de ser llenado, y así sucesivamente,
de modo que el total de secuencias de bases para una hebra de longitud 6 es
Hay 4096 formas de tener una hebra de ADN de longitud 6 (no le parece espectacular este
resultado).
Gregorio Mendel sabía mucha algo de matemática (y botánica) cuando en su tiempo en que
no se tenía idea de la molécula de ADN ni de genes inicia sus célebres trabajo de genética
mediante la experimentación con los guisantes. Ahora que sabemos genética (algo) nos
parece un juego de niños sus cálculos de conteo para saber la distribución de las
generaciones cruzadas cuyos “padres” tenían las unidades de herencia RR y Rr por
ejemplo. Ya dedicaremos un capítulo especial a la Estadística Molecular.
Vamos a ejemplo que nos prepararán el camino a situaciones más serias y de aplicación
inmediata. Suponga que se tiene una urna con bolitas rojas, bolitas azules. Y supongamos
que sacamos una bolita de esa urna (sin mirar la urna). ¿De cuantas maneras diferentes
podemos obtener un resultado particular? En primer lugar necesitamos saber la cantidad de
bolitas rojas y azules que tenemos en la urna. Supongamos que tenemos N1 y N2 bolitas
rojas y bolitas azules respectivamente, lo que hace un total de N = N1 + N2 bolitas. Luego la
manera de seleccionar una bolita (sea del color que sea) es precisamente N. En rigor es un
casillero que debemos llenarlo con algún tipo de bolitas que hay en la urna. Supongamos
ahora que debemos seleccionar (de la misma urna) dos bolitas. ¿De cuántas maneras
podemos hacer esta selección? Antes de responder a esta pregunta (digamos que entes de
aplicar el teorema fundamental del conteo) debemos aclarar el experimento. Esto es si
sacamos la primera bolita la devolvemos o no a la urna antes de sacar la segunda bolita. Si
sacamos la primera bolita y la devolvemos a la urna se llama extracción con reposición (o
con reemplazo); si no la devolvemos entonces se llama extracción sin reposición (o sin
reemplazo). Esta aclaración es fundamental. De modo que vamos a contestar la pregunta
para ambos casos.
a) con reposición:
En efecto, hay N maneras de llenar el primer casillero, cualquiera sea la bolita elegida esta
es devuelta a la urna, de manera que en la segunda extracción se tiene igual N maneras de
sacar la segunda bolita.
b) Sin reposición
3
En efecto, la primera extracción tiene N maneras de ser seleccionada, una vez realizada esta
extracción no se devuelve la bolita a la urna, de modo que en la segunda extracción hay N –
1 maneras diferentes de seleccionar una bolita.
Ahora bien, sobre la misma urna nos interesa saber de cuantas maneras podemos obtener
en dos extracciones con reposición dos bolitas rojas. La solución se entrega en el siguiente
diagrama
En efecto, si queremos que la primera bolita sea roja ella debe ser extraída entre todas las
rojas, que son N1, se devuelve esta bolita a la urna de tal manera que también hay N1
maneras de elegir una bolita roja en la segunda extracción.
¿De cuantas maneras podemos extraer dos bolitas blancas sin reposición? La respuesta sin
explicaciones esta dada por
Este problema lo podemos extender a situaciones levemente más complicadas. Veamos el
siguiente ejemplo. Tenemos una urna con cinco bolitas rojas, tres blancas y dos azules. Se
sacan tres bolitas con reposición. ¿De cuantas maneras podemos sacar tres bolitas que sean
del mismo color?
Observemos que la pregunta realmente consiste en tres problemas, a saber, ¿de cuántas
maneras posemos sacar tres bolas rojas, tres bolas blancas, y tres bolas azules? (Nota: las
extracciones son sin reposición, de manera que está la factibilidad de que tres bolas
extraídas sean azules a pesar de tener dos bolas azules en la urna, si el problema fuese
extracción sin reposición no habría manera de obtener tres bolitas azules). Entonces para
responder a la pregunta debemos estudiar cada uno de los tres caso en particular, y puesto
que cada uno de los casos es excluyente, la suma de las maneras para los tres casos no
entregará la solución. Esta se esquematiza en el esquema de la página siguiente.
Cada una de las filas nos entrega el resultado para cada color, luego se suma los resultados
para cada uno de los colores.
4
Con el teorema fundamental del conteo se pueden obtener resultados de mucha aplicación.
Pensemos nuevamente en las letras T, A, C, G. Esta vez no las consideremos como bases de
la molécula del ADN, sino como simplemente cuatro objetos diferentes. Nuestro interés es
ordenar estas cuatro letras de manera diferente, por ejemplo TACG, ATCG, son dos
ordenamientos diferentes. Pues bien, de cuántas maneras podemos ordenar estos cuatro
elementos. En rigor, en las secuencias TACG y ATCG, podemos notar que hemos
permutado, en este caso, la letra A por la letra T en la primera secuencia para así obtener la
segunda secuencia. De otra forma ¿de cuántas maneras diferentes podemos permutar la
secuencia TACG?
En rigor este problema se asemeja a sacar sin reposición cuatro objetos de un total de cuatro
objetos. Resolvemos este problema de la manera habitual (con las casillas)
En efecto, el primer casillero es para ubicar la primera letra entre cuatro opciones, si se
elige una entonces el segundo casillero tendrá solo tres opciones, una vez elegida esta letra
quedan 2 opciones para llenar el tercer casillero, y finalmente queda una letra que deberá
ser ocupada en el cuarto casillero.
Y esta metodología responde a la pregunta de cuántas maneras podemos permutar n objetos
diferentes. El primer casillero lo podemos llenar de n maneras diferentes, luego nos quedan
(n – 1) objetos que servirán para llenar el segundo casillero, luego en el tercer casillero nos
quedan (n – 2) objetos para ser elegidos, en el cuarto casillero tendremos (n – 3) objetos, y
así sucesivamente, en el casillero n- ésimo solo habrá una opción para elegir, el objeto
sobrante. De manera que n objetos se pueden permutar de
5
  
 
  
maneras diferentes. La expresión anterior se denota por
!  
 
  
y se lee “n factorial”. De modo que, a manera de ejemplo, la secuencia ABC admite 3!
Permutaciones, esto es 6 permutaciones, a saber: ABC, ACB, BAC, BCA, CAB y CBC. En
este ejemplo fue fácil la descripción de las permutaciones porque 3! = 6 es un número
aceptable en la búsqueda de las permutaciones. Sin embargo ¿puede usted describir todas
las permutaciones de la secuencia ABCDEFGHIJ ? Sin embargo, sabemos el número de
permutaciones posibles, que es
10! = 3628800
(Le faltaría cuaderno para anotar todas las permutaciones).
Ahora imagínese la secuencia del nucleótido TACGTGCGTA de longitud 10. Las maneras
de permutar estas diez bases es precisamente de tres millones seiscientos veintiocho mil
ochocientas maneras (aquí se consideran que los 10 elementos son diferentes en cuanto
entidad física si bien los que tienen la misma letra son iguales en su estructura química).
Veamos otro problema que lo podemos seleccionar con el teorema fundamental del conteo.
Supóngase que se tienen 5 elementos diferentes, por ejemplo A, B, C, D y E. Y nuestro
interés es elegir tres elementos diferentes, digamos seleccionar (que no extraer, puesto que
la extracción denota un orden de selección). ¿Entiende la situación? Es como decir, de entre
los alumnos Astudillo, Bahamondes, Cereceda, Dominguez y Esculapio debemos elegir tres
alumnos para que sean interrogados. Aquí no importa el orden de selección, elegir a
Bahamondes primero, a Cereceda segundo y Astudillo tercero da lo mismo que elegir a
Astudillo primero, Bahamondes segundo y Cereceda tercero, el hecho es que tres de ellos
deben ser elegidos para la interrogación. ¿Cómo resolvemos el problema?
Atento al razonamiento. En primer lugar resuelvo la manera de extraer 3 elementos de 5, y
sabemos que la respuesta es: 5*4*3 (Nota: aquí importa el orden de extracción sin
reposición). Es decir, podemos obtener los resultados Astudillo, Esculapio y Cereceda; y el
resultado de Esculapio, Astudillo y Cereceda; que para nosotros es lo mismo. Pero no
importa, hemos calculado la forma de sacar por orden tres alumnos sin repetición (sin
reposición). Calcularemos de otra manera este mismo número. Supongamos que el número
de seleccionar estos tres alumnos para la interrogación es a(3), que es un número
desconocido hasta ahora. Sin embargo para cada una de estas triadas de alumnos podemos
permutarlos entre ellos, y cada permutación de tres alumnos es 3!. De manera que se tiene
la igualdad

 !   
Es decir, el número de seleccionar tres alumnos diferentes de 5 alumnos, sin importar el
orden de selección es
6
   

!
De manera general. Supongamos que tenemos N elementos distintos, y queremos
seleccionar k elementos distintos de estos N (k < N). En primer lugar notemos que si
queremos extraer una muestra de tamaño k sin reposición las maneras diferentes son:
es decir   
maneras diferentes. Ahora es claro que
 
 
este número no es la solución a nuestro problema, puesto que allí hay repetidas frecuencias
que solo difieren en el orden de extracción. Por otro lado, supongamos que el número de
maneras de seleccionar k objetos diferentes de N objetos es el número a(k), que de
momento es desconocido. Ahora por cada colección de k objetos hacemos todas las
posibles permutaciones, que sabemos que son k!, de modo que el número de maneras de
extraer k objetos sin reposición de un total de N es también a(k).k!. Es decir
  
 


!
Por ejemplo, las maneras de seleccionar 3 objetos diferentes de 5 objetos es
   
        !


!

   
 
 3!2!
Generalizando
  
 
!



!

!
!
Podemos entonces hacer la siguiente definición

!
 

 
  !(N - k)!
y se lee “N sobre k” , y desde ahora en adelante significará el número de manera que
podemos seleccionar k objetos diferentes de un total de N objetos diferentes (sin importar el
orden de elección)
Bien, hemos entregado lo medular de los fundamentos del análisis combinatorio. ¿Qué
podemos hacer para que no se nos olvide? Ejercicios útiles y prácticos relacionados con el
campo de la salud y la biología.
7
Cada par de cromosomas homólogos consta de dos moléculas de ADN casi iguales. Un gen
de un determinado cromosoma es el encargado de la fabricación de una proteína especifica
(en el proceso llamado traducción). Ahora bien, un gen en un cromosoma no
necesariamente es igual al correspondiente gen del otro cromosoma, y la ubicación
geométrica de un gen (en rigor del par de genes que ahora llamaremos alelos) se llama
locus (y su plural el loci). De manera que en determinado locus tanto los cromosomas del
padre como de la madre tienen dos alelos cada uno, y ellos aportarán uno y solo un alelo al
hijo. Por ejemplo el par de alelos del padre es (A,B), donde A es el alelo ubicado en el
primer cromosoma homólogo y B el alelo en el segundo cromosoma homólogo; y
supongamos que (C,D) es el par de alelos de la madre, donde igual que antes el alelo C está
en el primer cromosoma de la madre y D en el segundo cromosoma (recalcamos que ambos
pares de alelos están en el mismo locus), entonces el hijo, en el mismo locus, tendrá un par
de genes (E,F) donde E es algún alelo del par de cromosomas del padre o de la madre, y F
es algún alelo que no proviene del alelo que está en el cromosoma de donde tomó el valor
el alelo F. Por ejemplo, (A,B) padre y (C,D) madre pueden generar (D,B). De manera más
precisa, si definimos la operación * que significa fecundación entonces los posibles
resultados para la combinación (A,B)*(C,D) son: (A, C); (A,D); (B, C); (B, D); (C, A); (C,
B); (D, A); (D, B)Ocho posibles combinaciones posibles como máximo, donde la primera
componente indica la posición en el primer cromosoma, y la segunda componente en el
cromosoma homólogo.
Llamaremos al par (A,B) genotipo, y la notación AB llamaremos fenotipo, donde AB es el
mismo fenotipo que BA,2 no significando que (A,B) es igual a (B,A). De manera que la
combinación (A,B)*(C,D) puede producir a lo más 8 genotipos y a lo más 4 fenotipos.3 Si
ocurre que el padre o la madre es (A,A) se dice que es homocigoto en ese locus, y para
(A,B) con A distinto de B es heterocigoto.
Para no complicarse con la posición de los alelos del nuevo gen es más sencillo establecer
el fenotipo que el genotipo. La generación del fenotipo mediante la operación * es como se
indica en la siguiente tabla
*
A
B
C
AC
BC
D
AD
BD
De manera que la herencia en un determinado locus se puede modelar mediante un par de
urnas donde en cada urna hay dos bolas, posiblemente de diferente color si es heterocigoto
o del mismo color si es homocigoto. Y lo que hace el hijo o la hija, es seleccionar de cada
urna uno y solo un alelo, y conforme a estas extracciones ubicar cada alelo en cada
cromosoma homólogo del locus correspondiente. Este hecho trivial tiene repercusiones
fundamentales en el fenotipo heredado. En efecto, suponga que en la urna del padre, la urna
I, están los alelos R y r, y en la urna II de la madre están los alelos R y r también. Entonces
es claro que el hijo o la hija puede tener tres fenotipos posibles, a saber RR, rR y rr. Pero es
claro que la manera de obtener el fenotipo rR es dos, a saber el r en la primera urna y el R
2
Es decir los genotipos (A, B) y (B, A) producen el mismo fenotipo AB
La expresión “a lo más” ocurre cuando hay a lo menos tres alelos distintos involucrados, en ese caso hay
cuatro posibilidades de fenotipos distintos.
3
8
de la segunda urna, o, el R de la primera urna y el r de la segunda urna. Y la manera de ser
homocigoto RR es única, R de la primera urna y R de la segunda urna; o ser homocigoto rr
es también única, r de la primera urna y r de la segunda urna. Bueno, este fue el
razonamiento consecuente de Gregorio Mendel que obtuvo con sus experimentos con los
guisantes, en la que definió la unidad física responsable de la herencia genética muchos
años antes de que se descubriera que esa unidad física era el gen.
En resumen, y bajo el contexto que estamos hablando, en el inicio de nuestra vida para
poder “cubrirnos” con los fenotipos que heredaremos de nuestros padres, digamos que
existen aproximadamente 150.000 pares de urnas homólogas (150.000 pares de alelos)
ubicadas a cada lado de un camino donde transitamos y de forma aleatoria sacamos una
bola y solo una bola de cada urna.
Pasaremos a otro ejemplo más trivial y alejado de la genética. El juego del Kino. Este juego
consiste en acertar a 15 número de un total de 25. Supongamos entonces que hay un
hombre inmensamente millonario y que quiere ser más millonario todavía. Contrata agentes
a lo largo de Chile para que compren los cartones de Kino y esperar que entre ellos se
encuentre el ganador del premio máximo (él desecha los premios de 11, 12, 13 y 14
aciertos, él quiere el premio mayor). La pregunta es ¿cuántos son los cartones diferentes
que el debe tener para asegurarse que tendrá el premio mayor?
Este es un problema de combinatoria, y consiste en averiguar de cuántas maneras podemos
seleccionar 15 números diferentes de un total de 25 números numerados del 1 al 25. La
respuesta es obvia:
 
  ! 3268760
 

  10!15!
¡la friolera de tres millones doscientos sesenta y ocho mil setecientos sesenta! cartones
diferentes. “Vaya “, dice el millonario, “si fuese solo acertar 10 números tendría más
opción”. ¿Qué piensa usted del razonamiento del millonario? (que claramente no sabía
estadística). Y la otra pregunta es ¿porqué acertar 11 números en el KINO es un premio
secundario si es más difícil obtenerlo? En efecto, las combinaciones posibles de seleccionar
11 números diferentes entre 25 numerados del 1 al 25 son
 
  4457400
 

 
¡la friolera de cuatro millones cuatrocientos cincuenta y siete mil cuatrocientos formas de
seleccionar 11 números de un total de 25!
Este millonario hizo un concurso más difícil (según él), adivinar un número entre 25. ¿qué
opina? Y una última pregunta, ¿cuál es la combinación más numerosa de obtener en el
juego del KINO?
9
Nota sobre el KINO: Si usted mira la reglamentación del concurso le puede confundir. En
efecto, dice: “En cada sorteo se extraerán al azar 15 bolillas sin reposición de una tómbola
que contiene 25 bolillas numeradas del 1 al 25”. Luego agrega, “son ganadores los cartones
cuyas combinaciones impresas obtengan 15, 14, 13, 12 y 11 coincidencias de los 15
números extraídos”. De manera que se puede considerar que el número de maneras de
obtener cartones con 15 números diferentes es por el procedimiento indicado, esto es
    
 
4274473667 143680000
Cantidad exorbitantemente grande, lo que pasa es que al usar la tómbola permite “indicar”
el número premiado (pues es evidente que con esa forma incluye a un exceso de cartones
repetidos con la misma combinación, aunque cada combinación que utilice los mismos
números sabemos que se repite con la misma frecuencia, en rigor 15!, (¿o no?).
Perfectamente se puede indicar el número premiado de otra forma, por ejemplo hacer una
 
lista de todos las combinaciones distintas de   , que un niño pequeño apunte con el dedo,
 
 
al azar, un número de la lista, ¿no me cree?
Veamos ahora un problema que tiene implicancias en asuntos judiciales, y se conoce como
la falacia del interrogador. Suponga usted que un testigo vio la escena que describiremos a
continuación y que es crucial para determinar un juicio en la corte: en el jardín ubicado en
el frontis de la casa, estaba el papá regando, la mamá podando las flores, una niña saltando
la cuerda, y detrás de un pequeño arbusto estaba una pequeña persona, que era el otro hijo,
pero el testigo no puede determinar el sexo de esta pequeña persona que estaba detrás el
arbusto. Para resolver el caso favorable a la fiscalía es fundamental que el sexo de la
persona fuera hombre, esto es un niño. El defensor alega de la siguiente manera: “Es una
incertidumbre como lanzar una moneda, pues todos sabemos que un vástago puede ser
hombre o mujer, de manera que para que sea hombre tiene una sola posibilidad entre
dos”. Sin embargo el fiscal responde: “En esta familia sabemos positivamente que tiene dos
hijos, ahora bien, sabemos el sexo de uno de los hijos, que es mujer, por otro lado las
posibles combinaciones de tener dos hijos son las siguientes, jerarquizando en primer lugar
el vástago mayor: (hombre, mujer), (mujer, hombre), (mujer, mujer) y (hombre, hombre)”,
y dirige la mirada al jurado que aprueba este razonamiento lógico, y continua, “pero
sabemos que la opción (hombre, hombre) no puede ocurrir, toda vez que sabemos que uno
de los hijos es mujer, de manera que solo nos quedan tres opciones, (hombre, mujer),
(mujer, hombre) y (mujer, mujer); por lo tanto las formas posibles que la persona detrás del
arbusto sea hombre es de dos opciones entre tres opciones”
¿Qué opina usted? Quién tiene más razón, el fiscal o el abogado defensor. Pues bien, esta
anécdota tiene repercusiones en el ámbito judicial que incluso toca problemas de
identificación mediante el ADN.
4.2 Definición clásica de Probabilidades
La sección anterior tuvo como objetivo último el saber calcular cuántos elementos tiene un
determinado conjunto finito. Piense usted en el número de cartillas del juego Kino, resulta
imposible describir cartilla por cartilla todas las posibilidades de seleccionar 15 números de
un total de 25, sin embargo sabemos el número de elementos que tiene ese conjunto, ¿cuál
10
conjunto?, el conjunto de todas las posibles cartillas ganadores del juego del Kino. Ahora
bien, supongamos que hemos conocido el número de elementos de un determinado
conjunto A, y además supongamos que este conjunto A representa todos los posibles
resultados de un experimento aleatorio (como obtener el premio del Kino, por ejemplo), y
supongamos además que cada resultado del conjunto A es igualmente preferible que el
resto. Por ejemplo pensemos en el lanzamiento de un dado, en este caso el conjunto tiene
seis posibles resultados y si el dado no está cargado, ningún número del dado es preferible
al otro. De igual manera, la tómbola que indica el ganador del Kino no marca preferencia o
tendencia por uno o por algunos números determinados entre el 1 y el 25. Pues bien, si este
es el caso, es decir, si los posibles resultados aleatorios correspondientes a un experimento
aleatorio descritos en el conjunto A son igualmente preferibles uno que otro, se define una
medida de incertidumbre para cada posible resultado, como:
  




  

(1)
donde  , indica la cardinalidad del conjunto A, es decir el número de elementos que tiene
A.
Esta definición de probabilidad, es de una potencia increíble. Podemos decir que esta
simple propiedad ha permitido el avance de todas las ciencias. Einstein dijo una vez “Dios
no juega a los dados”, en un contexto que significaba que de momento una parte de la
Física debería contentarse con explicar sus resultados con los fundamentos de la Teoría de
la Probabilidad, en particular con la llamada Mecánica Estadística, en espera de una teoría
“más sólida”, más determinística, y que, en definitiva, la teoría de la probabilidad tendría
una permanencia temporal. Pues, como en pocas ocasiones, Einstein se equivocaba. Al
parecer a Dios sí le gusta jugar a los dados.
La expresión (1), que se llama probabilidad uniforme discreta finita, tiene aplicaciones
extraordinarias. En rigor, una gran parte de fenómenos con resultados finitos se modelan
con esta probabilidad.
Observemos que hemos definido una medida de incertidumbre, o probabilidad, a cada
posible resultado del conjunto de todos los posibles resultados. Parece natural extender
esta definición a una variedad de resultados de todos los posibles resultados. Supongamos
que tenemos una serie de resultados de interés agrupados en un conjunto B, que está
contenido en A. Por ejemplo pensemos en el resultado de los números pares al lanzar un
dado, esto significa que estamos interesados en el conjunto B = {2, 4, 6}. Pues bien, sobre
cualquier subconjunto B del conjunto A, se define la probabilidad de B como:

 (2)

Con esta sencilla definición podemos concluir que la probabilidad de A, es decir la
probabilidad de todos los resultados, es 1; podemos concluir que si el conjunto B no tiene
11
elementos entonces su probabilidad es 0; y podemos concluir entonces que la probabilidad
de cualquier subconjunto B se encuentra entre los valores de 0 y 1.
Por otro lado, el conjunto Bc, el complemento de B, tiene la propiedad de que su
cardinalidad es igual a la cardinalidad de A menos la cardinalidad de B, es decir
 
entonces








 
(3)


que es un resultado fundamental en teoría de la probabilidad y se llama probabilidad del

complemento. De otra forma 

Si observamos atentamente la expresión anterior (2), la probabilidad de B se parece a la
definición de frecuencia relativa, donde  viene a ser el número de observaciones que
hemos considerado, y  viene a ser el número de observaciones que caen dentro de un
intervalo de clases de interés. La diferencia radica en que la frecuencia relativa en un
intervalo de clase es un calculo de observaciones realizadas, mientras que el valor de la
probabilidad es un cálculo teórico basado en una “suposición”, en una creencia que nos
permite decir: “esa será, al parecer, la frecuencia de aparición de los resultados que están en
B”.
Veamos unos ejemplos.
El lanzamiento de una moneda. Supongamos que lanzamos una moneda al aire. Entonces
el conjunto de todos los posibles resultados es {cara, sello}. Luego, si pensamos que la
moneda es correcta, entonces podemos definir
Pr{cara}=Pr{sello}=1/2
La coincidencia en el cumpleaños ¿Sabe usted que es altamente probable que de entre
unas 40 personas haya dos que coincida la fecha de su cumpleaños? Lo confirmaremos en
el siguiente desarrollo. El año tiene 365 días aproximadamente (nos echaremos al bolsillo
los años bisiestos), luego una persona nace indistintamente en alguno de esos días del año.
Vamos a suponer que los días del año los numeramos del 1 al 365. Luego si tenemos un
grupo de n personas, de ¿cuántas maneras estas n personas tienen su día de cumpleaños? El
razonamiento para determinar estas maneras es como sigue. La primera persona “elige” su
día de cumpleaños entre cualquier valor de los 365 días; la segunda persona también
“elegirá” su día de cumpleaños entre cualquier número de los 365 días; y así sucesivamente
hasta la n – ésima persona. En definitiva, los posibles resultados de los n cumpleaños de
estas n personas son 365n. De otra forma el espacio de los n cumpleaños tiene 365n maneras
de manifestarse. De tal modo que la probabilidad de tener una particular sucesión de n
fechas de cumpleaños es de
12


Ahora bien, de todos estos resultados, estaremos interesados en que no se repita ninguna
fecha de cumpleaños, es decir debemos encontrar el número de maneras de que las n
personas no coincidan en su día de cumpleaños. El razonamiento es el siguiente. La primera
persona, cualquiera de ellas, tiene 365 opciones de celebrar su cumpleaños, luego una
segunda persona debe tener su cumpleaños en cualquier día excepto en el día que la
primera persona lo tiene, es decir esta segunda persona tiene 364 = 365 – 1 opciones. Una
tercera persona entonces tendrá 363 = 365 – 2, para no coincidir con las dos fechas
anteriores. Una cuarta persona tendrá 362 = 365 – 3 opciones para no coincidir con las
anteriores. Finalmente la n – ésima persona tendrá disponibles 365 – (n-1) días para no
coincidir con las anteriores. Utilizando el teorema fundamental del conteo se tiene que la
cardinalidad del conjunto de resultados en que no coincidan los n cumpleaños es de
 
 
 

De manera que en virtud de (2) la probabilidad de que n personas no coincidan en el día de
su cumpleaños es de
  
 
 


Esta cantidad la podemos arreglar algebraicamente de la manera siguiente:
 
 
 

  
 




          
 
 


De manera que la probabilidad del conjunto B = {n personas no coincidan en el día de su
cumpleaños} es 
,4 donde


  




       
 


Por otro lado, el complemento del conjunto B = {n personas no coincidan en el día de su
cumpleaños} es Bc = {a lo menos dos personas coincidan en el día de su cumpleaños}, de
modo que
4
Utilizamos la expresión Q(n) porque en definitiva es una probabilidad que depende del número n de
personas involucradas.
13




Los cálculos para estas probabilidades dependiendo del número n de personas se entregan
en la tabla 1.
n
4
8
12
16
20
22
23
24
28
32
40
48
56
64
Q(n)
0.984
0.926
0.833
0.716
0.589
0.524
0.493
0.462
0.346
0.247
0.109
0.039
0.012
0.003
Tabla 1
P(n)
0.016
0.074
0.074
0.284
0.411
0.476
0.507
0.538
0.654
0.753
0.891
0.961
0.988
0.997
De manera que nos encontramos con la sorpresa de que en una curso de cuarenta alumnos,
es altamente probable, 0.891, que a lo menos haya dos personas que coincidan en el día de
su cumpleaños. ¿Qué le parece? ¿será cierto?
Los guisantes de Gregorio Mendel. Supongamos que las unidades físicas de herencia
definidas por Mendel son, para un guisante, Rr y para el otro guisante Rr, y que ellas se
combinan de la manera que indica la tabla 2
R
r
R
RR
rR
r
Rr
rr
Tabla 2
De manera que el guisante hijo puede tener los genotipos indicados en la tabla, y que
inducen a tres fenotipos. Vamos a suponer que este gen es causante del color de la flor,
donde RR es rojo, rr es blanco y Rr es rojo, por ser r recesivo. Pues bien, los posibles
resultados genéticos para el guisante hijo son cuatro como podemos observar en la tabla,
ahora cada uno de esos resultados está asociado al fenotipo color de la flor, de modo que
tenemos lo siguiente
RR
Rr
rR
 rojo
 rojo
 rojo
14
rr
 blanco
Para esta situación, en que el genotipo resultante del guisante hijo es un resultado aleatorio,
podemos definir la probabilidad
Pr{RR}=Pr{Rr}=Pr{rR}=Pr{rr}=1/4
De modo que si asociamos los resultados fenotípos a los resultados genotípos, tiene sentido
preguntarse ¿cuál es la probabilidad de que en el guisante hijo sus flores sean rojas? Es
decir, nos preguntan por la probabilidad del conjunto {Rr, rR, RR}, que es Pr{Rr, rR,
RR}=3/4. Además la probabilidad de que su color sea blanco es Pr{rr} = 1/4.
Observemos que podemos replantear estas probabilidades sin cambios sustanciales más que
leves cambios en el espacio de los resultados. En efecto, si consideramos el color que pueda
obtener este guisante entonces para cada color asignamos las siguientes probabilidades
Pr{rojo} = ¾
Pr{blanco} = ¼
Probabilidades que no son exactamente del tipo que definimos anteriormente en (1), puesto
que el espacio que estamos utilizando es {rojo, blanco} y cada una de las probabilidades
asociada a cada uno de estos resultados no es uniforme (es decir no tiene el valor de ½ para
cada color). Pero es claro que no existe contradicción con las probabilidades definidas en
(1), más aún de esos valores uniformes es que las probabilidades de los colores dejan de ser
iguales. No obstante, este ejemplo nos advierte de que la definición de probabilidad dada en
(1) hay que extenderla de manera más general, en el sentido de que hay resultados de un
determinado experimento que no necesariamente son equiprobables (equiprobables
significa la expresión dada en (1)).
Damos entonces una definición más general de probabilidad.
Sea el espacio A = {a1, a2, ... , an} el conjunto de todos los posibles resultados de un
determinado experimento aleatorio. Se dice que existe una probabilidad asociada a este


espacio si existen n números no negativos {p1, p2, ..., pn} tal que 
. Y si este es
el caso, se le asigna a cada ai el valor de pi. De otra forma
Pr{ai} = pi
De manera tal que para un espacio de resultados del tipo A = {a1, a2, ..., an} uno puede
definir infinidades de probabilidades, el problema es definir adecuadamente una
probabilidad que pueda predecir correctamente los resultados del fenómeno aleatorio, pues
al fin y al cabo una probabilidad es una medida de “adivinanza de unos resultados que
interesan”. El problema de saber si la probabilidad que se ha propuesto es la mejor que
describe los resultados de un experimento aleatorio pertenece al campo de la Inferencia
Estadística, que será estudiado más adelante.
La definición de esta probabilidad nos permite sacar algunas conclusiones fundamentales,
en primer lugar que si B es un conjunto subconjunto de A, digamos que B = {a1, a2, a3}
15
entonces Pr(B) = p1 + p2 + p3. Además si B y C son dos subconjuntos de A, y además b y C
son disjuntos5, entonces es claro que

 

es decir la probabilidad de unión disjunta es simplemente la suma de las probabilidades de
cada conjunto de la unión. Cuando la unión no es disjunta, no resulta complicado demostrar
que

 

 
Supongamos que tenemos un experimento que solo puede tener dos resultados, digamos
“está bien” o “está mal”, que denotaremos esos valores por 1 y 0 respectivamente. Por
ejemplo, podemos pensar en el éxito (1) o fracaso (0) de una determinada droga; en el
lanzamiento de una moneda donde obtener cara (1) es un éxito y obtener sello (0) es un
fracaso; en la revisión de calidad de una máquina, en donde aprobar el control es éxito (1),
y reprobar el control es fracaso (0). De manera que el espacio de los posibles resultados es
A = {0, 1}. De manera arbitraria asignemos la siguiente probabilidad a cada uno de estos
resultados, para p un número comprendido entre 0 y 1, definamos






(4)
Este espacio de probabilidad, es decir el espacio A = {0, 1 } con la probabilidad Pr{1} = p
y Pr{0} = 1 – p, se llama ensayo o experimento de Bernoulli. Más adelante veremos
aplicaciones de esta probabilidad, de momento podemos asegurar que esta probabilidad está
asociada a decisiones diarias como por ejemplo la resolución tardía de la duda de Hamlet:
Ser (1) o no ser (0), he ahí el problema...
Con un espacio de probabilidad de Bernoulli que lo replicamos varias veces podemos
formar un interesante espacio de probabilidad. Supongamos que tenemos el espacio A = {0,
1}, que tiene asociada una probabilidad como la dada en (4). Ahora bien, vamos a formar
un conjunto un poco extraño, que lo definiremos por


        


 


 
Es decir este conjunto está constituido por las n – uplas donde cada componente tiene el
valor de 1 o el valor 0. Por ejemplo, un elemento para el espacio A3 puede ser (1, 0, 0).
Ahora bien, porqué hemos formado este espacio. Suponga usted que vamos a revisar un
equipo mediante un control de calidad, donde 1 es “aprobado” y 0 es “reprobado”. Ahora
bien, lo que hacemos es revisar n equipos, de manera que la revisión para cada equipo no
5
Significa que los conjuntos B y C no tienen elementos comunes.
16
dependa de los resultados anteriores ni posteriores,6 entonces un posible resultado de esos n
equipos puede ser la n- upla (1, 1, 0, ..., 0,1) donde los “unos” indican que el equipo
revisado en la posición correspondiente fue “aprobado” y los “ceros” indican que el equipo
revisado en la correspondiente revisión fue “reprobado”. Ahora bien, en cada revisión hay
una probabilidad p de aprobar y una probabilidad 1 – p de reprobar. Vamos a definir ahora

una probabilidad para el espacio An. Supongamos que 

 
  de manera que


el esa n-upla hay k “unos” y n – k “ceros”, entonces

(5)







Para fijar ideas consideremos el espacio A4, entonces el elemento (1, 0, 0, 1, 1) tiene la
probabilidad





Ahora bien, la duda es si lo que definimos en (5 ) es efectivamente una probabilidad (¿o
basta que lo diga el profesor?) Lo que hemos definido en (5) es un número positivo
asociado a una n – upla que está constituida por ceros y unos, entonces debemos demostrar
que la suma de todos esos números, de las probabilidades de cada resultado, sea igual a 1.
Ahora tendremos tantos números de la forma dada en (5) como elementos tenga el espacio
An, y entonces ¿cuantos elementos tiene este espacio? El método para saberlo es sencillo.
Vamos a clasificar las n – uplas de acuerdo al siguiente criterio, primero todas las n – uplas
que no tengan ningún 1. La única posibilidad es la n-upla nula que describiremos a
continuación con su probabilidad asociada



 
Ahora contaremos todas las n – uplas que tengan uno y solo un “uno”. Es claro que hay n
elementos de este tipo, a saber todos aquellos que tienen un uno en cada una de las n
posiciones, y esto además es equivalente a calcular de cuantas maneras podemos
seleccionar 1 elemento entre n elementos. La respuesta es
 

  


 


 
ahora, ¿cuántos elementos de An existen con solo dos “unos”?. Esto equivale a calcular las
formas de seleccionar 2 elementos de un total de n, es decir
 

  


  
 
 
6
Se dice que los ensayos de Bernoulli son independientes, o la repetición de esos ensayos son independientes.
17
En general, ¿cuántos elementos de An existen con exactamente k “unos”? Nuevamente
equivale a calcular de cuántas maneras podemos seleccionar k elementos de un total de n, y
cada uno de ellos tendrá la misma probabilidad, esto es
 

  

 


 
Este último razonamiento es válido para todo k = 1, ..., n. De manera que el total de
“probabilidades” que debemos sumar para verificar si nos da 1, está indicada por la suma
 
de los coeficientes de la forma   , con k = 0, 1, ..., n, y donde además cada coeficiente


para cada valor k indica las veces en que se repite el valor de la probabilidad al obtener k

éxitos, esto es  
. En definitiva debemos probar que la suma
  

     
 


vale uno. Y eso es evidente para un profesor de matemática o un alumno con primer año
aprobado en matemáticas en la universidad.7
Con todo el desarrollo anterior podemos concluir que si tenemos n revisiones tipo
Bernoulli, con probabilidad p de éxito y (1- p) de fracaso, entonces la probabilidad de tener
k éxitos está dada por
  

(5)

   



Esta probabilidad se llama probabilidad binomial, en el entendido que la expresión {k}
significa que todas las n – uplas que contengan exactamente k “unos”.
Antes de ver un ejemplo de aplicación de la probabilidad binomial, haremos notar que la
probabilidad dada en (5) depende de dos parámetros, de n y de p. Donde el primer
parámetro indica la cantidad de repeticiones del ensayo de Bernoulli, y el segundo
parámetro es la probabilidad de éxito en el ensayo de Bernoulli.
Supongamos que se lanza 5 veces una moneda al aire y deseamos calcular la probabilidad
de obtener exactamente 4 caras en dichos lanzamientos. En este caso cada lanzamiento
tiene dos resultados posibles: cara (1) y sello (0), y la probabilidad de obtener cara es ½.
Por otro lado cada lanzamiento es independiente de los otros lanzamientos (digamos que un
   
, donde a = p y b = 1 – p.
    
 


7
Es en realidad el teorema del binomio
18
determinado resultado de un lanzamiento no afecta ningún otro), de manera que la
probabilidad de obtener cuatro caras está dada por

   
0.15625
    
    
 
Sobre el mismo ejemplo, deseamos calcular la probabilidad de obtener a lo menos 3 caras.
Esto significa que debemos calcular la probabilidad de la unión de los siguientes conjuntos:
{obtener 3 caras}, {obtener 4 caras}, {obtener 5 caras}, y donde cada uno de estos
conjuntos son claramente disjuntos; de manera que la probabilidad está dada por
Pr{obtener 3 caras} + Pr{obtener 4 caras} + Pr{obtener 5 caras}
que es igual a






 

   
    
 
  

 
 
  
    











             



 
 
 
    
4.3 Espacio de probabilidad (discretos)
Lo que hemos visto hasta ahora en probabilidades tiene soporte en un espacio de resultados
finito. Sin embargo hay resultados de muchos fenómenos aleatorios en que el espacio de los
resultados es infinito, e incluso puede ser infinito numerable o infinito no numerable. Un
ejemplo de espacio infinito numerable es el conjunto {0, 1, 2, ...}. Digamos que un espacio
es infinito numerable si no tiene una cota superior y sus elementos se pueden numerar (es
decir se puede identificar el primer elemento, el segundo elemento, etcétera). Un ejemplo
de espacio infinito no-numerable es el intervalo [0, 1]. En efecto, este intervalo tiene
infinitos elementos, a saber todos los números comprendidos entre el 0 y el 1, y además no
se puede establecer un orden de numeración, por ejemplo ¿cuál es el segundo elemento que
viene después del 0? Si alguien está tentado en decir el 0,1 podemos replicar que antes está
el 0, 05, y antes de ese número el 0,025 y así sucesívamente. De manera que no existe
manera de numerar este intervalo, como ningún intervalo de la forma [a, b], o (a, b], y en
. El problema que surge,
general cualquier tipo de intervalo, incluido el intervalo 
entonces, es ¿podemos definir probabilidades sobre este tipo de conjuntos? La respuesta es
afirmativa toda vez que hagamos una buena definición más general de probabilidad.
Vamos a dar una definición separada para ambos tipos de conjunto.
Primero, cuando A es un conjunto infinito numerable. Sin perdida de generalidad
supongamos que A = {0, 1, 2, ...}. Diremos que existe una probabilidad para A si existe una
colección infinita numerable de números no negativos  
, tal que





. Si este es el caso, entonces definimos la función



19
 , como
y además definimos la función Pr{B}, para cualquier   




 


De otra forma, se dice que la probabilidad del conjunto B es la suma de las probabilidades
de cada elemento de B. 8
Es claro que si A = {0, 1, 2, ...} no hay manera de encontrar una probabilidad cuyos valores
de probabilidad para cada i = 0, 1, 2, ... sea constante. Es decir, no existe una probabilidad
sobre A = {0, 1, 2,...} tal que Pr{i} = a, con 0 < a <1. ¿Por qué?
Por lo tanto, si se define una probabilidad sobre el espacio A = {0, 1, 2,...}, es claro que
algunos puntos de A serán más probables que otros. Para la búsqueda de una probabilidad
sobre el espacio A = {0, 1, 2,...}, basta encontrar una serie infinita de números no
negativos, tal que la suma de esta serie sea finita. Nos explicaremos con algunos ejemplos.
La probabilidad geométrica
No resulta complicado demostrar que para 









 
(6)

De manera que en virtud de la propiedad (6) podemos definir una probabilidad sobre el
espacio A = {0, 1, 2,...} de la manera siguiente:





 
 (7)
¿Qué interpretación tiene esta probabilidad? Digamos que es una probabilidad que indica la
“carrera de éxitos”. Vamos a explicar esto.
Suponga usted que se revisará un determinado producto elaborado, que se le realizará un
determinado control de calidad, y este control solo tiene dos opciones: bueno o malo, la
probabilidad de que el producto este malo es p, y por lo tanto 1 - p será la probabilidad de
encontrarlo bueno (en este caso, encontrar el primer producto malo es un "éxito"). Se
considera que la revisión de los productos son independientes, es decir que un determinado
producto esté bueno o malo no incide en los resultados de la revisión de los productos
posteriores o anteriores. Se revisará tantos productos (uno a uno) hasta el momento que se
encuentre una malo. De manera que si definimos la variable aleatoria X como "el número
de productos revisados antes de encontrar uno malo", entonces esta variable aleatoria
tomará valores en el conjunto
8
Es probable que reciba muchas recriminaciones por intentar definir de esta manera el concepto de
probabilidad.
20



En efecto, la opción X = 0, significa que el primer producto revisado fue malo (no se
alcanzó a encontrar uno bueno), y esto ocurre con probabilidad p. Si X = 1, significa que el
primer producto revisado fue bueno y el segundo fue malo, y esto ocurre con probabilidad
p(1 - p). En general, la probabilidad del suceso X = n, significa que el producto (n + 1)ésimo se encontró malo, y esto ocurre con probabilidad




Observe que el factor 
es la probabilidad de que los primeros n productos estén
buenos.
A manera de ejemplo más práctico imagínese que usted lanzará una moneda hasta que
obtenga una cara (éxito). Que le salga cara a la primera, ocurrirá con una probabilidad de
1/2. Que le salga cara al segundo lanzamiento, significa que en el primer lanzamiento
obtuvo un sello (que también ocurre con probabilidad 1/2, y se considera un fracaso), y en
el segundo lanzamiento obtiene una cara, de manera que obtener por primera vez una cara
en el segundo lanzamiento es que ha realizado antes un lanzamiento fallido, y así
sucesivamente. De otra forma el suceso X = n, significa que hubo n lanzamientos fallidos y
en el lanzamiento (n +1) se encontró "el éxito".
La probabilidad definida según (7) se llama probabilidad geométrica.
La probabilidad de Poisson
Otra búsqueda de probabilidad sobre el conjunto {0, 1, 2, ...} es aprovechando la conocida
serie siguiente:



 
!

de manera que se concluye que








!
Por lo tanto podemos definir la siguiente probabilidad





!



(8)
La probabilidad definida en (8) se llama probabilidad de Poisson, y es muy frecuente en la
naturaleza, a veces se llama la ley de los raros eventos.
21
Veamos algunos ejemplos de cálculo. Supongamos que una variable aleatoria X, toma
valores en el conjunto {0, 1, 2, ...} con probabilidad de Poisson de parámetro  , es
decir







!
Es relativamente sencillo con una calculadora realizar los cálculos para distintos valores de
k, sin embargo puede ser divertido utilizar el programa que se entrega en la siguiente
ubicación: http://es.geocities.com/riotorto/tabl/tabl_poisson/tabl_poisson.htm. (pulse aquí).
En esa página el parámetro  es m, y el valor k se denota por r. Diviértase!
Más adelante veremos aplicaciones de esta probabilidad, y el significado del parámetro  .
Por lo general la probabilidad de Poisson modela fenómenos que denotan la llegada de
clientes a una fila en una determinada unidad de tiempo (por ejemplo cada una hora, o cada
10 minutos, etcétera), otras veces puede denotar el número de vehículos que una puede
encontrar en un segmento de carretera de longitud determinada (por ejemplo, cada de
longitud un kilómetro). La probabilidad de Poisson también puede modelar el número de
organismos que se pueden encontrar en un área determinada, por ejemplo en un área de un
kilómetro cuadrado en el mar, y se quiere ubicar el número de tiburones que se puede
encontrar en esa área en períodos de una hora. Una hermosa modelación de esta situación
se puede encontrar en el sitio:
http://www.ideamas.cl/cursoProb/javaEstat/poisson_distribution/Poisson.html
Haga clic allí y diviértase comprendiendo la probabilidad de Poisson.
4.4 Espacio de Probabilidad Continuo
Hasta ahora hemos definido y trabajado con probabilidades definidas en un conjunto finito
de resultados aleatorios, o en un conjunto infinito numerable de resultados aleatorios. Sin
embargo existen resultados de experimentos aleatorios que pueden asumir cualquier valor
en la recta real o en una parte de la recta real, por ejemplo los reales positivos, o en un
intervalo real de la forma [a, b]. En estos casos, ¿cómo podemos definir una probabilidad
sobre estos conjuntos cuyos elementos son incontables? Recuerde que era fundamental que
los elementos de un conjunto de resultados fuera finito o infinito numerable, pues así
podríamos darle un "peso" probabilístico a cada valor de resultado, con la condición que la
suma de esos "pesos" fuera 1. Pero esta técnica no la podemos realizar en conjuntos
infinitos no numerables. Se hace necesario entonces extender el concepto de probabilidad
para los números reales.
Sea  el conjunto de los números reales, diremos que existe una probabilidad para este
conjunto si existe una función P tal que:
1. Para todo subconjunto A, que "usted pueda imaginar", de números reales se cumple que
 
 
2. Si A y B son dos subconjuntos de números reales que "usted se pueda imaginar", tal que
la intersección entre ellas es vacía, entonces

 


3. Y finalmente, 
22

Observe que del postulado 2 y 3 se desprende que 
.
La anterior definición es válida si restringimos la definición a un intervalo real, es decir si
reemplazamos  por un intervalo de la forma [a. b], o por el intervalo 
  , solamente
modificando las condiciones de que los subconjuntos deben estar en estos espacios y que la
probabilidad sobre estos intervalos debe ser 1. Veamos sobre la marcha un ejemplo muy
utilizado de probabilidad sobre el intervalo [a, b].
Probabilidad uniforma sobre [0, 1]
Definamos para cualquier intervalo (a, b) contenido en [0, 1] la función



De otra forma es una función que mide la longitud de cualquier intervalo contenido en el
intervalo [0,1].
No resulta complicado constatar que esta función satisface los tres postulados anteriores.
En efecto, es claro que para cualquier intervalo (a, b) contenido en [0, 1], se tiene que



y en particular



Si tenemos dos intervalos [a,b] y [c,d] tal que, sin perdida de generalidad b < c, para que
sean disjuntos, entonces
  







Esta probabilidad le da un "peso" positivo a cualquier intervalo, sin embargo no le da
ningún "peso", en rigor le da probabilidad cero, a un punto de ese intervalo. En efecto, sea x
cualquier número comprendido entre 0 y 1, entonces




de manera que, para este tipo de probabilidad, la probabilidad de un punto (de un número)
es cero, luego podemos concluir que los intervalos (a, b], [a, b], [a,b) y (a, b) tienen la
misma probabilidad puesto que un valor o un par de valores ni quita ni pone para esta
probabilidad uniforme.
Esta definición de probabilidad es fundamental para ciertos procesos de simulación. En
efecto. Suponga usted que se tiene una urna en que hay 5 bolitas rojas, 3 blancas y 2 negras.
Se saca una bolita al azar. Y queremos repetir este procedimiento unas mil veces
(reponiendo la bolita para cada vez, se entiende). ¿Cómo podríamos realizar estas mil
simulaciones? Muy sencillo, le decimos al computador que saque un número al azar que
esté entre 0 y 1. Si el número elegido está entre 0 y 0.5, en rigor en el intervalo [0, 0.5]
entonces interpretamos el resultado de "se extrajo una bolita roja"; ahora si el número
seleccionado al azar está en el intervalo (0.5, 0.8] interpretamos el resultado como "se
extrajo una blanca", pero si el número seleccionado al azar está entre (0.8, 1], decimos que
23
se "extrajo" una bola negra (que equivale a decir que el número seleccionado al azar no
cayó en ninguno de los dos primeros intervalos). Observe que la longitud de cada uno de
los intervalos es proporcional a la distribución de los colores de las bolitas.
Muy bien, hemos definido una probabilidad sobre el intervalo [0, 1]. La pregunta ahora es,
¿podemos definir una probabilidad sobre la recta real? La respuesta es afirmativa.
La más "normal" de las probabilidades en la recta real
Sobre cualquier intervalo real (a, b) contenido en  , definimos la siguiente función













   

Pues bien, ¡esta es una probabilidad definida sobre  !, y depende de los parámetros  y
 . La gráfica de la expresión anterior, llamada también campana de Gauss, es de la
forma:
Observemos que si y 
, entonces no se "suaviza" la fórmula como


  



  
 
En particular si 
, se tiene




 


    


 
Nos vamos a detener en esta última fórmula. En rigor la expresión F(x), no es nada más que
el cálculo del "área bajo la curva", que va desde el punto x hasta el valor "menos infinito".
necesariamente vale 1, puesto que es la probabilidad de todo
Por otro lado el valor de 
el espacio de los números reales, es decir
24




de modo que el área bajo la curva comprendida desde "menos infinito" a "más infinito"
debe ser 1. Observe por otro lado, en que sin resolver la integral, nos podemos dar cuenta
que F(-a) = F(a). De modo que la curva, o función F(x), es simétrica respecto del eje 0
(observe la campana de Gauss). Todo lo anterior se resume en el gráfico siguiente:
Visite este sitio: http://personal5.iddeo.es/ztt/Tem/t21_distribucion_normal.htm (Nota,
desde aquí "plagiamos" las gráficas de esta sección)
25
Descargar