ESTADISTICA BÁSICA
Video: TABLAS DE FRECUENCIAS – Datos agrupados y
No agrupados |
Video: MEDIDAS DE TENDENCIA CENTRAL: Media,
Mediana y Moda |
Video: MEDIDAS DE POSICIÓN: Cuartiles, Deciles y
Centiles |
Video: CALCULAR CUARTILES |
Video: MEDIDAS DE DISPERSIÓN: Desviación media,
varianza, desviación estándar y coeficiente de variabilidad |
|
1.1 DEFINICIÓN
Los orígenes de la estadística están asociados al conteo de personas, riquezas y productos de una colectividad.
El DANE informa
que Colombia ocupa el puesto 28 del ranking de 196 estados con un número de
habitantes significativos. La población en los últimos cinco años es:
48.203.000 en 2015, 48.748.000 en 2016, 49.292.000 en 2017, 49.834.000 en 2018
y 50.374.000 en 2019. (ESTADÍSTICA DESCRIPTIVA).
Una encuesta mostró que sólo el 46% de los estudiantes de undécimo grado podían resolver problemas que incluyeran fraccionarios, decimales y porcentajes. Además, sólo el 77% de los estudiantes de undécimo grado pudo sumar correctamente el costo de hamburguesas, papas fritas y gaseosas, que figuraban en el menú de un restaurante. (ESTADÍSTICA INFERENCIAL).
APLICACIONES
La muestra puede ser aleatoria, tomada al azar y sin la intervención de las personas encargadas de la investigación. Si una muestra es representativa de una población se pueden sacar conclusiones importantes acerca de esta población. Sin embargo, es importante notar que la muestra debe ser aleatoria, porque de otra manera, la inferencia acerca de la población será inválida.
Ejemplo: Se quiere una muestra
sistemática del 4%, localizas el primer ítem entre un entero entre 1 y 25
(100/4 = 25). Suponiendo que se escoge aleatoriamente el 20, es decir que el primer
valor estará ubicado en la posición 20 en el marco muestral. El segundo valor
estará en la posición 45 (20+25=45); el tercer valor en la posición 65 (45+20=65),
etc., hasta que la muestre esté completa.
Ejemplo: De 250 ovejas, se deben examinar 61 de estas. Se toma un número entre uno y el cuatro. Entonces, tomamos la oveja número 3, y a continuación cada cuarto animal: 7, 11, 15, 19, 23, así sucesivamente hasta llegar a la 247.
ALEATORIO ESTRATIFICADO: Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático, una de las técnicas de selección más usadas en la práctica.
PARÁMETRO: Es una medición numérica que describe algunas características de una población.
Tipos de Estadísticos
Centralización
Indican valores con respecto a lo que los datos parecen agruparse.
Media, Mediana y Moda
Posición
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles, …
Dispersión
Indican la mayor o menor concentración de los datos con respecto a
las medidas de centralización.
Desviación típica, coeficiente de variación, rango, varianza.
Forma
Dan una idea de cómo se distribuyen los datos.
Asimetría, apuntamiento o curtosis
|
ESCALA
NOMINAL:
|
Nombres o Categorías
Género (hombre/mujer); Raza; Estado Civil; Religión. |
ESCALA
ORDINAL:
|
Cuando siguen un orden
Clasificación de una prueba (primero, segundo, tercero); Estatus socioeconómico; Calificación del cliente (MS, S, I, MI) |
ESCALA
o NIVEL DE MEDICIÓN DE INTERVALO:
|
No tienen un punto de partida inherente, pero la
diferencia entre dos valores de datos tiene un significado. (Los años 1000, 1492,
1776, 2000); (98,2°F y 98,6°F).
|
ESCALA
o NIVEL DE MEDICIÓN DE RAZÓN:
|
Si tiene un punto de partida o cero inherente. (El precio
de un texto escolar, $100.000; un libro de $100.000 es cinco veces más
costoso que un texto de $20.000).
|
- Cuál es la
población c.
Cuál es la muestra
- Identifique
el parámetro de interés d.
Identifique la estadística
- Cuál es la
población c.
Cuál es la muestra
- Cuál es la
variable d. Qué tipo de variable
Es la diferencia entre dos límites inferiores consecutivos:
DENSIDAD DE FRECUENCIA:
1,17
|
1,61
|
1,16
|
1,38
|
3,53
|
1,23
|
3,76
|
1,94
|
0,96
|
0,15
|
2,41
|
0,71
|
0,02
|
1,59
|
0,19
|
0,82
|
0,47
|
2,16
|
0,92
|
0,75
|
2,59
|
3,07
|
1,4
|
4,75
|
2,01
|
55.8
|
60.9
|
37.0
|
91.3
|
65.8
|
42.3
|
33.8
|
60.6
|
76.0
|
69.0
|
45.9
|
39.1
|
35.5
|
56.0
|
44.6
|
71.7
|
61.2
|
61.5
|
47.2
|
74.5
|
83.2
|
40.0
|
31.7
|
36.7
|
62.3
|
47.3
|
94.6
|
56.3
|
30.0
|
68.2
|
75.3
|
71.4
|
65.2
|
52.6
|
58.2
|
48.0
|
61.8
|
78.8
|
39.8
|
65.0
|
60.7
|
77.1
|
59.0
|
50.5
|
69.3
|
70.8
|
64.9
|
37.1
|
87.1
|
66.3
|
62.8
|
60.5
|
39.9
|
80.1
|
62.6
|
60.2
|
50.3
|
38.9
|
70.0
|
65.6
|
xi
|
ni
|
fi
|
%
|
Ni
|
Fi
|
%
|
|
30 – 39
|
34,5
|
8
|
0,1333
|
13,33
|
8
|
0,1333
|
13,33
|
40 – 49
|
44,5
|
10
|
0,1666
|
16,66
|
18
|
0,3
|
30
|
50 – 59
|
54,5
|
8
|
0,1333
|
13,33
|
26
|
0,4333
|
43,33
|
60 – 69
|
64,5
|
20
|
0,3333
|
33,33
|
46
|
0,7666
|
76,66
|
70 – 79
|
74,5
|
9
|
0,15
|
15
|
55
|
0,9166
|
91,66
|
80 – 89
|
84,5
|
3
|
0,05
|
5
|
58
|
0,9666
|
96,66
|
90 – 99
|
94,5
|
2
|
0,0333
|
3,33
|
60
|
1
|
100
|
60
|
0,9999
|
99,999
|
xi
|
ni
|
fi
|
%
|
Ni
|
Fi
|
%
|
|
30,0 – 39,2
|
34,6
|
9
|
0,15
|
15
|
9
|
0,15
|
15
|
39,3 – 48,5
|
43,9
|
9
|
0,15
|
15
|
18
|
0,3
|
30
|
48,6 – 57,8
|
53,2
|
6
|
0,1
|
10
|
24
|
0,4
|
40
|
57,9 – 67,1
|
62,5
|
19
|
0,316
|
31,6
|
43
|
0,716
|
71,6
|
67,2 – 76,4
|
71,8
|
10
|
0,166
|
16,6
|
53
|
0,882
|
88,2
|
76,5 – 85,7
|
81,1
|
4
|
0,066
|
6,6
|
57
|
0,95
|
95
|
85,8 - 95
|
90,4
|
3
|
0,05
|
5
|
60
|
1
|
100
|
60
|
0,9999
|
99,999
|
DISEÑO ADECUADO DE LA TABLA DE FRECUENCIAS:
....................................................................................................................................
[L2 – L1)
|
ni
|
Ni
|
fi
|
%
|
10
|
||||
18
|
||||
35
|
||||
13
|
||||
200)
|
||||
4
|
70
|
xi
|
ni
|
Ni
|
fi
|
1
|
4
|
0,08
|
|
2
|
4
|
||
3
|
16
|
0,16
|
|
4
|
7
|
0,14
|
|
5
|
5
|
28
|
|
6
|
38
|
||
7
|
7
|
45
|
|
Intervalos
|
Marca
de Clase
|
Frecuencia
Absoluta
|
Frecuencia
Acumulada
|
Frecuencia
Relativa
|
Frecuencia
Relativa Acumulada
|
[80 –
90)
|
85
|
0,150
|
|||
[90 –
100)
|
8
|
||||
[100
– 110)
|
105
|
23
|
0,225
|
0,575
|
|
[110
– 120)
|
0,825
|
||||
[120
– 130)
|
125
|
7
|
|||
Total
|
40
|
1.0
|
1.7 GRÁFICOS ESTADÍSTICOS
1.7.1 Diagramas de Barras
2.1.2.1 Media Aritmética Ponderada
Se usa en
aplicaciones de la física y en la determinación de las características de
dispersión.
Resistencia
(Kg/cm2)
|
ni
|
|
[100 a 200)
|
6
|
|
[200 a 300)
|
8
|
|
[300 a 400)
|
21
|
|
[400 a 500)
|
33
|
4
|
6
|
5
|
6
|
4
|
5
|
5
|
6
|
5
|
6
|
5
|
5
|
8
|
8
|
8
|
9
|
6
|
7
|
7
|
6
|
7
|
9
|
3
|
2
|
7
|
5
|
7
|
7
|
3
|
4
|
6
|
7
|
7
|
7
|
8
|
6
|
6
|
7
|
6
|
3
|
4
|
6
|
8
|
5
|
6
|
7
|
5
|
5
|
4
|
6
|
2.2 MEDIANA
- Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.
- Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).
2.3.1 Mediana para datos agrupados
.............................................................................................................
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
3.1 CUARTILES
Nota: Como los cuartiles representan un posición: 25%, 50% y 75%, cuando el número de esta posición del cuartil da un resultado decimal, entonces se aproxima a la posición entera.
3.1.1 Cuartiles para datos agrupados
Li límite inferior de la clase donde se encuentra el cuartil
INTERPOLACIÓN LINEAL
Es para calcular un valor intermedio de una recta cualquiera, definida
por dos puntos conocidos. Denominada como una “regla de cinco”, donde se definen
cinco valores: dos de cada punto conocido, además de la abscisa u ordenada del
punto deseado.
3). Calcular los cuartiles Q1, Q2 y Q3 para datos agrupados, de acuerdo a las siguientes tablas:
Intervalos
|
xi
|
ni
|
Ni
|
[10, 15)
|
12,5
|
4
|
4
|
[15, 20)
|
17,5
|
3
|
7
|
[20, 25)
|
22,5
|
7
|
14
|
[25, 30)
|
27,5
|
8
|
22
|
[30, 35)
|
32,5
|
4
|
26
|
26
|
Intervalos
|
ni
|
Ni
|
[50, 60)
|
8
|
|
[60, 70)
|
10
|
|
[70, 80)
|
16
|
|
[80, 90)
|
14
|
|
[90, 100)
|
9
|
|
[100, 110)
|
2
|
|
[110, 120)
|
1
|
|
........................................................................................................................................................
3.2 DECILES
Los deciles o decillas dividen la información en diez partes iguales, en cantidades porcentuales de 10 en 10.
D1
|
D2
|
D3
|
D4
|
D5
|
D6
|
D7
|
D8
|
D9
|
D10
|
10%
|
10%
|
10%
|
10%
|
10%
|
10%
|
10%
|
10%
|
10%
|
10%
|

28
|
31
|
28
|
30
|
28
|
27
|
30
|
32
|
35
|
26
|
25
|
29
|
26
|
28
|
25
|
31
|
31
|
32
|
27
|
30
|
31
|
31
|
25
|
28
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
13
|
14
|
15
|
16
|
17
|
18
|
19
|
20
|
21
|
22
|
23
|
24
|
25
|
25
|
25
|
26
|
26
|
27
|
28
|
28
|
28
|
28
|
28
|
29
|
30
|
30
|
30
|
30
|
31
|
31
|
31
|
31
|
31
|
32
|
32
|
35
|
16
|
16,8
|
17
|
30
|
?
|
31
|
3.2.1 Deciles para datos agrupados
Intervalos
|
xi
|
ni
|
Ni
|
[1 –
4)
|
2
|
2
|
2
|
[4 – 7)
|
5
|
5
|
7
|
[7 – 10)
|
8
|
6
|
13
|
[10 –
13)
|
11
|
7
|
20
|
[13 –
16)
|
14
|
9
|
29
|
[16 –
19)
|
17
|
10
|
39
|
[19 –
22)
|
20
|
11
|
50
|
50
|
Cuando se calcula el percentil que corresponde a una puntuación determinada, el resultado puede dar decimal, entonces se toma la cantidad entera más próxima, ya que los percentiles son 99 valores enteros.
Intervalos
|
ni
|
Ni
|
[50, 60)
|
8
|
|
[60, 70)
|
10
|
|
[70, 80)
|
16
|
|
[80, 90)
|
14
|
|
[90, 100)
|
9
|
|
[100, 110)
|
2
|
|
[110, 120)
|
1
|
|
Intervalos
|
xi
|
ni
|
Ni
|
[10, 15)
|
12,5
|
3
|
|
[15, 20)
|
17,5
|
5
|
|
[20, 25)
|
22,5
|
7
|
|
[25, 30)
|
27,5
|
4
|
|
[30, 35)
|
32,5
|
2
|
|
21
|
Intervalos
|
ni
|
[0, 10)
|
21
|
[10, 20)
|
28
|
[20, 30)
|
81
|
[30, 40)
|
87
|
[40, 50)
|
112
|
[50, 60)
|
78
|
[60, 70)
|
54
|
[70, 80)
|
39
|
Total
|
500
|
Calcular la desviación media de los siguientes datos:
2, 4, 6, 8
Calcular la desviación media de la distribución de datos agrupados:
El problema de los signos en la desviación media, es eludido elevando las diferencias al cuadrado. La varianza es uno de los parámetros más importantes, pues teniendo conocimiento de la varianza de una población, se ha avanzado en el conocimiento de la población misma.
La variancia sesgada o varianza poblacional, refleja a la perfección el significado de una medida de dispersión como un promedio de los cuadrados de las desviaciones y tiene una gran aplicación en el estudio de las probabilidades.
xi
|
ni
|
xi · ni
|
xi2 · ni
|
|
[10,
20)
|
15
|
1
|
15
|
225
|
[20,
30)
|
25
|
8
|
200
|
5000
|
[30,40)
|
35
|
10
|
350
|
12 250
|
[40,
50)
|
45
|
9
|
405
|
18 225
|
[50,
60
|
55
|
8
|
440
|
24 200
|
[60,70)
|
65
|
7
|
455
|
29 575
|
[70,
80)
|
75
|
6
|
450
|
33 750
|
49
|
2315
|
123 225
|
4.4 DESVIACIÓN TÍPICA
En una muestra aleatoria normal se
tomaron los siguientes resultados: 41.9, 45.2, 45.8, 45.8, 45.9, 46.0, 46.1,
46.1, 46.4, 47.0. Calcular la desviación típica.
Una distribución tiene x = 140 y s = 28,28 y otra x = 150 y s = 25. ¿Cuál de las dos distribuciones presenta mayor dispersión?.
xi | ni | xi | (xi)2 |
2 | 2 | 4 | 8 |
3 | 5 | 15 | 45 |
4 | 7 | 28 | 112 |
5 | 2 | 10 | 50 |
Total | 16 | 57 | 215 |
EJERCICIOS RESUELTOS DE LAS
25 x 24 x 23 x 22 x 21 = 6.375.600 maneras de formar una representación de ese sindicato que conste de presidente, vicepresidente, secretario, etc.
Nota: Aunque los principios básicos de conteo pueden usarse en la gran mayoría de los casos, usualmente hay fórmulas (basadas en esos principios) que permiten hacer los cálculos de manera más rápida. Otro método práctico es el diagrama de árbol.
EJEMPLO 12: Hay cuatro regalos diferentes para entregarlos a cuatro estudiantes que clasificaron a la final de un evento de poesía. El sorteo puede efectuarse por muestreo aleatorio simple.
¿De cuántas maneras pueden entregarse estos
regalos?
4! = 4 x 3 x 2 x 1 = 24
EJEMPLO 13: Se tienen los números
naturales: 1, 2, 3 y 4. ¿Cuántos números de cuatro cifras se pueden conformar?
4! = 4 x 3 x 2 x 1 = 24
1 letra 2 letra 3 letra 4
dígito 5 dígito 6 dígito 7 dígito
(26) (26) (1) (10) (10) (10) (10)
(26)*(26)*(1)*(10)4 = 6.760.000
(Nota: no se puede repetir, el orden importa)
Ejemplo 16:
¿De cuántas maneras se pueden ubicar nueve personas?
Ejemplo 19: En un restaurante sirvieron una porción de papas con tres salsas diferentes a elegir entre diez posibles. ¿De cuántas formas diferentes se puede hacer la elección de las salsas?
ESPACIO MUESTRAL (U): Es el conjunto de todos los posibles resultados que se pueden obtener al realizar el experimento. Es todo lo que puede ocurrir al realizar un experimento.
EVENTO (E) o Punto Muestral:
Es un subconjunto del espacio muestral.
La probabilidad de que ocurra un evento se mide por un número entre cero y uno, inclusive. Si un evento nunca ocurre, su probabilidad asociada es cero, mientras que si ocurriese siempre su probabilidad sería igual a uno.
La
probabilidad es la relación entre el número de resultados de éxito respecto al
total de resultados posibles, puede ser objetiva o subjetiva.
Enfoque clásico:
En una caja hay 50 manzanas rojas y 200 manzanas
verdes, cuál es la probabilidad que al tomar una fruta ésta sea manzana roja.
Enfoque de frecuencia
relativa:
En una caja que contiene manzanas rojas y verdes, se
han tomado 80 frutas y de éstas 15 han sido manzanas rojas, cuál es la
probabilidad que al tomar una fruta ésta sea manzana roja.
EVENTOS:
MUTUAMENTE EXCLUYENTES o DISJUNTOS: Aquellos que no pueden ocurrir simultáneamente (al mismo tiempo). Ej: que un billete sea de $5.000 y de $10.000.
NO EXCLUYENTES ENTRE SÍ o COMPATIBLES: Cuando la ocurrencia de uno de ellos no impide que suceda también otro. Ej: que una persona sea profesor y tenga 20 años.
INDEPENDIENTES: Éstos no se ven afectados por otros. El resultado de uno no afecta al otro. Ej: el tipo de ropa y la probabilidad que llueva durante el día.
DEPENDIENTES
Cuando
un evento afecta la probabilidad de que suceda otro. Ej: si un proceso no se
realiza con materiales de calidad, es más probable que el resultado resulte
mal.
Ejemplo 2: Lanzamiento de un dado:
b) Si se escoge una flor aleatoriamente, ¿Cuál es la probabilidad de que sea blanca?
Ejemplo 9: Una bolsa contiene 6 globos rojos, 4
blancos y 5 azules. Se saca al azar un globo. Hallar las siguientes probabilidades,
al ser extraído un globo:
Ejemplo 11:
En un cofre se tienen seis monedas de: $1000; tres monedas de $500; y una de
$200. ¿Cuál es
la probabilidad que al extraer una moneda, ésta sea de $1000?.
Ejemplo 12:
En un cofre se tienen seis monedas de: $1000; tres monedas de $500; y una de
$200. ¿Cuál es
la probabilidad que al extraer una moneda, ésta sea de $1000 o de $500?.
Ejemplo 13:
Se lanza un dado,
y se gana si el resultado es par o divisible por 3. ¿Cuál es la probabilidad de
ganar?
U = {1, 2, 3,
4, 5, 6}
A = Resultado par: {2, 4, 6}
B = Divisible por tres: {3, 6}
Ejemplo 14:
Cuál es probabilidad
de que carta extraída sea un AS o COPAS
Ejemplo 15:
Se lanza un par de
dados. Si la suma es 6, hallar la probabilidad que uno de los dados sea 2?.
E = Suma sea 6:
{(1, 5), (2, 4), (3,3), (4,2), (5,1)}
A = {dado = 2}
AWE =
{(2, 4), (4, 2)}
Ejemplo 17:
En un cofre se tienen seis monedas de: $1000; tres monedas de $500; y una de
$200. ¿Cuál es
la probabilidad que al extraer al azar dos monedas, ambas sean de $1000?.
Ejemplo 18: Si se extrae dos cartas de un paquete de 52 cartas, halle la probabilidad de que ambas cartas sean ases, si la primera carta extraída:
Ejemplo 19:
¿Cuál es probabilidad
que un estudiante de la secundaria que juega fútbol compita luego en la liga
nacional y llegue a graduarse como profesional?
P(A) = juega
fútbol, el 5% de los estudiantes de secundaria
P(B) = juega en
la liga profesional, el 1,7%
P(C) = graduado
como profesional, el 40%
P(A) = 0,05
P (B l A) = 0,017
P(C l A y B) =
0,4
P (A y B y C)
= P (A) * P (B l A) =
P(C l A y B)
P (A y B y C) =
(0,05) * (0,017) * (0,4) = 0,00034 = 0,034%
Ejemplo 20:
Si los eventos A y
B son independientes, y P(A) = 0,2 y P(B) = 0,3 hallar lo siguiente: