Ir al contenido principal

Estadistica

Estadística.



La estadística es una herramienta muy poderosa que permite clasificar, describir e inferir información a partir de un conjunto de datos. Es por ello que recopila datos numéricos de todo tipo, ya sean características de personas, cualidades, cosas, etcétera. La estadística es la ciencia cuyo objetivo es reunir información cuantitativa sobre grupos, series de hechos, individuos, etc. Resulta de utilidad no solo para recopilar y describir datos, sino también para proyectar comportamiento con base en la interpretación de la información.

Dos ramas de la estadística 

Inferencial: plantea y da soluciones a problemas específicos, estimando resultado con base en los datos existentes.

Descriptiva: presenta y clasifica los datos obtenidos de la población, es decir, describe la información

Conceptos básicos de la estadística.

Población: Conjunto de todos los elementos que permiten resolver un problema y que presentan una característica común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.). 

Muestra: Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso que no se detiene (como la producción de un bien), se debe analizar un subconjunto o parte de ésta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. En general, el tamaño de la muestra es mucho menor al tamaño de la población. Por ejemplo, a veces se estudian poblaciones enteras: elecciones, censos; otra vez números “pequeños”: los alumnos de una facultad, los habitantes de una ciudad, los miembros de una asociación, etc.; pero otras muchas veces se estudian muestras.

Individuo: Un individuo o unidad estadística es cada uno de los elementos que componen la población. Debes tener en cuenta que un individuo en estadística puede ser distinto a un individuo como persona. Por ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada negocio, que está formado por varias personas, es un individuo de la población.

Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción reducida y representativa de la población.

Dato: El dato es cada uno de los valores que se han obtenido al realizar un estudio estadístico. Por ejemplo: si se lanza una moneda al aire 5 veces obtenemos 5 datos: sol, sol, águila, sol, águila.

Variable: Se llama variable a una característica que se observa en una población o muestra, la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo y se puede clasificar en cuantitativa y cualitativa.


Métodos de muestreo.

Muestreo aleatorio simple: Cada miembro de la población tiene la misma chance de ser seleccionado. Los individuos que constituirán la muestra son elegidos aleatoriamente mediante números aleatorios obtenidos por Tabla o programas en computadora. La población debe ser homogénea respecto a la variable de interés.

Muestreo sistemático: Se utiliza con frecuencia en lugar de un muestreo aleatorio. Cada individuo es seleccionado según la enésima posición de una lista de los miembros de la población, el primero de ellos se escoge al azar. Mientras que la lista no contiene ningún orden oculto, este método es tan bueno como el método de muestreo aleatorio. Su única ventaja con respecto a la técnica de muestreo aleatorio es la simplicidad. 

 Muestreo estratificado simple: Consiste en subdividir a la población en grupos homogéneos en función al estudio que se desea realizar. Es apropiado cuando la población ya está dividida en estratos y los estratos tienen diferente tamaño y es necesario tener ambos en cuenta. Refleja de forma más precisa las características de la población estratificada en comparación con otro tipo de muestras.

 Muestreo conglomerados: La población está subdividida en subpoblaciones llamadas conglomerados. Los conglomerados deben presentar toda la variabilidad de la población. Además, los conglomerados deben ser muy parecidos entre sí. La selección de los conglomerados que integran la muestra es al azar. Todos los elementos del conglomerado representan la población, de modo que conviene incluirlos a todos en la muestra. Una muestra de conglomerados usualmente produce un mayor error muestral y es menos precisa en las estimaciones que una muestra aleatoria simple del mismo tamaño, pero es menos costosa y más rápida de muestrear.

Tipos de variables

A su vez las variables se dividen en distintos tipos, después del siguiente esquema se ofrece una breve descripción de cada tipo de variable. 


Cuantitativa: Variable cuantitativa es aquella que se expresa en valores numéricos. Se subdividen en discreta y continua.

 Discreta: Es una variable expresada con valores enteros. Ejemplo: número de hijos de una familia, número de alumnos de un curso, número de empleados en una empresa. 

 Continua: Es una variable que puede tomar cualquier valor dentro de un intervalo. Ejemplo: peso (de 50 a 57.9 kg), estatura (de 1.70 a 1.76 m), sueldo (de $15,030.40 a $25,299.90).

 Cualitativa: Variable cualitativa es aquella que describe cualidades. No son numéricas y se subdividen en nominal y ordinal.

 Nominal: Son variables presentadas sin orden ni jerarquía. Ejemplo: estado civil, preferencia por una marca, sexo, lugar de residencia.

 Ordinal: Son variables organizadas de acuerdo con una clasificación. Ejemplo: grado de estudios, días de la semana, calidad de la atención, nivel socioeconómico.

Organización de datos.

¿Que son los datos? representa la organización que ofrece acceso a un conocimiento preciso y concreto. Su organización es importante para un análisis adecuado y su representación gráfica.

¿Como se puede organizar? con una tabla de frecuencias, herramienta que posibilita organizar los datos de una muestra estadística, agrupándolos en intervalos y clases para facilitar su análisis. Una modalidad de esta en la que los datos no se agrupan, si no que solo se ordena, en el diagrama de tallo y hojas el cual ofrece información cuantitativa y grafica a la vez.

Elementos de la tabla de frecuencia

Intervalo de clase: es una división arbitraria para distinguir entre un conjunto de valores y los demás. La amplitud de cada intervalo es el mismo en toda la muestra y cada intervalo representa una clase.

Frecuencia relativa: es el porcentaje que representa una clase dentro de una muestra.

Frecuencia acumulada: es el porcentaje de la muestra que representa todas las clases acumuladas hasta cierto intervalo.

REPRESENTACION GRAFICA 

¿Qué es? la representación gráfica de datos es parte fundamental de cualquier análisis estadístico. El tipo de representación utilizada depende de la clase de datos a evaluar.

Datos cualitativos: son datos que generalmente expresan opiniones, motivaciones o información que no puede expresarse con cifras. Estos datos se pueden representar con:

* Graficas de barra.
* Graficas de pastel o circulares 



Datos cualitativos: son datos que expresan cantidades concretas y pueden utilizarse para elaborar estudios " duros ". Estos datos se pueden representar con: 

* Histogramas 
* Polígonos de frecuencia 
* Ojivas 


A continuación, ejemplos:

 1) Un restaurante local en Tuxtla Gutiérrez utiliza un cuestionario para preguntar a sus clientes como califican el servicio, la calidad de los alimentos. los cocteles, los precios y la atmosfera del restaurante. Cada característica se califica en una escala de excepcional (O), muy bueno (V), bueno (G), promedio (A) y malo (P).

G     O    V    G   A   O   V   O   V   G   O    A    V    V    O    P    V    O    G 

A      O    O    O   G   O   V   V     A    G    O   V   P   V    O    O    G   O    O 

V    O    G    A    O    V   O   O    G   V    A    G 

A) use la estadística descriptiva (tabla de frecuencia) para resumir los datos siguientes recabados en una tabla de frecuencias sobre la calidad de la comida.

B) Representa los datos en un gráfico de barras y un gráfico de pastel.

A)


B)


2) Los siguientes datos proporcionan las cantidades semanales que gasta en abarrotes una muestra de hogares.

 271, 363, 159, 76, 227, 337, 295, 319, 250,

279, 205, 279, 266, 199, 177, 162, 232, 303

192, 181, 321, 309, 245, 278, 50, 41, 335,

116, 100, 151, 240, 474, 297, 170, 188, 320,

429, 294, 570, 342, 279, 235, 434, 123, 325

= 45 datos 

A) ¿cuántas clases recomendaría? 3
B) organice los datos en una distribución de frecuencias.
C) representa los datos en un gráfico de polígonos.


B)





C)

MEDIDAS DE TENDECIA CENTRAL

Parte 1 

Las medidas de tendencia central resumen un conjunto de valores en una solo para poyar a su descripción e interpretación.

Media: se obtiene sumando todos los valores y dividiendo el resultado entre el número total de datos.




Mediana: valor que se ubica a la mitad de la distribucion cuando los datos se acomodan.


Moda: valor que más se repite en una serie de números.



Ejemplo:



 








MEDIDAS DE TENDECIA CENTRAL 

Parte 2

Promedio móvil: es un procedimiento de cálculo para organizar y crear pronósticos a lo largo del tiempo.

Media armónica: son números inversos a la media aritmética.

Deciles: los datos se dividen en 10 partes iguales.
 
Cuartiles: los datos se dividen en 4 partes iguales.

Percentiles: los datos se dividen en 100 partes iguales.

Ejemplo:








MEDIDAS DE VARIABILIDAD O DE DISPERSION

Parte 1 

Rango: es la diferencia entre el dato mayor y el menor de un conjunto de datos.



Desviación: es la diferencia que hay entre cada uno de los datos y la media del conjunto de datos.



Desviación estándar: es un índice que muestra cuanto se diferencia una puntuación común y la media de un grupo de puntuaciones.



Varianza: es la media del cuadrado de las desviaciones de la distribución de datos.




MEDIDAS DE VARIABILIDAD O DE DISPERSION 

Parte 2 


Asimetría: sirve para comparar conjuntos de datos respecto de la media en población o muestra.

Coeficiente de variación: ayuda a observar que tanto varia la curva respecto de la distribución de los datos qué se acercan a la media.

Curtosis: es la media de una distribución e indica los datos que tienden a la derecha o izquierda de una curva.


PROBABILIDAD

Posibilidad de ocurrencia de un hecho o acontecimiento y se analiza bajo tres enfoques.

Regla de cálculo P (X):

Clásica P (X): Núm.. eventos exitosos/ Núm.. de posibles resultados.

Frecuencial P (X): Num. eventos favorables/ Num. total de observaciones.

Subjetiva: basada en las distribuciones de probabilidad, conjunto de todos los posibles valores P (X) de un evento. Distribución binominal, distribución poisson, distribución hipergeométrica, distribución geométrica, distribución multinomial.

Ejemplo:

1) ¿Cuál es la P (X) de obtener 3 veces consecutivas águilas al lanzar una moneda al aire?

2) ¿Cuál es la P (X) de seleccionar a un estudiante de LAF y otro de CP para una encuesta conociendo la siguiente información?

1) Diagrama de árbol:


2)


DISTRIBUCION DE PROBABILIDAD BINOMINAL

Su fórmula es:

ejemplo:











REFERENCIAS:

Propio elaborado.

Conceptos_basicos_de_estadistica.pdf (unam.mx)

book5e2.pdf (buap.mx)

Estadística - Wikipedia, la enciclopedia libre

























































































































Comentarios