Desde U Can: Estadísticas para tontos
Por Deborah J. Rumsey, David Unger
Los detalles que explican qué hacer con los datos en cada estudio o experimento concebible no pueden ser contenidos en una sola página. Sin embargo, esta Hoja de Trucos resume muchos de los métodos y fórmulas básicas utilizadas en el análisis de datos.
Indice
Ver qué símbolos estadísticos representan
Los símbolos (o notación) que se encuentran en los problemas estadísticos se dividen en tres categorías principales: símbolos matemáticos, símbolos que hacen referencia a una población y símbolos que hacen referencia a una muestra.
- Los símbolos matemáticos son fáciles de descifrar con una simple revisión de álgebra. Incluyen elementos como los signos de la raíz cuadrada, las ecuaciones de una recta y las combinaciones de operaciones matemáticas.
- Los símbolos de población son casi siempre letras griegas minúsculas. Se refieren a los valores de población desconocidos que usted está tratando de estimar.
- Los símbolos de muestra son casi siempre letras minúsculas con acentos. Se refieren a las estadísticas conocidas que se calculan a partir de los datos.
Familiarizarse con las estadísticas comunes
Después de que los datos han sido recolectados, el primer paso para analizarlos es elaborar algunas estadísticas descriptivas para obtener una idea inicial de los datos. Por ejemplo:
- ¿Dónde se encuentra el centro de los datos?
- ¿Qué tan dispersos están los datos?
- ¿Cuán correlacionados están los datos de dos variables?
Las estadísticas descriptivas más comunes se encuentran en la siguiente tabla, junto con sus fórmulas y una breve descripción de lo que cada una de ellas mide.
Cómo calcular el tamaño de la muestra en la estadística
Al diseñar un estudio, el tamaño de la muestra es una consideración importante porque cuanto mayor sea el tamaño de la muestra, más datos tendrá y más precisos serán sus resultados (suponiendo que sean de alta calidad). Si conoce el nivel de precisión que desea (es decir, el margen de error deseado), puede calcular el tamaño de la muestra necesario para alcanzarlo.
Encontrar el tamaño de la muestra necesario para estimar la media de una población,
o una proporción de población (p), utilice la siguiente fórmula:
donde z* es el valor crítico para el nivel de confianza que necesita; MOE representa el margen de error deseado; y
representa la desviación estándar de la población.
Si
σ es desconocido,
- Al buscar la estimación con la desviación estándar de la muestra, s, de un estudio piloto.
- Cuando busque p, estime con p0(1 – p0), donde p0 es una suposición inicial (normalmente 0,50) de p.
Comprobación de fórmulas para intervalos de confianza
En estadística, un intervalo de confianza da un rango de valores plausibles para alguna característica de población desconocida. Contiene una estimación inicial más o menos un margen de error (la cantidad por la cual espera que sus resultados varíen si se tomaron otras muestras). La siguiente tabla muestra las fórmulas para los componentes de los intervalos de confianza más comunes y las claves de cuándo utilizarlos.
Análisis de los valores críticos del intervalo de confianza
Los valores críticos (valores z*) son un componente importante de los intervalos de confianza (la técnica estadística para estimar los parámetros de la población). El valor z*, que aparece en la fórmula del margen de error, mide el número de errores estándar que deben sumarse y restarse para alcanzar el nivel de confianza deseado (el porcentaje de confianza que desea).
La siguiente tabla muestra los niveles de confianza más comunes y sus correspondientes valores z*.
También puede utilizar estos valores z* críticos para pruebas de hipótesis en las que la estadística de la prueba sigue una distribución Z. Si el valor absoluto del estadístico de prueba es mayor que el valor z* correspondiente, rechace la hipótesis nula.
Evaluación de reclamaciones con pruebas de hipótesis
Se utilizan pruebas de hipótesis para cuestionar si alguna afirmación sobre una población es cierta (por ejemplo, una afirmación de que el 90 por ciento de los estadounidenses poseen un teléfono celular).
Para probar una hipótesis estadística, se toma una muestra, se recogen datos, se forma una estadística, se estandariza para formar una estadística de prueba y se decide si la estadística de prueba refuta la afirmación. La siguiente tabla muestra los detalles importantes para las pruebas de hipótesis.
Obsérvese que para las pruebas que implican la diferencia de dos valores de población
es típico que
es 0.
También puede utilizar estos valores críticos de z* para pruebas de hipótesis en las que el estadístico de prueba sigue una distribución Z. Si el valor absoluto del estadístico de prueba es mayor que el valor z* correspondiente, rechace la hipótesis nula.