Domina el universo de los datos.
Una guía interactiva para explorar, visualizar y entender la estadística de una forma nueva y audaz.
Comenzar a explorar1. Ingresa tus Datos
Pega tus datos aquí, carga un archivo CSV o usa los datos de ejemplo. La magia comenzará al instante.
2. Estadística Descriptiva
Un resumen numérico de tus datos. Elige si tus datos representan una muestra o una población completa para ver los cálculos correctos.
3. Visualización de Datos
Una imagen vale más que mil números. Explora la forma, centro y dispersión de tus datos con estas gráficas interactivas.
Diagrama de Puntos (Dot Plot)
Cada punto representa un dato. Ideal para ver la distribución de conjuntos de datos pequeños.
Histograma
Agrupa los datos en "contenedores" (bins) para mostrar la frecuencia. Ajusta el número de bins para descubrir patrones.
Diagrama de Caja (Box Plot)
El "resumen de cinco números": mínimo, Q1, mediana, Q3 y máximo. Revela la dispersión, simetría y datos atípicos.
Diagrama de Dispersión (Scatter Plot)
Para datos de dos variables (x, y). Muestra la relación entre ellas. La línea representa la regresión lineal.
4. Probabilidad y Simulaciones
Explora el azar y cómo las frecuencias a largo plazo se acercan a la probabilidad teórica.
Lanzar una Moneda
Lanzar un Dado (6 caras)
5. Distribuciones de Probabilidad
Modelos matemáticos que describen la probabilidad de diferentes resultados.
Distribución Normal
La famosa "curva de campana". Modela muchos fenómenos naturales.
Distribución Binomial
Describe el número de éxitos en \(n\) ensayos independientes, cada uno con probabilidad de éxito \(p\).
6. Muestreo y Teorema Central del Límite
El TCL es uno de los resultados más importantes de la estadística. Dice que si tomas muestras suficientemente grandes de una población, las medias de esas muestras estarán distribuidas normalmente, ¡sin importar la forma de la distribución de la población original!
Simulación del Teorema Central del Límite (TCL)
Usa los datos que ingresaste como "población". Tomaremos miles de muestras de un tamaño determinado, calcularemos la media de cada una y dibujaremos un histograma de esas medias.
7. Calculadoras Rápidas
Herramientas para cálculos estadísticos comunes.
Calculadora de Puntuación Z
Calcula cuántas desviaciones estándar un valor \(x\) está de la media \(\mu\).
8. Tabla de Fórmulas Clave
| Medida | Fórmula |
|---|---|
| Media Muestral | \(\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i\) |
| Varianza Muestral | \(s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2\) |
| Desviación Estándar Muestral | \(s = \sqrt{s^2}\) |
| Varianza Poblacional | \(\sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2\) |
| Desviación Estándar Poblacional | \(\sigma = \sqrt{\sigma^2}\) |
| Coeficiente de Correlación (r) | \(r = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum(x_i - \bar{x})^2 \sum(y_i - \bar{y})^2}}\) |
| Probabilidad Binomial | \(P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}\) |
| Puntuación Z | \(z = \frac{x - \mu}{\sigma}\) |
9. Glosario
- Correlación
- Medida estadística que expresa hasta qué punto dos variables están relacionadas linealmente.
- Cuartiles
- Valores que dividen un conjunto de datos ordenado en cuatro partes iguales. Q1, Q2 (Mediana), Q3.
- Datos Atípicos (Outlier)
- Una observación que es numéricamente distante del resto de los datos.
- Desviación Estándar
- Medida de la cantidad de variación o dispersión de un conjunto de valores.
- Estadístico
- Un número que resume un aspecto de los datos de una muestra (ej. la media muestral \(\bar{x}\)).
- Media
- El promedio aritmético de un conjunto de números.
- Mediana
- El valor medio en un conjunto de datos ordenado.
- Moda
- El valor que aparece con más frecuencia en un conjunto de datos.
- Muestra
- Un subconjunto de miembros seleccionados de una población.
- Parámetro
- Un número que resume un aspecto de la población completa (ej. la media poblacional \(\mu\)).
- Población
- El conjunto completo de elementos que poseen la característica de interés.
- Rango Intercuartílico (IQR)
- La diferencia entre el tercer y el primer cuartil (Q3 - Q1). Mide la dispersión del 50% central de los datos.
- Teorema Central del Límite (TCL)
- Teorema fundamental que establece que la distribución de las medias muestrales se aproxima a una distribución normal a medida que el tamaño de la muestra crece.
- Varianza
- El promedio de las diferencias al cuadrado con respecto a la media. Mide la dispersión.
10. Preguntas Frecuentes
¿Cuándo debo usar la mediana en lugar de la media?
Usa la mediana cuando tu conjunto de datos tenga valores extremos (outliers) o esté muy sesgado. La media es muy sensible a estos valores extremos y puede dar una idea engañosa del "centro" de los datos. La mediana, al ser el valor del medio, no se ve afectada por ellos. Por ejemplo, al analizar salarios, donde unas pocas personas ganan muchísimo más que el resto, la mediana suele ser un mejor indicador del salario "típico".
¿Qué significa realmente la desviación estándar?
La desviación estándar te dice, en promedio, qué tan lejos está cada punto de dato de la media. Una desviación estándar pequeña significa que los datos están muy agrupados alrededor de la media (son consistentes). Una desviación estándar grande indica que los datos están muy dispersos. Es como medir la "propagación" de tus datos.
¿Por qué la correlación no implica causalidad?
Este es uno de los principios más importantes en estadística. Que dos variables se muevan juntas (correlación) no significa que una cause la otra. Puede haber una tercera variable oculta (variable de confusión) que cause ambas. Ejemplo clásico: las ventas de helados y los ataques de tiburones están correlacionados. ¿Comer helado causa ataques de tiburón? No. La variable oculta es el calor del verano, que hace que más gente compre helados y más gente se bañe en el mar.
¿Para qué sirve una puntuación Z?
Una puntuación Z estandariza un valor, diciéndote exactamente cuántas desviaciones estándar está por encima o por debajo de la media. Esto es increíblemente útil para comparar valores de diferentes distribuciones. Por ejemplo, si sacaste un 80 en un examen de historia (media 70, desv. est. 5) y un 75 en matemáticas (media 60, desv. est. 10), ¿en cuál te fue mejor relativamente? Tu Z en historia es (80-70)/5 = +2. Tu Z en matemáticas es (75-60)/10 = +1.5. ¡Te fue mejor en historia en comparación con tus compañeros!
¿Por qué se divide entre n-1 para la varianza muestral?
Se divide por \(n-1\) (los "grados de libertad") en lugar de \(n\) para obtener una estimación insesgada de la varianza de la población. Cuando usamos la media de una muestra (\(\bar{x}\)) para calcular la varianza, esta media ya está "optimizada" para esa muestra específica, haciendo que las desviaciones al cuadrado sean un poco más pequeñas de lo que serían si usáramos la verdadera media de la población (\(\mu\)). Dividir por \(n-1\) corrige esta subestimación, dándonos una mejor idea de la varianza real de la población de la que proviene la muestra.