Tabla de Distribución de Frecuencias

Una tabla de distribución de frecuencias es un cuadro que organiza grandes volúmenes de datos de manera estructurada, facilitando su análisis y el cálculo de estadísticos. Sus principales componentes son:

  • Clases: Valores o intervalos en los que se agrupa la variable.
  • Frecuencia absoluta: Número de veces que aparece cada clase.  

Además, la tabla de frecuencias puede incluir porcentajes acumulados o representaciones gráficas para mejorar la interpretación de los datos.

A) Elementos de una tabla de frecuencias

1) Valores observados (X)

Las observaciones, o valores observados, corresponden a las diferentes manifestaciones que puede tomar la variable.

2) Tamaño de la muestra (n)

El tamaño de la muestra se refiere al número de elementos o unidades de análisis que la integran.

3) Rango (R)

El rango es una medida de dispersión que ofrece una visión inicial sobre la distribución y variabilidad de los datos.

\[R=X_{max} - X_{min}\]

4) Número de clases (K)

Las clases agrupan las observaciones de cada elemento, facilitando el análisis de los datos. Se recomienda utilizar entre 6 y 15 clases, pudiendo determinar su cantidad mediante la regla de Sturges.

\[ k = 1 + 3.322 \cdot \log n \]

Nota: En Microsoft Excel, la función LOG() se corresponde con un logaritmo decimal, es decir, un logaritmo de base 10.

El número de intervalos (K) se redondea al entero más cercano. Si el decimal es 5 o mayor, se ajusta al siguiente entero; de lo contrario, se mantiene. A continuación, se muestran algunos ejemplos:

\[ K = 7.2 \approx 7\]
\[K = 7.158 \approx 7\]
\[K = 7.5 \approx 8\]
\[K = 7.953 \approx 8\]

5) Amplitud (A)

La amplitud (A) es la diferencia entre el límite inferior y el límite superior de una clase. 
Se calcula mediante la siguiente fórmula:

\[A = \frac{R}{K}\]

Se recomienda redondear la amplitud al mismo número de decimales que los datos. Sin embargo, 
este redondeo sigue ciertas consideraciones especiales, las cuales se detallan a continuación:

Caso 1: Datos enteros

Si los datos son enteros, "A" se redondea al siguiente número entero. 
Ejemplo:

Si A = 4.2, se redondea a 5.
Si A = 4.8, se redondea a 5.

Caso 2: Datos con un decimal

Si los datos tienen un decimal, "A" se redondea a la décima más cercana.
Ejemplo:

Si A = 5.43, se redondea a 5.5.
Si A = 5.48, se redondea a 5.5.

Caso 3: Datos con dos decimales

Si los datos tienen dos decimales, "A" se redondea a la centésima más cercana.
Ejemplo:

Si A = 5.432, se redondea a 5.44.
Si A = 5.438, se redondea a 5.44.

6) Clases (Xi)

Las clases son conjuntos que organizan los valores de la variable analizada. Cada una puede identificarse mediante una letra, un número o una característica distintiva.

7) Intervalos de clase

El intervalo de clase es el rango de valores dentro de una clase, delimitado por un límite inferior (Li) 
y un límite superior (Ls). Su amplitud es constante y se emplea en variables cuantitativas continuas 
o cuando los valores son demasiado numerosos para listarlos individualmente.

En el primer intervalo de clase, el límite inferior corresponde al menor valor de la variable. A partir del segundo intervalo, este límite será igual al límite superior de la clase anterior. En cuanto al límite superior, siempre se obtiene sumando la amplitud al límite inferior. Veamos las fórmulas:

\[L_i = X_{\text{min}}\]
\[L_s = X_{\text{min}} + A\]

Para asegurar la correcta construcción de los intervalos de clase, el límite superior del último intervalo 
debe ser igual a la suma del valor mínimo de la muestra y el producto de "K" por la amplitud.

\[\text{Ultimo } L_s = X_{\text{min}} + K \cdot A\]

Tipos de intervalos

Tipo Notación Datos comprendidos
Intervalo cerrado [ a ; b ] a ≤ x ≤ b
Intervalo abierto ( a ; b ) a < x < b
Intervalo semiabierto por la derecha [ a ; b ) a ≤ x < b
Intervalo semiabierto por la izquierda ( a ; b ] a < x ≤ b

Nota: a y b representan dos números consecutivos cualquiera.

8) Marcas de clase (xi)

La marca de clase es el punto medio de cada intervalo y se utiliza como su valor representativo. Es un elemento clave en el cálculo de estadígrafos como la media y la desviación estándar, además de ser fundamental en la construcción de gráficos como el polígono de frecuencias. Su fórmula es:

\[ x_i = \frac{L_i + L_s}{2} \]

Donde:
xi ... Es la marca de clase del intervalo de clase "i"
Li … Es el límite inferior del intervalo de clase
Ls … Es el límite superior del intervalo de clase

9) Frecuencias absolutas (fi)

La frecuencia absoluta representa la cantidad de veces que un valor específico de la variable 
aparece en el conjunto de datos.

10) Frecuencias absolutas acumuladas (Fi)

La frecuencia absoluta acumulada indica el número total de observaciones hasta un determinado 
valor en la distribución de datos, resultando de la suma progresiva de las frecuencias absolutas.

11) Frecuencias relativas (hi)

La frecuencia relativa representa la proporción de veces que aparece un valor respecto al total 
de observaciones y se expresa en forma de fracción.

\[ h_i = \frac{f_i}{n} \]

Donde:
hi … Frecuencia relativa (tanto por uno)
fi … Frecuencia absoluta
n … Tamaño de la muestra

12) Frecuencias relativas acumuladas (Hi)

La frecuencia relativa acumulada representa la proporción acumulada de observaciones hasta un 
determinado valor en la distribución de datos. En otras palabras, es la suma progresiva de las frecuencias relativas y, al igual que estas, se expresa en forma de fracción.

13) Frecuencias porcentuales (pi o hi%)

Estas frecuencias corresponden a la versión porcentual de las frecuencias relativas.

\[ p_i = h_i \cdot 100 \]

Donde:
pi … Frecuencia porcentual (tanto por ciento)
hi … Frecuencia relativa

Comentarios

Entradas más populares de este blog

La Estadística

Muestreo