Saltar la navegación

Uso de herramientas estadísticas

Para realizar una inspección por muestreo es necesario calcular ciertos parámetros estadísticos como la media o promedio y la desviación estándar de una muestra, los cuales se conocen como parámetros de dispersión.


Media, mediana y moda

Son las medidas de tendencia central más usadas en estadística, resumen un conjunto de datos con un solo número.

La media es el promedio de los datos; la mediana es el valor central cuando los datos están ordenados; y la moda es el valor que aparece con mayor frecuencia.

Media (Promedio)

La media o promedio es el punto en una distribución de medidas, alrededor del cual las desviaciones sumadas son iguales a cero. Es el valor promedio de una muestra o población. Muestra la tendencia central en una muestra. Es el valor que resultaría de repartir equitativamente el total observado entre los individuos de la muestra. El promedio o media muestral se calcula de la siguiente manera:

  • Donde: X = promedio o media de la muestra
  • Σfx = sumatoria de los valores individuales (X1+ X2+…+ X6) → para una muestra de 6 unidades
  • n = tamaño de la muestra. Número de observaciones, mediciones o unidades de la muestra. Para el caso anterior, n es igual a 6.

En palabras sencillas, se calcula sumando todos los valores del conjunto y dividiendo el resultado entre el número total de valores.

Ejemplo:

Tenemos los siguientes datos: 4, 6, 8, 10.

Mediana

La mediana es el valor que ocupa la posición central de los datos, cuando están ordenados de menor a mayor. Es el valor que se encuentra exactamente en el centro de un conjunto de datos, una vez que estos han sido ordenados de menor a mayor. Para obtener el valor de la mediana, se puede realizar lo siguiente:

  • Si hay un número impar de datos: la mediana es el valor central.
  • Si hay un número par de datos: la mediana es el promedio de los dos valores centrales.
Ejemplo:
  • Datos: 3, 5, 7 → Mediana = 5
  • Datos: 2, 4, 6, 8 → Mediana = (4 + 6)/2 = 5
  • Para 1, 3, 5, 7, 9, la mediana es 5.
  • Para 1, 3, 5, 7, la mediana es (3+5)/2 = 4
Moda

La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Es el valor o los valores que más se repiten en un conjunto de datos.

Puede no existir (si todos aparecen iguales), también puede ser única (unimodal), o podrían existir dos o más (bimodal, multimodal). La moda es útil para datos cualitativos (por ejemplo, color más vendido). Tiene la desventaja de que no podría representar bien la tendencia si hay varias modas.

  • Ejemplo:

    Datos: 2, 4, 4, 6, 7 → Moda = 4
  • Datos: 1, 2, 2, 3, 3, 4 → Bimodal = 2 y 3

¿Cuándo se debe usar cada una?

Estas herramientas estadísticas se deben utilizar de acuerdo con los resultados que se quieren obtener. Por eso es importante conocer muy bien cada una de las herramientas que existen.

  • Media: Es útil para datos simétricos, pero es sensible a datos extremos que pueden distorsionar su valor.
  • Mediana: Es una mejor opción cuando hay valores extremos, ya que no se ve tan afectada por ellos y representa mejor el centro del conjunto de datos.
  • Moda: Es útil para identificar el valor más común, especialmente en datos categóricos.

A continuación, se muestra un cuadro comparativo de estas tres herramientas de tendencia central:

Medida Definición Ejemplo (2, 4, 6, 8, 100) Observación
Media Promedio aritmético (2+4+6+8+100)/5 = 24 Afectada por el 100
Mediana Valor central 6 Más representativa si hay valores extremos
Moda Valor más frecuente No existe (todos distintos)

Puede no estar definida

En resumen, el uso de cada una de estas herramientas es el siguiente:
  • La media se usa para ver el promedio general.
  • La mediana es más estable frente a valores atípicos.
  • La moda es ideal para identificar el valor más común o popular.

Desviación estándar

La desviación estándar muestral se calcula como la raíz cuadrada de la varianza. La varianza mide la distancia existente entre los valores individuales y el promedio.

Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y el promedio. La sumatoria obtenida se divide entre el tamaño de la muestra menos uno (n-1).

En otras palabras, la desviación estándar de la muestra nos dice la variabilidad que hay dentro de una muestra, es decir, qué tanto varían los valores individuales respecto al promedio.

  • Donde: S = desviación estándar de la muestra
  • Σ f (X - X)² = sumatoria de las diferencias al cuadrado entre cada valor y el promedio.
Ejemplo de Cálculo:

Por ejemplo, si tengo una muestra con tamaño 5 (n = 5), mi promedio es 37,8 y los valores, mediciones o repeticiones para dicha muestra son 38, 37, 39, 37, 38. Entonces, la desviación estándar es la siguiente:

S = √ ((38-37,8)2 + (37-37,8)2 + (39-37,8)2 + (37-37,8)2 +(38-37,8)2)/5-1

S = 0,83666003

La desviación estándar da información sobre la concentración o variabilidad de los valores de una distribución y mide la dispersión existente en la población, teniendo en cuenta todos los datos de la muestra.

Esta se incluye en ciertas fórmulas empleadas para los planes de muestreo, de ahí la importancia de conocer este parámetro y cómo calcularlo.