La construcción de un diagrama de barras es muy sencilla: sobre un eje horizontal se representan los valores o modalidades de la variable estadística y sobre cada uno de dichos valores o modalidades se levanta una columna cuya altura es igual a la correspondiente frecuencia absoluta o, en su caso, relativa. En ocasiones se alterna la posición de los ejes de referencia, situando los valores en el eje vertical y las barras horizontales.

 

Un diagrama de caja, también llamado diagrama de caja y bigotes, está formado por un rectángulo, la caja, y dos segmentos, los bigotes, uno a cada lado del rectángulo. La caja abarca el recorrido intercuartílico, que es el intervalo comprendido entre el primer cuartil q1 y el tercer cuartil q3. Dentro de la caja se representa con un segmento la mediana de la distribución. El bigote izquierdo queda determinado por el valor mínimo y el primer cuartil y el derecho por el tercer cuartil y el valor máximo, excepto si existen valores atípicos.

 

 

Se consideran valores atípicos los menores que q1-1.5·(q3-q1) y los mayores que q3+ 1.5·(q3-q1). Esto quiere decir que la longitud máxima de los bigotes es una vez y media la longitud de la caja (q3-q1). Cuando hay valores atípicos estos se representan fuera del diagrama de caja, mediante asteriscos o puntos.

Los diagramas de caja permiten una fácil lectura e interpretación del tipo de simetría de una distribución:

  • Es simétrica cuando la media, mediana y moda de la distribución coinciden y los datos se distribuyen de igual forma a ambos lados de esas medidas.

  • Es asimétrica positiva o sesgada a la derecha, cuando los datos tienden a concentrarse hacia la parte inferior de la distribución. La media se situaría a la derecha de la mediana.

  • Es asimétrica negativa o sesgada hacia la izquierda cuando los datos tienden a concentrarse hacia la parte superior de la distribución. La media se situaría a la izquierda de la mediana.

 

Para describir el centro y la dispersión de un conjunto de datos tenemos dos opciones:

  • Si la distribución es más o menos simétrica, la media aritmética y la desviación típica.

  • Si la distribución es asimétrica o sesgada, el resumen de los cinco números: valor mínimo, primer cuartil, mediana, tercer cuartil y valor máximo.