Histogramas

De apariencia similar a un gráfico de columnas, los histogramas ilustran la frecuencia de ocurrencia de algún evento o propiedad medible. Se utilizan para mostrar estadísticas en negocios, economía y otras disciplinas, y proporcionan una herramienta útil para analizar datos y tendencias.

PROCEDIMIENTO BÁSICO.

Los histogramas se emplean con mayor frecuencia para trazar una distribución de valores o resultados de un conjunto de observaciones. En este sentido, están relacionados con la noción de curva de campana —o curva sesgada— para describir una serie de datos. Por ejemplo, un investigador puede utilizar un histograma para resumir los datos recopilados de una encuesta sobre los ingresos familiares de sus clientes. El eje horizontal podría representar los ingresos y el eje vertical podría representar el número de encuestados. Un enfoque típico sería determinar rangos de valores significativos, o escala, para el eje horizontal, que en este caso es el ingreso. Por lo tanto, el investigador puede optar por dividir los ingresos en unidades de $ 10,000, creando una primera categoría de $ 10,000 o menos, una segunda categoría que va desde $ 10,000 a $ 20,000, y así sucesivamente. El uso de una escala de rangos iguales significa que cada columna del histograma tendrá un ancho uniforme. Las alturas de las columnas vendrían entonces determinadas por el número de encuestados pertenecientes a cada categoría de ingresos. Se pueden usar números reales de la encuesta o proporciones o porcentajes del total para representar la frecuencia, y por lo tanto la altura, para cada categoría de ingresos en el histograma. Una vez que se preparan los datos, el diagrama terminado se puede generar fácilmente desde una hoja de cálculo o un programa de gráficos en una computadora personal. Se pueden usar números reales de la encuesta o proporciones o porcentajes del total para representar la frecuencia, y por lo tanto la altura, para cada categoría de ingresos en el histograma. Una vez que se preparan los datos, el diagrama terminado se puede generar fácilmente desde una hoja de cálculo o un programa de gráficos en una computadora personal. Pueden usarse números reales de la encuesta o proporciones o porcentajes del total para representar la frecuencia, y por lo tanto la altura, para cada categoría de ingresos en el histograma. Una vez que se preparan los datos, el diagrama terminado se puede generar fácilmente desde una hoja de cálculo o un programa de gráficos en una computadora personal.

CREANDO UN HISTOGRAMA LÓGICO.

El ejercicio anterior incluye todo lo que se necesita para crear un histograma simple. Hacerlo significativo, por supuesto, requiere más esfuerzo. Ciertos tipos de datos se prestan mejor a los histogramas que otros, y algunos tipos de información no son apropiados para los histogramas en absoluto.

El eje horizontal solo debe representar un concepto con un orden numérico definido y una escala medible. Por ejemplo, una serie de nombres de empresas no pueden servir como valores horizontales; dicho gráfico sería simplemente un gráfico de columnas que compara observaciones discretas. En la mayoría de los casos, las medidas de tiempo, como los años, también serían inapropiadas como variable horizontal porque muestran una secuencia en lugar de una escala. Dado que un histograma se usa principalmente para ilustrar la frecuencia y la dispersión de valores, también tiene poco sentido elegir una escala horizontal con muy pocos rangos (por ejemplo, se puede mostrar poca dispersión en solo tres categorías). Sin embargo, a pesar del ejemplo de ingresos anterior, es aceptable definir categorías horizontales en rangos desiguales a lo largo de la escala,

Por el contrario, el eje vertical normalmente representa indicadores de frecuencia o proporción y, por lo tanto, cifras como ingresos y ganancias no serían apropiadas aquí. Sin embargo, encontrar una escala adecuada es mucho más simple para el eje vertical. Si se utilizan frecuencias reales, la escala puede reflejar su rango de valores. Del mismo modo, las proporciones y los porcentajes contienen escalas implícitas: la suma de todas las frecuencias debe ser igual a 1 o 100, respectivamente, por lo que cada longitud vertical será menor que la suma respectiva. Además, debido a que el eje vertical representa la frecuencia o la proporción, los histogramas nunca muestran valores negativos; cero es la frecuencia o proporción más baja posible.

INTERPRETACIÓN DE HISTOGRAMAS.

Si bien la información que se obtiene de un histograma varía ampliamente según la naturaleza de los datos y la perspectiva del espectador, se pueden hacer algunas generalizaciones. Los puntos de interés obvios en un histograma son sus picos y valles. Estos muestran cuán amplia y uniformemente se dispersa la variable medida en el eje horizontal. En la denominada distribución normal, hay un pico ancho en la categoría media y los lados izquierdo y derecho del histograma son simétricos. Sin embargo, este no tiene por qué ser el caso. Puede haber varios picos y pueden estar sesgados hacia cualquier extremo de la escala.

Considere nuevamente el ejemplo del estudio de ingresos de los clientes. Suponga que hay un pico en los ingresos de los clientes en la categoría de $ 80 000 a $ 90 000 y prácticamente ningún valor por debajo del rango de $ 30 000. Claramente, esto indicaría que los hogares de la base de clientes de la empresa ganan en promedio sustancialmente más que el hogar típico de EE. UU. (Esto supone, por supuesto, que la muestra era representativa y no hay razón para creer que los encuestados informaron erróneamente sus ingresos).

Quizás contrariamente a la intuición, cuando un histograma muestra un grupo grande y estrecho de valores en un rango y muy pocos valores en otros rangos, esto significa que existe una distribución bastante homogénea, al menos en términos de la variable que se mide. De hecho, una distribución perfectamente homogénea tendría una sola columna grande, porque todos los valores caerían en la misma categoría. Por el contrario, si los valores están muy dispersos y no hay un pico claro, se sugiere una distribución muy heterogénea. Una distribución perfectamente heterogénea produciría un histograma plano. Nuevamente, dependiendo de lo que se mida y de quién lo mida, estas propiedades pueden considerarse favorables o desfavorables.

Como ejemplo final, suponga que el investigador que estudia los ingresos de los clientes encuentra una población muy homogénea de clientes, todos en tramos de ingresos altos. Si el investigador busca orientar una campaña de marketing al grupo demográfico más importante de la empresa, esta homogeneidad probablemente se consideraría positiva. Sin embargo, si la empresa está bajo investigación criminal por discriminar ilegalmente a clientes de bajos ingresos, este histograma probablemente provocaría una interpretación negativa.

5/5 - (5 votes)