¿Qué es la Estadística?
La disponibilidad de datos es una gran ayuda en el mundo actual. Sin embargo, el mayor desafío es analizarlo para nuestras necesidades. Es esencial comprender y describir los datos para evaluar los extensos recursos de los datos.
Podemos explicar los datos utilizando diferentes métodos. La estadística, la rama de las matemáticas, nos ayuda a recopilar, organizar, visualizar e interpretar datos. Además, las estadísticas se dividen en dos tipos: descriptivas e inferenciales. Las estadísticas inferenciales y descriptivas dependen del mismo conjunto de datos. Las estadísticas descriptivas solo dependen de este conjunto de datos, aunque las estadísticas inferenciales a menudo se basan en estos datos para generalizar la población.
Profundicemos en este artículo de hoy para conocer las estadísticas descriptivas.
¿Qué es la estadística descriptiva?
Como su nombre lo indica, las estadísticas descriptivas describen datos. Es una herramienta para recopilar, organizar, resumir, mostrar y analizar muestras de una población. La estadística descriptiva no depende de la teoría de la probabilidad, a diferencia de la estadística inferencial. Abre el camino para una mejor comprensión y visualización de los datos.
Las estadísticas descriptivas son valiosas porque sería un desafío imaginar lo que muestran los datos si solo presentamos nuestros datos sin procesar, principalmente si hay muchos. Por tanto, la estadística descriptiva nos permite aportar los datos de forma más significativa y facilitar su interpretación.
¿Por qué no convertirse en un científico de datos para comprender las estadísticas descriptivas?
Si prefiere estadísticas descriptivas o inferenciales, puede encontrar varias oportunidades en el área de análisis de datos y ciencia de datos. La capacitación en certificación de programación de Data Science con R incluye descubrimiento de datos, visualización de datos, análisis predictivo y análisis descriptivo con el lenguaje R. Puede conocer los paquetes de R, cómo se pueden importar y exportar datos en R, estructuras de datos en R y diferentes principios estadísticos, análisis de conglomerados y proyecciones. El curso R es adecuado para aspirantes a científicos de datos, como expertos en TI o desarrolladores de software. También es ideal para personas que buscan convertir una carrera en análisis de datos, aspirantes que trabajan en análisis de datos y análisis de negocios, graduados en ciencia de datos y profesionales con experiencia dispuestos a utilizar la ciencia de datos en sus campos.
Propósito de la estadística descriptiva
Las características esenciales de los datos de un estudio se definen mediante estadística descriptiva. Se resumen la muestra y las medidas. Forman la base de prácticamente cualquier análisis cuantitativo de los datos en combinación con un análisis gráfico simple. Además, un conjunto de datos se puede resumir y describir utilizando estadísticas descriptivas mediante una variedad de explicaciones tabuladas y gráficas y discusión de los resultados observados. Los datos cuantitativos complejos se resumen en estadísticas descriptivas. Para dos propósitos, la estadística descriptiva puede ser útil para 1) proporcionar datos esenciales sobre las variables en un conjunto de datos y 2) resaltar las posibles relaciones entre las variables.
Diferentes tipos de estadísticas descriptivas
- Distribución de frecuencias
La distribución de frecuencia se utiliza para datos cuantitativos y cualitativos, mostrando la frecuencia o recuento de los diferentes resultados en un conjunto de datos o muestra. La distribución de frecuencias generalmente se muestra en una tabla o mapa. En la tabla, cada entrada o gráfico está asociado con el número o la frecuencia de valores que ocurren en un intervalo, rango o categoría particular.
La distribución de frecuencia es esencialmente un resumen de datos agrupados clasificados por clases mutuamente excluyentes y el número de ocurrencias en cada categoría. Permite una forma más ágil y sistemática de presentar datos sin procesar.
Los cuadros y gráficos de visualización y distribución de frecuencia que se utilizan comúnmente incluyen diagramas de barras, histogramas, cuadros y diagramas de líneas.
- Tendencia central
La tendencia central se refiere a una descripción general descriptiva de un conjunto de datos que usa un valor único que refleja el centro de distribución de datos. La media, la mediana y la moda son medidas simples de tendencia central, conocidas como medidas de ubicación central.
El indicador más famoso de la tendencia central es el promedio o el valor más común en un conjunto de datos. La mediana se refiere a la puntuación media para un orden ascendente de resultados.
- Variabilidad
Una medida de variabilidad es una estadística descriptiva que muestra el grado de dispersión en una muestra. Las mediciones de variabilidad deciden qué tan lejos del centro parecen caer los puntos de datos.
La dispersión, la extensión y la variabilidad se aplican e indican el rango y el ancho de la distribución de los valores en un conjunto de datos. El rango, las desviaciones estándar y las variaciones muestran los diversos componentes y aspectos del margen.
El rango muestra el nivel de dispersión o la distancia óptima del máximo a los valores más bajos en un conjunto de datos. La desviación estándar se aplica para calcular la varianza promedio en un conjunto de datos y obtener información sobre la distancia o discrepancia entre un valor en un conjunto de datos y su valor medio. La varianza muestra el alcance del diferencial y es un promedio general de las desviaciones cuadradas.
Ejemplos de estadística descriptiva
- Si desea un ejemplo claro de estadísticas descriptivas, mire solo el promedio de calificaciones del estudiante (GPA). Un GPA recopila puntos de datos de una amplia gama de calificaciones, clases y exámenes, luego los promedia y finalmente proporciona una visión general del rendimiento académico promedio del estudiante. Tenga en cuenta que el GPA no pronostica ni produce conclusiones para resultados futuros. En cambio, ofrece una explicación inequívoca del rendimiento académico de los estudiantes basada en valores de datos.
- Tome un número simple para resumir qué tan bien lo hace un bateador en el béisbol, el promedio de bateo. Esta cifra es solo el número de hits dividido por el número de veces al bate (expresado como tres dígitos significativos).
Limitaciones de la estadística descriptiva
Las estadísticas descriptivas son tan pequeñas que solo se resumen las personas o los elementos que ha calculado. Los datos que ha obtenido no se pueden usar para generalizar a otros u objetos (es decir, para usar datos de una muestra para determinar las propiedades / parámetros). Al probar un fármaco para vencer al cáncer en sus pacientes, por ejemplo, no puede decir que funcionaría solo en base a estadísticas descriptivas en otros pacientes con cáncer (mientras que las estadísticas inferenciales le brindarán esta oportunidad).
Resumen de líneas
- La palabra “estadística descriptiva” se refiere al análisis, síntesis y presentación de resultados relacionados con una muestra o un conjunto de datos de población total.
- Las estadísticas descriptivas ayudan al análisis de datos. Permite una presentación de datos significativa e inteligible, lo que permite una comprensión simplificada del conjunto de datos.