viernes, 4 de marzo de 2011

Resumen: Histogramas y Distribuciones de Frecuencia

Una tabla de frecuencia es útil para organizar data en clases de acuerdo al numero de ocurrencias en cada clase, o frecuencia. La frecuencia relativa muestra el porcentaje de la data en cada clase. Una representación gráfica de un tabla de frecuencia que utiliza “bins” para mostrar la cantidad en cada clase es llamado un histograma. A pesar de que se asemeja mucho, una gráfica de barra es utilizada solamente para variables categóricas. Un polígono de frecuencia se crea marcando los puntos medios de cada “bin” y sus frecuencias y conectando estos puntos con segmentos de recta. Los polígonos de frecuencia son útiles para ver la forma general de la distribución de una data y para comparar múltiples conjuntos de data. Para cualquier distribución de data debes siempre poder describir la forma, centro y esparcimiento. La data que forma montones puede ser clasificada como simétrica o sesgada (skewed). Las distribuciones que son sesgadas a la izquierda tiene la mayoría de la data concentrada en la derecha y la data esparcida o menos concentrada en el lado izquierdo. Este extremo donde hay menos concentración se conoce como cola (tail). Una distribución que es sesgada a la derecha tiene gran parte de la data concentrada al lado izquierdo y la cola al lado derecho. Un diagrama de ojiva, o diagrama de frecuencia relativa acumulada muestra como la data se acumula a través de los diferentes valores de la variable.

No hay comentarios:

Publicar un comentario