viernes, 4 de marzo de 2011

Resumen: Gráficas Comunes y Diagramas de Data

Las gráficas de barra son utilizadas para representar data categórica en una forma que se parece, pero no es lo mismo que un histograma. Una gráfica circular es útil para mostrar variables categóricas, especialmente cuando es importante mostrar como los porcentajes de un conjunto completo de data encajan en categorías individuales. Un dot plot es una manera conveniente de representar data numérica univariada colocando puntos individuales a lo largo de una recta numérica para representar cada valor. Este tipo de diagrama es especialmente útil en darnos una impresión rápida de la forma, centro y esparcimiento de la data, pero son tediosas de hacer a mano cuando se trabaja con conjuntos grandes de data. Los stem and leaf plots muestran información similar con el beneficio añadido de mostrar los valores de los datos. La data bivariada puede ser representada utilizando un scatterplot para mostrar si existe alguna asociación entre las dos variables. Usualmente una de las variables, explanatory variable (independiente), puede ser identificada como aquella que tiene algún impacto en la otra variable, response variable (dependiente). La variable explanatory debe ser colocada en el eje horizontal y la variable response en el eje vertical. Cada punto es dibujado individualmente. Si existe asociación entre las dos variables, esta puede ser identificada como fuerte si los puntos se acomodan en una forma bien distintiva con poca variación de la forma en los puntos individuales, o débil se los puntos aparentan estar colocados mas aleatoriamente. Si los valores de la variable response generalmente aumenta a medida que los valores de la variable explanatory también aumenta, entonces la data tiene una asociación positiva. Si la variable response generalmente disminuye a medida que la variable explanatory aumenta, la data tiene una asociación positiva. En una gráfica de línea, hay significado al cambio entre puntos consecutivos así que estos puntos se conectan. Las gráficas de línea son usualmente utilizadas cuando la variable explanatory es tiempo.

No hay comentarios:

Publicar un comentario