Este Ingenioso Químico y Matemático dio su aporte a la estadística con varias de las gráficas más usadas en el análisis de datos exploratorio.
Sus principales contribuciones fueron:
- La introducción de las modernas técnicas para estimar el espectro de las series temporales. En 1965, en un artículo conjunto con J. W. Cooley, publicado en la revista Mathematics of Computation, introdujo el algoritmo de la transformada rápida de Fourier (FFT), fundamental para crear el procesamiento digital de datos.
- Fundó el Análisis Exploratorio de Datos o EDA (Exploratory Data Analysis), una nueva aproximación a la estadística que usa fuertemente un conjunto de técnicas basadas en el uso de gráficos. Su libro Exploratory Data Analysis (1977) es el clásico sobre este tema. EDA es una filosofía básicamente gráfica de exploración de datos estadísticos. Destacan los gráficos "Box-and-Whisker Plot" (Diagrama de caja y bigotes) , el "Stem-and-Leaf Diagram" (Diagrama de tallo y hojas), los “Radigramas” (rootograms) y los Diagramas de ajuste.
El Diagrama de Tallo y Hoja, a pesar de no ser un gráfico definitivo para la presentación de datos, es fácil y rápido para realizar a mano, con el se puede dar una mirada no pulida de los datos.
Que podemos concluir al ver este gráfico???
- El valor característico de la distribución (Promedio, moda, etc)
- La forma general de la distribución (simetría, asimetría a la derecha, asimetría a la izquierda)
- Grado de dispersión respecto del valor característico
- Outlier (Observaciones individuales que se escapan del patrón general de los datos)
- Huecos(hoyos) en los datos
- Cantidad de peaks
Como construirlo??
En un gráfico de tallo y hoja cada valor de datos es partido en "un tallo" "y una hoja". "La hoja" es por lo general el último dígito del número y los otros dígitos a la izquierda "de la hoja" forman "el tallo". Por ejemplo, el número 136 sería partido como:
TALLO: 13
HOJA: 6
- Puede ordenar los datos de menor a mayor, esto ayudara a la organización de los datos (Opcional)
- Separe cada número en un tallo y una hoja.
- Agrupe los números con los mismos tallos. Ponga los tallos en una lista en orden creciente.
35, 36, 38, 40, 42, 42, 44, 45, 45, 47, 48, 49, 50, 50, 50
Algunos software como R, SPSS o MINITAB pueden separar el Tallo en una parte inferior(hojas desde el cero al 4) y otra superior (hojas desde el 5 al 9)
Este gráfico también puede ser usado para comparar dos grupos de datos, trazando hojas al lado izquierdo y derecho del tallo.
Además facilita el calculo de cuantiles(percentiles, cuartiles, quintiles, etc etc).
Este gráfico también puede ser usado para comparar dos grupos de datos, trazando hojas al lado izquierdo y derecho del tallo.
Además facilita el calculo de cuantiles(percentiles, cuartiles, quintiles, etc etc).
Su comando en R es:
>X<-c(35, 36, 38, 40, 42, 42, 44, 45, 45, 47, 48, 49, 50, 50, 50)
>stem(X)
The decimal point is 1 digit(s) to the right of the |
3 | 568
4 | 0224
4 | 55789
5 | 000
> stem(X,scale=0.5)
The decimal point is 1 digit(s) to the right of the |
3 | 568
4 | 022455789
5 | 000
24 comentarios:
Exelente explicacion!!! muchas gracias...encontraba informacion sobre esto pero no la entendia.... en este trabajo se la presenta sencilla y clara.
Gracias otra vez...
Me parece interesante su información, no veo que difundan mucho esto de las técnicas de EDA, muy entendible.
Felicitaciones.
Rigo - Peru
Gracias...
Ni mi profesor lo habria podido explicar mejor..
Esta muy claro!
Excelente ayuda, me ha servido mucho para un pequeño trabajo que me dieron en la U. Una consulta ¿existe alguna función o comando para facilitar el trabajo en excel cuando son muchos digitos?
Saludos. gracias por la información.
No se quien seas pero me ayudasates un monton con tu explicacion pq no entendia a mi profesor de universidad!!!! Gracias!!!!
carnal muxas gracias por la informacion
neta que estas bien perro
mi maestro esta bien wey
Me había olvidado por completo que alguna vez quise escribir sobre esto, lo retomare nuevamente.
Gracias por los comentarios son de gran inspiración.
Sldos
Roberto
mijito rico !
muchas gracias por lo que escribiste, me fue muy util preparando una clase.
hay mejores explicaciones la tuya es buena pero muy enredada pero... me sirvio mucho gracias!
Muy buena explicación, mejor que en la mayoría de las páginas en las que busque antes :D Muchas gracias!!
Hola! la explicación es muy buena pero tengo una duda. Cuando se trata de números de más de dos dígitos cual es el tallo y cuales son las ramas? Por ejemplo, con números como 125 o 1650.
Muchas Gracias!
Gracias mil, esta información me ayudó mucho a hacer una tarea, eres un sol.
wow gracias por a info me ha sido de gran utilidad
lalalalal se agradece
como se puede hacer un diagrama de tallos y hojas con estos datos: 6,7,7,8,8,8,8,9,9,9,9,9,9,9,10,10,10,10,10,11. n=20
ayuda a resolverlo.
Felicitaciones , trabajo muy bien hecho
Hola a todos...
Gracias por su informacion,,, pero lo k mas me gusto d esta clase fue el tallo k hicieron con sus hojas...
esta muy bien explixado, deberian ponerse a dar clases en las uni!!!!
buenas tardes!! es que mi tarea dice segmentando el mercado.. cual es el mercado objetivo de este diagrama
tallo hoja
1 5 8 4
2 6 0 2 6 7 9 2
3 7 2 4 2 1 0 7
4 0 4 1 6 5 4 2
5 5 0 8
6 2 8 3
me pueden ayudar?
Hol, super bien tu explicación, ahora si cache como hacer, solo tengo una duda en el trabajo que me mandan dice que haga el diagrama incluyendo dos veces los valores en los tallos, cómo hago eso? Por fa ayudame...mil gracias!! Cómo me comunico contigo?
Me encanto tu explicacion, Gracias:3
hola como se haria con numeros asi1.52 1.59 1.60 etc
como se hace con una numero de 5 cifras??
Publicar un comentario