viernes, 14 de marzo de 2008

Diagrama de Tallo y Hoja

No puedo comenzar hablando del gráfico de Tallo y Hoja sin referirme a su creador John Wilder Tukey.

Este Ingenioso Químico y Matemático dio su aporte a la estadística con varias de las gráficas más usadas en el análisis de datos exploratorio.

Sus principales contribuciones fueron:


  • La introducción de las modernas técnicas para estimar el espectro de las series temporales. En 1965, en un artículo conjunto con J. W. Cooley, publicado en la revista Mathematics of Computation, introdujo el algoritmo de la transformada rápida de Fourier (FFT), fundamental para crear el procesamiento digital de datos.

  • Fundó el Análisis Exploratorio de Datos o EDA (Exploratory Data Analysis), una nueva aproximación a la estadística que usa fuertemente un conjunto de técnicas basadas en el uso de gráficos. Su libro Exploratory Data Analysis (1977) es el clásico sobre este tema. EDA es una filosofía básicamente gráfica de exploración de datos estadísticos. Destacan los gráficos "Box-and-Whisker Plot" (Diagrama de caja y bigotes) , el "Stem-and-Leaf Diagram" (Diagrama de tallo y hojas), los “Radigramas” (rootograms) y los Diagramas de ajuste.
Entonces Continuando...

El Diagrama de Tallo y Hoja, a pesar de no ser un gráfico definitivo para la presentación de datos, es fácil y rápido para realizar a mano, con el se puede dar una mirada no pulida de los datos.

Que podemos concluir al ver este gráfico???

  1. El valor característico de la distribución (Promedio, moda, etc)
  2. La forma general de la distribución (simetría, asimetría a la derecha, asimetría a la izquierda)

  3. Grado de dispersión respecto del valor característico
  4. Outlier (Observaciones individuales que se escapan del patrón general de los datos)

  5. Huecos(hoyos) en los datos

  6. Cantidad de peaks

Como construirlo??

En un gráfico de tallo y hoja cada valor de datos es partido en "un tallo" "y una hoja". "La hoja" es por lo general el último dígito del número y los otros dígitos a la izquierda "de la hoja" forman "el tallo". Por ejemplo, el número 136 sería partido como:
TALLO: 13
HOJA: 6

  1. Puede ordenar los datos de menor a mayor, esto ayudara a la organización de los datos (Opcional)
  2. Separe cada número en un tallo y una hoja.

  3. Agrupe los números con los mismos tallos. Ponga los tallos en una lista en orden creciente.
Veamos un Ejemplo con los siguientes 15 datos:

35, 36, 38, 40, 42, 42, 44, 45, 45, 47, 48, 49, 50, 50, 50


Algunos software como R, SPSS o MINITAB pueden separar el Tallo en una parte inferior(hojas desde el cero al 4) y otra superior (hojas desde el 5 al 9)


Este gráfico también puede ser usado para comparar dos grupos de datos, trazando hojas al lado izquierdo y derecho del tallo.

Además facilita el calculo de cuantiles(percentiles, cuartiles, quintiles, etc etc).

Su comando en R es:

>X<-c(35, 36, 38, 40, 42, 42, 44, 45, 45, 47, 48, 49, 50, 50, 50)
>stem(X)

The decimal point is 1 digit(s) to the right of the |

3 | 568
4 | 0224
4 | 55789
5 | 000

> stem(X,scale=0.5)

The decimal point is 1 digit(s) to the right of the |

3 | 568
4 | 022455789
5 | 000

24 comentarios:

mIsHu =) dijo...

Exelente explicacion!!! muchas gracias...encontraba informacion sobre esto pero no la entendia.... en este trabajo se la presenta sencilla y clara.
Gracias otra vez...

Anónimo dijo...

Me parece interesante su información, no veo que difundan mucho esto de las técnicas de EDA, muy entendible.

Felicitaciones.

Rigo - Peru

Anónimo dijo...

Gracias...

Ni mi profesor lo habria podido explicar mejor..


Esta muy claro!

Anónimo dijo...

Excelente ayuda, me ha servido mucho para un pequeño trabajo que me dieron en la U. Una consulta ¿existe alguna función o comando para facilitar el trabajo en excel cuando son muchos digitos?
Saludos. gracias por la información.

Clary dijo...

No se quien seas pero me ayudasates un monton con tu explicacion pq no entendia a mi profesor de universidad!!!! Gracias!!!!

Anónimo dijo...

carnal muxas gracias por la informacion
neta que estas bien perro
mi maestro esta bien wey

Roberto Parra dijo...

Me había olvidado por completo que alguna vez quise escribir sobre esto, lo retomare nuevamente.

Gracias por los comentarios son de gran inspiración.

Sldos

Roberto

Anónimo dijo...

mijito rico !

Anónimo dijo...

muchas gracias por lo que escribiste, me fue muy util preparando una clase.

Anónimo dijo...

hay mejores explicaciones la tuya es buena pero muy enredada pero... me sirvio mucho gracias!

Anónimo dijo...

Muy buena explicación, mejor que en la mayoría de las páginas en las que busque antes :D Muchas gracias!!

Miriam dijo...
Este comentario ha sido eliminado por el autor.
Ele dijo...

Hola! la explicación es muy buena pero tengo una duda. Cuando se trata de números de más de dos dígitos cual es el tallo y cuales son las ramas? Por ejemplo, con números como 125 o 1650.
Muchas Gracias!

Anónimo dijo...

Gracias mil, esta información me ayudó mucho a hacer una tarea, eres un sol.

Breakthoven dijo...

wow gracias por a info me ha sido de gran utilidad

lalalalal se agradece

Anónimo dijo...

como se puede hacer un diagrama de tallos y hojas con estos datos: 6,7,7,8,8,8,8,9,9,9,9,9,9,9,10,10,10,10,10,11. n=20
ayuda a resolverlo.

Anónimo dijo...

Felicitaciones , trabajo muy bien hecho

Francheska Maldonado dijo...

Hola a todos...
Gracias por su informacion,,, pero lo k mas me gusto d esta clase fue el tallo k hicieron con sus hojas...

Anónimo dijo...

esta muy bien explixado, deberian ponerse a dar clases en las uni!!!!

Jean Carlo Ariiaz dijo...

buenas tardes!! es que mi tarea dice segmentando el mercado.. cual es el mercado objetivo de este diagrama

tallo hoja
1 5 8 4
2 6 0 2 6 7 9 2
3 7 2 4 2 1 0 7
4 0 4 1 6 5 4 2
5 5 0 8
6 2 8 3

me pueden ayudar?

Criss dijo...

Hol, super bien tu explicación, ahora si cache como hacer, solo tengo una duda en el trabajo que me mandan dice que haga el diagrama incluyendo dos veces los valores en los tallos, cómo hago eso? Por fa ayudame...mil gracias!! Cómo me comunico contigo?

fernanda:) dijo...

Me encanto tu explicacion, Gracias:3

Anónimo dijo...

hola como se haria con numeros asi1.52 1.59 1.60 etc

kate m dijo...

como se hace con una numero de 5 cifras??