Muchos preguntarán, ¿Cómo obtengo en R esa tabla de frecuencias que
tanto se enseña en los libros de estadística básica?. En este post traigo la
manera de construirla en R.
El ejemplo partirá de
las siguientes observaciones:
Introducir en R:
ventas <- c(2540, 2560, 2612, 2630,
2720, 2760, 2785, 2804, 2831, 2935)
La tabla de
frecuencias se puede obtener de la generación de un histograma gracias a la
función “hist” que pertenece al R base por lo que no hay necesidad de descargar
paquete.
his
<- hist(ventas, breaks = 5, col = "lightblue", border =
"black")
Se puede observar que
introducimos primero la variable ventas, después se define el número de
intervalos de clases con “breaks”. El resto de elementos es para darle color o
bordes al gráfico, se puede revisar la ayuda de hist para conocer más al
respecto.
Al ejercutar his
obtendremos el histograma:
his
La gráfica se generó
gracias a una tabla de frecuencia. El objeto his que creamos, contiene los
datos necesarios para construir la nuestra.
Revisemos con la
función “unclass”:
hiss
<- unclass(his)
hiss
$breaks
2500
2600
2700
2800
2900
3000
$counts
2
2
3
2
1
$density
0.002
0.002
0.003
0.002
0.001
$mids
2550
2650
2750
2850
2950
$xname
’ventas’
$equidist
TRUE
Genero las clases:
Clases <- c('<=2600',
'(2600, 2700]',
'(2700, 2800]',
'(2800, 2900]',
'(2900, 3000]')
Obtenemos las
frecuencias de unos de los elementos de hiss.
Frecuencia <- as.numeric(hiss$counts)
Frecuencia
2
2
3
2
1
Extraemos las
frecuencias relativas y en este caso las multiplicamos por 100.
Frecuencia_relativa <-
(hiss$density)*100
Frecuencia_relativa
0.2
0.2
0.3
0.2
0.1
Obtenemos las
frecuencias acumuladas.
Frecuencia_acumulada <-
cumsum(Frecuencia)
Frecuencia_acumulada
Generamos las
frecuencias acumuladas con la función.
Frecuencia_relativa_acumulada <-
cumsum(Frecuencia_relativa)
Frecuencia_relativa_acumulada
0.2
0.4
0.7
0.9
1
Unimos las variables
generadas en una tabla
Tabla <- data.frame(Clases,
Frecuencia, Frecuencia_relativa, Frecuencia_acumulada, Frecuencia_relativa_acumulada)
Tabla
El resultado será:
Clases Frecuencia Frecuencia_relativa Frecuencia_acumulada
1
<=2600 2 0.2 2
2 (2600, 2700] 2 0.2 4
3 (2700, 2800] 3 0.3 7
4 (2800, 2900] 2 0.2 9
5 (2900, 3000] 1 0.1 10
Frecuencia_relativa_acumulada
1 0.2
2 0.4
3 0.7
4 0.9
5 1.0
Con cusum podemos
sumar las frecuencias y las frecuencias relativas.
colSums(Tabla[,2:3])
La salida será:
Frecuencia Frecuencia_relativa
10 1
Si conoces algún
paquete para obtener la tabla de frecuencias comentarlo abajo.
Deybi Morales León
Comentarios
Publicar un comentario