R o Stata I: Obtener la media

Media
Color: Stata
Color: R

Esta es conocida como el promedio en muchos libros no estadísticos. Su representación matemática es:



Cada x es una observación y un dato numérico. Esto es la suma de todos los datos entre la cantidad de observaciones.

Supongamos que tenemos las siguientes observaciones, de forma arbitraria llamaremos a la variable ingresos, cada ingreso pertenece a una persona distinta:


No. de observación
Ingresos
1
2000
2
6500
3
7555
4
8522
5
367

Tenemos 5 observaciones (una muestra de cinco personas), esto sería . La suma de todos los ingresos da como resultado 24,944 córdobas o dólares, no importa el caso. 24,944/5 según la fórmula nos da la media que es 4,988.8 córdobas que es el ingreso promedio de la muestra:

Stata:
Utilicemos la computación para este sencillo cálculo:
1. Introducir la variable a Stata. En esta existe el camino largo de introducir esa tabla como variable.

Primero generamos una variable vacía (se usa punto).
gen ingresos = .
set obs 1
replace ingresos = 2000 in 1
set obs 2
replace ingresos = 6500 in 2
set obs 3
replace ingresos = 7555 in 3
set obs 4
replace ingresos = 8522 in 4
set obs 5
replace ingresos = 367 in 5
En stata también se puede utilizar el comando edit, que abre un cuadro al estilo de excel para introducir datos.



2. Aplicar el comando sum que es la abreviación de summarize, podemos abreviar la mayoría de comandos en stata, algo que puede resultar confuso para muchos.

sum ingresos

El resultado es una tabla de resumen estadístico como esta:


Observamos en la tercera columna la media.
Otra manera es con:
tabstat ingresos, stat(mean)
Dando solo el valor necesitado.

En R.

En R existen múltiples maneras de introducir los datos, la más conocidas es.

1. Introducir los datos como vectores
ingresos <- c(2000, 6500, 7555, 8522, 367)
Aplicar Enter.

2. En R, una función similar para un resumen estadístico es summary.
summary(ingresos)

Presenta una tabla de resumen estadísticos como esta:
No se puede obviar que por defecto aparecen números enteros. La cuarta columna en la media que necesitamos.

Podemos sugerirle a R aplicar hasta 10 dígitos.
summary(ingresos, digits=10)

Hasta el momento hemos sacado una tabla resumen. ¿Cómo obtener solo la media?

En podemos utilizar la siguiente función:
mean(ingresos)

En Stata podemos utilizar el siguiente comando pero aún nos da más de lo que queremos:
mean ingresos

Otra manera es utilizando las lineas:
tabstat ingresos, stat(mean)



Resuelva en Stata o R. Obtenga la media de una muestra de observaciones de ciertos análisis de aguas, cuyos valores son 8, 3, 5, 12, 10. La respuesta a obtener es 7.6. (Estadísticas para Ingeniería y Ciencias, Quevedo Urías H.)

Puedes compartinos tu respuesta elaborado en estos u otros softwares. Si tienes una mejor manera de hacerlo o compartir programación al respecto, escríbenos: morales.economia@gmail.com

Deybi Morales León

Comentarios

Envíanos un mensaje

Nombre

Correo electrónico *

Mensaje *