Extracción y visualización de open data desde la nube utilizando R Project Deybi Morales León Usuarios R Nicaragua



  • 1. Extracción y visualización de open data desde la nube utilizando R Project Deybi Morales León Usuarios R Nicaragua https://www.facebook.com/groups/usuariosrnicaragua/
  • 2. ¿Qué es R? Es un lenguaje y entorno de programación estadística www.r-project.org www.rstudio.com
  • 3. Paquetes R contiene 5778 paquetes para trabajar todas las áreas de estadísticas y su utilización en la mayoría de las ciencias. --Alta calidad gráfica (3D, estáticos, dinámicos, mapas, etc) --Creación de informes con LaTeX y html. --Extracción de bases de datos desde las nubes. --Interacción con otros programas (Excel, matlab, python, eviews, etc)
  • 4. Filosofía y práctica que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control. Disponibilidad por el internet Datos económicos -Crecimientos del PIB -Deuda externa -Balanza comercial -etc. Datos financieros -Tasas de interés -Precios de las acciones -Índices bursátiles, -etc. Datos ambientales -Emisiones de CO2 -etc. Datos Sociales -Tasa de natalidad -Tasa de mortalidad -Índices bursátiles, -etc. Utilización de API para Facebook y Twitter
  • 5. Paquetes disponibles para extracción de la nube
  • 6. zipcode U.S. ZIP Code database for geocoding fImport Rmetrics - Economic and Financial Data Import rWBclimate A package for accessing World Bank climate data WDI World Development Indicators (World Bank) ggmap A package for spatial visualization with Google Maps and OpenStreetMap googlePublicData An R library to build Google's Public Data Explorer DSPL Metadata files weatherData Get Weather Data from the Web emdatr Global Disaster Losses from the EMDAT database Using R ergmharris Local Health Department network data set fImport Rmetrics - Economic and Financial Data Import geomapdata Data for topographic and Geologic Mapping gpk 100 Data Sets for Statistics Education GCD Global Charcoal Database govStatJPN functions to get public survey data in Japan fueleconomy EPA fuel economy data vegdata Functions to access vegetation databases (Turboveg) and prepare vegetation data especially its taxonomy for analysis
  • 7. fExtremes Rmetrics - Extreme Financial Market Data fImport Rmetrics - Economic and Financial Data Import fueleconomy EPA fuel economy data GCD Global Charcoal Database geomapdata Data for topographic and Geologic Mapping govStatJPN functions to get public survey data in Japan gpk 100 Data Sets for Statistics Education zipcode U.S. ZIP Code database for geocoding ustyc Fetch US Treasury yield curve data UScancer Create US cancer datasets from SEER, IARC, and US Census data
  • 8. Paquetes gráficos
  • 9. ggplot2 An implementation of the Grammar of Graphics lattice Lattice Graphics
  • 10. Ejemplos
  • 11. Abonados a internet por cada 100 personas Primero instalar el paquete WDI, este es para el Banco Mundial install.packages(“WDI”) library(WDI) Identificar el indicador buscado, con una palabra como en google indicadores<-WDIsearch(“internet”) View(indicadores)
  • 12. usuarios.internet<-WDI(country="all", indicator=indicadores[10,1], start=2012, end=2012) Activar ggplot2 library(ggplot2) qplot(data=usuarios.internet[100:258,], x=iso2c, y=IT.NET.USER.P2, main="2012 Usuarios de internet", xlab="", ylab="Usuarios por cada 100") + geom_text(aes(label=country), size=4, angle=45, hjust=1, vjust=1, color="black") + geom_point(aes(size=IT.NET.USER.P2), colour="blue", alpha=0.9)
  • 13. ¿Dónde mis hijos tendrán mayores probabilidades de vida? library(WDI) indicadores<-WDIsearch("life") View(indicadores) library(maps) library(RColorBrewer) library("ggplot2") library("plyr") library("scales") library("rgeos") library("ggmap") library("mapproj") library("maptools")
  • 14. data(wrld_simpl) world_ggmap <- fortify(wrld_simpl, region = "ISO2") head(world_ggmap) indicadores<-WDIsearch(“life”) View(indicadores) Años.vida<-WDI(country="all", indicator=indicadores[4,1], start=2012, end=2012) ggplot(Años.vida, aes(map_id = iso2c)) + geom_map(aes(fill=SP.DYN.LE00.IN), map = world_ggmap, color="black") + expand_limits(x = world_ggmap$long, y = world_ggmap$lat) + xlab(NULL) + ylab(NULL) + ylim(c(-60, 80)) + scale_fill_gradient(low="white", high="blue",name="Años" ) + ggtitle("Esperanza de vida al nacer (Datos: 2012)")
  • 15. Precios de acciones: El pajarito azul en problemas install.packages("quantmod") library("quantmod") getSymbols("TWTR",src="yahoo") barChart(TWTR) View(TWTR) Es necesario identificar el ticket de la acción, en este caso de ejemplo TWTR pertenece a Twitter.
  • 16. Gracias

Comentarios

Envíanos un mensaje

Nombre

Correo electrónico *

Mensaje *