Translate

viernes, 18 de abril de 2014

R, un lenguaje y entorno de programación para análisis estadístico


Como les conté en el post anterior estoy haciendo un curso de R en Coursera. Por eso me atrevo a realizar un post de R.

R es un lenguaje y entorno de programación para análisis estadístico y gráfico. Su historia es larga pero para hacer un resumen, podríamos decir que es un dialecto libre del lenguaje S, desarrollado por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993.

En qué me puede ayudar R?

  • R al estar orientado a las estadísticas, proporciona un amplio abanico de herramientas.
  • Entre otras características de R, podemos nombrar su capacidad gráfica, que permite generar gráficos con alta calidad, con sólo utilizar las funciones de graficación.
  • R también puede usarse como herramienta de cálculo numérico y a la vez ser útil para la minería de datos.

Como dije anteriormente R es un poderoso entorno y lenguaje en el cual podemos tratar datos y gráficar. Pero no quiero detenerme en el entorno sino que quiero revisar el lenguaje.

Al igual que S, se trata de un lenguaje de programación, lo que permite que permite extender sus propias funciones. La gran mayoría de las funciones de R fueron escritas en R pero por cuestiones de rendimiento existen funciones escritas en lenguajes de más bajo nivel como C o Fortran.

R es un lenguaje interpretado, el usuario normalmente accede por líneas de comandos o consola. Veamos unos ejemplos:

Si queremos hacer un Hola mundo podemos hacerlo de la siguiente manera:

> print("Hola Mundo")

[1] "Hola Mundo"

Sumemos 2 números:

> 2 + 3

[1] 5

Pero que hace tan potente a R? Momento, que recién empezamos! Veamos a R haciendo lo que mejor sabe hacer, analizar datos.

Vamos a crear una colección:

x <- c(1,2,3,4,5,6)

Vamos a calcular el cuadrado de cada elemento:

> y <- x^2

> y

[1] 1 4 9 16 25 36

Ahora vamos a calcular la media, la varianza y vamos a gráficar!

> mean(y)

[1] 15.16667

> var(y)

[1] 178.9667

> plot (y)




Como podemos ver R es un lenguaje y entorno muy poderoso, orientado al estudio de datos estadísticos.

Además, R puede integrarse con distintas bases de datos y existen bibliotecas que facilitan su utilización desde lenguajes de programación interpretados como Perl, Python y Ruby. Y por supuesto existen proyectos que permiten utilizar R desde Java o .net.

Y por si fuera poco cuenta con un poderoso entorno de desarrollo llamado R studio que se puede descargar de forma gratuita.

Dejo links: