sábado, 31 de diciembre de 2011

Apache Hadoop con Spring Data

 Spring Data provee soporte para Apache Hadoop; que es Hadoop es un proyecto de software libre el cual tiene como objetivo brindar servicios de computacion distribuida de este proyecto ya hablamos:
http://emanuelpeg.blogspot.com/2009/10/apache-hadoop-es-un-proyecto-java-de.html

Spring Data es otro proyecto libre que nos ayuda a interactuar con diferentes tipos de almacenes de datos. Este proyecto implementa un modulo para interactuar con Apache Hadoop.

Entre sus características podemos nombrar:


  • Una extensión para Spring Batch para soportar la comunicación punto a punto
  • Simplifica la lectura y escritura de recursos HDFS
  • Spring Batch Tasklets Map-Reduce para en un Job con streaming
  • Integración con Hbase, Hive y Pig



Para utilizar este proyecto con maven deben agregar el siguiente repositorio:


 spring-snapshot
 Spring Maven SNAPSHOT Repository
 http://s3.amazonaws.com/maven.springframework.org/snapshot



y la siguiente entrada en el pom:


 org.springframework.data
 spring-data-hadoop
 1.0.0.BUILD-SNAPSHOT
 


Dejo links:

http://www.springsource.org/spring-data/hadoop
http://static.springsource.org/spring-hadoop/docs/current/reference/
http://hadoop.apache.org/