http://emanuelpeg.blogspot.com/2009/10/apache-hadoop-es-un-proyecto-java-de.html
Spring Data es otro proyecto libre que nos ayuda a interactuar con diferentes tipos de almacenes de datos. Este proyecto implementa un modulo para interactuar con Apache Hadoop.
Entre sus características podemos nombrar:
- Una extensión para Spring Batch para soportar la comunicación punto a punto
- Simplifica la lectura y escritura de recursos HDFS
- Spring Batch Tasklets Map-Reduce para en un Job con streaming
- Integración con Hbase, Hive y Pig
Para utilizar este proyecto con maven deben agregar el siguiente repositorio:
spring-snapshot Spring Maven SNAPSHOT Repository http://s3.amazonaws.com/maven.springframework.org/snapshot
y la siguiente entrada en el pom:
org.springframework.data spring-data-hadoop 1.0.0.BUILD-SNAPSHOT
Dejo links:
http://www.springsource.org/spring-data/hadoop
http://static.springsource.org/spring-hadoop/docs/current/reference/
http://hadoop.apache.org/