Apache HBase esta
ligada directamente con Hadoop, dado que funciona sobre el sistema de
archivos HDFS. Dada esta relación HBase utiliza todas las ventajas y
características de Hadoop. Es tolerante a fallos, utiliza
map-reduce, distribuido, escala de forma horizontal, etc, etc.
Pero que ventajas tiene utilizar Apache HBase comparado con utilizar HDFS solo:
Hadoop/HDFS
|
HBase
|
Provee un file system distribuido. | Provee un almacén de datos basado en columnas |
Está optimizado para el almacenamiento de archivos de gran tamaño sin lectura/escritura aleatoria de estos archivos | Esto está optimizado para datos tabulares con facilidad de lectura/escritura aleatoria |
Utiliza archivos planos. | Usa pares de datos clave-valor |
El modelo de datos no es flexible. | Esto utiliza almacenamiento tabular con soporte incorporado de Hadoop MapReduce |
Está principalmente optimizado para escritura de una sola lectura | Está optimizado para leer/escribir muchas veces |