通过最近的巨杉学习,这两天又接触了一下Hadoop,感觉有似曾相识的感觉。
我的理解是:HBASE就像巨杉集群内的一个存储集群,可以实现上层文件的共享。HDFS像是巨杉本身分布式,类似sdbadmin用sdb进去的那个shell层面进行的操作,MapReduce有点像SQL实例和Coord节点编目节点间进行的操作。想问一下这样是否正确?
另外,看了这篇文章 巨杉Tech | Hbase迁移至SequoiaDB 实战,想问一下SequoiaDB是可以支持把Hbase里面的数据通过巨杉的MySQL实例导入到巨杉里面存着,有没有其他对接的功能?大胆假设一下SequoiaDB是否可以替换Hadoop里面的HBase?
最后,我了解到有些地方将大数据和greenplum一起用了,具体细节不太清楚怎么用的。想问巨杉和GP的对比有吗?