Hadoop

内部:MapReduce分布式编程处理模型
HDFS分布式文件系统
Zookeeper分布式集群协商服务软件
HBASE类似BigTable,基于列存储非结构化数据
Hive数据仓库
Pig创建mapreduce程序的高级脚本语言
Flumecloudera提供日志手机系统
Sqoop与关系数据库转移工具HueCloudera提供用户管理界面
Chukwa数据收集系统 Avro数据序列化系统
AvatarNode单namenode的备份解决方案
Cassandra分布式NoSQL数据库Hama基于块同步并行(Bulk sync parall)的科学计算、图形处理等复杂计算工具
Mashout机器学习
周边:Ganglia监控Nagios告警Scribe日志收集
http://hadoop.apache.org/
Facebook雅虎

本文介绍了Hadoop及其周边项目的详细情况,包括MapReduce分布式编程处理模型、HDFS分布式文件系统、Zookeeper分布式集群协商服务软件等核心组件,并提及了如HBase、Hive、Pig等用于数据存储和处理的重要工具。
297

被折叠的 条评论
为什么被折叠?



