http://hi.baidu.com/nullbeta/blog/item/76e2781549d76e1d34fa418f.html
四款有名的开源海量数据采集工具
2011-08-01 23:21
面对海量数据,传统的ETL(Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载)工具显得力不从心,主要是数据转换开销太大,在性能上无法满足海量数据的采集需求。下面向大家介绍四款开源的海量数据采集工具。
Facebook的Scribe
https://github.com/pcting/scribe/
LinkedIn的Kafka
http://sna-projects.com/kafka/downloads.php
淘宝的Timetunnel
http://code.taobao.org/project/view/411/
Hadoop的Chukwa
http://incubator.apache.org/chukwa/
本文介绍了四款用于处理海量数据的开源采集工具:Facebook的Scribe、LinkedIn的Kafka、淘宝的Timetunnel以及Hadoop的Chukwa。这些工具旨在解决传统ETL工具在面对大数据时性能不足的问题。
3120

被折叠的 条评论
为什么被折叠?



