大数据项目仓库、涉及 Hadoop、Spark、Kafka、Hbase..... 等,更新中...
| 项目名 | 说明 | 
|---|---|
| ImoocLogAnalysis | 使用 Spark SQL imooc 访问日志,数据清洗,统计,可视化 | 
| 项目名 | 所属组件 | 介绍 | 
|---|---|---|
| ch2noaa | MapReduce | MapReduce 实验 - 计算气温 最大/最小/平均 值 | 
| hdfscrud | HDFS | HDFS Java API 增删查改 | 
| hdfslogcollect | HDFS | Timer 定时将日志文件备份到 HDFS 中去,copyFromLocalFile | 
| commonfans | MapReduce | MapReduce 计算共同好友 | 
| hadoopjoin | MapReduce | MapReduce 两表进行左连接 left join,两表进行 map join | 
| customizePartition | MapReduce | MapReduce 自定义分区 ,Partitioner 决定每条记录应该送往哪个reducer节点 | 
| sparkSqlSample | Spark SQL | Spark SQL 样例,关于HiveContext、SQLContext、SparkSession、RDD、DataFrame、Dataset的使用 | 
| curator-example | Zookeeper | 基于Apache Curator实现对Zookeeper的操作,以及数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等Zookeeper的应用场景 | 
| HbaseExamples | HBase | Hbase Java API的基本操作,包括增删查改、过滤器、协处理器,Phoenix、Phoenix+Mybatis等 | 
| kafka-example | Kafka | 深入理解Kafka各种操作,生产者、消费者、主题、分区、应用、可靠性、spark |