在详细地学习如何写自己的Spark Streaming程序之前,我们先来快速地看一个简单的Spark Streaming程序的例子。我们现在要计算从一个TCP数据服务器接收到的文本数据中单词的个数。我需要向下面这样去做:
首先,导入Spark Streaming的类;再导入一些StreamingContext的隐式转换,来增加来自其它类(比如DStream)的有用方法。StreamingContext是所有streaming功能的主入口点。我们以两个执行线程和1s的执行间隔来创建一个本地的StreamingContext。
import org.apache.spark._
import org.apache.spark.streaming._
import org.apache.spark.streaming.StreamingContext._ // not necessary in Spark 1.3+
// Create a local StreamingContext with two working thread and batch interval of 1 second.
本文提供了一个简单的Spark Streaming程序例子,演示如何计算从TCP数据服务器接收的文本数据中的单词数。首先导入必要的Spark Streaming库,创建StreamingContext,接着设置TCP源,通过flatMap和reduceByKey操作计算单词数。最后,启动并运行Spark Streaming程序。
订阅专栏 解锁全文
2928

被折叠的 条评论
为什么被折叠?



