开发者社区大数据文章正文

基于mac构建大数据伪分布式学习环境（十一）-部署Flink1.14.5

2022-10-20 218

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文主要讲解实时计算引擎Flink的部署，并使用word count实例来验证部署结果

1.解压

2.修改配置

vi flink-conf.yaml

jobmanager.rpc.address: bigdata

classloader.check-leaked-classloader: false

vi masters

bigdata:8081

vi workers

bigdata

3.启动验证

start-cluster.sh

18066 TaskManagerRunner

4.访问web页面

网络异常，图片无法展示

5.Flink on yarn

配置环境变量

环境变量增加

exportHADOOP_CLASSPATH=`${HADOOP_HOME}/bin/hadoop classpath`

测试提交任务到yarn

flink run -m yarn-cluster -yjm1024-ytm1024 ../examples/batch/WordCount.jar

6.wordCount测试成功

网络异常，图片无法展示

文章标签：

云原生大数据计算服务 MaxCompute

实时计算 Flink版

流计算

分布式计算

资源调度

Hadoop

大数据

关键词：

构建实时计算 Flink版

云原生大数据计算服务 MaxCompute环境

构建云原生大数据计算服务 MaxCompute

云原生大数据计算服务 MaxCompute构建

云原生大数据计算服务 MaxCompute学习

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

颜学长

郑小健

分布式计算大数据 Apache

ClickHouse与大数据生态集成：Spark & Flink 实战

【10月更文挑战第26天】在当今这个数据爆炸的时代，能够高效地处理和分析海量数据成为了企业和组织提升竞争力的关键。作为一款高性能的列式数据库系统，ClickHouse 在大数据分析领域展现出了卓越的能力。然而，为了充分利用ClickHouse的优势，将其与现有的大数据处理框架（如Apache Spark和Apache Flink）进行集成变得尤为重要。本文将从我个人的角度出发，探讨如何通过这些技术的结合，实现对大规模数据的实时处理和分析。

郑小健

976 2 3

青云交（Java大数据AI云原生Python）

6月前

本文系统阐述 Java 大数据技术在智能教育学习社区中的深度应用，涵盖数据采集架构、核心分析算法、活跃度提升策略及前沿技术探索，为教育数字化转型提供完整技术解决方案。

青云交（Java大数据AI云原生Python）

303 10 10

武子康

分布式计算监控大数据

大数据-131 - Flink CEP 案例：检测交易活跃用户、超时未交付

武子康

274 0 0

申某某

11月前

SQL 存储大数据

Flink 基础详解：大数据处理的强大引擎

Apache Flink 是一个分布式流批一体化的开源平台，专为大规模数据处理设计。它支持实时流处理和批处理，具有高吞吐量、低延迟特性。Flink 提供统一的编程抽象，简化大数据应用开发，并在流处理方面表现卓越，广泛应用于实时监控、金融交易分析等场景。其架构包括 JobManager、TaskManager 和 Client，支持并行度、水位线、时间语义等基础属性。Flink 还提供了丰富的算子、状态管理和容错机制，如检查点和 Savepoint，确保作业的可靠性和一致性。此外，Flink 支持 SQL 查询和 CDC 功能，实现实时数据捕获与同步，广泛应用于数据仓库和实时数据分析领域。

申某某

8202 32 33

zdl

消息中间件运维大数据

大数据实时计算产品的对比测评：实时计算Flink版 VS 自建Flink集群

本文介绍了实时计算Flink版与自建Flink集群的对比，涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务，显著降低了运维成本，提供了强大的集成能力和弹性扩展，特别适合中小型团队和业务波动大的场景。文中还提出了改进建议，并探讨了与其他产品的联动可能性。总结指出，实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色，是大数据实时计算的优选方案。

zdl

572 56 56

zzy的aly

数据采集数据可视化大数据

大数据体系知识学习（三）：数据清洗_箱线图的概念以及代码实现

这篇文章介绍了如何使用Python中的matplotlib和numpy库来创建箱线图，以检测和处理数据集中的异常值。

zzy的aly

374 1 1

郑小健

分布式计算大数据 OLAP

AnalyticDB与大数据生态集成：Spark & Flink

【10月更文挑战第25天】在大数据时代，实时数据处理和分析变得越来越重要。AnalyticDB（ADB）是阿里云推出的一款完全托管的实时数据仓库服务，支持PB级数据的实时分析。为了充分发挥AnalyticDB的潜力，将其与大数据处理工具如Apache Spark和Apache Flink集成是非常必要的。本文将从我个人的角度出发，分享如何将AnalyticDB与Spark和Flink集成，构建端到端的大数据处理流水线，实现数据的实时分析和处理。

郑小健

370 1 1

小Lee

存储 SQL 分布式计算

大数据学习

【10月更文挑战第15天】

小Lee

330 1 1

zzy的aly

分布式计算大数据 Linux

大数据体系知识学习（二）：WordCount案例实现及错误总结

这篇文章介绍了如何使用PySpark进行WordCount操作，包括环境配置、代码实现、运行结果和遇到的错误。作者在运行过程中遇到了Py4JJavaError和JAVA_HOME未设置的问题，并通过导入findspark初始化和设置环境变量解决了这些问题。文章还讨论了groupByKey和reduceByKey的区别。

zzy的aly

238 1 1

zzy的aly

分布式计算 Hadoop 大数据

大数据体系知识学习（一）：PySpark和Hadoop环境的搭建与测试

这篇文章是关于大数据体系知识学习的，主要介绍了Apache Spark的基本概念、特点、组件，以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码，帮助读者搭建和测试大数据环境。

zzy的aly

496 1 1

基于mac构建大数据伪分布式学习环境（十一）-部署Flink1.14.5

热门文章

最新文章

相关课程

相关电子书