第三章 dolphinscheduler基础使用之数据源配置（包括hive，spark，mysql，oracle）

最新推荐文章于 2026-06-29 19:43:08 发布

原创最新推荐文章于 2026-06-29 19:43:08 发布 · 1.1w 阅读

16 ·

本内容遵循CC 4.0 BY-SA版权协议

收录于

dolphinscheduler专题

本文详细介绍了Hive和Spark的数据源配置步骤，包括Hive的多用户配置、服务启动、WEB端口访问及常见问题排查；Spark Thrift Server的启动参数设置和连接方法；同时涉及MySQL和Oracle数据库的服务启动与连接配置。

1、hive数据源配置

（1）hive的多用户配置

hive本身不创建用户，用户就是linux的用户，

（2）打开hive的server服务

第一步：运行hive下bin/hiveserver2脚本

./hiveserver2

在这里插入图片描述

第二步：新建xshell窗口

beeline

# 2、连接hive2
!connect jdbc:hive2://192.168.6.102:10000

# 3、输入用户名和密码
Enter username for jdbc:hive2://192.168.6.102:10000: atguigu
Enter password for jdbc:hive2://192.168.6.102:10000: ******

在这里插入图片描述

第三步：打开hive的WEB端

hadoop102:10002

在这里插入图片描述

（3）海豚调度器创建资源
在这里插入图片描述

（3）常见问题

在这里插入图片描述

问题原因

# 1、检查hiveserver是否启动
netstat -anp |grep 10000

解决方式

启动hiveserver2

2、Spark数据源配置

（1）启动Spark thritfserver

sbin/start-thriftserver.sh --hiveconf hive.server2.thrift.port=10001 --master yarn --driver-cores 1 --driver-memory 1G --executor-cores 1 --executor-memory 1G -num-executors 2