利用脚本定时获取HDFS空间目录的存储状况

本文档介绍了如何通过脚本定时获取HDFS目录的存储状况,包括编写Python脚本解析数据,Shell脚本执行HDFS命令并入库操作,以及设置Linux定时任务实现15分钟一次的调度。

  1. 文档编写目的
    利用脚本定时获取HDFS空间目录的存储状况

  2. 编写脚本前准备
    1 利用管理员账户登录集群cm界面

2 进入cm界面,点击HDFS
3 点击实例,选一台装了datanode角色的主机,这里
我选择了cdh1.hadoop.com

4 进去cdh1.hadoop.com的交互界面

5 查看kerberos凭证

注意:因为集群是启用Kerberos,所以必须使用HDFS凭证,不然刷新脚本无法执行成功
登录凭证
编写python脚本解析数据

  1. 进入脚本编辑目录
    Cd /root/myshell/catalog

  2. 因为我们生成的目标解析文件是用 hadoop fs -du- h /,文本格式如下

  3. 编辑python脚本
    #!/usr/bin/python2

-- coding: utf-8 --

import json
import datetime
#— python2.7 中全局字符编码设置-----
import sys
reload(sys)
sys.setdefaultencoding(‘utf-8’)
#--------------------------------
#集群名称,部署在不同集群的脚本,查完名称在这里写死
cluster=“YY01”
time = datetime.datetime.now().strftime(’%Y-%m-%d %H:%M:%S’)
#实际文件大小
fullsize=""
#备份大小
backupsize=""
#目录名称
catalog=""
sql=""
with open(’/root/myshell/c

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值