DataX使用hdfsreader时问题记录及解决方法

本文解决了DataX在运行过程中常见的三个问题:1. OOM内存溢出异常,通过调整JVM参数解决;2. 解析snappy压缩文件时的链接错误,添加正确的Java库路径;3. 读取SequenceFile文件时的编解码错误,引入缺失的lzo库。

1.报OOM异常

解决方法1:在执行datax.py后面增加参数--jvm=-Xmx8g

解决方法2:在$DATAX_HOME/bin/datax.py里,修改第三十行 DEFAULT_JVM = "-Xms1g -Xmx8g -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=%s/log" % (DATAX_HOME)

 

2.在对snappy压缩文件解析时,报 java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy()Z

解决方法:在启动datax时,添加--jvm=-Djava.library.path=$HADOOP_HOME/lib/native

 

3.在读取SequenceFile文件时,报java.lang.IllegalArgumentException: Unknown codec: com.hadoop.compression.lzo.LzoCodec

解决方法:将$HADOOP_HOME/lib下的lzo包拷贝到$DATAX_HOME/lib下。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值