1.报OOM异常
解决方法1:在执行datax.py后面增加参数--jvm=-Xmx8g
解决方法2:在$DATAX_HOME/bin/datax.py里,修改第三十行 DEFAULT_JVM = "-Xms1g -Xmx8g -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=%s/log" % (DATAX_HOME)
2.在对snappy压缩文件解析时,报 java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy()Z
解决方法:在启动datax时,添加--jvm=-Djava.library.path=$HADOOP_HOME/lib/native
3.在读取SequenceFile文件时,报java.lang.IllegalArgumentException: Unknown codec: com.hadoop.compression.lzo.LzoCodec
解决方法:将$HADOOP_HOME/lib下的lzo包拷贝到$DATAX_HOME/lib下。
本文解决了DataX在运行过程中常见的三个问题:1. OOM内存溢出异常,通过调整JVM参数解决;2. 解析snappy压缩文件时的链接错误,添加正确的Java库路径;3. 读取SequenceFile文件时的编解码错误,引入缺失的lzo库。
2864

被折叠的 条评论
为什么被折叠?



