执行语句生成的数据末尾出现了一个空行
因为导入的数据是lzo格式,其所在文件夹下既有数据也有对应的lzo索引。
hive会自动进行小文件合并,就将索引文件合并到lzo数据中去了,所以出现了空行,同时也导致后续无法对lzo数据进行切片。
关闭hive的小文件合并功能
set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;
执行语句生成的数据末尾出现了一个空行
因为导入的数据是lzo格式,其所在文件夹下既有数据也有对应的lzo索引。
hive会自动进行小文件合并,就将索引文件合并到lzo数据中去了,所以出现了空行,同时也导致后续无法对lzo数据进行切片。
关闭hive的小文件合并功能
set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;
Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:
部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。