dsfsfs 发表于 2016-12-13 11:22:56

hive中lzo文件map不分块问题

  1,确保创建索引
  $HADOOP_HOME/bin/hadoopjar$HADOOP_HOME/lib/hadoop-lzo-0.4.10.jar com.hadoop.compression.lzo.DistributedLzoIndexer/user/hive/warehouse/flog
  2,创建hive表时需要在后面指定format格式
  SETFILEFORMAT
  INPUTFORMAT "com.hadoop.mapred.DeprecatedLzoTextInputFormat"
  OUTPUTFORMAT "org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat";
  或者alter table现有表。
  3,alter table后对已经load进表中的数据,需要重新load和创建索引,要不还是不能分块
页: [1]
查看完整版本: hive中lzo文件map不分块问题