hive 替换第三方jar包不生效问题排查

图片看不到的可以看我的CSDN的博客:
hive 替换第三方jar包不生效问题排查

想直接看结论和解决方案的同学可以直接跳到2.4章节

一、问题描述

前几天有用户反馈将hive查询结果以orc导入到hdfs目录时出现异常,sql大概如下:

insert overwrite directory '/tmp/' stored as orc
select * from x_table;

异常显示是在查询结束要写入orc文件时出现NullPointException。

对这个问题感兴趣的同学可以看我的这篇博客:

hive insert overwrite directory 问题排查

简单的做了几次模拟,发现有些数据可以,比如说把""号改成某些字段。很自然的觉的可能是数据的问题,所以最开始的想法是在orc的出错的源码周围打点日志,顺便判断以为空就跳过不处理同时把那条数据打印出来。于是从github上下载了orc的源码,开始改代码,然后编译打包,放到测试机器的hive/lib下。最后再执行出错语句时,发现异常信息还是一样,连出错的行数都没变化,日志也没输出。这就s说明orc-core.jar替换没生效,hive运行时没有加载这个jar*。

所以问题总结就是:

  • 替换了hive/lib下面的jar包,重启hive后新的jar包还是没生效的问题。

二、排查过程

备注:我们的hive是跑在yarn上面的,一般是用spark作为执行引擎

1. 梳理hive程序的执行流程

我们都知道,hive在执行sql的时候,会解析语法树,然后构造执行计划,接着做一些优化,最后会生成spark或者mapred job执行任务。所以我们hive任务是在yarn上的各个container上执行的。由于我们的执行引擎设置的是spark,所以最好先了解一下hive是怎么提交生成的spark job到yarn上面执行的。

看了一圈hive源码后,大概理通了spark的提交流程。

如果我们在配置文件中指定了spark.master=yarn,hive在真正执行任务的时候会通过spark-submit往yarn提交spark job。我们可以在hive.log的日志中看到以下日志:

2019-01-22T11:20:54,268  INFO [Thread-23] spark.client.SparkClientImpl:469 Running client driver with argv: /www/spark/bin/spark-submit --executor-cores 2 --executor-memory 6g --properties-file /tmp/spark-submit.7734574653075860835.properties --class org.apache.hive.spark
.client.RemoteDriver /www/apache-hive-2.3.3-bin/lib/hive-exec-2.3.3-yangjb-0121.1.jar --remote-host dn162 --remote-port 13719 --conf hive.spark.client.connect.timeout=10800000 --conf hive.spark.client.server.connect.timeout=36000000 --conf hive.spark.client.channel.log.le
vel=null --conf hive.spark.client.rpc.max.size=52428800 --conf hive.spark.client.rpc.threads=8 --conf hive.spark.client.secret.bits=256 --conf hive.spark.client.rpc.server.address=null

了解spark的同学应该很容易看的出来,这就是标准的spark往yarn提交任务的命令。

插个题外话,稍微介绍一下hive运行spark job的流程:

往yarn提交了一个任务执行RemoteDriver这个类的main方法,这个类会在集群中以客户端的方式去连接hive这边启动的服务端rpc。之后hive进程和集群中的RemoteDriver就通过netty rpc的方式来沟通,包括发送执行的spark work等。

2. 推测问题产生的原因

知道hive是如何执行的后,就可以开始查找为什么orc.jar包不生效了。既然是在yarn的container上面执行spark job,我们就要看下orc的jar包是在yarn直接指定的classpath里面,还是提交spark job时直接指定classpath中

我首先先搜了一圈yarn对应的所有classpath,甚至连java的lib都看了,发现并没有orc包

接着看spark提交job时执行的配置文件/tmp/spark-submit.7734574653075860835.properties。发现有一行配置,应该就是spark job执行时指定的classpath了。

spark.yarn.jars hdfs://lrtscluster/data/spark2_2_2/*

但是去这个hdfs目录下找了一圈,发现也没有对应的orc包。这时候就很蒙圈了,既然都没有orc包,那hive任务运行时是如何加载orc的类的呢。(这里可以百分比确认出错的类是orc包下面的类)

后面又看了几圈yarn和hive、spark的配置,都没有发现有哪个地方可能有这个orc包,所以只能动用工具来排查这个类到底出自哪个jar包的了。

3. 通过arthas找出罪魁祸首

arthas是一款jvm相关问题排查工具,arthas的使用不在这里介绍,不了解的同学可以看我的这篇博客:

JVM进程诊断利器——arthas介绍

主要流程就是观察到spark在某个container上执行时,立马将arthas安装到目标机器上,然后attach到该container进程中排查。

最后通过命令排查到所有已加载的orc类

sc -d *.orc.impl.* 

发现加载这些类的jar包竟然是一个叫/tmp/xxx/__app.jar__的类。yarn要运行job时,会收集相关的信息到一个临时目录,里面包括跑job要依赖的jar包等。这个\_\_app.jar\_\_包就在这个临时目录下。最后在进入这个目录看,发现这个包竟然是hive-exec-xxx.jar的一个软连接。

突然之间恍然大悟,跑去看了下hive的ql模块的pom文件,发现以下这些代码:

 <plugin>                                                                              
   <groupId>org.apache.maven.plugins</groupId>                                         
   <artifactId>maven-shade-plugin</artifactId>                                         
   <executions>                                                                        
     <execution>                                                                       
       <id>build-exec-bundle</id>                                                      
       <phase>package</phase>                                                          
       <goals>                                                                         
         <goal>shade</goal>                                                            
       </goals>                                                                        
       <configuration>                                                                 
           <!--also see maven-jar-plugin execution.id=core-jar-->                      
         <artifactSet>                                                                 
           <includes>                                                                  
             <!-- order is meant to be the same as the ant build -->                   
             <include>org.apache.hive:hive-common</include>                            
             <include>org.apache.hive:hive-exec</include>                              
             <include>org.apache.hive:hive-serde</include>                             
             <include>org.apache.hive:hive-llap-common</include>                       
             <include>org.apache.hive:hive-llap-client</include>                       
             <include>org.apache.hive:hive-metastore</include>                         
             <include>org.apache.hive:hive-service-rpc</include>                       
             <include>com.esotericsoftware:kryo-shaded</include>                       
      <include>com.esotericsoftware:minlog</include>                                    
      <include>org.objenesis:objenesis</include>                                        
             <include>org.apache.parquet:parquet-hadoop-bundle</include>               
             <include>org.apache.thrift:libthrift</include>                            
             <include>org.apache.thrift:libfb303</include>                             
             <include>javax.jdo:jdo-api</include>                                      
             <include>commons-lang:commons-lang</include>                              
             <include>org.apache.commons:commons-lang3</include>                       
             <include>org.jodd:jodd-core</include>                                     
             <include>com.tdunning:json</include>                                      
             <include>org.apache.avro:avro</include>                                   
             <include>org.apache.avro:avro-mapred</include>                            
             <include>org.apache.hive.shims:hive-shims-0.23</include>                  
             <include>org.apache.hive.shims:hive-shims-0.23</include>                  
             <include>org.apache.hive.shims:hive-shims-common</include>                
             <include>com.googlecode.javaewah:JavaEWAH</include>                       
             <include>javolution:javolution</include>                                  
             <include>com.google.protobuf:protobuf-java</include>                      
             <include>io.airlift:aircompressor</include>                               
             <include>org.codehaus.jackson:jackson-core-asl</include>                  
             <include>org.codehaus.jackson:jackson-mapper-asl</include>                
             <include>com.google.guava:guava</include>                                 
             <include>net.sf.opencsv:opencsv</include>                                 
             <include>org.apache.hive:spark-client</include>                           
             <include>org.apache.hive:hive-storage-api</include>                       
             <include>org.apache.orc:orc-core</include>                                
             <include>org.apache.orc:orc-tools</include>                               
             <include>joda-time:joda-time</include>                                    
           </includes>                                                                 
         </artifactSet>                                                                
         <relocations>                                                                 
           <relocation>                                                                
             <pattern>com.esotericsoftware</pattern>                                   
             <shadedPattern>org.apache.hive.com.esotericsoftware</shadedPattern>       
           </relocation>                                                               
           <relocation>                                                                
             <pattern>org.objenesis</pattern>                                          
             <shadedPattern>org.apache.hive.org.objenesis</shadedPattern>              
           </relocation>                                                               
         </relocations>                                                                
       </configuration>                                                                
     </execution>                                                                      
   </executions>                                                                       
 </plugin>                                                                             

上面的代码会将指定的依赖包打进hive-exec-xx.jar里面

4. 问题总结和解决办法

hive在打包hive-exec-xx.jar时会将一些相关的依赖打进去,也就是FatJar,这就导致我们更换hive/lib的一些第三方jar包不生效的问题

要解决这个问题,个人认为有两种办法:

  1. 如果就涉及一些类的话,直接编译完这些类后,替换jar包里面的指定类。这个通过zip命令可以实现对jar包文件的增删改。
  2. 自己编译一个新的版本,然后改一下hive的源码,版本改成自己编译的,之后再编译一遍hive

三、个人反思和一些总结

  1. 对hive的了解还不够深入。如果足够熟悉hive的话,这应该是个很简单的问题,要能快速解决才对,花了几个小时排查不太应该
  2. 个人认为hive打包的方式有问题,不是说不应该打FatJar,而是既然打了FatJar,又将那些第三方jar包放进lib中,导致开发或运维以为可以直接更换第三方jar包。——其实把这些第三方jar包都删了也不会影响hive运行
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 161,873评论 4 370
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,483评论 1 306
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 111,525评论 0 254
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,595评论 0 218
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,018评论 3 295
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,958评论 1 224
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,118评论 2 317
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,873评论 0 208
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,643评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,813评论 2 253
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,293评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,615评论 3 262
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,306评论 3 242
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,170评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,968评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,107评论 2 285
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,894评论 2 278

推荐阅读更多精彩内容