240 发简信
IP属地:北京
  • 优化一:hive.auto.convert.join

    大表关联小表,把小表自动加载到内存中,需要确认以下配置为true,相当于写了一个mapjoin 实例: 查看url占比前十的数据 基表总数据量为...

  • hive sql 条件放在on和where区别比较

    原理: 关联时会先创建临时表t1和t2,where后面的条件会先过滤t1、t2临时表后在关联,on后面的条件会先关联t1、t2后在过滤。 结论:...

  • Resize,w 360,h 240
    Pycharm中使用GitHub

    环境:pycharm 2016,git 2.8,github账户,windows7 一、配置Pycharm 不管你用哪种方法,进入pycharm...

  • Resize,w 360,h 240
    idea用maven开发hive的udf详细过程

    创建maven项目file>new>project2.添加依赖的jar包,第一次添加可能有点慢 导入完毕后左边多出很多jar包,右边则没有红色横...

  • python操作mysql数据库

    Python标准数据库接口为Python DB-API,为开发人员提供了数据库应用编程接口。接口支持多数据库: GadFly mSQL MySQ...

  • Resize,w 360,h 240
    hive中orc表sqoop导出到mysql

    环境: sqoop版本:1.4.6hive版本:2.1.1hadoop版本:2.7.3 起因: orc表导出到mysql有时碰到空字符串的问题一...

  • PYTHON部分基础D5

    魔法方法以双下划线开头和结尾的特殊成员及“魔法方法”,有些是方法,调用时要加括号,有些是属性,调用时不需要加括号 __doc__说明性文档和信息...

  • Resize,w 360,h 240
    编写第一个Django应用,第2部分

    本文根据官方文档在win10环境一步步学习python Django3.0基础。操作步骤较为详细,基础原理最好观看官方文档 1.数据库设置 如果...

  • Resize,w 360,h 240
    编写第一个Django应用,第1部分

    本文根据官方文档在win10环境一步步学习python Django3.0基础。操作步骤较为详细,基础原理最好观看官方文档 Django包含可用...