240 发简信
IP属地:江西
  • hive数据库操作

    创建表 如果不加if not exist,如果已经存在表,则会报错,但是,如果加了if not exist,则如果存在了表,就会忽略后面执行的语...

  • Resize,w 360,h 240
    Pandas基本数据结构总结

    简介 pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包 类似于 Numpy 的核心是 ndarray(经过Numpy...

  • Scala数组操作

    1. 定长数组 2. 变长数组:数组缓冲 3. 遍历数组和数组缓冲 利用下标来进行遍历 不需要数组下标遍历 总结一下:其实两种遍历方式是一样的,...

  • Lombok是什么

    1.为什么会有Lombok,解决了什么痛点 最近在学习spring boot的时候发现spring boot里面有推荐使用lombok,现在就写...

  • Resize,w 360,h 240
    利用Hive分析搜狗用户查询日志

    1.下载日志 在http://www.sogou.com/labs/resource/q.php进行下载,我们下载的是mini版本 2.解决乱码...

  • Hadoop常用shell命令

    cat 类似于Linux中的cat命令。 copyFromLocal cp 将文件从源路径复制到目标路径。这个命令允许有多个源路径,此时目标路径...

  • linux crontab总结

    简介 crontab命令常见于Unix和类Unix的操作系统之中,用于设置周期性被执行的指令,crontab储存的指令被守护进程激活, cron...

  • 皮尔逊相关系数评价相似度

    皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。假设有两个变量X、Y,那么两变量间的皮尔逊相关...

  • python常用类库之collections

    1.deque 高效实现插入和删除操作的双向列表,适合用于队列和栈 2.defaultdict 使用dict时,如果引用的Key不存在,就会抛出...

个人介绍
混迹于西安的java程序猿