240 发简信
IP属地:香港
  • Resize,w 360,h 240
    Python操作MySQL数据库

    前面一章我们把数据库给安装上了,这一章我们将使用 Python 去简单的操作下 MySQL;那么,想要操作MySQL就必须要先启动数据库服务,进...

    0.2 2094 3 61
  • Resize,w 360,h 240
    Selenium 的基本使用 - 登录知乎并爬取信息

    由于 JavaScript 动态渲染的页面不止 Ajax 这一种,有些网站获取数据并不包含Ajax请求,有些网站是对 Ajax 进行加密处理;为...

  • Resize,w 360,h 240
    Flink系列 - 实时数仓之ETL实战(二)

    一、概述   上一篇实战中我们已经使用ogg实现了mysql数据以json的格式同步到了kafka里边去了,也就是说我们的源端的埋点的数据已经处...

    0.5 7704 6 14
  • Flink系列 - 实时数仓之CEP预警实战(五)

      CEP 即Complex Event Processing - 复杂事件,Flink CEP 是在 Flink 中实现的复杂时间处理(CEP...

    1.3 3584 2 13
  • Resize,w 360,h 240
    Flink系列 - 实时数仓之统计数据并入redis实战(七)

      有时候,wordcount 的案例的原理还真是好用,当然不过单单是从官网复制的案例远远是不满足我们的平时需求的。那么假如我们如下需求: 数据...

    2.5 2290 0 11
  • Resize,w 360,h 240
    Selenium 实战 之 淘宝商品信息的爬取

    虽然淘宝的页面数据是通过 Ajax 获取的,也就是可以通过开发者模式直接找到它请求数据的接口,并且发现返回的数据是 json 的格式;但是这里需...

  • Resize,w 360,h 240
    Ogg 监控 MySQL - Binlog 日志并对接 Kafka 实战(一)

      对于 Flink 数据流的处理,一般都是去直接监控 xxx.log 日志的数据,至于如何实现关系型数据库数据的同步的话网上基本没啥多少可用性...

    0.5 5345 7 10
  • Resize,w 360,h 240
    Greenplum 数据库 之 拉链表 的实现

      历史拉链表是一种数据模型,主要是针对数据仓库设计中表存储数据的方式而定义的;顾名思义,所谓历史拉链表,就是记录一个事务从开始一直到当前状态的...

    0.6 3377 3 10
  • Resize,w 360,h 240
    Java-API对HDFS文件的读写操作(一)

    我们要是提到大数据的文件存储,那么久离不开分布式文件系统;闲话少讲,我们今天的目标是:1.读取 hdfs 上的文件内容,2.将本地文件上传到 h...

个人介绍
如若有心能自ヾ(≧奋≦)〃,何愁他日不雄飞。