240 发简信
IP属地:北京
  • MADlib——基于SQL的数据挖掘解决方案

    https://blog.csdn.net/wzy0623/column/info/15741 原 HAWQ与Hive查询性能对比测试 一、实验...

  • HAWQ取代传统数仓实践

    1.为什么选择HAWQ 2.HAWQ技术解析(二) —— 安装部署 HAWQ取代传统数仓实践(十一)——维度表技术之维度合并 有一种合并维度的情...

  • Resize,w 360,h 240
    基于Spring+SpringMVC+Mybatis分布式敏捷开发系统架构

    技术名称官网 Spring Framework容器http://projects.spring.io/spring-framework/ Sp...

  • iOS应用架构谈 开篇

    缘由 之前安居客iOS app的第二版架构大部分内容是我做的,期间有总结了一些经验。在将近一年之后,前同事zzz在微信朋友圈上发了一个问题:假如...

  • 教程

    一 入门系列 1. Scrapy爬虫入门教程二 官方提供Demo https://www.jianshu.com/p/428cbd8d12ec ...

  • Resize,w 360,h 240
    Spark生态圈概述与Hadoop对比

    Spark:快速的通用的分布式计算框架 概述和特点: 1)Speed,(开发和执行)速度快。基于内存的计算;DAG(有向无环图)的计算引擎;基于...

  • Scrapy 爬虫的几个例子

    1. 简单的爬虫 1)需要从网站上爬取文章,并上传至服务器,实现模拟用户发帖。 GitHub地址:https://github.com/Joho...

  • scrapy在采集网页时使用随机user-agent的方法

    默认情况下scrapy采集时只能使用一种user-agent,这样容易被网站屏蔽,下面的代码可以从预先定义的user-agent的列表中随机选择...

  • Scrapy基础(十二)————异步导出Item数据到Mysql中

    Scrapy基础(十二)————异步导出Item数据到Mysql中 上次说过从Item中同步写入数据库,因为网络的下载速度和数据库的I/O速度是...