鏡澤 - 简书

鏡澤

IP属地：北京

MADlib——基于SQL的数据挖掘解决方案
https://blog.csdn.net/wzy0623/column/info/15741 原 HAWQ与Hive查询性能对比测试一、实验...

951 0 0
HAWQ取代传统数仓实践
1.为什么选择HAWQ 2.HAWQ技术解析（二） —— 安装部署 HAWQ取代传统数仓实践（十一）——维度表技术之维度合并有一种合并维度的情...

0.1 537 0 1

基于Spring+SpringMVC+Mybatis分布式敏捷开发系统架构
技术名称官网 Spring Framework容器http://projects.spring.io/spring-framework/ Sp...

571 0 0
iOS应用架构谈开篇
缘由之前安居客iOS app的第二版架构大部分内容是我做的，期间有总结了一些经验。在将近一年之后，前同事zzz在微信朋友圈上发了一个问题：假如...

277 0 0
教程
一入门系列 1. Scrapy爬虫入门教程二官方提供Demo https://www.jianshu.com/p/428cbd8d12ec ...

141 0 1
Spark生态圈概述与Hadoop对比
Spark：快速的通用的分布式计算框架概述和特点： 1)Speed,（开发和执行）速度快。基于内存的计算；DAG（有向无环图）的计算引擎；基于...

1159 0 1
Scrapy 爬虫的几个例子
1. 简单的爬虫 1）需要从网站上爬取文章，并上传至服务器，实现模拟用户发帖。 GitHub地址：https://github.com/Joho...

291 0 1

scrapy在采集网页时使用随机user-agent的方法
默认情况下scrapy采集时只能使用一种user-agent，这样容易被网站屏蔽，下面的代码可以从预先定义的user-agent的列表中随机选择...

399 0 0
Scrapy基础(十二)————异步导出Item数据到Mysql中
Scrapy基础(十二)————异步导出Item数据到Mysql中上次说过从Item中同步写入数据库，因为网络的下载速度和数据库的I/O速度是...

717 0 0