Kettle:简介 ETL:简介 ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用...
Coursera是国外的一款非常有名的公开课网站,值得大家一起学习,但有时候要在coursera上看个课程,发现看不了,爬墙各种方法都试了,特意...
[线上环境部署Django,nginx+uwsgi 和nginx+gunicorn,这两种方案,应该如何选择?] 大家是采用的何种部署方式? 第...
随机森林是否需要后剪枝?sklearn为什么没有实现这个功能,是否有人实现了这个功能? 在使用随机森林算法的时候,常常需要通过限制最大深度,最大...
z-score标准化 z-score标准化是将数据按比例缩放,使之落入一个特定区间。 要求:均值 μ = 0 ,σ = 1 标准差公式: z-s...
前言: 本系列教程会从软件的基本安装开始,最终目的是通过完成几个案例后, 大家实现自由抓取App中想要的资源。 本系列以后会更的: Appium...
一、概述 数据库表:• 表输出• 更新,删除,插入/更新• 批量加载(mysql,oracle)• 数据同步文件:• SQL 文件输出• 文本文...
[数仓中的全量表,增量表,拉链表,流水表,快照表] 预热: 我们先从几个物理概念入手理解什么是流量,存量,增量 (1)存量:系统在某一时点时的所...
众所周知,一到月末、月初或月中时,各职能部门、各管理会议、各管理决策等都在为报表绞尽脑汁、加班加点和操心操劳。 事实上绝大多数中小企业所使用的国...