240 发简信
  • 120
    09-多进程间的通信与数据共享

    上篇文章对python多线程进行了介绍,GIL锁使得python的多线程并不能并发执行,为了提高多核CPU的利用率,可以采取多进程的方式,即为每个任务单独启动一个独立的进程,...

  • @兜兜的动感超人 不用,登陆后可以用request来进行路由爬取信息

    11-Scrapy反爬策略&模拟登录

    一.反反爬虫相关机制 通常反反爬主要有以下几个策略: 动态设置User-Agent(随机切换User-Agent,模拟不同用户的浏览器信息) 禁用Cookies 设置延迟下载...

  • 06-Docker

    ⼀. Docker介绍 Docker是什么? Docker 是⼀个开源的应⽤容器引擎,基于Go语⾔并遵从Apache2.0协议开源。Docker 可以让开发者打包他们的应⽤以...

  • python操作kafka

    一、什么是kafka kafka特性:(1) 通过磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能.(2) 高吞吐量 :即使是非常普...

  • 120
    15-TensorFlow高级

    一.反向传播 几个人站成一排第一个人看一幅画(输入数据),描述给第二个人(隐层)……依此类推,到最后一个人(输出)的时候,画出来的画肯定不能看了(误差较大)。反向传播就是,把...

  • 120
    14-TensorFlow入门和基本模型

    一.什么是TensorFlow Tensor(张量)意味着 N 维数组,Flow(流)意味着基于数据流图的计算,TensorFlow即为张量从图的一端流动到另一端;支持CNN...

  • 120
    13-特征工程之金融反欺诈

    1.本项目需解决的问题 本项目通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 2.建模思路 3.项目背景 数据集包含由...

  • 120
    12-机器学习练习与特征工程、评价指标

    一.使用PCA识别手写数字 PCA:Principal Component Analysis(主成分分析)PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提...

  • 120
    11-SVM与K均值聚类

    一.SVM 什么是SVM? SVM主要针对小样本数据进行学习、分类和预测(有时也叫回归)的一种方法,能解决神经网络不能解决的过学习问题,而且有很好的泛化能力 1.1 SVM原...

  • 120
    10-决策树与贝叶斯

    一.什么是决策树 决策树分类的思想类似于找对象。现想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话: 女儿:多大年纪了?母亲:26。女儿:长的帅不帅?母亲:挺帅的...

  • 120
    09-LinearRegression线性回归和逻辑斯蒂回归

    一.导数 几种常见函数的导数 ① C'=0(C为常数);② (xn)'=nx(n-1) (n∈Q);③ (sinx)'=cosx;④ (cosx)'=-sinx;⑤ (ex)...