240 发简信
  • 金融风控比赛二

    在充分了解赛题之后,准备开始进行数据集的分析工作,分别从数据集维度,标签,字段属性和类型。本次数据集主要有44列,其中有连续性数据和离散型数据以...

  • 120
    金融风控赛一

    赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。这是一道基础的01分类问题,...

  • 120
    nextCloud私人云

    前言: 前段时间我写了一篇mega同步盘的文章, 有小伙伴表示如果mega某天被封掉就尴尬了, 既然这样, 我们就用手头的vps资源自己搭一个私...

  • laravel 部署,更新清空缓存

    初始化部署:git clone git@...克隆仓库获得代码chown -R www:www *这里设置为nginx/Apache的实际的用户...

  • 网站优化之sitemap.xml网站地图的写法

    网站地图是一个网站的缩影,包含网站的内容地址,是根据网站的结构、框架、内容,生成的导航文件。网站地图分为三种文件格式:xml格式、html格式以...

  • 超详细robots.txt大全和禁止目录收录及指定页面

    robots.txt写法大全和robots.txt语法的作用1如果允许所有搜索引擎访问网站的所有部分的话 我们可以建立一个空白的文本文档,命名为...

  • seo优化,如何对网站的Robots.txt进行设置

    SEO链接优化之robots.txt的写法。什么是robots.txt?这是一个文本文件,是搜索引擎爬行网页要查看的第一个文件,你可以告诉搜索引...

  • PIP换源

    pip国内的一些镜像 阿里云 http://mirrors.aliyun.com/pypi/simple/  中国科技大学 https://py...

  • 120
    python爬虫方法,robots.txt文件采集网站数据!

    转自人生苦短丨我爱python在我抓取网站遇到瓶颈,想剑走偏锋去解决时,常常会先去看下该网站的robots.txt文件,有时会给你打开另一扇抓取...

个人介绍
为了理想一直坎坷奔跑的梦想者