240 发简信
IP属地:上海
  • Resize,w 360,h 240
    爬虫基础_02——BeautifulSoup

    今天主要是利用BeautifulSoup爬一下糗百 http://www.qiushibaike.com/包括:作者,年龄,段子内容,好笑数,评...

  • Resize,w 360,h 240
    动态网页爬取图片——花瓣网

    今天我们来爬取一个图片网站花瓣网,写一个比较简单的图片下载的爬虫; 图片太多了,只截了这些图片,大概几千张;对,没错,就是你们喜欢的胖迪,1、首...

  • Resize,w 360,h 240
    pymongodb的用法

    今天主要是介绍一下mongodb的使用,通过爬取中国天气网的你所在城市一年的天气历史数据,可以简单掌握mongodb的使用; windows下M...

  • Resize,w 360,h 240
    爬虫基础_03——xpath

    今天是利用xpath爬取网址: 简书首页包括:标题,作者,发表时间,内容,阅读量,评论数,点赞数,打赏数,所投专题主要思想:利用xpath获取网...

  • Resize,w 360,h 240
    scrapy的快速入门(三)

    总结一下之前的spider,总的来说,Spider类就是定义了如何爬取某个(或某些)网站。包括了爬取的动作以及如何从网页的内容中提取结构化数据(...

  • Resize,w 360,h 240
    静态网页爬取多页

    爬取的网站:企业黄页 这里我是抓取一个省的公司,按照这个分类抓取的,省——市——分类——公司,其实方法不限的;按照这个顺序一级一级往下获取所需的...

  • Resize,w 360,h 240
    新闻推荐03——多路召回

    多路召回 所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显...

  • Resize,w 360,h 240
    GBDT+LR模型

    1. GBDT+LR简介 协同过滤和矩阵分解存在的劣势就是仅利用了用户与物品相互行为信息进行推荐, 忽视了用户自身特征, 物品自身特征以及上下文...

  • Wide&Deep模型

    Wide & Deep是专门为推荐系统点击率预估而设计的一个种联合模型。 1. 点击率预估 点击率预估是对每次广告点击情况作出预测,可以输出点击...