240 发简信
IP属地:江西
  • Resize,w 360,h 240
    2017/5/19 爬取简书百万数据

    小分队第一期的最后一次作业,本次作业的内容是爬取简书百万以上的用户,不过我只爬了60多万用户,因为之前没有设置代理IP,同时请求过快的原因而被封...

    0.1 1070 9 13 1
  • Resize,w 360,h 240
    2017/4/23 如何使爬虫更像人

    作业思路 昨天在尝试了几次拉勾网的爬取,因为调试了几次后运行,然后IP就被封了谷歌了一番,发现谷歌上还是比较少关于这方面的教程,要么是重复,要么...

  • Resize,w 360,h 240
    2017/5/9 微博爬取用户信息

    作业思路 在这次作业爬取的是新浪微博的用户信息,日爬取量25000个用户,寄存在云服务器上运行(不过服务器每次都因为内存不够把进程给杀了,汗.....

    0.1 1531 3 8 1
  • Resize,w 360,h 240
    #我对python表个白# 爬虫物语

    天哪,第一次表白竟要献给一个虫子和一条蝰蛇。 一只爬虫的起源 在写第一个爬虫之前先是发生了这么一件事,一个关于女神的故事。在上个学期为考试而复习...

  • Resize,w 360,h 240
    大数据带你解读图书馆借阅情况

    统计方法 数据来自学校官网,使用python爬虫抓取数据,统计数据截至2017/4/9,使用excel及魔镜进行数据分析 概览 本次所选取的数据...

  • Resize,w 360,h 240
    2017/4/27 cookies

    感觉距离上次交作业已经很久了...已经落后大家这么多了 思路分析 上次交的作业虽然能够爬取到数据,但是和大家的不同,完全偏离主题呀,心好痛这次作...

  • Resize,w 360,h 240
    2017/4/21 七日热门数据分析

    七日热门里写了些什么? 因为分词的问题,有很多词没有分好,从标签中大概地可以看出,主要涉及的是生活, 学习方法, 大学生活,还有阅读这一些主题,...

  • Resize,w 360,h 240
    2017/4/18爬虫作业

    作业代码 作业结果 作业的思路 本来是打算用scrapy的,但是由于才刚开始看scrapy文档,就卡在输出item上了,就还是选择了老套路,单线...

  • 2017/5/1 从爬虫回味函数思想

    在前两天中所提到,对于函数的传递还是不太熟悉,当时过了就过了,没在意,现在想从函数背后的思想来理解一下函数,如有错误之处,欢迎亲指正。下一次再来...

个人介绍
莫名地想把知识串进来
写一本只属于自己的书
哈哈,一个文集一个领域一本书