240 发简信
  • 120
    2017/5/19 爬取简书百万数据

    小分队第一期的最后一次作业,本次作业的内容是爬取简书百万以上的用户,不过我只爬了60多万用户,因为之前没有设置代理IP,同时请求过快的原因而被封...

    0.1 880 9 14 1
  • 120
    #我对python表个白# 爬虫物语

    天哪,第一次表白竟要献给一个虫子和一条蝰蛇。 一只爬虫的起源 在写第一个爬虫之前先是发生了这么一件事,一个关于女神的故事。在上个学期为考试而复习...

  • 120
    2017/5/9 微博爬取用户信息

    作业思路 在这次作业爬取的是新浪微博的用户信息,日爬取量25000个用户,寄存在云服务器上运行(不过服务器每次都因为内存不够把进程给杀了,汗.....

    0.1 1136 3 8 1
  • 120
    2017/5/3 爬取知乎搜索结果

    作业思路 要被考试给急疯了...背书背得脑壳疼,具体思路在代码里有,分析由于时间关系,就不详述了。选取了一个另一个方向来爬取答案,就是爬取搜索结...

  • 2017/5/1 从爬虫回味函数思想

    在前两天中所提到,对于函数的传递还是不太熟悉,当时过了就过了,没在意,现在想从函数背后的思想来理解一下函数,如有错误之处,欢迎亲指正。下一次再来...

  • 120
    2017/4/29 豆瓣读书

    作业思路 这次只爬取了一个经济学这个标签下的所有书思路和之前的差不多,不过有一点区别的就是分页的url以及豆瓣的反爬策略 分页URL https...

  • 120
    2017/4/27 cookies

    感觉距离上次交作业已经很久了...已经落后大家这么多了 思路分析 上次交的作业虽然能够爬取到数据,但是和大家的不同,完全偏离主题呀,心好痛这次作...

  • 120
    2017/4/23 如何使爬虫更像人

    作业思路 昨天在尝试了几次拉勾网的爬取,因为调试了几次后运行,然后IP就被封了谷歌了一番,发现谷歌上还是比较少关于这方面的教程,要么是重复,要么...

  • 2017/4/22 一周复盘

    在这一周里的学习了哪些东西? 在这一周里围绕一个小的练手项目写了四篇 作业内容抓取简书七日热门数据,如果有时间加以分析http://www.ji...

个人介绍
莫名地想把知识串进来
写一本只属于自己的书
哈哈,一个文集一个领域一本书