240 发简信
  • 120
    爬取雪球网优化之代理池

    在之前的文章中,提到如何爬取雪球网用户的股票数据,但是由于爬取过程中,会存在一些问题,比如由于网站设有反爬虫机制,所以会导致在爬取过程中收到40...

  • 120
    爬取雪球网用户股票数据

    近来想找一些网站作为爬虫项目练手,在查阅了知乎后,找到了很多有价值爬取的网站,由于母上大人作为一个资深股民,经常要用大量时间翻阅股票,因此我决定...

  • 泰坦尼克号生存预测

    本次笔记主要记录了一个机器学习的入门实战,泰坦尼克号生存预测。主要涉及的知识点有,python的pandas包,机器学习包sklearn。 背景...

  • SQL练习题(2)

    SQL练习 题目均取自sqlzoo, 在此只写下自己的答案。 4. SELECT within SELECT 4.1select name ...

  • SQL练习题(1)

    数据库基础知识 将大量数据保存起来,通过计算机加工而成的可以高效访问的数据集合成为数据库(Database,DB)。用来管理数据库的计算机系统成...

  • 120
    利用Excel进行数据分析

    本章主要讲述对上一章中爬取的数据通过Excel进行数据清洗和分析。 数据分析的基本步骤为:提出问题->理解数据->数据清洗->构建模型->数据可...

    0.3 687 0 24 1
  • 120
    爬取拉勾网数据分析师岗位

    本次笔记主要记录了本人利用python编写爬虫对拉勾网的数据分析师岗进行爬取,因为打算从事数据分析师这个职业,所以想对这个职业进行一个数据分析。...

    0.2 869 0 19
  • 120
    数据分析学习路径

    本人在美国读完机械工程硕士后,回国后决定转行数据分析师,今天开始把自己的学习过程,见解,以及一些疑惑记录下来。 先说说为什么要学习数据分析,个人...

    2.3 3357 10 96 1