我的Python2017总结

96
爱柚子的陈同学
2017.12.14 15:48* 字数 598

作为一个Mobile开发工程师,2017年业余时间写的最多的居然是Python。总共10个Project,其中6个爬虫,3个工具,1个函数库。
源码都在GitHub: https://github.com/9468305/python-script

  1. geetest_offline
    Python破解GeeTest滑块验证码offline V5.10.10,以国家企业信用信息公示系统网站为例。
    吐槽1:很强大的机器学习验证码,居然被轻易绕过。
  2. auc_pr_roc
    Python scikit-learn计算PR ROC曲线AUC值。
    用于 携程旅行网 云海竞赛平台 携程机票航班延误预测算法大赛,竞赛算法结果核算。
  3. gsxt_mobile
    Python爬虫 - 国家企业信用信息公示系统 App,通过 App HTTP API 查询企业信息。
    吐槽2:简陋不堪的App,发飚起来连自己都打。
  4. geetest_offline_gd
    Python爬虫 - http://gd.gsxt.gov.cn 企业详细信息。
    吐槽3:官网做得像大三学生业余水平课程作业。
  5. nacao_v1
    Python爬虫 - 全国组织结构代码管理中心V1.0。
    吐槽4:无底线无限制可随意访问的网站。
  6. nacao_v2
    Python爬虫 - 全国组织结构代码管理中心V2.0。
    吐槽5:再怎么改版都无法掩盖粗糙地设计实现的网站。
  7. excel_combine
    Python实现 - Excel多文件一键自动合并。
  8. lagou
    Python爬虫 - Selenium 拉勾网 数据采集。
    某天,HR妹子接到一个任务,收集并分析拉勾网BAT三家公司所有招聘岗位的分类,要求,薪酬范围,人数等信息。
    人肉采集辛苦枯燥,随手写段代码搭救妹子。
  9. leveldb
    Python leveldb Utils 常用方法封装。
  10. gitstats
    Python实现 - Git commit log统计分析。
    简单分析项目成员的代码提交次数,增删代码量。

2018预告

  • 2017年Python项目写的足够多了,想换换方向。
  • 机器学习推动Python继续大火,但是上手有点难,继续搁置。
  • 2018年计划切换Javascript,写一些Web Application和微信小程序。
  • Kotlin看上去很美好,期待Kotlin-JS,Kotlin Native的表现。
  • Swift。。。。。。就让它随风去吧,中短期内无望支持跨平台。
陈同学的工作
Web note ad 1