周记 2017 6.26 - 7.1

数据分析

作为金融从业者,我对用户特征很感兴趣,我很好奇究竟什么人会在我们平台贷款,这些人具有什么特点,这些人资质怎么样呢,到底应不应该给他们贷款呢。

如果想知道这些问题的答案,单纯的猜想是不够的,需要对用户数据进行分析,让数据来说话。

而进行数据分析,仅仅会敲代码是不够的,需要了解数据特征,对数据进行处理。

常用Python数据分析库:

  1. Numpy 对数据进行简单运算,比如找出数组中最大值,数组之间计算。
  2. Pandas 在Numpy基础上提供了更强大的功能,比如对数据进行分组、数组之间的连接。
  3. Seaborn 图形化工具库。
  4. Bokeh 制作类似D3.js简洁漂亮的交互可视化图片库。
  5. Scikit-learn 机器学习库。

FICO分数

FICO分数,来源于美国,可以简单的理解为个人信用分,这个分值是根据个人信用报告(可以是人行征信报告)通过数学模型计算得出,分值越高代表信用越好。

Apache Tomcat命名由来

Tomcat:首先会让人联想到cat 猫,tomcat代表雄猫,也代表F14(雄猫战斗机),作者起Tomcat是希望它能向雄猫那样照顾自己(依靠大家而不是自己来发展壮大)。

Catalina:轰炸机,但是这里指的是Catalina Island 圣卡塔利娜岛,作者虽然没有去过这个岛但一直很喜欢这个岛。

推荐阅读更多精彩内容