前言 本文将介绍如何使用Plotly+Cufflinks更简便地制作出更好的图表。这是Github上一个大神发布的资料,本人学习之后觉得非常实用...
嘿嘿嘿,我觉得VBA最好玩的一点是:它非常接地气!VBA是什么?就是用敲代码的方式使用EXCEL呗,一切报表用上VBA,简直分分钟搞定呀!本篇想...
写在前面的话 开始做数据分析,最头疼的就是数据探索和清洗了。Pandas里面有很多函数用于初步探索和分析,例如pd.describe()。今天逛...
Hive的数学函数包含两种,一种是内嵌函数,一种是由java定义的自定义函数。对于不懂Java的数据分析师,掌握Hive的内嵌函数就显得尤为重要...
hive是什么呢?如果用它的百度概念,那就是:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整...
写在最前的话 Numpy是数据科学计算的基础模块,用于数值计算。Numpy基于数组计算,比Python自带的数据结构如列表等要速度快很多,如[3...
决策树算法利用非度量(nunmetric)的方式进行一系列的查询问答来判断和分类,被广泛用于分类和回归模型,三种最常用的实现算法是CART、ID...
超平面的相关知识是学习SVM算法的数学基础。当初为了弄清楚超平面的全面知识,在网络上搜寻良久都没找到详细的讲解,最终是一篇英文讲义救了急。我做了...
对于存在excel里的数据诸如商品信息、会员信息、交易信息等,每当我们需要查找的时候,第一反应都是使用Ctrl+F或vlookup函数,但如果表...