Pandas库的介绍

Pandas库的引用

Pandas是python第三方库,提供高性能易用数据类型和分析工具

import pandas as pd

Pandas基于Numpy实现,常与Numpy和Matplotlib一同使用


Pandas库的理解

两个数据类型:Series,DataFrame

基于上述数据类型的各类操作(基本操作、运算操作、特征类操作、关联类操作)


Pandas库的Series类型



Series类型可以由如下类型创建:

1.python列表,index与列表元素个数一致

2.标量值,index表达Series类型的尺寸

3.python字典,键值对中的‘键’是索引,index从字典中进行选择操作

4.ndarray,索引和数据都可以通过ndarray类型创建

5.其他函数,range()函数等


Series类型的基本操作

Series类型包括index和value两部分

Series类型的操作类似ndarray类型

Series类型的操作类似python字典类型


Series类型的操作类似ndarray类型:

1.索引方法相同,采用[]

2.numpy中运算和操作可用于series类型

3.可以通过自定义索引的列表进行切片

4.可以通过自动索引进行切片,如果存在自定义索引,则一同被切片

Series类型的操作类似python字典类型:

1.通过自定义索引访问

2.保留字in操作

3.使用.get()方法

Series是一维带‘标签’数组

index_0   --->data_a

Series基本操作类似ndarray和字典,根据索引对齐


DataFrame类型可以由如下类型创建:

1.二维ndarray对象

2.由一维ndarray、列表、字典、元组或Series构成的字典

3.Series类型

4.其他的DataFrame类型


Pandas库的数据类型操作


重新索引

.reindex(index=None,columns=None,...)的参数

index,columns            新的行列自定义索引

fill_value                       重新索引中,用于填充缺失位置的值

method                       填充方法,ffill当前值向前填充,bfill向后填充

limit                             最大填充量

copy                             默认true,生成新的对象,false时,新旧相等不复制

索引类型的常用方法

.append(idx)           链接另一个index对象,产生新的index对象

.diff(idx)                    计算差集,产生新的index对象

.intersection(idx)        计算交集

.union(idx)                   计算并集

.delete(loc)                删除loc位置处的元素

.insert(loc,e)               在loc位置增加一个元素e

Pandas库的数据类型运算

算术运算法则

算术运算根据行列索引,补齐后运算,运算默认产生浮点数

补齐时缺项填充NaN(空值)

二维和一维、一维和零维间为广播运算

采用+ - * /符号进行的二元运算产生新的对象

方法形式运算

.add(d,**argws)    类型间加法运算,可选参数

.sub(d,**argws)    类型间减法运算,可选参数

.mul(d,**argws)    类型间乘法运算,可选参数

.div(d,**argws)    类型间除法运算,可选参数

比较运算法则

比较运算只能比较相同索引的元素,不进行补齐

二维和一维、一维和零维间为广播运算

采用>  <  >=  <=  ==  !=等符号进行的二元运算产生布尔对象

Pandas的数据特征分析


.sort_values()方法在指定轴上根据数值进行排序,默认升序

Series.sort_values(axis=0,ascending=True)

DataFrame.sort_values(by,axis=0,ascending=True)

                   by:axis轴上的某个索引或索引列表

基本统计分析函数

适用于Series和DataFrame类型

.sum()           计算数据的总和,按0轴计算,下同

.count()         非NaN值的数量

.mean()  .median()   计算数据的算术平均值,算术中位数

.var()   .std()      计算数据的方差、标准差

.min()     .max()     计算数据的最小值、最大值

.describe()         针对0轴(各列)的统计汇总

适用于Series

.argmin()    .argmax()    计算数据最大值、最小值所在位置的索引位置(自动索引)

.idxmin()     .idxmax()    计算数据最大值、最小值所在位置的索引(自定义索引)

累计统计分析函数

适用于Series和DataFrame类型,累计计算

.cumsun()                  依次给出前1、2、...、n个数的和

.cumprod()                 依次给出前1、2、...、n个数的积

.cummax()                  依次给出前1、2、...、n个数的最大值

.cummin()                   依次给出前1、2、....、n个数的最小值


适用于Series和DataFrame类型,滚动计算(窗口计算)

.rolling(w).sum()                依次计算相邻w个元素的和

.rolling(w).mean()               依次计算相邻w个元素的算术平均值

.rolling(w).var()                    依次计算相邻w个元素的方差

.rolling(w).std()                   依次计算相邻w个元素的标准差

.rolling(w).min()   .max()                依次计算相邻w个元素的最小值和最大值

数据的相关分析

两个事物,表示为x和y,如何判断它们之间的存在相关性?

相关性

          1.x增大,y增大,两个变量正相关

          2.x增大,y减小,两个变量负相关

          3.x增大,y无视,两个变量不相关


相关分析函数

适用于Series和DataFrame类型

.cov()                计算协方差矩阵

.corr()                 计算相关系数矩阵,Pearson、Spearman、Kendall等系数



最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容