pivot_table
基本语法:pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All', observed=False, sort=True)
new=pd.pivot_table(
df, #表名
index=[column], #索引,行分类,必须值,可以放多个值
columns=[column],#列,列分类,可选值,可以多个值
values=[column], #计算值的列,可以放多个值
aggfunc=lambda x: x.value_counts().count() #方式1,单个值
aggfunc=[np.sum,np.mean] #方式2,多个值
aggfunc={column1:[np.sum,np.mean],column2:np.sum} #方式3,多个值
,fill_value=0 #空值填充
,dropna=False #True时如果列的所有值都是NaN,将被删除,默认为False
,margins=True # 会添加行/列的总计 默认为False
,margins_name=str #为总计设置名称
)
aggfunc
对values值计算方式,常用方法有
lambda x: len(x.value_counts()) 去重计数
np.min
np.max
np.mean
np.median
aggfunc可以使用dict类型