Pandas(数据结构:DataFrame)

0.061字数 357阅读 459

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等),DataFrame既有行索引也有列索引。

建DataFrame, 传入一个由等长列表或NumPy数组组成的字典:

data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
        'year': [2000, 2001, 2002, 2001, 2002, 2003],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]} 

frame = pd.DataFrame(data)
创建DataFrame

特别大的DataFrame,head方法会选取前五行

head方法

如果指定了列序列,则DataFrame的列就会按照指定顺序进行排列

指定顺序
获取列坐标

将DataFrame的列获取为一个Series

DataFrame的列获取为一个Series的两种方式

行也可以通过位置或名称的方式进行获取

行的获取

可以给那个空的”debt”列赋上一个标量值或一组值

列的赋值

如果赋值的是一个Series,就会精确匹配DataFrame的索引,所有的空位都将被填上缺失值

精确匹配,缺省空位

为不存在的列赋值会创建出一个新列。关键字del用于删除列。

删除列

如果嵌套字典传给DataFrame,pandas就会被解释为:外层字典的键作为列,内层键则作为行索引

由嵌套字典转换得到的DataFrame

对DataFrame进行转置(交换行和列)

转置

设置了DataFrame的index和columns的name属性,则这些信息也会被显示出来

解释信息的显示

values属性也会以二维ndarray的形式返回DataFrame中的数据

values属性

如果DataFrame各列的数据类型不同,则值数组的dtype就会选用能兼容所有列的数据类型:

兼容

推荐阅读更多精彩内容