Skip to content
Starslayerx edited this page Mar 18, 2021 · 29 revisions

green-pi
Pandas(panel data)基于Numpy,其主要数据类型为Series和DataFrame,分别为一维和二维数据表,还有Panel类型,用于三维甚至更高维的数据,但很少使用。

import pandas as pd

Pandas基本数据类型

  • Series
    Series是一维的数组型对象,内部嵌套了一个一维的ndarry类型,并含有数据标签index。 分别可以通过valuesindex属性来获取数据值和标签.
    此外还有deype属性表示数据类型,Series.index和Series本身都有有name属性表示其名称
    Series
    (交互式环境下索引在左,值在右) $ \ $
    Series可以执行numpy中的数组运算,运算会作用在values即其内嵌的ndarray上。 生存Series序列主要有以下几种方法:
  1. 使用一维ndarray生成Series
    # index默认从0开始,也可以自行指定
    pd.Series(np.arange(5), index=['a', 'b', 'c', 'd', 'e'])
  2. 使用列表或元组构建
    pd.Series([1,2,3,...])
    pd.Series((4,5,6,...))
  3. 使用字典构建
    $$ 键 \rightarrow index \ 值 \rightarrow values $$
    pd.Series({},index=...)

若修改index后,多出的index对应的值为NaN,缺少的index及其对应的值会消失

  1. 使用DataFrame类型中的某一列构建

Clone this wiki locally