Pandas Panel基本操作
Panel数据3D容器. 术语 Panel data 源自计量经济学,名称来之于pandas ? pan(el)-da(ta)-s.
3个轴的名称描述如下- ?
items ? 轴0,每个items都对应一个包含在其中的DataFrame。
major_axis ? 轴1,它是每个DataFrame的索引(行)。
minor_axis ? 轴2,它是每个DataFrame的列。
面板可以使用以下构造函数创建- ?
pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)
构造函数的参数如下:
参数 | 描述 |
data | 数据采用各种形式,例如ndarray,series,map,list,dict,常量以及DataFrame |
items | axis=0 |
major_axis | axis=1 |
minor_axis | axis=2 |
dtype | 每列的数据类型 |
copy | 复制数据。默认 false |
面板可以使用多种方式创建,例如:
从 ndarrays 创建 从 DataFrame的字典创建
# 创建一个空panel import pandas as pd import numpy as np data = np.random.rand(2,4,5) p = pd.Panel(data) print(p)
运行结果如下:
<class 'pandas.core.panel.Panel'> Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis) Items axis: 0 to 1 Major_axis axis: 0 to 3 Minor_axis axis: 0 to 4
# 创建一个空panel import pandas as pd import numpy as np data = { 'Item1' : pd. DataFrame(np. random.randn(4, 3)), 'Item2' : pd. DataFrame(np. random.randn(4, 2))} p = pd. Panel(data) print(p)
运行结果:
Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis) Items axis: Item1 to Item2 Major_axis axis: 0 to 3 Minor_axis axis: 0 to 2
可以使用Panel构造函数创建一个空面板,如下所示:
# 创建一个空panel import pandas as pd p = pd.Panel() print(p)
运行结果:
<class 'pandas.core.panel.Panel'> Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis) Items axis: None Major_axis axis: None Minor_axis axis: None
可以用以下三项从panel中查询数据:
Items Major_axis Minor_axis
# 创建一个空panel import pandas as pd import numpy as np data = {
运行结果:
0 1 2 0 0.488224 -0.128637 0.930817 1 0.417497 0.896681 0.576657 2 -2.775266 0.571668 0.290082 3 -0.400538 -0.144234 1.110535
从两个item中查询item1,输出的结果是一个具有4行3列的DataFrame,分别是Major_axis和Minor_axis。
可以使用panel.major_axis(index)方法访问数据.
# 创建一个空panel import pandas as pd import numpy as np data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 'Item2' : pd.DataFrame(np.random.randn(4, 2))} p = pd.Panel(data) print(p.major_xs(1))
运行结果:
Item1 Item2 0 0.417497 0.748412 1 0.896681 -0.557322 2 0.576657 NaN
可以使用panel.minor_axis(index)方法访问数据。
# 创建一个空panel import pandas as pd import numpy as np data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 'Item2' : pd.DataFrame(np.random.randn(4, 2))} p = pd.Panel(data) print(p.minor_xs(1))
运行结果:
Item1 Item2 0 -0.128637 -1.047032 1 0.896681 -0.557322 2 0.571668 0.431953 3 -0.144234 1.302466