pandas应用实例之pivot函数详解

目录

1、pivot函数的定义

2、pivot函数的说明

3、pivo函数的参数

4、pivot函数实例

5、pivot函数在实际工作中解决的案例

总结

1、pivot函数的定义 pivot(index=None,columns=None,values=None) -> DataFrame 2、pivot函数的说明

通过给定的索引(index)和列(column)的值重新生一个DataFrame对象。

根据列值对数据进行整形(生成一个“透视”表)。从指定的索引/列中使用唯一的值来形成结果数据帧的轴。此函数不支持数据聚合,多个值将导致列中的多索引。

3、pivo函数的参数

index:指定一列做为生成DataFrame对象的索引,如果为空则默认为原来的索引。

columns:指定一列的值作为列名,必须传值。

values:指定一列作为生成DataFrame对象的值。可以为空。

4、pivot函数实例 df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'], 'bar': ['A', 'B', 'C', 'A', 'B', 'C'], 'baz': [1, 2, 3, 4, 5, 6], 'zoo': ['x', 'y', 'z', 'q', 'w', 't']})

# 指定foo的值为新dataframe的index,bar的值为columns,dataframe中对应的值为baz df.pivot(index='foo', columns='bar', values='baz')

# 没有指定value,列名最外层保留原来的列,如下结果baz和zoo为原dataframe中的列名,新指定的列名bar在里层(暂时这么理解)。 df.pivot(index='foo', columns='bar')

# 可以通过索引的方式取指定的列数据 df.pivot(index='foo', columns='bar')['baz']

# 可以指定多个values df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])

# 指定多个columns df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])

# 指定多个index df.pivot(index=['foo','bar'], columns='baz', values='zoo')

# 指定多个index可以通过index名取当个index的数据 df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]

# 这两行代码运行将会报错。 # 报错提示:ValueError: Index contains duplicate entries, cannot reshape # 意思是指定的索引one有两个列bar=A冲突了。 df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'], "bar": ['A', 'A', 'B', 'C'], "baz": [1, 2, 3, 4]}) df.pivot(index='foo', columns='bar', values='baz') 5、pivot函数在实际工作中解决的案例

现在要上图中的不同code之间从2020-11-16到2020-11-18三天内num序列数的相关性。

首先,dataframe对象可以直接调用函数corr()计算不同列之间的相关性,所以现在需要将原始的dataframe对象转换成以code为列,date为索引,num为值的dataframe。
第一种比较笨的方法就是循环,此方法不但代码量较多而且在数据量很大时会比较耗时。不建议使用。

grouped = df.groupby(by=["code"]) df_num = pd.DataFrame() for name,group in grouped: d = pd.Series(data=group["num"].values,name=name) df_num = pd.concat([df_num,d],axis=1) df_close

第二种方法就是使用pivot函数,一行代码解决,运行快速。

df_num = df.pivot(index='date',columns='code',values='num')

想要的形式的dataframe生成了就可以直接调用corr()函数直接求出code之间的相关性了

# 计算列之间的相关性 df_num.corr()

总结

到此这篇关于pandas应用实例之pivot函数的文章就介绍到这了,更多相关pandas pivot函数内容请搜索易知道(ezd.cc)以前的文章或继续浏览下面的相关文章希望大家以后多多支持易知道(ezd.cc)!

推荐阅读

    excel怎么用乘法函数

    excel怎么用乘法函数,乘法,函数,哪个,excel乘法函数怎么用?1、首先用鼠标选中要计算的单元格。2、然后选中单元格后点击左上方工具栏的fx公

    opporeno8参数配置及价格

    opporeno8参数配置及价格,面部,亿元,Oppo的荣誉2020年1月4日,接近屏幕关闭传感器是否支持双卡:支持oppor11splus什么时候上市的Oppo R11S P

    excel中乘法函数是什么?

    excel中乘法函数是什么?,乘法,函数,什么,打开表格,在C1单元格中输入“=A1*B1”乘法公式。以此类推到多个单元。1、A1*B1=C1的Excel乘法公式

    魅蓝note6性能参数有哪些

    魅蓝note6性能参数有哪些,摄像头,蓝牙,魅蓝note6性能参数有哪些魅力蓝色Note6最好拍照。电池寿命更长。蓝色Note6使用高通 snapdragon 625

    标准差excel用什么函数?

    标准差excel用什么函数?,函数,标准,什么,在数据单元格的下方输入l标准差公式函数公式“=STDEVPA(C2:C6)”。按下回车,求出标准公差值。详细

    设置总账参数|用友u8设置总账参数

    设置总账参数|用友u8设置总账参数,,1. 用友u8设置总账参数1、首先要点开数据权限控制设置;2、选择想要设置控制的单据;3、打开后看到左上角

    csgo参数设置|csgo怎么保存

    csgo参数设置|csgo怎么保存,,csgo怎么保存第一步下载csgo的官方版本。然后再下载一个5e对战平台,PS:5e的账号和csgo的账号不是一个账号。第

    移动apn设置|移动apn设置参数

    移动apn设置|移动apn设置参数,,移动apn设置参数1、打开手机系统设置界面应用,点击页面中的“移动网络”设置选项。2、进入移动网络设置页面