Python数据分析 | (27) 重塑和轴向旋转

最新推荐文章于 2024-09-21 05:41:09 发布

原创

最新推荐文章于 2024-09-21 05:41:09 发布 · 1k 阅读

标签

#Python数据分析 #重塑和轴向旋转

收录于

有许多用于重新排列表格型数据的基础运算。这些函数也称作重塑(reshape)或轴向旋转(pivot)运算。

1. 重塑层次化索引

2. 将"长格式"旋转为"宽格式"

3. 将"宽格式"旋转为"长格式"

1. 重塑层次化索引

层次化索引为DataFrame数据的重排任务提供了一种具有良好一致性的方式。主要功能有二:

stack:将数据的列“旋转”为行。
unstack:将数据的行“旋转”为列。

我将通过一系列的范例来讲解这些操作。接下来看一个简单的DataFrame，其中的行列索引均为字符串数组:

data = pd.DataFrame(np.arange(6).reshape((2, 3)),
                    index=pd.Index(['Ohio', 'Colorado'], name='state'),
                    columns=pd.Index(['one', 'two', 'three'],
                    name='number'))
data

对该数据使用stack方法即可将列转换为行，得到一个Series:

result = data.stack()
result

对于一个层次化索引的Series，你可以用unstack将其重排为一个DataFrame:

result.unstack()

默认情况下，unstack操作的是最内层(stack也是如此)。传入分层级别的编号或名称即可对其它级别进行unstack操作:

print(result.unstack(0))
print("------------")
print(result.unstack('state'))

如果不是所有的级别值都能在各分组中找到的话，则unstack操作可能会引入缺失数据:

s1 = pd.Series([0, 1, 2, 3

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CoreJT

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

pandas教程：Reshaping and Pivoting 整形和旋转

Cachel Wood的博客

11-07

513

（长格式或堆叠格式）。但是在一些例子里，这种格式的数据并不好处理；，我们会在第十一章讲得更详细些。前两个传入的值是列，分别被用于作为行索引和列索引（（用于多重时间序列的长格式），或者有两个以上键（列中不同的数据，添加到表格中。有很多用于整理表格型数据的基本操作，指的就是。舍弃最后一个参数，我们能得到一个有多层级列的。，这种固定的模式（列名和数据类型）能让作为。（主键，这是关系型数据库里的术语），能实现。（群指示器），其他列可以作为数据值。，我们必须指明哪些列是群指示器。表格中的每一行表示一个观测数据。

利用Python进行数据分析——重塑和透视（12）

bwqiang的博客

08-10

241

重塑和透视使用多层索引进行重塑 statck（堆叠）该操作会“旋转”或将列中的数据透视到行。unstack（拆堆）该操作会将行中的数据透视到列。 In [5]: data = pd.DataFrame(np.arange(6).reshape((2,3)), index=pd.Index(['Ohio', 'Colora ...: do'], name='state'), columns=pd.Index(['one', 'two', 'three'], name='number')) In [6

参与评论您还未登录，请先登录后发表或查看评论

Python reshape() 函数用法

热门推荐

weixin_43937759的博客

06-07

12万+

reshape（）函数用于在不更改数据的情况下为数组赋予新形状。

python中stack函数_python pandas stack和unstack函数

weixin_36368413的博客

01-29

1423

在用pandas进行数据重排时，经常用到stack和unstack两个函数。stack的意思是堆叠，堆积，unstack即“不要堆叠”，我对两个函数是这样理解和区分的。常见的数据的层次化结构有两种，一种是表格，一种是“花括号”，即下面这样的l两种形式：store1store2store3street1123street2456 表格在行列方向上均有索引(类似于DataFrame)，花括号结构只有“...

使用Pivot、Pivot_Table、Stack和Unstack等方法在Pandas中对数据变形（重塑）

象在舞的技术专栏

12-24

4106

Pandas是著名的Python数据分析包，这使它更容易读取和转换数据。在Pandas中数据变形意味着转换表或向量（即DataFrame或Series）的结构，使其进一步适合做其他分析。在本文中，小编将举例说明最常见的一些Pandas重塑功能。一、Pivot pivot函数用于从给定的表中创建出新的派生表，pivot有三个参数：索引、列和值。具体如下： ...

Pandas中的数据重塑（reshape）功能

jiahaohappy的博客

05-08

2万+

引言Pandas 是 python 中常用的数据分析软件库，它提供了 DataFrames 和 Series 的工具，这使得 numpy 和 matplotlib 可以更加便捷地读取转换数据。数据重塑表示转换一个表格或者向量的结构，使其适合于进一步的分析。 Pandas 拥有一些其他软件不具备的重塑功能，这对初学者来说可能会比较棘手。本文中我将举例说明 Pandas 中一些常用的重塑函数，并结合图表

python数据提取和合并_python 数据清洗之数据合并、转换、过滤、排序

weixin_39793813的博客

12-22

501

python数据分析08_Pandas数据归整：聚合和重塑

清平乐的技术专栏

11-09

807

在许多应用中，数据可能分散在许多文件或数据库中，存储的形式也不不利利于分析，应采用聚合、合并、重塑数据的方法进行处理。一、层次化索引层次化索引（hierarchical indexing）是pandas的一项重要功能，它使你能在一个轴上拥有多个（两个以上）索引级别。 In [9]: data = pd.Series(np.random.randn(9), ...: index=[['a',...

python数据合并_python 数据清洗之数据合并、转换、过滤、排序

weixin_39776817的博客

11-29

143

前面我们用pandas做了一些基本的操作，接下来进一步了解数据的操作，数据清洗一直是数据分析中极为重要的一个环节。数据合并在pandas中可以通过merge对数据进行合并操作。import numpy as npimport pandas as pddata1 = pd.DataFrame({'level':['a','b','c','d'],'numeber':[1,3,5,7]})data2=...

Pandas 索引转置函数stack(),unstack()详解

最新发布

bbaaa123的博客

09-21

1804

Pandas 索引转置函数stack(),unstack()详解

利用python进行数据分析

LanceJerry的博客

12-03

598

利用python进行数据分析（其四）数据规整：聚合、合并和重塑在许多应用中，数据可能分散在许多文件或数据库中，存储的形式将不利用分析，因此可以使用聚合、合并、重塑数据的方法来对数据进行规整。 1.层次化索引层次化索引是pandas的一项重要功能，可以在一个轴上拥有多个（两个以上）索引级别，因此能以低维度形式处理高纬度数据。举例来说明： In [9]: data = pd.Series(np....

Pandas之stack()和unstack()用法

lightis_tian的博客

04-06

2万+

学习pandas的时候一直搞不清stack()和unstack()，看起来就是把df转了转但一直不知道具体原理。看了【Python】pandas轴旋转stack和unstack用法详解后，觉得清楚了很多，再结合《利用python进行数据分析》的解释和例子，写下这篇博客作一个总结和思考。 stack()即“堆叠”，作用是将列旋转到行 unstack()即stack()的反操作，将行旋转到列看个栗...

dataframe 的reset_index()——问答帖

诡途的博客

10-26

8231

在一个python交流学习群里看到的一个问题，这里之所以单独拿出来写一下是因为：我一开始也犯过这个错，而且很多人都犯过问：想问一下，这个在reset_index重新定义索引后，为什么columns[0]不是对应的data吗？（这本书是《利用python进行数据分析》——学Python的话很经典的一本书）图片不知道清不清晰，贴下代码 ldata=data.stack().reset_ind...

【Pandas】pandas.lreshape详解与实战应用：长格式数据重塑的利器，用于将宽格式的数据转换为长格式。长格式数据在处理多变量数据、时间序列分析和绘图时更为实用

科技改变人类，技术成就未来

08-04

1114

在数据分析和处理过程中，经常需要对数据进行重塑操作，以便更好地适应分析需求。pandas.lreshape 是 Pandas 提供的一个函数，用于将宽格式的数据转换为长格式。长格式数据在处理多变量数据、时间序列分析和绘图时更为实用。本文将详细介绍 pandas.lreshape 的用途和用法，包括其参数详解、示例代码以及进阶使用技巧。

pandas中数据框的reshape操作

庐州月光的博客

06-26

5905

欢迎关注”生信修炼手册”!数据框的长宽转换对于熟悉R语言的朋友而言，应该不会陌生。使用ggplot2画图时，最常用的数据处理就是长宽转换了。在pandas中，也提供了数据框的长宽转换功能...

浅谈pandas stack和unstack函数

qq_42006613的博客

10-30

2267

说明 Stack: 将数据的列索引转换为行索引(列索引可以简单理解为列名) Unstack: 将数据的行索引转换为列索引作用执行stack是一个层次化的过程，即由原来表格数据结构转化为树形结构。 Unstck反之。值得注意的是运行后数据类型有dataframe转化为series 样例：原始数据：执行stack操作：相当于将第一行转化为二级索引 data = pd.read_excel('e:\\1.xlsx',index_col=[0]) print(data.stack()

去除使用pivot_table后产生的多重索引

未央的博客

02-23

6469

参考来源将列中的重复索引删除 pro_data.columns = pro_data.columns.droplevel(0) 使用reset_index()将行的多重索引去除但是此时name和glass_id仍为索引 pro_data = pd.concat([pro_data,pd.DataFrame(data=pro_data.index.tolist(),columns=[p...

但行好事，莫问前程。

08-31

1万+

0.背景在Pandas的使用中，常常需要到行列切换的情况，即所谓的数据透视表，这里根据Pandas当中的此类专题进行总结，主要解析pivot，melt，stack，unstack几个函数的使用。** 1.pivot（一定要看下pivot_table） pivot做的就是从源数据构造透视表的过程，透视表是在数据统计中一个数据汇总的方式。pivot使用例子如下所示。 import pan...

python/pandas数据分析（十三）-数据清理、转换、合并，重塑

python|大数据爱好者Alvin

01-01

1万+

合并数据结构pandas.merge 根据一个或多个键将不同DataFrame中的行连接起来。pandas.concat 沿着一条轴将多个对象堆叠起来具体可以参考之前专门讲数据合并的章节索引上的合并有时，DF中的链接键位于其索引中。left_index=True or right_index=True(or 两个都传入)以说明索引应该被用作链接键left1=pd.DataFrame({'key':l

Python—pandas之reshape(1,-1)

qq_45986917的博客

01-26

6562

在创建DataFrame的时候我们常常会用reshape函数来更改数据的列数和行数。 reshape可以用于numpy库里的ndarray和array结构以及pandas库里面的DataFrame和Series结构。 reshape（行，列）可以根据指定的数值将数据转换为特定的行数和列数。然而，在实际使用中，特别是在运用函数的时候，系统经常会提示是否需要对数据使用reshape(1,-1)或者reshape(-1,1)进行转换，那这两个转换是什么意思呢？难道还有-1行的数据？实际上.