Power Query逆透视列实战:电商销售数据从宽表变长表的完整指南
电商数据分析师每天都要面对海量的销售数据报表,其中最常见的就是按月份横向排列的宽表结构。这种"产品ID_月份"的表格虽然便于人工查看,但在进行深度分析时却成了绊脚石。本文将带你彻底掌握Power Query的逆透视技术,将杂乱无章的宽表转换为分析友好的长表结构。
1. 理解宽表与长表的本质区别
在电商数据分析中,我们通常会遇到两种典型的数据结构:
宽表(Wide Format)示例:
| 产品ID | 产品名称 | 1月销售额 | 2月销售额 | 3月销售额 |
|---|---|---|---|---|
| P1001 | 智能手表 | 15,200 | 18,500 | 22,100 |
| P1002 | 无线耳机 | 9,800 | 12,300 | 14,600 |
长表(Long Format)示例:
| 产品ID | 产品名称 | 月份 | 销售额 |
|---|---|---|---|
| P1001 | 智能手表 | 1月 | 15,200 |
| P1001 | 智能手表 | 2月 | 18,500 |
| P1001 | 智能手表 | 3月 | 22,100 |
| P1002 | 无线耳机 | 1月 | 9,800 |
| P1002 | 无线耳机 | 2月 | 12,300 |
| P1002 | 无线耳机 | 3月 | 14,600 |
宽表看似紧凑,但实际上存在三大致命缺陷:
- 分析工具不友好:大多数BI工具(如Power BI、Tableau)都需要长表格式才能进行有效分析
- 扩展性差:每新增一个月份就需要添加一列,导致表格结构频繁变动
- 计算复杂度高:跨月份的比较计算需要编写复杂的跨列公式
提示:长表结构是关系型数据库的标准格式,也是现代数据分析工具的首选输入格式。它遵循"每个变量一列,每个观察一行"的整洁数据(

220

被折叠的 条评论
为什么被折叠?



