Python数据可视化--Matplotlib--入门

简介: Python数据可视化--Matplotlib--入门

Matplotlib介绍

1. Matplotlib 是 Python 中常用的 2D 绘图库,它能轻松地将数据进行可视化,作出精美的图表。


2. Matplotlib 这个模块很庞大,最常用的是其中一个子模块——pyplot 。


import matplotlib.pyplot as plt

pyplot模块

1. pyplot 中最基础的作图方式是以点作图,即给出每个点的坐标,pyplot 会将这些点在坐标系中画出,并用线将这些点连起来。

import numpy as np
import matplotlib.pyplot as plt
 
x=np.arange(0,2*np.pi,0.1) 
# 生成一个从 0 到 2π 的数组,步长是 0.1。
y=np.sin(x) 
# numpy 中计算正弦函数的方法,我们将 x 的值传进去就得到对应的正弦值。
plt.plot(x,y) 
#有了 x 和 y 的值之后,将其分别传入 plt.plot() 方法,pyplot 会将其转换成对应的坐标。
plt.show()
# 将这些坐标连成线就得到了函数的图像,最后调用 plt.show() 方法就能将图像显示出来了。

2. 其实对于每一对 x 和 y,还有一个可选的格式化参数,用来指定线条的颜色、点标记和线条的类型。

import numpy as np
import matplotlib.pyplot as plt
# 设置字体为黑体,防止报错
plt.rcParams['font.family'] = ['SimHei']
# 生成对应数组
x = np.arange(0, 2 * np.pi, 0.1)
y1 = np.sin(x)
y2 = np.cos(x)
# 生成对应函数
plt.plot(x, y1, 'ro--')  # 正弦函数图像
plt.plot(x, y2, 'b*-.')  # 余弦函数图像
# 等价于 plt.plot(x, y1, 'ro--', x, y2, 'b*-.')
plt.show()

呈现图分类

1. 按照数据展示的目标可以把它们分为五种,分别是:趋势、比较、构成、分布和联系。


2. 趋势:这是最常见的一种时间序列关系,关心数据如何随着时间变化,趋势类里的图表能直观反映出每年、每月、每天的变化趋势,增长、减少、上下波动还是基本不变。最常见的是折线图,它能很好地表现指标随时间呈现的趋势。


3. 构成:主要关注每个部分占整体的比例。展示构成关系的图表类型里,最常见的就是饼壮图。


4. 比较:可以展示某个维度上的排列顺序,分析某维度之间的对比是差不多,还是 “大于”、“小于”,


5. 分布:当你关心数据集中、频率、分布时,比如根据地理位置数据,通过地图来展示不同分布特征。比较常用的图表有地图、直方图、散点图。


6. 联系:主要查看两个变量之间是否表达出我们预期所要证明的相关关系。


绘制折线图

1. plt.rcParams['font.family'] = ['SimHei'],再绘图之前先把字体设置成黑体,防止报错。


2. 加图例很简单,只要在调用 plt.plot() 方法时传入 lable 参数,接着用 plt.legend() 方法显示图例即可。

import matplotlib.pyplot as plt
 
x = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
y1 = [61, 42, 52, 72, 86, 91, 73]
y2 = [23, 26, 67, 38, 46, 55, 33]
# 修改字体
plt.rcParams['font.family'] = ['SimHei']
# 传入 label 参数
plt.plot(x, y1, label='商品 A')
plt.plot(x, y2, label='商品 B')
# 显示图例
plt.legend()
# 绘制图片
plt.show()


1. 如果想自行选择图例位置的话可以通过 plt.legend() 方法的 loc 参数实现。


2. 我们还可以通过 plt.xlable() 和 plt.ylable() 方法来设置 x 轴和 y 轴的标签.


3. 还能通过 plt.title() 给图表设置标题。


plt.legend(loc='lower right')
# 设置 x 轴标签
plt.xlabel('时间')
# 设置 y 轴标签
plt.ylabel('销量')
# 设置图表标题
plt.title('商品销量对比图')

绘制柱状图

普通柱状图

1. 调用 plt.bar() 方法即可,我们需要传入两个参数。


2. 第一个参数是 x 轴上刻度的标签序列。


3. 第二个参数则用于指定每个柱子的高度,也就是具体的数据。


4.  plt.bar() 还有一些可选参数,常用的有 width 和 color,分别用于设置柱子的宽度和颜色。

import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
names = ['篮球', '羽毛球', '乒乓球']
nums = [26, 20, 19]
plt.bar(names, nums, width=0.6, color='skyblue')
plt.show()

堆叠柱状图

1. 堆叠柱状图不仅可以展示每一个分类的总量,还能展示该分类包含的每个小分类的大小及占比,因此非常适合处理部分与整体的关系。


2. 多调用了一次 plt.bar() 方法,并传入了 bottom 参数。每调用一次 plt.bar() 方法就会画出对应的柱状图,而 bottom  参数作用就是控制柱状图低端的位置。


import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
 
names = ['篮球', '羽毛球', '乒乓球']
nums_boy = [16, 5, 11]
nums_girl = [10, 15, 8]
 
plt.bar(names, nums_boy, width=0.6, color='skyblue', label='男')
plt.bar(names, nums_girl, bottom=nums_boy, width=0.6, color='pink', label='女')
plt.legend()
plt.show()

分组柱状图

1. 分组柱状图经常用于不同组间数据的比较,这些组都包含了相同分类的数据。


2. 首先使用 np.arange(3) 方法创建了一个数组 x,值为 [ 0 1 2 ],并定义了一个变量 width 用于指定柱子的宽度。


3. 在调用 plt.bar() 时,第一个参数不再是刻度上的标签,而是对应的刻度。以 [ 0 1 2 ] 为基准,分别加上和减去柱子的宽度得到 [-0.15 0.85 1.85] 和 [0.15 1.15 2.15],这些刻度将分别作为两组柱子的中点,并且柱子的宽度为 0.3。


4. 因此,我们还要调用 plt.xticks() 方法来将 x 轴上刻度改成对应的标签。该方法的第一个参数是要更改的刻度序列,第二个参数是与之对应的标签序列。

import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
x = np.arange(3)
width = 0.3
 
names = ['篮球', '羽毛球', '乒乓球']
nums_boy = [16, 5, 11]
nums_girl = [10, 15, 8]
 
plt.bar(x - width / 2, nums_boy, width=width, color='skyblue', label='男')
plt.bar(x + width / 2, nums_girl, width=width, color='pink', label='女')
plt.xticks(x, names)
plt.legend()
plt.show()

饼图

1. 饼图用于表示不同分类的占比情况,通过弧度大小来对比各种分类。


2. 饼图的画法很简单,只要传入数据和对应的标签给 plt.pie() 方法即可。但为了让饼图更加直观清晰,需要了解一些额外的参数:参数 autopct 则给饼图自动添加百分比显示。


3. 还能通过 explode 参数来让饼图中的某一部分突出显示,来强调某项数据。


4. 默认 explode 参数里的元素都是 0,我们将需要突出显示的部分对应位置的值设大一点,就能将对应的区块抽离出来突出显示。这个数值越大,抽离的效果就越明显。

import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
 
data = [64745.2, 364835.2, 489700.8]
labels = ['第一产业', '第二产业', '第三产业']
explode = (0.1, 0, 0)
 
plt.pie(data, explode=explode, labels=labels, autopct='%0.1f%%')
plt.show()

致谢

感谢您花时间阅读这篇文章!如果您对本文有任何疑问、建议或是想要分享您的看法,请不要犹豫,在评论区留下您的宝贵意见。每一次互动都是我前进的动力,您的支持是我最大的鼓励。期待与您的交流,让我们共同成长,探索技术世界的无限可能!

相关文章
|
2月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
409 7
|
2月前
|
数据可视化 关系型数据库 MySQL
基于python大数据的的海洋气象数据可视化平台
针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。
|
3月前
|
数据采集 Web App开发 自然语言处理
新闻热点一目了然:Python爬虫数据可视化
新闻热点一目了然:Python爬虫数据可视化
|
3月前
|
测试技术 开发者 Python
Python单元测试入门:3个核心断言方法,帮你快速定位代码bug
本文介绍Python单元测试基础,详解`unittest`框架中的三大核心断言方法:`assertEqual`验证值相等,`assertTrue`和`assertFalse`判断条件真假。通过实例演示其用法,帮助开发者自动化检测代码逻辑,提升测试效率与可靠性。
390 1
|
2月前
|
Cloud Native 算法 API
Python API接口实战指南:从入门到精通
🌟蒋星熠Jaxonic,技术宇宙的星际旅人。深耕API开发,以Python为舟,探索RESTful、GraphQL等接口奥秘。擅长requests、aiohttp实战,专注性能优化与架构设计,用代码连接万物,谱写极客诗篇。
Python API接口实战指南:从入门到精通
|
2月前
|
存储 Java 调度
Python定时任务实战:APScheduler从入门到精通
APScheduler是Python强大的定时任务框架,通过触发器、执行器、任务存储和调度器四大组件,灵活实现各类周期性任务。支持内存、数据库、Redis等持久化存储,适用于Web集成、数据抓取、邮件发送等场景,解决传统sleep循环的诸多缺陷,助力构建稳定可靠的自动化系统。(238字)
617 1
|
3月前
|
数据采集 数据可视化 关系型数据库
基于python大数据的电影数据可视化分析系统
电影分析与可视化平台顺应电影产业数字化趋势,整合大数据处理、人工智能与Web技术,实现电影数据的采集、分析与可视化展示。平台支持票房、评分、观众行为等多维度分析,助力行业洞察与决策,同时提供互动界面,增强观众对电影文化的理解。技术上依托Python、MySQL、Flask、HTML等构建,融合数据采集与AI分析,提升电影行业的数据应用能力。
|
3月前
|
调度 数据库 Python
Python异步编程入门:asyncio让并发变得更简单
Python异步编程入门:asyncio让并发变得更简单
239 5
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
|
数据可视化 数据挖掘 Linux
震撼发布!Python数据分析师必学,Matplotlib与Seaborn数据可视化实战全攻略!
在数据科学领域,数据可视化是连接数据与洞察的桥梁,能让复杂的关系变得直观。本文通过实战案例,介绍Python数据分析师必备的Matplotlib与Seaborn两大可视化工具。首先,通过Matplotlib绘制基本折线图;接着,使用Seaborn绘制统计分布图;最后,结合两者在同一图表中展示数据分布与趋势,帮助你提升数据可视化技能,更好地讲述数据故事。
318 1

推荐镜像

更多