感知损失的pytorch实现

最新推荐文章于 2026-05-21 06:06:42 发布

原创

最新推荐文章于 2026-05-21 06:06:42 发布 · 6.4k 阅读

收录于

当前文章被以下社区和专栏收录：

该博客介绍了感知损失函数的概念，它解决了像素级损失函数在图像错位时导致的较大误差问题。感知损失通过VGG网络提取图像的语义特征来计算损失，降低了对像素精确匹配的依赖。文中给出了使用torch.nn.MSELoss()作为内容损失的PyTorch实现代码，并展示了如何在实际损失计算中结合感知损失和像素级损失。

常用的损失函数如torch.nn.MSELoss()、torch.nn.L1Loss()计算的是两幅图像间像素位置一一对应的像素级的损失函数。对于一种极端情况：两幅完全一样的图像但对应的像素位置错开一个像素的距离，像素级损失函数计算出来的效果往往比较大，但人眼观察两幅图像几乎没有差距。
感知损失函数是一种能理解图像语义信息的损失函数，它利用一个Vgg网络提取出图像的特征信息，并利用这些特征信息做loss，能够有效解决上述像素级损失函数的问题。以下是感知损失的pytorch实现代码：
定义感知损失

# Loss functions
class PerceptualLoss():
	def contentFunc(self):
		conv_3_3_layer = 14
		cnn = models.vgg19

标签

#pytorch #python #深度学习

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ZJU_Nature

关注关注

8
点赞
踩
35

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【损失函数：3】感知损失：Perceptual Loss、总变分损失（TV Loss）（附Pytorch实现）

NorthSmile的博客

09-28

1万+

提出感知损失的概念，用于实时超分辨任务和风格迁移任务，后来也被应用于更多的领域，在图像去雾方向也有不少工作使用到了感知损失，所以这里就细看一下感知损失具体是什么，该如何构造（说个题外话：我之前做实验，用VGG提取特征构造感知损失狂爆内存，然后直接放弃了，都怪设备太垃圾啊！！！）。

损失函数——感知损失（Perceptual Loss）

weixin_50752408的博客

03-15

2万+

例如，VGG-19网络中的卷积层可以提取图像的纹理和结构信息，而网络的全连接层可以提取图像的语义信息。感知损失的计算方式通常是将输入图像和目标图像分别通过预训练的神经网络，得到它们在网络中的特征表示。与传统的均方误差损失函数（Mean Square Error，MSE）相比，感知损失更注重图像的感知质量，更符合人眼对图像质量的感受。其中，x 是输入图像，y 是目标图像，Fi(x) 和 Fi(y) 分别表示它们在预训练的神经网络中的第 i 层的特征表示，N 是特征层数。然后我们创建了损失函数。

4 条评论您还未登录，请先登录后发表或查看评论

(二) PyTorch实现perceptual loss

zyr_freedom的博客

03-26

4697

另一个版本，但是本质时一样的： import torch import torch.nn as nn import torch.nn.functional as F from torch.autograd import Variable from math import exp import numpy as np from torchvision import models import os,cv2 device = torch.device("cuda" if torch.cuda.is_ava

感知损失：VGG损失（VGG损失是训练过程中的损失函数，用来优化模型参数）【不直接比较两张图像的像素差异，而是比较它们经过预训练VGG网络后，在特征空间中的差异】

u013250861的博客

05-05

461

VGG 损失是一种典型的感知损失。它不直接比较图像像素，而是利用预训练 VGG 网络提取特征，然后比较真实图像和生成图像在特征空间中的差异。LVGG∣∣ϕlx−ϕlx∣∣LVGG∣∣ϕlx−ϕlx∣∣相比像素损失，VGG 损失更关注图像的视觉质量、纹理结构和语义相似性，因此在超分辨率、风格迁移、图像修复和图像生成任务中非常常见。一句话总结：VGG 损失衡量的不是“像素是否一样”，而是“看起来是否像”。

损失函数技术总结及Pytorch使用示例

limingmin2020的博客

01-04

488

本文对损失函数的类别和应用场景，常见的损失函数，常见损失函数的表达式，特性，应用场景和使用示例作了详细的总结。

Pytorch Feature loss与Perceptual Loss的实现

xiongxyowo的博客

03-12

1万+

本文主要改动自：https://github.com/sowmyay/medium/blob/master/CV-LossFunctions.ipynb 首先回顾下特征损失(Feature loss)或者感知损失(Perceptual Loss)的初衷：许多损失函数，如L1 loss、L2 loss、BCE loss，他们都是通过逐像素比较差异，从而对误差进行计算。然而，有的时候看起来十分相似的两个图像(比如图A相对于图B只是整体移动了一个像素)，此时对人来说是几乎看不出区别的，但是其像素级损失(pi.

感知损失的计算pytorch实现

qq_46401672的博客

08-20

635

感知损失的计算pytorch实现

超越像素：用PyTorch实现感知损失(Perceptual Loss)驱动图像生成

weixin_29081101的博客

03-14

本文深入探讨了如何利用PyTorch实现感知损失（Perceptual Loss）以提升图像生成质量。通过对比传统像素级损失（如MSE）的局限性，文章阐述了感知损失的核心原理：借助预训练的VGG网络提取高级语义特征进行比较，从而引导模型生成视觉上更自然、结构更连贯的图像。详细介绍了从钩子机制到完整FeatureLoss类的实现步骤，并提供了针对风格迁移、超分辨率等任务的实战调参指南。

别再只用L1/L2了！图像修复实战：用PyTorch手把手教你实现感知损失与边缘损失

weixin_30379531的博客

03-31

443

本文深入探讨了图像修复中超越传统L1/L2损失的进阶方法，重点介绍了感知损失与边缘损失的PyTorch实现。通过实战代码演示和调参技巧，帮助开发者解决图像修复中的过度平滑、语义失真等问题，显著提升修复质量。感知损失通过VGG特征空间计算差异，能有效捕捉语义信息，是图像恢复领域的重要技术突破。

【PyTorch学习笔记】一、两个全连接层的感知机实现（损失函数及优化器的使用）

小昊同学

05-31

1870

import torch from torch import nn # 全连接类 class Linear(nn.Module): def __init__(self, in_dim, out_dim): super(Linear, self).__init__() # Parameter 为Tensor的构造方法，默认求导 # w b 为网络需要学习的参数 self.w = nn.Parameter(torch.randn(in_d.

告别模糊边界：手把手教你用PyTorch实现医学图像分割中的边界感知损失（附代码）

热门推荐

Drug discovery

05-14

4万+

本文来自收费专栏：https://blog.csdn.net/nanhuaibeian/article/details/102668095 目录一.感知损失二、Loss_feature 三、Loss_style 一.感知损失图中：蓝线加黑线表示内容损失，作用在较低特征层上红线和黑线表示风格损失，作用在从低到高所有特征层上这个结构和GAN较为相似左边是Transform Net: fw，起着条件生成器的作用， pix2pix GAN 的生成器就也...

PyTorch自定义损失函数实现

新缸中之脑

02-11

2295

MNIST 数据集是广泛用于图像分类任务的数据集，它包含 70,000 张手写数字图像，每张图像的分辨率为 28x28 像素。任务是将这些图像分类为 10 个数字之一 (0–9)。此任务旨在根据 MNIST 数据集中提供的训练示例训练一个模型，该模型可以准确地对手写数字的新图像进行分类。此任务的典型方法是使用多类逻辑回归模型，它是一个 softmax 分类器。softmax 函数将模型的输出映射到 10 个类别的概率分布。交叉熵损失通常用作此类模型的损失函数。

【Python/Pytorch - 网络模型】-- 手把手搭建3D VGG感知损失模型

银尘博客

06-13

1149

感知损失：对于提升图片的肉眼可见细节，效果十分明显；对于一些指标如（SSIM、PSNR）这些，效果不明显。

深度学习从入门到精通——感知损失介绍及基本实现

swpucwf的博客

09-04

6386

Perceptual Losses感知损失感知损失图像转换问题（image transformation tasks），输入一副图像转换成另一幅图像输出。现有方法来解决的图像转换问题，往往以监督训练的方式，训练一个前向传播的网络，利用的就是图像像素级之间的误差。这种方法在测试的时候非常有效，因为仅仅需要一次前向传播即可。但是，像素级的误差没有捕获输出和ground-truth图像之间的感知区别（perceptual differences）。高质量的图像可以通过定义和优化perceptual loss

Perceptual Loss（感知损失）&Perceptual Losses for Real-Time Style Transferand Super-Resolution论文解读

qq_40962125的博客

01-10

7409

感知损失通过一个固定的网络（VGG16,VGG19..），分别用prediction 和 groundtruth作为VGG16输入，得到对应的输出特征，pre-vgg，gt-vgg。注：往往pre-loss（感知损失）为正则项，需要配合其他损失函数进行指导，可以通过自定参数调节感知损失的惩罚（调节）力度。在提取特征时，通常不会只使用一层的特征，而是使用网络中浅层，中层，深层特征，进行组合。2.送入prediction和ground truth分别通过VGG前向，并得到pre-vgg，gt-vgg。

感知机Perceptron

weixin_39861267的博客

11-03

1042

感知机

感知机根据不同分布数据样本得到不同的损失值（基于pytorch），简单理解算法收敛性问题

zzr

05-24

549

# 测试函数最常用来解决的一个问题：算法最后结果是不是收敛的 ''' 比如我们想用一条线去分割一个数据集将他分成两个类别-----》这里我们用感知机算法来测试一下 ''' ''' 感知机一般只能解决线性分类问题也就是说图像是这个样子的,我们目的是找到一条线讲他们分开 ''' import matplotlib.pyplot as plt import numpy as np X = [[1...