SAM-2全面来袭,能够分割任意图像和视频,代码开源!

SAM-2

摘要:

在SAM之上加入记忆模块,相比于SAM,SAM2有以下提升:

  • 支持任意长视频实时分割
  • 实现zero-shot泛化
  • 分割和追踪准确性提升
  • 解决遮挡问题

SAM2的核心思路是将图像视作单帧视频

  • 从SAM直接扩展至视频领域,同时支持图像和视频输入。
  • 处理视频唯一的区别在于,模型需要依赖内存来回忆处理过的信息,以便在当前时间步长上准确分割对象。

进行交互式分割的过程主要分为两步:选择和细化

  • 在第一帧中,用户通过点击来选择目标对象,SAM2根据点击自动将分割传播到后续帧,形成时空掩码。
  • 如果SAM2在某些帧中丢失了目标对象,用户可以通过在新一帧中提供额外的提示来进行校正。
  • 如果在第三帧中需要需要恢复对象,只需在该帧中点击即可。

方法

PVS task

Promptable Visual Segmentation (PVS) task :提示视觉分割任务

  • 把静态的图像分割任务扩展到动态的多帧图像即视频分割任务
  • PVS与静态图像和视频领域的多个任务相关。在图像上,SA任务可以被视为PVS的一个子集,其中视频被简化为单个帧。

模型结构

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值