swintransformer tensorrt

原创已于 2022-03-11 11:12:00 修改 · 3.4k 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

于 2022-03-11 11:10:13 首次发布

本文介绍了如何将PyTorch模型导出为ONNX格式，特别提到argmax操作不建议直接导出，因为会导致推理结果出错。解决方法是使用C++重写argmax的后处理步骤。此外，针对TensorRT 8.2.3，无需自定义插件，layernorm和gelu等操作能够成功解析并进行推理。

pytorch版本导出onnx的代码大致雷同，op12，定义input,outname，唯一注意的是最后一层argmax不要onnx导出。这个op用onnx导出直接导致推理结果全为0.

如果还有提示pad的错误，可以直接修改inputsize为7的整数倍，去掉pad部分的代码。

tensorrt版本本次选用8.2.3,不需要自定义plugin,layernorm ,gelu都能正确解析推理。

argmax的后处理直接用c++重写，适用于分割。

标签

#深度学习 #pytorch #人工智能

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

josiechen 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。