发布了文章2024-01-05
● v1.13.3 新版本发布[链接]●「MegEngine 开发者说」-编译器上手指南,算子开发及开源项目指导手册[链接]●《MegEngine 优化 dataloader 使用体验!data monitor 帮助更好定位性能瓶颈》[链接]●《MegEngine 正式支持 XLA 啦!》[链接]●《CPU 程序性能优化》[链接]
发布了文章2024-01-02
近日,MegEngine 在 v1.13.3 正式完成了与国内 AI 芯片独角兽寒武纪旗下云端人工智能处理器芯片的兼容性适配。MegEngine 与 寒武纪目前完成了常见 cv 模型的算子适配,这也标志着寒武纪端云一体的人工智能芯片,与 MegEngine 深度学习框架的成功融合。
发布了文章2023-12-19
在训练业务模型过程中,如果我们发现模型的训练速度不符合预期,往往会下意识地认为网络本身出了问题。但实际上,大多数时候问题发生在模型的数据供给逻辑中。
发布了文章2023-12-13
XLA(Accelerated Linear Algebra)是 Google 提出的一个神经网络编译器,可以用于加速 AI 模型的训练和推理。MegEngine 1.13.1 中也已经支持了 XLA,在训练模型时可以选择开启此项功能,不同的模型可以获得 10%~80% 不等的速度提升。
发布了文章2023-12-07
「MegEngine 开发者说」直播课程第二期火爆来袭!本期既有技术大佬带来深度学习编译器 MegCC 的详细教程,又有实习经历丰富的在校同学分享 MegEngine 算子开发流程及开源经历,手把手带你学习,精彩不容错过!更有直播间有奖答疑, 现在报名,即有机会获得 MegEngine...
发布了文章2023-11-17
一个程序首先要保证正确性,在保证正确性的基础上,性能也是一个重要的考量。要编写高性能的程序,第一,必须选择合适的算法和数据结构;第二,应该编写编译器能够有效优化以转换成高效可执行代码的源代码,要做到这一点,需要了解编译器的能力和限制;第三,要了解...
发布了文章2023-11-03
● v1.13.2 新版本发布 [链接] ● MegCC 新版本发布 [链接] ● DataFunSummit2023:AI 基础软件架构峰会 《MegEngine 训练性能优化与 AI 编译实践》主题演讲 [链接] ● MegEngine 开发者说-开源项目分享,实习宝典传授 [链接]
发布了文章2023-09-05
v1.13.1 新版本发布 MegCC 新版本发布【MegEngine 使用小技巧】系列文章1.《MegEngine 使用小技巧:如何使用 MegCC 进行模型编译》2.《MegEngine 使用小技巧:Profiler 使用手册》Imperative 介绍专栏1.《MegEngine Python 层模块串讲(上)》2.《MegEngine Python ...
发布了文章2023-08-30
0.写在前面“xx,R 那边反应多机训练速度慢,你看一下什么情况”“xxx,为什么 MGE 更新之后,xxx 网络训练变慢了,你看一下”这是组内日常对话然后有人日常背锅组员的状态是:提性能,提性能,还是 TMD 提性能据不完全统计,有 80% 的性能问题其实是因为训练代码写的不...
发布了文章2023-08-26
你是否需要 AI 初学者入门级的开源教程?你是否期待和顶尖开发者一起学习,向深度学习领域的大佬看齐?你是否希望通过课程讲解,了解项目实践,掌握深度学习、大模型相关的前沿 AI 技术?如果你的答案是肯定的,那么 「MegEngine 开发者说」系列课程正是你想要的!「...
发布了文章2023-08-17
以最新的 release 版本 release-1.13.0 为例介绍一下 MegEngine 的代码结构以及如何学习 MegEngine 的代码。
发布了文章2023-07-31
在前面的文章中,我们简单介绍了在 MegEngine imperative 中的各模块以及它们的作用。对于新用户而言可能不太了解各个模块的使用方法,对于模块的结构和原理也是一头雾水。Python 作为现在深度学习领域的主流编程语言,其相关的模块自然也是深度学习框架的重中之重。
发布了文章2023-07-28
在前面的文章中,我们简单介绍了在 MegEngine imperative 中的各模块以及它们的作用。对于新用户而言可能不太了解各个模块的使用方法,对于模块的结构和原理也是一头雾水。Python 作为现在深度学习领域的主流编程语言,其相关的模块自然也是深度学习框架的重中之重。
发布了文章2023-07-21
在前面的文章中,我们简单介绍了在 MegEngine imperative 中的各模块以及它们的作用。对于新用户而言可能不太了解各个模块的使用方法,对于模块的结构和原理也是一头雾水。Python 作为现在深度学习领域的主流编程语言,其相关的模块自然也是深度学习框架的重中之重。
发布了文章2023-07-06
MegEngine 作为一个训推一体的 AI 框架,为用户提供了模型训练以及部署的能力。但是在部署模型时,由于会存在对于部署的模型计算来说不必要的代码,导致 SDK 体积比较大。为了解决上述问题,我们提供了新的工具:AI 编译器 MegCC。
发布了文章2023-06-16
在之前的文章中我们介绍过 MegEngine 的 Imperative Runtime 以及它与 MegBrain、MegDNN 的关系,这篇文章中我们将介绍 Imperative 中包含的常用组件。
发布了文章2023-06-14
MegCC 是一个深度学习模型编译器,具有以下特点:极轻量级运行时:只在二进制文件中保留所需的计算内核。例如,MobileNet v1 的81KB运行时间高性能:每个操作都经过专家精心优化便携:只生成计算代码,易于在 Linux、Android、TEE、BareMetal 上编译和使用Low Memory...
发布了文章2023-06-08
众所周知,开源深度学习框架旷视天元(MegEngine)是旷视自主研发的国产工业级深度学习框架 ,是旷视新一代 AI 生产力平台 Brain++ 的最核心组件,在2020年3月正式向全球开发者开源。MegEngine 凭借其训练推理一体、超低硬件门槛和全平台高效推理 3 大核心优势,帮助...
发布了文章2023-05-30
MegCC 是一个真真实实的深度学习模型编译器,具备极其轻量的 Runtime 二进制体积,高性能,方便移植,极低内存使用以及快启动等核心特点。用户可在 MLIR 上进行计算图优化,内存规划,最后通过预先写好的 code 模版进行代码生成。
发布了文章2023-05-16
roofline 分析是一种简单评估当前计算任务对当前平台计算/访存能力的利用情况的方法,可以帮助分析算子的优化方向和优化潜力。mperf 实现了安卓 mali/adreno 两种 gpu 平台的 roofline 分析能力,下面以 mali 平台为例,简单介绍一下操作步骤。