回答了问题2022-12-23
例如,在 Hashtable 中,Entry<?,?> 表示 Hashtable 内部使用的数据结构,用来保存键值对。但是,由于 Hashtable 的键和值的类型是不确定的,所以使用 Entry<?,?> 来保存数据可以让 Hashtable 可以接受任意类型的键和值。
发布了文章2021-12-29
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文剖析一下ACIQ 对称量化算法实现,以 Tengine 的实现为例。 这是量化实现的第三篇,前面还有一、二,有兴趣的同学可以查阅 (1) ...
发布了文章2021-12-27
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文介绍了全志 XR806 say hello world 实现。 咱们之前已经完成了 XR806 鸿蒙系统的固件编译和固件烧录,得到的终端输出类似这样: ...
发布了文章2021-12-22
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本教程详细记录了全志 XR806 OpenHarmony 鸿蒙系统固件烧录的方法。 在上一篇文章《【嵌入式AI】全志 XR806 OpenHarmony 鸿蒙系统固...
发布了文章2021-12-21
XR806 是全志科技旗下子公司广州芯之联研发设计的一款支持 WiFi 和 BLE 的高集成度无线 MCU 芯片,支持鸿蒙 L0 系统。具有集成度高、硬件设计简单、BOM 成本低、安全可靠等优点。可广泛满足 智能家居、智慧楼宇、工业互联、儿童玩具、电子竞赛、极客DIY 等领域的无线...
发布了文章2021-12-17
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文剖析一下 KL 对称量化算法实现,以 Tengine 的实现为例。 前面已经写过一篇《【模型推理】量化实现分享一:详解 min-max 对称量...
发布了文章2021-12-15
Tengine 是 OpenAILab 开源的优秀端侧深度学习推理框架,其核心主要由 C 语言实现,包裹的功能代码嵌套了 C++。量化是推理加速必不可少的优化环节,成熟的推理框架一般会把量化模块剥离出来形成独立的一套工具,如 Tengine、NCNN、昇腾、寒武纪都这么做,这主要是...
发布了文章2021-12-13
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 本文介绍一下 Tengine 模型转换及量化流程。 Tengine 同 ncnn 一样,也是优秀的端侧推理框架,前面写过一篇《ncnn 模型转换及量化流程》,有兴趣的同学可以...
发布了文章2021-12-10
前面写过一篇《【经验分享】win10 qmake 构建 ncnn vs 工程》,介绍了在 win10 上使用 nmake 和 qmake 构建 ncnn vs 工程的方法,这里用 cmake 来走一遍 Tengine vs 工程的构建。大家知道,ncnn 和 Tengine 都是低算力场景十分受欢迎的深度学习推理框架,而 cmake ...
发布了文章2021-12-08
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文介绍了用 C++ 实现一般模型推理图片预处理的方法,通用性较强。 大家知道,对于一个视觉深度学习应用来说,主要会涉及几个流程...
发布了文章2021-12-06
Go 语言是 Google 开发的开源编程语言,于 2009 年 11 月开源,由于它从底层原生支持并发,所以 Go 语言在多核并发上拥有原生的设计优势。Go 语言现在发展的很快,其近 C 的执行性能和近解释型语言的开发效率,以及近乎完美的编译效率,让它风靡全球。
发布了文章2021-12-04
其中安培卡主要包括 A100、A40、A30、A16、A10、A2,老推理卡主要包括 T4、P4、P40、V100,本文主要用于从老推理卡迁移到新安培卡时应该会用到的参数对比调研,属于人肉汇总型,若数据有误,欢迎指正。
发布了文章2021-12-01
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本教程详细介绍了在 linux 下使用 Makefile 快速构建单工程的方法。 本文的亮点是快速构建工程,所以不会长篇大论 Makefile 语法。 ...
发布了文章2021-11-30
关于 cuda 及 cudnn 的安装就不多说了,关于 opencv 的编译可以参考我之前写的《【经验分享】x86、aarch64、arm32环境编译/交叉编译opencv方法》,里面记录了在 x86、aarch64及 arm32 平台上编译 opencv 的方法,简洁有效。
发布了文章2021-11-26
Yolo 系列是工程中应用十分广泛的目标检测算法,特别是从 yolov3 开始,逐步的进化,到 yolov4、yolov5 等,工程的接受度越来越高。而 deepstream 是英伟达提出的一套加速深度学习落地的 pipeline 应用,那么当 deepstream 遇到 yolo,会擦出什么样的火花呢,让我...
发布了文章2021-11-24
pytorch-mlu 逐层模式中算子间数据传递和存储的基本单元是 tensor。pytorch-mlu 根据 tensor 中的 device 属性值将算子分发到不同设备。以 abs() 算子为例,在 dispatch 阶段会根据 input_tensor 的设备属性值将算子调用分发到具体设备,逻辑如下图所示:
发布了文章2021-11-23
使用 python 的 importlib.import_module() 方法能够动态加载 py 脚本,并调用里面的方法,这个操作在某些时候非常管用,功能类似 py 脚本里的 import xxx、from xxx import xxx。
发布了文章2021-11-22
Shared memory 是一块很小、低延迟的 on-chip memory,比 global memory 快上百倍,可以把 shared memory 当作可编程的 cache,主要作用有:
发布了文章2021-11-18
关于 deepstream 的安装可以参考我之前写的文章《【经验分享】ubuntu 安装 deepstream6.0》、《【经验分享】ubuntu 安装 deepstream5.1》,成功安装后会在 /usr/bin 里生成一些例程可执行程序,如 deepstream-app 就是最基础的一个,这里通过这篇文章介绍一下 deep...
发布了文章2021-11-17
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 本文分析下 darknet load_weights 接口,这个接口主要做模型权重的加载。1、darknet 数据加载流程 之前的文章已经介绍了一下 darknet 目标检测的数据加载流...