专业 英语

CoPaw

CoPaw

AI应用
Qwen
Qwen3

内置vllm部署的Qwen3-4B-Instruct-2507模型,agentscope开源的类似openclaw个人助手。

一、计算机

1.计算机基础

(1)计算机组成原理

缩写英文全称中文释义拓展
TLBTranslation Lookaside Buffer页表缓存、快表是CPU内存管理单元(MMU)中的一种高速缓存,用于加速虚拟地址到物理地址的转换,它存储了最近访问过的页表项,当CPU需要地址转换时,先在TLB中查找,如果命中(hit)则快速获取物理地址,否则(miss)需查询慢速的页表,然后将结果存入TLB
Instruction Set指令集
MMUMemory Management Unit内存管理单元
ALU算术逻辑单元Arithmetic Logical Unit
heuristic启发式的
regregister寄存器
ACK帧acknowledgement frame确认帧
present bit状态位、有效位、存在位、合法位
page frame页框、页帧、物理块、内存块、主存块

(2)计算机网络

缩写英文全称释义拓展
LLCLogical Link Control Sublayer逻辑链路控制子层
Frame
MTUMaximum Transmission Unit最大传输单元
PDUProtocol Data Unit协议数据单元
token令牌计网中的token是用于身份验证的令牌,NLP中的token是词元
CRCCyclic Redundancy Check循环冗余校验码
NATNetwork Address Translation网络地址转换将私有IP地址转换为公有IP地址

①NAT(Network Address Translation,网络地址转换)是一种将私有IP地址转换为公有IP地址的技术,通常用于局域网(LAN)与广域网(WAN)之间的数据通信。它主要用于解决IPv4地址短缺问题,并提高网络安全性。
②IP地址转换:NAT将内部网络的私有IP地址映射为外部网络的公有IP地址,允许多个设备共享一个公有IP地址进行外网通信。
③NAT的工作原理:NAT工作时,它会修改数据包的IP头部,将源IP地址替换为一个公有IP地址,同时记录下源端口和转换后的公有IP与端口的映射。数据返回时,NAT会根据这个映射将数据包转发回原始的内部设备。


(3)软件工程

缩写英文全称中文全称
DFDData Flow Diagram数据流(程)图

(4)数据库

单词中文
index索引
schema模式
key码、键、关键字
attribute属性
relation关系
domain
Cartesian product笛卡尔积
DBA、DataBase Administrator数据库管理员

(5)编译原理

单词释义拓展
parse解析
intermediate code中间代码
optimisation优化
assembly code汇编代码
object code目标代码
linking链接
compiler编译器
closure闭包
augmented增广的augmented grammar 增广文法
augmented matrix 增广矩阵
item
automata自动机Nondeterministic Finite Automada,NFA,不确定的有穷自动机
concrete具体的concrete syntax 具体语法
parse(语法) 分析parsing 分析法
semantic语义
syntax语法abstract syntax tree 抽象语法树
grammar文法LR grammar   LR文法

(6)离散数学

英文中文
Floors and Ceilings上取整和下取整
Difference差分
Inverse Difference逆差分
Forward Difference前向差分
Backward Difference后向差分
Falling Factorial下降阶乘幂
Rising Factorial上升阶乘幂
discrete离散的

(7)设计模式

设计原则:

缩写英文全称中文释义拓展
SOLID5个面向对象原则更宏观的设计原则
DRYDon’t Repeat Yourself不要重复你自己提高代码重用,避免重复代码
KISSKeep It Simple, Stupid保持简单
LODLaw of Demeter最少知识原则
YAGNIYou Aren’t Gonna Need It不要过度设计

2.软件开发

(1)编译

缩写英文全称中文释义
IRIntermediate Representation中间表示

前端:管你什么语言,统统先翻译成同一种 IR。
后端:管你什么硬件,你都只认这同一种 IR,把它转成你的机器码。
这样一来,新增一种语言只需写一个新前端,新增一种硬件只需写一个新后端,完美实现 N 种语言 × M 种硬件的自由组合。


两种编译工具链:GCC、Clang+LLVM

clang+llvm:Clang+LLVM编译工具链,其中Clang编译器

如果把“Clang+LLVM”看作整个项目
它就是一个编译工具链(Compiler Toolchain)。除了编译器 Clang,它还包括:
LLVM 核心库:优化器、代码生成器
链接器 LLD
调试器 LLDB
C/C++ 标准库 libc++/libstdc++(或配合平台的)
各种工具:llvm-ar、llvm-objdump、llvm-nm 等

Clang 是前端,其核心职责是:将 C/C++/Objective-C 源代码,转换为与目标平台无关的 LLVM 中间表示(LLVM IR)。它不负责后续的机器相关优化和最终代码生成。
Clang 的工作链路很清晰:源代码 → 词法分析 → 语法分析 → 语义分析 → 生成 LLVM IR。至此,Clang 的任务就结束了。
判定“前端”身份的依据很明确:处理的是源代码,生成的是 IR,不参与机器码生成。


编译器经典三段式设计:前端-中端(优化器/中间表示)-后端
在这里插入图片描述

vllm:vLLM


(2)编程词汇

缩写英文全称中文释义拓展
instance实例容器实例、dte_instance
fbtermframe buffer terminal帧缓冲终端fbterm 是一个基于 framebuffer(帧缓冲)的终端程序,它能够在没有图形界面的环境中(例如,只提供命令行的环境)提供一个图形化的终端。它的全名是 Framebuffer Terminal,与传统的基于字符的终端(如 xterm)不同,fbterm 直接在帧缓冲设备上渲染字符,从而避免了依赖图形桌面环境(如 X11)或传统的文本控制台。
tuple元组Python数据类型:元组
GCCGNU编译器GNU Compiler Collection
SQL结构化查询语言Structured Query Language
STLStandard Template Library标准模板库
OOP面向对象编程,面向对象的程序设计Object Oriented Programming
lvalue左值
rvalue右值
Abstraction抽象
Encapsulation封装
Inheritance继承
Polymorphism多态
identation缩进
iteration循环
recursion递归
millisecond毫秒ms
undefined reference to …未定义
redefinition重定义
multiple definition多次定义
constructor构造函数
copy constructor拷贝构造函数
destructor析构函数
assignment operator function赋值运算符函数
LFLine Feed换行符\n,ASCII码值是10,十六进制是0a
paraparameter形参
argargument实参
exception异常
subscriptn.下标
catenatev.连接cat
Undefined identifier未定义的标识符
socket套接字
fdfile descriptor文件描述符
-Ssource code源代码
object-oriented面向对象的OO
xxx-oriented基于xxx的
idxindex数组下标
EOFend of file文件结尾while(scanf(“%d”,&n) !=EOF){ }
resresult结果
cntcount数值
retreturn返回值
ptrpointer指针指针就是地址
bufbuffer缓冲区
recursion递归recursive call:递归调用
unwinding recursion:解除递归
compile编译C2143:编译错误
factorial阶乘
mulmultiplyimul 带符号整数乘
varvariable变量
static静态的静态链表:static linked list
operand[计] 操作数;[计] 运算对象
opoperator运算符

(3)开发术语

缩写英文全称中文释义拓展
GUIGraphical User Interface图形化用户界面又称图形用户接口,是指采用图形方式显示的计算机操作用户界面
CLICommand Line Interface命令行界面例如:bash、PowerShell、
TUIText-based User Interface文本用户界面例如:vim、VSCode的终端部分
RegressionRegression Testing回归测试在代码修改后,重新执行之前的测试用例,确保新改动没有破坏原有功能。
目的是防止软件出现 “回归缺陷”(Regression Bug)
即:原本正常的功能,因为新代码的引入而"退化"或"回归"到有问题的状态
RDPRemote Desktop Protocol远程桌面协议它是由微软(Microsoft)开发的一种专有网络通信协议,主要用于允许用户通过网络连接到另一台计算机(通常是运行 Windows 的计算机),并像坐在那台计算机面前一样对其进行图形化控制。
reporepository代码仓库code repository 代码仓库
PRpull request合并请求提交PR
workaround 方案临时解决方案、临时办法暂时无法从根源上解决这个问题,暂时用一种解决方案把这个问题给绕过去,称为workaround
UUIDUniversally Unique Identifier通用唯一标识符
documentation说明文档
SEOSearch Engine Optimization搜索引擎优化
CRUDCreate 创建
Retrieve 检索
Update 更新
Delete 删除
增删改查
UIUser Interface用户界面
APIApplication Programming Interface应用程序编程接口,简称接口
WSLWindows Subsystem for LinuxWindows的Linux子系统
CI/CDContinuous Integration / Continuous Delivery(Deployment)持续集成 / 持续交付(部署)
DevOpsDevelopment & Operations开发和运维
diagDiagnostics诊断指用于监测、测试、诊断、故障排除、性能监控和分析系统性能与状态的工具、模块或系统
ARAction Require需要完成的任务
flow流程、工作流程梳理一下这个活儿的flow写成wiki文档
feature新功能、新特性“Add new feature”通常表示添加了一个新功能或特性。我们用feature,而不用function。
known hosts list已知主机列表
merge合入指代码合并入仓库,即已经过Gerrit平台的CI/CD 和 人工代码review,并且submit,代码合并入库的完成状态。

GUI大模型:Cursor、Github Copilot插件、Claude Code插件
CLI大模型:Claude Code CLI、Openclaw、Gemini CLI


(4)Linux

缩写英文中文拓展
sdSCSI DiskSCSI协议磁盘后面sd扩展为:SCSI/SATA/SSD/USB
LTSLong-Term Support长期支持版本Ubuntu-24.04 LTS:2024年4月发布,支持到2029年
Ubuntu-22.04 LTS:2022年4月发布,支持到2027年
Ubuntu-20.04 LTS:2020年4月发布,支持到2025年
GRUBGRand Unified Bootloader大统一引导加载程序GRUB(GRand Unified Bootloader)是 Linux 系统的启动引导程序
GRUB是一个开源的引导加载程序(Bootloader),主要用于Linux。作用:引导操作系统、多重引导、加载内核、配置文件
BSD 系统Berkeley Software Distribution伯克利软件发行版BSD 系统(Berkeley Software Distribution)是一个源自于 Unix 的操作系统家族。它最初由 加利福尼亚大学伯克利分校(University of California, Berkeley) 的计算机科学实验室开发,最著名的版本是 FreeBSD、OpenBSD 和 NetBSD 等。
ETAEstimated Time of Arrival预计剩余时间
TTYTeletypewriter交互式终端cron就没有TTY,非交互式环境,不可见,属于后台守护进程
UTCCoordinated Universal Time协调世界时
CSTChina Standard Time中国标准时间 (北京,上海)CST = UTC + 8

通过选择UTC这个缩写,避免了语言上的偏袒。例如,英语国家的标准时间常用CUT,而法语国家可能更倾向于使用TUC。为了兼顾两者,采用了UTC,这个缩写没有明显倾向于任何单一语言。


(5)软件

缩写英文全称中文释义
GUIGraphical User Interface图形化用户界面
install安装
uninstall卸载
OCROptical Character Recognition光学字符识别
log in / sign in登录
sign up注册
APPapplication应用程序
launch启动 (计算机程序)
desktop shortcut桌面快捷方式
setup wizard安装向导
spam folder垃圾信箱
AI enthusiastAI爱好者
Release of Liability免责声明

Dont forget to check your spam folder. 不要忘记检查你的垃圾邮箱。


(6)web

缩写英文全称中文释义
XHRXML Http RequestXML HTTP 请求

XHR(XMLHttpRequest)是一个浏览器提供的API,用于在不重新加载整个页面的情况下,与服务器交换数据。它允许网页通过异步方式发送请求并接收响应,从而实现动态加载数据,比如在网页上更新内容而不刷新整个页面。XHR最初是为处理XML数据而设计的,但如今也可以处理JSON、文本或其他类型的数据。
常见的使用场景包括:
①动态加载网页内容(例如,AJAX技术)。
②实时更新页面的数据(如新闻、天气、股票信息等)。
③向服务器提交表单数据而不重新加载页面。


(7)云服务

缩写英文全称中文释义
jumpserver跳板机 / 堡垒机
XNAS纯文件共享、局域网网盘;无权限管理、无版本管理
Nexusnexus 的上传下载的权限管控比xnas更严格些
QosQuality of Service服务质量
SaaSSoftware as a Service软件即服务
IaaSInfrastructure as a Service基础设施即服务
PaaSPlatform as a Service平台即服务

(8)DevOps

缩写英文全称中文释义拓展
CI/CDContinuous Integration / Continuous Deployment (Delivery)持续集成 / 持续部署 (交付)
NGNginx反向代理服务器保护最终服务器的IP,只暴露给用户代理服务器的IP
k8sKubernetes
Node节点Node 是计算资源,它为 Pod 提供资源支持,一个 Node 可以运行多个 Pods。
pod容器组Pod 是部署的单元,它是容器的封装体,多个容器可以在同一个 Pod 内部运行。

(9)工程流程

缩写英文全称中文释义拓展
ECREngineering Change Request工程变更请求

3.深度学习

(1)智能体 Agent

缩写英文中文拓展
ReActReasing & Acting推理+行动模式循环:思考、行动、观察 (走一步看一步)
Claude Code、Codex、OpenClaw都是这个行为模式
Plan-and-Execute先规划,后执行先做攻略,再出发
Cursor是这个行为模式
FARSFully Automated Research System全自动科研多智能体系统FARS由4个智能体组成:
构思智能体(Ideation Agent)、规划智能体(Planning Agent)、实验智能体(Experiment Agent)、写作智能体(Writing Agent)
Stanford Agentic Reviewer斯坦福AI审稿系统吴恩达牵头研发,它的评分结果与人类高度一致,达到了人类专家的审稿水平。
MCPModel Context Protocol模型上下文协议MCP、A2A,都是Agent协议

FARS是由 日行迹公司 (创始人为上海创智学院的助理教授 孙天祥博士) 开发的用于论文写作的并行多智能体系统。在2026年春节期间直播200多个小时产出了100篇论文。它包含构思、规划、实验、写作四个模块。
(1)构思Agent:主要负责调研文献和生成假设。它可以访问公开的论文库和GitLab代码仓。生成的假设要先通过自动化审查,只有审查通过的假设,才会转给规划模块,保证任务基本可行。
(2)规划Agent:负责把idea落地,设计试验方案。比如:确定模型、数据集和评估指标
(3)实验Agent:负责编写和运行代码。它可以调用160张NVIDIA GPU集群,也能调用各类模型接口,能产出数据和图表,具备自我纠错能力。哪怕是负面结果,它也会如实报告。
(4)写作Agent:负责写论文。它会将结果整理成短论文(Short Paper)的格式。无论结果正面还是负面,它都会完整记录。最终论文包含摘要、方法、实验和分析。

FARS的消耗与产出:
(1)消耗:基于160张卡,9.5天,消耗114亿Token(成本约10.4万美元)
(2)产出:生成了244个假设,产出了100篇论文
(3)消耗产出比:约1000美元/篇,2小时/篇,1亿token/篇

FARS的论文质量:
(1)斯坦福AI审稿系统按照ICLR标准打分:均分5.05,超过ICLR投稿均分4.21,接近最终被接受论文的平均分5.39。说明FARS产出论文的均分已经明显高于人类投稿的整体平均水平,距离中稿的平均线也差距不大。
(2)通过读FARS生成的论文:说明大模型非常擅长在既定框架下,通过数据分析找到最优解。

总结:未来,最不值钱的就是idea。
ChatGPT的核心贡献者之一 翁家羿提到:“idea是廉价的,真正的挑战在于如何把这些idea快速、正确的实现和迭代。”


(2)论文

缩写英文中文拓展
** Corresponding author通讯作者* 是通讯作者
## joint first authors共同第一作者# 是共一作者
leverage利用Our approach leverages 3D Gaussian Splatting (3DGS) based …
benchmark基准一套标准化的评估体系
Baseline基线简单传统的基础模型或方法
pipeline流水线一系列按顺序执行的数据处理步骤或阶段
每个步骤负责特定的任务,并将结果传递给下一个步骤,最终完成一个完整的流程。这种设计方式能够使复杂的过程变得模块化和易于管理
SOTAthe current state-of-the-art methods当前最先进的方法指在某一特定任务或数据集上,当前表现最好的模型或方法。
指某一领域或技术中当前最高水平的研究成果或技术方案。它代表了特定时间段内经过验证的最优方法,常用于学术论文或技术报告中凸显创新性和先进性。
survey综述
paper论文
Conference Paper会议论文
Jounal Article期刊论文
Thesis学位论文
open-ended开放式的
approach方法
i.e.id estShe’s studying a STEM subject, i.e., physics. 她在学习STEM学科,也就是物理学。
CCFChina Computer Federation中国计算机协会
propose提出is proposed to address the challenges in
Label Smoothing标签平滑防止模型过拟合和过度自信,导致降低了泛化能力
regularization正则化
scale缩放scaled 缩放
tokenization词元化把一段文字,变成一组Token
OpenAI的GPT,tiktok,1000个token对应750个英文单词或500个汉字
architecture架构
Bibliography参考文献
Literature Review文献综述
Ablation study消融实验通过去除或修改模型的不同模块,来验证每个模块的贡献
case study案例研究
ACMAssociation for Computing Machinery美国计算机协会
IEEEInstitute of Electrical and Electronics Engineers电气电子工程师学会
enumeration枚举
PIPrincipal Investigator独立学术带头人、独立项目负责人

在这里插入图片描述

例如,在机器学习领域,一个典型的pipeline可能包含以下几个步骤:
①数据预处理:包括数据清洗、缺失值填充、异常值处理等。
②特征工程:从原始数据中提取有用的特征,进行特征选择或者创建新的特征。
③模型训练:使用经过处理的数据训练机器学习模型。
④模型评估:对训练好的模型进行评估,检查其准确性和有效性。
⑤模型部署:将训练好的模型部署到生产环境中,以便实时或批量地对新数据进行预测。


(3)深度学习 DL

根据AI领域两位泰斗斯图亚特·罗素(Stuart Russell)和彼得·诺维格(Peter Norvig)合著的经典著作《人工智能:一种现代的方法》,人工智能的核心目标是通过计算机程序或机器来模拟人类智能,涵盖语言理解、问题解决、学习、认知和决策等多方面能力。


PPO、DPO、GRPO都是post-training阶段的大模型对齐算法 (Alignment),都属于RLHF:
(1)PPO是代价最高,效果最好的。(传统在线强化学习方案,训练代价最高、工程最难,效果上限高,但落地成本极高)。[OpenAI的GPT在早期RLHF时用的就是PPO]
(2)DPO是实现最简化的,成本最低,(训练稳定易复现),效果略低于PPO和GRPO。目前业界首选
(3)GRPO属于在DPO和PPO之间取了折中,只牺牲极少效果,就能大幅降低对齐成本,性价比最高。(DPO成本最低,PPO效果最好)。DeepSeek用的便是GRPO对齐算法

GRPO是deepseek能火的一个关键原因之一,在稍微牺牲了一点效果的情况下,大幅度降低了成本
主观打分:
PPO效果10分,DPO效果9分,GRPO效果9.5分
PPO成本10分,DPO成本1分,GRPO成本2.5分


缩写英文全称中文全称核心思想
MoEMixture of Experts混合专家模型MoE将传统单一的"通才"模型拆分为多个功能独立的专家子网络,每个专家专注于处理特定类型的数据或任务
PPOProximal Policy Optimization近端策略优化策略梯度方法:在策略梯度方法中引入"近端约束",防止策略更新幅度过大
DPODirect Preference Optimization直接偏好优化绕过显式的奖励模型(Reward Model),直接从人类偏好数据中学习策略
GRPOGroup Relative Policy Optimization组相对策略优化随机化 + 策略梯度方法:
DeepSeek提出的PPO变体,通过组内采样和相对奖励评估降低训练成本。对每个问题采样一组输出,用组内奖励的相对排名(而非绝对值或单独的价值模型)计算优势函数;省去独立Critic模型,减少显存开销
TRPOTrust Region Policy Optimization信任区域策略优化信任区域 + 策略梯度方法:
通过严格的数学约束确保策略更新在"信任区域"内进行,保证单调改进
train训练训练阶段:分为预训练(pre-train)和后训练(post-train)
inference推理推理阶段:例如有few shot和zero shot
zero-shot learning零样本学习推理阶段:用户用AI模型,直接提问
few-shot learning小样本学习推理阶段:用户用AI模型,举几个例子让AI按照这种规范,再提问
batch size批量大小
epochs迭代轮次
LRlearning rate学习率学习率太高,模型会在最优解附近反复横跳;
学习率太低,模型收敛太慢
Training Set训练集
Validation Set验证集
Test Set测试集
trade-off权衡
activation function激活函数
retrain on启用了重新训练
retrain off禁用了重新训练
MLPMultilayer Perceptron多层感知器
FCFully connected neural network全连接神经网络也被称为 “多层感知机 MLP”。全连接神经网络是前馈神经网络的一个典型实现
FFNFeed-Forward (Neural) Network前馈神经网络“前馈”强调信息流向无环,但不限定层间如何连接——不仅可以是全连接,也可以是稀疏连接(如卷积层)、局部连接等。例如,卷积神经网络(CNN)中的卷积层也是前馈结构,但它并不属于全连接网络。
backbone network主干网络
RLHFReinforcement Learning with Human Feedback基于人类反馈的强化学习、人类反馈对齐
encoder编码器
decoder解码器
Tensor张量
compress压缩
pooling池化
context上下文
sparse稀疏的
semantic语义的,图像区域的,区域分割
FLfederated learning联邦学习分布式机器学习方法
supervised learning强监督学习
weakly supervised learning弱监督学习
semi-supervised learning半监督学习
self-supervised learning自监督学习
unsupervised learning无监督学习
CNNConvolutional Neural Networks卷积神经网络
GANGenerative Adversarial Network生成对抗网络

1.联邦学习(Federated Learning)是一种分布式机器学习方法,它允许模型在多个分散的边缘设备或服务器上进行训练,而不需要将数据集中到一个中心位置。这种方法特别适合于处理敏感数据(如个人隐私信息),因为它减少了数据泄露的风险。
2.联邦学习允许各参与方在本地对数据进行训练,而不是将数据集中到一个中心服务器。通过加密机制下的参数交换,各参与方可以在不泄露数据隐私的情况下,共同构建一个虚拟的全局模型。


(4)计算机视觉 CV

缩写英文全称中文释义拓展
salient object detection显著目标检测
BERBoundary Error Rate边界误差率
MAEMean Absolute Error平均绝对误差
F β F_β FβF-beta scoreFβ 分数综合精确率和召回率的指标,β 用于调整两者权重
Accaccuracy rate准确率
IoUIntersection over Union交并比交集与并集的比率。它是用来衡量两个集合重叠程度的一种指标,通常用于图像分割和目标检测中,评估预测结果与真实标签的匹配程度
mIoUmean Intersection over Union平均交并比
CGFormerCV+Generative Models计算机视觉+图像生成
ViTVision Transformer视觉TransformerViT (Vision Transformer) 是一种用于图像识别的深度学习模型,基于 Transformer 架构,最初由 Google Research 团队于 2020 年提出。
它将 Transformer 应用到计算机视觉任务,打破了卷积神经网络(CNN)在视觉任务中的长期主导地位。
ViT的核心思想是将图像划分为一系列的“补丁” (patches),然后将这些补丁视为序列输入到 Transformer 模型中进行处理。
multimodal多模态
LVLMslarge vision-language models大视觉语言模型
YOLOYou Only Look Once“你只看一次”YOLOv5做目标检测
LLaVALarge Language and Vision Assistant大语言和视觉助手是一种多模态大模型
CLIPContrastive Language-Image Pretraining对比语言-图像预训练也是一种多模态大模型
zero-shot
CLIP的核心思想是通过对比学习(contrastive learning),在图像和文本之间建立一个共享的表示空间,使得模型能够理解和关联图像与文本之间的语义关系
DETRDEtection TRansformers基于Transformer的检测模型
VQAVisual Question Answering视觉问答理解图像内容并回答
ReIDPerson Re-Identification行人重识别
image inpainting图像修复
SRsuper-resolution超分辨率
voxel体素,体元,立体像素
pixel像素
translation invariance平移不变性
SSIMStructural Similarity Index结构相似性指数SSIM 更侧重图像的结构相似度,越接近1表示图像质量越好。
在很多应用中,SSIM 比 PSNR 更能准确反映图像质量,因为它考虑了人眼对图像结构的敏感度。
PSNRPeak Signal-to-Noise Ratio峰值信噪比PSNR 主要衡量图像的像素差异,越大表示图像质量越好
SIFTScale Invariant Feature Transform尺寸不变特征变换

1.ReID(Person Re-Identification,行人重识别) 是计算机视觉领域的一项核心技术,旨在跨不同摄像头或场景识别同一行人。简单来说,它的任务是:给定一个目标行人图像(查询图像),从大量不同摄像头拍摄的候选图像库中,找到属于同一人的图像。主要用于智能安防、智能零售行业。

2.IoU评估单个预测和真实标注之间的重叠程度。
mIoU则是对所有类别的IoU进行平均,常用于多类别的评估
(1)IoU用于评估两个区域(例如预测区域和真实标注区域)之间的重叠程度。它通过计算预测区域与真实区域的交集与并集的比值来衡量:
在这里插入图片描述
其中,A和B分别表示预测区域和真实标注区域。IoU值越高,表示预测的区域与真实标注区域越重合,性能越好。
(2)IoU(mean Intersection over Union): mIoU是IoU在多个类别上的平均值,通常用于评估多分类问题中的性能,特别是在语义分割中。它是对每个类别的IoU值求平均,计算公式为:
在这里插入图片描述
其中,N是类别的数量,
IoU𝑖 表示第i个类别的IoU值。mIoU提供了一个整体的性能评价,能够反映在多个类别上模型的表现。

3.DETR
DETR(DEtection TRansformers)是一种基于Transformer的目标检测模型,它由Facebook AI Research(FAIR)团队在2020年提出。DETR模型的创新之处在于,借助Transformer模型的强大能力,避免了传统目标检测方法中复杂的先验框架、区域提议网络(RPN)和非最大抑制(NMS)等步骤,简化了目标检测的工作流程。
总结:DETR利用Transformer架构简化了目标检测的流程,同时提升了模型的灵活性和精度。

4.CLIP(Contrastive Language-Image Pretraining)是由OpenAI于2021年提出的一种基于对比学习的跨模态模型,旨在通过联合训练图像和文本数据来建立图像和文本之间的关联。CLIP的主要目标是使模型能够理解文本和图像之间的相似性,从而能够执行多种跨模态任务,如图像分类、图像生成、零-shot学习等。
CLIP最大的亮点之一是其zero-shot学习能力。


(5)自然语言处理 NLP

  • 2022年11月30日,OpenAI发布GPT-3.5,标志着AI行业的真正启动,迅速推动了AI的普及化。

  • 2023年3月14日,OpenAI发布了GPT-4,是首款多模态大模型,支持文本+图像的输入,生成文本输出。

  • ​2024年11月,人工智能公司 Anthropic 推出了一种开放标准协议:模型上下文协议(Model Context Protocol,简称 MCP)。旨在解决大型语言模型(LLM)与外部数据源和工具之间的集成问题。

缩写英文中文拓展
fine-tuning微调Tunable(火焰图标)表示该模块的参数是可调整、可训练的
Frozen(雪花图标):表示该模块的参数是固定、不可训练的
CoTchain-of-thought思维链
ToTtree of thought思维树
GPTGenerative Pre-trained Transformer生成式预训练变换模型
BERTBidirectional Encoder Representations from Transformers基于Transformer的双向编码器表示
TRTransformer变换器、转换器、变形金刚
GRUgated recurrent unit门控循环单元 (RNN的一种变体)
LSTMlong short-term memory长短期记忆模型 (RNN的一种变体)
RNNRecurrent Neural Network循环神经网络
one-hot独热编码
Q,K,VQuery、Key、Value查询、键、值
few-shot少样本
zero-shot零样本
few-shot fine-tuning少样本微调
token词元
Bbillion十亿参数
AI Agent人工智能代理、智能体
ICLin-context learning上下文学习
emergence涌现
NLPNatural Language Processing自然语言处理
AIArtificial Intelligence人工智能

1.BERT:
由Google于2018年提出。BERT的核心创新是能够在上下文中同时考虑词语的左右信息,这与传统的语言模型(如单向RNN或LSTM)不同,后者只能从左到右或从右到左进行训练。

2.端到端:

  • 在自然语言处理(NLP)领域中,“端到端”(End-to-End)指的是一种模型架构,其中输入数据经过一系列的自动化处理步骤,直到产生最终输出,整个过程中没有人工干预或中间的手动特征工程。
  • 传统的NLP系统通常包括多个处理阶段,如分词、词性标注、命名实体识别等,每个阶段都需要人工设计特征。而端到端模型则通过深度学习或其他自动化方式,让模型从原始输入(例如文本或语音)直接学习到最终任务的输出(如分类标签、生成文本或翻译结果)。
  • 例如,传统的机器翻译系统可能会先将输入句子分解为词或短语,然后逐步进行翻译。而端到端的神经机器翻译(NMT)系统会直接将一个完整的句子输入到模型中,经过训练后,模型能够从输入的源语言直接输出目标语言的翻译结果,无需手动设计特征。
  • 总的来说,端到端模型具有简化流程、自动化特征学习和更高效的特点,因此在现代NLP中得到广泛应用。

3.vLLM
(1)项目简介:
vLLM is a fast and easy-to-use libaray for LLM inference and serving.
vLLM是一个开源的大模型推理加速框架,由伯克利大学的LMSYS组织开发
(2)功能特性:
①高效的内存管理:通过PageAttention技术,vLLM实现了对注意力机制中键值(KV)缓存的高效管理,减少了内存浪费
②兼容 OpenAI 的API服务器
③多硬件平台支持


(6)大语言模型 LLM

缩写英文中文拓展
Prompt Engineering提示词工程关注"如何与AI对话"
Context Engineering上下文工程关注"给AI提供什么信息"
例如,Skill
Harness EngineeringAgent = LLM + Harness
关注让AI持续工作
Regression回归、回退模型改了参数导致性能下降叫回退。改了一个bug导致其他模块不能用了,这种测试叫回归测试
Evalevaluate评估
Training训练需要极高的带宽 (HBM的强项),因为要频繁更新权重。
Inference推理需要极大的容量 (LPDDR的强项),因为要把整个 DeepSeek-V3(几百GB)装进显存里。
GPUGraphics Processing Unit图形处理器GPU是这是显卡的大脑,负责计算
显卡Graphics Card,代码调用的是GPU来进行计算VRAM是显卡上专门用来存储图像、纹理和 AI模型参数的地方,当报错Out of Memory时,说明显存(VRAM)不够了
VRAMVideo Random Access Memory显存VRAM直译是“视频随机存取存储器”
俗称“显卡的存储器”,即显存
OOMCUDA out of memory显存不足模型训练时,显卡的显存(VRAM)不足
SFTSupervised Fine‑Tuning监督微调SFT侧重「学会怎么做」——教模型“该怎么回答”
RFTReinforcement Fine‑Tuning强化微调RFT侧重「怎么做得更好」——在“会回答”的基础上,让回答更符合人类的喜好
ChatGPT 5.2 Thinking知识截止 2025-08-31
可“extended thinking”深度思考,博主亲自测试深度思考时间长达5min43s
Gemini 3 Pro长上下文:文档给出 100 万输入 / 6.4 万输出 token,知识截点 2025 年 1 月。
多模态输入:在 Vertex AI 侧明确支持从文本、音频、图片、视频、PDF、代码库等来源理解海量信息。
Claude Sonnet 4Anthropic 公司推出的一款大型语言模型(LLM)变体,属于其最新一代 Claude 4 系列 的产品线之一
支持最高 100 万 token 上下文
LLaMALarge Language Model Meta AIMeta AI大语言模型llama是美洲大羊驼,所以缩写就用了这个LLaMA。该系列模型昵称也为羊驼系大模型
Meta的前身是FaceBook
ChatGLM清华智谱AI
LLMLarge Language Model大语言模型
MLLMMultimodal Large Language Model多模态大模型讲 [文本、图像、音频、视频] 作为输入内容,通常基于 Transformer,将不同模态编码后映射到统一语言空间
VLMVision Language Model视觉语言模型理解图片
Video LLMVideo Large Language Models视频大语言模型理解视频。提出时间:2022年
VLAVision-Language Alignment视觉语言对齐专注于将图像和文本映射到统一的语义空间
vLLMVirtual Large Language Model虚拟大语言模型提升推理速度,优化内存使用效率,解决“KV缓存”问题
LoRALow-Rank Adaptation低秩自适应LoRA是一种用于大模型微调(Fine-tuning)的技术
Scaling Laws扩展定律
模型压缩、裁剪、量化、反量化是深度学习领域中用于模型轻量化的核心技术,目的是在尽可能不损失模型精度的前提下,减小模型的体积、降低计算复杂度,让模型能部署在算力有限的设备上(如手机、嵌入式设备、边缘计算节点)。
RAGRetrieval-Augmented Generation检索增强生成RAG是一种结合了检索和生成的模型架构,用于提升大语言模型(LLM)的上下文理解和生成能力。提出时间2020年。
Hierarchical RAGHierarchical Retrieval-Augmented Generation层次化检索增强生成模型提出时间2021年,Facebook AI Reseach团队
RLReinforcement Learning强化学习机器学习的一个重要分支,专注于通过试错和奖励机制来训练智能体(Agent)完成任务。与监督学习和无监督学习不同,强化学习不依赖于标记的数据集,而是通过智能体与环境的互动来学习最优策略.。
End-to-End端到端

(7)具身智能、空间感知、机器人、强化学习

缩写英文中文拓展
ckptcheckpoint检查点强化学习训练中保存模型权重、训练配置、日志的目录
rsl_rlRobotic Systems Lab - Reinforcement Learning机器人系统实验室 - 强化学习rsl_rl 是一个库,由 ETH Zurich 的机器人系统实验室开发,专注机器人强化学习(非通用 RL)
开发主体:这个库由瑞士苏黎世联邦理工学院(ETH Zurich)的 Robotic Systems Lab (RSL) (机器人系统实验室)开发,该实验室专注于 legged 机器人(四足 / 双足机器人)、移动机器人的控制与强化学习研究。
核心定位:rsl_rl 是一个轻量级、高性能的强化学习(RL)库,专门针对机器人控制场景优化(而非通用 RL),底层基于PyTorch实现,支持GPU加速,适配机器人仿真/实机部署。
SRsuccess rate成功率
SPLSuccess weighted by Path Length路径长度加权成功率
Visual Robot视觉机器人
Navigation导航
Locomotion运动
embodied intelligence具身智能embody 体现、embodied 具身的
embedded嵌入式的embed 嵌入、embedded 嵌入式的
spatial空间的

(8)推荐系统

缩写英文中文
SRSequential Recommendation序列推荐
CFCollaborative Filtering协同过滤
RSrecommender system推荐系统
MMRSsmultimodal recommender systems多模态推荐系统
cold-start issues冷启动问题
item物品、商品
user用户
behavior行为

(9)计算机图形学

缩写英文中文
OpenGLOpen Graphics Library开放式图形库
GPUGraphics Processing Unit图形处理器
context上下文
vector向量
matrix矩阵
vertex顶点
coordinate坐标
frame of reference参考系
texture纹理
lighting、illumination光照、照明
transformation变换
render渲染
translation平移
scale / scaling缩放
rotation旋转
shear剪切
perspective视角
visualization可视化
homogeneous同类的
reflection映射
isotropic各向同性的

(10)AI嵌入式、物联网

缩写英文全称中文释义
Edge Computing边缘计算
Federated Learning联邦学习
Distributed System分布式系统
AIoTArtificial Intelligence & Internet of Things人工智能物联网
IoTInternet of Things物联网
RTOSreal-time operating system实时操作系统
NFCNear Field Communication近场通信

(11)人机交互

缩写英文中文拓展
HCIHuman-Computer Interaction人机交互
ARAugmented Reality增强现实AR 是将数字信息(如图像、视频、3D模型、文字)叠加在真实世界视图上的技术。它不是取代现实,而是“增强”现实。
VRVirtual Reality虚拟现实VR 是一种完全沉浸式的计算机生成环境。它通过屏蔽用户对真实世界的视觉和听觉,将其完全带入一个数字合成的世界中
MRMixed Reality混合现实它是 AR 的高级形式,不仅将虚拟物体叠加在现实中,还让虚拟物体能与真实环境进行物理互动(例如,一个虚拟球碰到真实的桌子会反弹)。目前业界常将高端的 AR 设备也称为 MR 设备。
UXUser Experience用户体验
UEDUser Experience Design用户体验设计 (五个层次和关键要素)

AR应用场景

  • 教育:扫描课本图片,跳出立体的动物或历史场景模型。
  • 导航:在手机地图上看到的实景箭头指引。
  • 零售与装修:在购买家具前,通过手机摄像头看沙发摆在家里的效果(如宜家APP)。
  • 工业维修:维修工人戴上眼镜,眼前直接显示机器的内部结构图或维修步骤提示。

(12)控制算法

缩写英文中文拓展
PIDProportional-Integral-Derivative Control比例-微分-积分PID是一种百年经典控制算法:u(t)=Kp×e(t)

4.就业领域

(1)职场

缩写英文全称中文释义拓展
sign off最终的签字确认
DevOpsDevelopment and Operations软件开发和IT运维
OCoffer call口头offer / offer letter
PMproduct manager产品经理
HChead count招聘名额
ldleader上级领导
plproject leader项目领导者、项目组长
mtmentor企业导师
QAQuality Assurance质量保证工程师区分测开、QA、测试
Consultant顾问,技术咨询驻场
Contractor外包技术人员、合同工
ODOutsourcing Dispatch外包派遣
被challange被质疑,被认为不合理 或者 被要求提供更多依据
total package总包
base月薪
all hands meeting公司全员大会
PRDProduct Requirement Document产品需求文档
BUBusiness Unit业务单元, 车BU是华为智能汽车解决方案事业部的缩写
FIREFinancial Independence & Retire Early财务独立,提早退休
group集团

邮件:

缩写英文全称中文全称
FYIFor Your Information供你参考、仅通知转发(无需回复)
(当你发送邮件给某人,只是想让他们知道某些信息,不需要他们采取行动、不需要回复时,就可以用FYI)
CCCarbon Copy抄送
BCCBlind Carbon Copy密送
ASAPAs Soon As Possible尽快行动
ETAEstimated Time of Arrival预计完成时间

(2)芯片

更多芯片领域术语可参考:芯片验证(CV,Chip Validation)、芯片测试

缩写英文全称中文释义拓展
Compute Cluster计算集群
Compute throughput计算吞吐量芯片单位时间内可完成的计算任务量,核心性能指标
AI training and inferenceAI训练和推理
buyoff验收机器验证:Machine buyoff 设备验收
CPUCentral Processing Unit中央处理单元万能工,但并行能力差,啥活都能干啥活都不精通。适合做统筹调度的大脑
GPUGraphics Processing Unit图形处理单元有几十个处理单元,适用于并行计算,专门为图形处理,也可用于AI训练。功耗高
NPUNeural Network Processing Unit神经网络处理单元AI专才。专为矩阵运算、激活函数等适用。功耗低,适合边缘设备计算
TPUTensor Processing Unit张量处理单元谷歌专门为TensorFlow设计的硬件加速,但只适配谷歌生态
IRQInterrupt Request外部中断请求
Root Cause根本原因
errata勘误表
A-B-A Swap Test交叉测试交叉测试是芯片及模块故障诊断中的“金标准”之一,通过“故障随器件走”或“不随器件走”这一下交换验证过程,帮你快速锁定故障来源。
FPSframes per second每秒帧数是一个衡量性能、衡量画面流畅度 的重要指标,表示每秒渲染或显示的画面帧数
vendor供应商公司A下订单给公司B,A是采购商(purchaser),B是供应商(vendor)
idle闲置状态即不跑case和模型时
RPMRevolutions Per Minute每分钟转速芯片板卡的风扇转速
I²CInter-Integrated CircuitI²C总线一种串行通信协议,串行通信总线,连接微控制器和外围设备,简单、灵活、可靠
wafer晶圆
die晶粒,单颗裸芯
chip芯片
validation验证芯片验证 Chip Validation
lane通道数PCIe x4:四个lane,带宽是x1带宽的4倍
PCIePeripheral Component Interconnect Express外设组件互连扩展PCI Express 或 PCIe总线
miscmiscellaneous杂项
GBGabian电路设计工具
efuse电子熔断器类似ROM,写一些固定值。efuse 是一个内建的电路,在芯片制造后或使用过程中进行一些不可逆的配置或锁定操作
EVBEvaluation Board评估板,绿色无壳大卡
PRBPrototype Board原型板,带壳的小卡
DSPDigital Signal Processor数字信号处理器
SoCSystem on Chip片上系统
AMDAdvanced Micro Devices, Inc.美国超威半导体公司
Supermicro超微
overview概述、综述spec overview
BUBring Up芯片点亮
profiling性能分析
ICintegrated circuit集成电路
IPIntellectual Property知识产权用于芯片设计的知识产权或设计模块,可复用的IP模块
RISCReduced Instruction Set Computer精简指令集计算机
SpecSpecification规格、规范 或 技术参数
SiPSystem in Package系统级封装
ROMread only memory只读存储器
RAMrandom access memory随机存取存储器
SRAMStatic RAM静态随机存取存储器
DRAMDynamic RAM动态随机存取存储器
SDRAMSynchronous Dynamic RAM同步动态RAM
DDRDouble Data Rate双倍数据速率

(3)自动驾驶

缩写英文全称中文释义
LiDAR激光雷达
radar雷达
AGVAutomated Guided Vehicle自动导引车
latency / delay延迟、响应时间
World Models世界模型
SLAMSimultaneous Localization and Mapping同步定位与建图
OccOccupancy占用
BEVbird’s-eye view鸟瞰图
point cloud点云
time series时序
fisheye camera鱼眼相机
multi-source Information Fusion多源信息融合
Autonomous Driving自动驾驶

(4)音视频

缩写英文全称中文释义拓展
CODEC编解码CODEC = Encoder + Decoder
核心功能是将数据从一种格式转换为另一种格式,主要用于压缩存储和高效传输,同时保证数据能被正确还原

1.CODEC有软件实现,也有硬件实现。

2.CODEC 由两个核心部分组成:
(1)编码器 (Encoder):将原始数据(如音频、视频、文本)转换为压缩 / 编码格式,目的是减小数据体积,便于存储或网络传输
(2)解码器 (Decoder):将编码后的数据还原为原始格式,供播放、显示或进一步处理

本质:CODEC 是数据的 “翻译官”,解决 “大数据如何高效流转” 的问题 —— 通过去除冗余信息(无损压缩)或利用人类感知特性舍弃次要信息(有损压缩)来实现高效存储与传输。



二、数学

中文英文全称缩写符号
奇异值Singular Value
奇异值分解Singular Value DecompositionSVD
复数complex number
实部real part
虚部imaginary part
矩阵matrix
极值extremum
极值点extremum point
当且仅当if and only ififf
因子factor
约数、除数divisor
递推数列recursive sequence
指数exponent
指数的exponential
积分intergralint ∫ \int
行列式determinantdet| |
tracetr
独立同分布independent identically distributediid
随机变量random variabler.v.



三、机械、材料

单词中文
shear剪切
chrome铬(一种金属)
Google Chrome 谷歌浏览器
pantograph受电弓
coupler车钩

谷歌Chrome浏览器的名称来源于"Chrome"这个单词,而不是"browser",主要是因为它所借鉴的其中一个特性——简洁和速度。"Chrome"是指一种高光泽的金属,同时也是一个简洁的单词,有助于传达速度和精致的意象。此外,"Chrome"还可以被理解为一种表面处理技术,使其具有光滑、闪亮的外观。因此,谷歌选择使用"Chrome"作为其浏览器的名称,以强调其速度、简洁和闪亮的特性。



四、医药

单词中文缩写
Directions使用说明
rinsev.用清水冲洗
lightweight轻量级、轻量级的
heavyweight重量级、重量级的
dermatologist皮肤科医生、皮肤学者
encapsulated密封的
retinol维A醇、维生素A1、视黄醇
hyaluronic acid玻尿酸、透明质酸
Hydratev.补水Hydrates intensely 强烈补水
carbohydrate  n.碳水化合物
vitamin C维生素CVC
vitamin C essence维C精华
serum精华液、乳清、血清
niacinamide烟酰胺
ceramide神经酰胺
licorice root extract甘草根提取物
post-acne mark(s)痘印
pore(s)毛孔
Non-comedogenic不含致痘成分
CeraVe适乐肤
sunscreen防晒霜
replumps fine lines修复细纹



五、英美计量单位

容积计量单位容量
liter (升)1L = 1000ml
pint (品脱)1 pint = 0.568升 = 20液体盎司
quart (夸脱)1 quart = 2 pint
gallon (加仑)1 gallon = 4 quart = 4.55L
bushel (蒲式耳)1 bushel = 8 gallon

质量计量单位重量
ounce (盎司)1 ounce = 28g
pound (磅)1 pound = 453.6g

长度计量单位长度
inch (英寸)1 inch = 2.5cm
feet (英尺)1 feet = 0.35m
mile (英里)1 mile = 1.6km

您可能感兴趣的与本文相关的镜像

CoPaw

CoPaw

AI应用
Qwen
Qwen3

内置vllm部署的Qwen3-4B-Instruct-2507模型,agentscope开源的类似openclaw个人助手。

内容概要:本文介绍了一个基于Simulink的混合储能驱动永磁同步电机全系统仿真模型,涵盖了系统整体架构与关键控制策略,重点实现了电流环的二阶滑模控制(STSMC)、有限集模型预测控制(FCS-MPC)和PI控制等多种先进控制方法。该模型集成了混合储能系统与永磁同步电机驱动系统,能够模拟复杂工况下的动态响应、能量管理过程及多变量耦合特性,适用于高性能电机控制系统的设计、分析与验证,尤其在新能源汽车、电动驱动系统和工业自动化等领域具有重要应用价值。; 适合人群:具备Simulink仿真基础、电力电子与电机控制背景的高校研究生、科研人员及自动化、电气工程领域的研发工程师。; 使用场景及目标:①用于研究和对比不同电流控制策略(如STSMC、FCS-MPC、PI)在永磁同步电机系统中的动态性能、鲁棒性与抗干扰能力;②支撑混合储能系统在电动驱动、新能源汽车、智能电网等领域的系统级仿真与优化设计;③为先进控制算法的开发与工程化落地提供高保真、模块化的仿真平台。; 阅读建议:建议结合Simulink模型与相关控制理论进行对照学习,重点关注各功能模块之间的信号交互、控制逻辑设计及参数整定方法,可通过修改负载条件、切换控制模式等方式开展对比实验,深入理解系统动态行为与控制效果差异。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员爱德华

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值