专业英语

原创已于 2026-06-11 18:37:11 修改 · 2.6k 阅读

33 ·

CC 4.0 BY-SA版权

文章标签：

#专业英语

于 2025-03-04 17:01:00 首次发布

英语专栏收录该内容

10 篇文章

订阅专栏

CoPaw

AI应用

Qwen

Qwen3

内置vllm部署的Qwen3-4B-Instruct-2507模型，agentscope开源的类似openclaw个人助手。

一、计算机

1.计算机基础

(1)计算机组成原理

缩写	英文全称	中文释义	拓展
TLB	Translation Lookaside Buffer	页表缓存、快表	是CPU内存管理单元（MMU）中的一种高速缓存，用于加速虚拟地址到物理地址的转换，它存储了最近访问过的页表项，当CPU需要地址转换时，先在TLB中查找，如果命中（hit）则快速获取物理地址，否则（miss）需查询慢速的页表，然后将结果存入TLB
	Instruction Set	指令集
MMU	Memory Management Unit	内存管理单元
ALU	算术逻辑单元	Arithmetic Logical Unit
	heuristic	启发式的
reg	register	寄存器
ACK帧	acknowledgement frame	确认帧
	present bit	状态位、有效位、存在位、合法位
	page frame	页框、页帧、物理块、内存块、主存块

(2)计算机网络

缩写	英文全称	释义	拓展
LLC	Logical Link Control Sublayer	逻辑链路控制子层
	Frame	帧
MTU	Maximum Transmission Unit	最大传输单元
PDU	Protocol Data Unit	协议数据单元
	token	令牌	计网中的token是用于身份验证的令牌，NLP中的token是词元
CRC	Cyclic Redundancy Check	循环冗余校验码
NAT	Network Address Translation	网络地址转换	将私有IP地址转换为公有IP地址

①NAT（Network Address Translation，网络地址转换）是一种将私有IP地址转换为公有IP地址的技术，通常用于局域网（LAN）与广域网（WAN）之间的数据通信。它主要用于解决IPv4地址短缺问题，并提高网络安全性。
②IP地址转换：NAT将内部网络的私有IP地址映射为外部网络的公有IP地址，允许多个设备共享一个公有IP地址进行外网通信。
③NAT的工作原理：NAT工作时，它会修改数据包的IP头部，将源IP地址替换为一个公有IP地址，同时记录下源端口和转换后的公有IP与端口的映射。数据返回时，NAT会根据这个映射将数据包转发回原始的内部设备。

(3)软件工程

缩写	英文全称	中文全称
DFD	Data Flow Diagram	数据流(程)图

(4)数据库

单词	中文
index	索引
schema	模式
key	码、键、关键字
attribute	属性
relation	关系
domain	域
Cartesian product	笛卡尔积
DBA、DataBase Administrator	数据库管理员

(5)编译原理

单词	释义	拓展
parse	解析
intermediate code	中间代码
optimisation	优化
assembly code	汇编代码
object code	目标代码
linking	链接
compiler	编译器
closure	闭包
augmented	增广的	augmented grammar 增广文法 augmented matrix 增广矩阵
item	项
automata	自动机	Nondeterministic Finite Automada，NFA，不确定的有穷自动机
concrete	具体的	concrete syntax 具体语法
parse	(语法) 分析	parsing 分析法
semantic	语义
syntax	语法	abstract syntax tree 抽象语法树
grammar	文法	LR grammar LR文法

(6)离散数学

英文	中文
Floors and Ceilings	上取整和下取整
Difference	差分
Inverse Difference	逆差分
Forward Difference	前向差分
Backward Difference	后向差分
Falling Factorial	下降阶乘幂
Rising Factorial	上升阶乘幂
discrete	离散的

(7)设计模式

设计原则：

缩写	英文全称	中文释义	拓展
SOLID	5个面向对象原则	更宏观的设计原则
DRY	Don’t Repeat Yourself	不要重复你自己	提高代码重用，避免重复代码
KISS	Keep It Simple, Stupid	保持简单
LOD	Law of Demeter	最少知识原则
YAGNI	You Aren’t Gonna Need It	不要过度设计

2.软件开发

(1)编译

缩写	英文全称	中文释义
IR	Intermediate Representation	中间表示

前端：管你什么语言，统统先翻译成同一种 IR。
后端：管你什么硬件，你都只认这同一种 IR，把它转成你的机器码。
这样一来，新增一种语言只需写一个新前端，新增一种硬件只需写一个新后端，完美实现 N 种语言 × M 种硬件的自由组合。

两种编译工具链：GCC、Clang+LLVM

clang+llvm：Clang+LLVM是 编译工具链，其中Clang是编译器。

如果把“Clang+LLVM”看作整个项目
它就是一个编译工具链（Compiler Toolchain）。除了编译器 Clang，它还包括：
LLVM 核心库：优化器、代码生成器
链接器 LLD
调试器 LLDB
C/C++ 标准库 libc++/libstdc++（或配合平台的）
各种工具：llvm-ar、llvm-objdump、llvm-nm 等

Clang 是前端，其核心职责是：将 C/C++/Objective-C 源代码，转换为与目标平台无关的 LLVM 中间表示（LLVM IR）。它不负责后续的机器相关优化和最终代码生成。
Clang 的工作链路很清晰：源代码 → 词法分析 → 语法分析 → 语义分析 → 生成 LLVM IR。至此，Clang 的任务就结束了。
判定“前端”身份的依据很明确：处理的是源代码，生成的是 IR，不参与机器码生成。

编译器经典三段式设计：前端-中端(优化器/中间表示)-后端
在这里插入图片描述

vllm：vLLM

(2)编程词汇

缩写	英文全称	中文释义	拓展
	instance	实例	容器实例、dte_instance
fbterm	frame buffer terminal	帧缓冲终端	fbterm 是一个基于 framebuffer（帧缓冲）的终端程序，它能够在没有图形界面的环境中（例如，只提供命令行的环境）提供一个图形化的终端。它的全名是 Framebuffer Terminal，与传统的基于字符的终端（如 xterm）不同，fbterm 直接在帧缓冲设备上渲染字符，从而避免了依赖图形桌面环境（如 X11）或传统的文本控制台。
	tuple	元组	Python数据类型：元组
GCC	GNU编译器	GNU Compiler Collection
SQL	结构化查询语言	Structured Query Language
STL	Standard Template Library	标准模板库
OOP	面向对象编程，面向对象的程序设计	Object Oriented Programming
	lvalue	左值
	rvalue	右值
	Abstraction	抽象
	Encapsulation	封装
	Inheritance	继承
	Polymorphism	多态
	identation	缩进
	iteration	循环
	recursion	递归
	millisecond	毫秒	ms
	undefined reference to …	未定义
	redefinition	重定义
	multiple definition	多次定义
	constructor	构造函数
	copy constructor	拷贝构造函数
	destructor	析构函数
	assignment operator function	赋值运算符函数
LF	Line Feed	换行符	`\n`，ASCII码值是10，十六进制是0a
para	parameter	形参
arg	argument	实参
	exception	异常
	subscript	n.下标
	catenate	v.连接	cat
	Undefined identifier	未定义的标识符
	socket	套接字
fd	file descriptor	文件描述符
-S	source code	源代码
	object-oriented	面向对象的	OO
	xxx-oriented	基于xxx的
idx	index	数组下标
EOF	end of file	文件结尾	while(scanf(“%d”,&n) !=EOF){ }
res	result	结果
cnt	count	数值
ret	return	返回值
ptr	pointer	指针	指针就是地址
buf	buffer	缓冲区
	recursion	递归	recursive call：递归调用 unwinding recursion：解除递归
	compile	编译	C2143:编译错误
	factorial	阶乘
mul	multiply	乘	imul 带符号整数乘
var	variable	变量
	static	静态的	静态链表：static linked list
	operand	[计] 操作数；[计] 运算对象
op	operator	运算符

(3)开发术语

缩写	英文全称	中文释义	拓展
GUI	Graphical User Interface	图形化用户界面	又称图形用户接口，是指采用图形方式显示的计算机操作用户界面
CLI	Command Line Interface	命令行界面	例如：bash、PowerShell、
TUI	Text-based User Interface	文本用户界面	例如：vim、VSCode的终端部分
Regression	Regression Testing	回归测试	在代码修改后，重新执行之前的测试用例，确保新改动没有破坏原有功能。目的是防止软件出现 “回归缺陷”（Regression Bug）即：原本正常的功能，因为新代码的引入而"退化"或"回归"到有问题的状态
RDP	Remote Desktop Protocol	远程桌面协议	它是由微软（Microsoft）开发的一种专有网络通信协议，主要用于允许用户通过网络连接到另一台计算机（通常是运行 Windows 的计算机），并像坐在那台计算机面前一样对其进行图形化控制。
repo	repository	代码仓库	code repository 代码仓库
PR	pull request	合并请求	提交PR
	workaround 方案	临时解决方案、临时办法	暂时无法从根源上解决这个问题，暂时用一种解决方案把这个问题给绕过去，称为workaround
UUID	Universally Unique Identifier	通用唯一标识符
	documentation	说明文档
SEO	Search Engine Optimization	搜索引擎优化
CRUD	Create 创建 Retrieve 检索 Update 更新 Delete 删除	增删改查
UI	User Interface	用户界面
API	Application Programming Interface	应用程序编程接口，简称接口
WSL	Windows Subsystem for Linux	Windows的Linux子系统
CI/CD	Continuous Integration / Continuous Delivery(Deployment)	持续集成 / 持续交付(部署)
DevOps	Development & Operations	开发和运维
diag	Diagnostics	诊断	指用于监测、测试、诊断、故障排除、性能监控和分析系统性能与状态的工具、模块或系统
AR	Action Require	需要完成的任务
	flow	流程、工作流程	梳理一下这个活儿的flow写成wiki文档
	feature	新功能、新特性	“Add new feature”通常表示添加了一个新功能或特性。我们用feature，而不用function。
	known hosts list	已知主机列表
	merge	合入	指代码合并入仓库，即已经过Gerrit平台的CI/CD 和人工代码review，并且submit，代码合并入库的完成状态。

GUI大模型：Cursor、Github Copilot插件、Claude Code插件
CLI大模型：Claude Code CLI、Openclaw、Gemini CLI

(4)Linux

缩写	英文	中文	拓展
sd	SCSI Disk	SCSI协议磁盘	后面sd扩展为：SCSI/SATA/SSD/USB
LTS	Long-Term Support	长期支持版本	Ubuntu-24.04 LTS：2024年4月发布，支持到2029年 Ubuntu-22.04 LTS：2022年4月发布，支持到2027年 Ubuntu-20.04 LTS：2020年4月发布，支持到2025年
GRUB	GRand Unified Bootloader	大统一引导加载程序	GRUB（GRand Unified Bootloader）是 Linux 系统的启动引导程序 GRUB是一个开源的引导加载程序(Bootloader)，主要用于Linux。作用：引导操作系统、多重引导、加载内核、配置文件
BSD 系统	Berkeley Software Distribution	伯克利软件发行版	BSD 系统（Berkeley Software Distribution）是一个源自于 Unix 的操作系统家族。它最初由加利福尼亚大学伯克利分校（University of California, Berkeley）的计算机科学实验室开发，最著名的版本是 FreeBSD、OpenBSD 和 NetBSD 等。
ETA	Estimated Time of Arrival	预计剩余时间
TTY	Teletypewriter	交互式终端	cron就没有TTY，非交互式环境，不可见，属于后台守护进程
UTC	Coordinated Universal Time	协调世界时
CST	China Standard Time	中国标准时间 (北京，上海)	CST = UTC + 8

通过选择UTC这个缩写，避免了语言上的偏袒。例如，英语国家的标准时间常用CUT，而法语国家可能更倾向于使用TUC。为了兼顾两者，采用了UTC，这个缩写没有明显倾向于任何单一语言。

(5)软件

缩写	英文全称	中文释义
GUI	Graphical User Interface	图形化用户界面
	install	安装
	uninstall	卸载
OCR	Optical Character Recognition	光学字符识别
	log in / sign in	登录
	sign up	注册
APP	application	应用程序
	launch	启动 (计算机程序)
	desktop shortcut	桌面快捷方式
	setup wizard	安装向导
	spam folder	垃圾信箱
	AI enthusiast	AI爱好者
	Release of Liability	免责声明

Dont forget to check your spam folder. 不要忘记检查你的垃圾邮箱。

(6)web

缩写	英文全称	中文释义
XHR	XML Http Request	XML HTTP 请求

XHR（XMLHttpRequest）是一个浏览器提供的API，用于在不重新加载整个页面的情况下，与服务器交换数据。它允许网页通过异步方式发送请求并接收响应，从而实现动态加载数据，比如在网页上更新内容而不刷新整个页面。XHR最初是为处理XML数据而设计的，但如今也可以处理JSON、文本或其他类型的数据。
常见的使用场景包括：
①动态加载网页内容（例如，AJAX技术）。
②实时更新页面的数据（如新闻、天气、股票信息等）。
③向服务器提交表单数据而不重新加载页面。

(7)云服务

缩写	英文全称	中文释义
	jumpserver	跳板机 / 堡垒机
XNAS		纯文件共享、局域网网盘；无权限管理、无版本管理
Nexus		nexus 的上传下载的权限管控比xnas更严格些
Qos	Quality of Service	服务质量
SaaS	Software as a Service	软件即服务
IaaS	Infrastructure as a Service	基础设施即服务
PaaS	Platform as a Service	平台即服务

(8)DevOps

缩写	英文全称	中文释义	拓展
CI/CD	Continuous Integration / Continuous Deployment (Delivery)	持续集成 / 持续部署 (交付)
NG	Nginx	反向代理服务器	保护最终服务器的IP，只暴露给用户代理服务器的IP
k8s	Kubernetes
	Node	节点	Node 是计算资源，它为 Pod 提供资源支持，一个 Node 可以运行多个 Pods。
	pod	容器组	Pod 是部署的单元，它是容器的封装体，多个容器可以在同一个 Pod 内部运行。

(9)工程流程

缩写	英文全称	中文释义	拓展
ECR	Engineering Change Request	工程变更请求

3.深度学习

(1)智能体 Agent

缩写	英文	中文	拓展
ReAct	Reasing & Acting	推理+行动	模式循环：思考、行动、观察 (走一步看一步) Claude Code、Codex、OpenClaw都是这个行为模式
	Plan-and-Execute	先规划，后执行	先做攻略，再出发 Cursor是这个行为模式
FARS	Fully Automated Research System	全自动科研多智能体系统	FARS由4个智能体组成：构思智能体(Ideation Agent)、规划智能体(Planning Agent)、实验智能体(Experiment Agent)、写作智能体(Writing Agent)
	Stanford Agentic Reviewer	斯坦福AI审稿系统	吴恩达牵头研发，它的评分结果与人类高度一致，达到了人类专家的审稿水平。
MCP	Model Context Protocol	模型上下文协议	MCP、A2A，都是Agent协议

FARS是由日行迹公司 (创始人为上海创智学院的助理教授孙天祥博士) 开发的用于论文写作的并行多智能体系统。在2026年春节期间直播200多个小时产出了100篇论文。它包含构思、规划、实验、写作四个模块。
(1)构思Agent：主要负责调研文献和生成假设。它可以访问公开的论文库和GitLab代码仓。生成的假设要先通过自动化审查，只有审查通过的假设，才会转给规划模块，保证任务基本可行。
(2)规划Agent：负责把idea落地，设计试验方案。比如：确定模型、数据集和评估指标
(3)实验Agent：负责编写和运行代码。它可以调用160张NVIDIA GPU集群，也能调用各类模型接口，能产出数据和图表，具备自我纠错能力。哪怕是负面结果，它也会如实报告。
(4)写作Agent：负责写论文。它会将结果整理成短论文(Short Paper)的格式。无论结果正面还是负面，它都会完整记录。最终论文包含摘要、方法、实验和分析。

FARS的消耗与产出：
(1)消耗：基于160张卡，9.5天，消耗114亿Token(成本约10.4万美元)
(2)产出：生成了244个假设，产出了100篇论文
(3)消耗产出比：约1000美元/篇，2小时/篇，1亿token/篇

FARS的论文质量：
(1)斯坦福AI审稿系统按照ICLR标准打分：均分5.05，超过ICLR投稿均分4.21，接近最终被接受论文的平均分5.39。说明FARS产出论文的均分已经明显高于人类投稿的整体平均水平，距离中稿的平均线也差距不大。
(2)通过读FARS生成的论文：说明大模型非常擅长在既定框架下，通过数据分析找到最优解。

总结：未来，最不值钱的就是idea。
ChatGPT的核心贡献者之一翁家羿提到：“idea是廉价的，真正的挑战在于如何把这些idea快速、正确的实现和迭代。”

(2)论文

缩写	英文	中文	拓展
*	* Corresponding author	通讯作者	* 是通讯作者
#	# joint first authors	共同第一作者	# 是共一作者
	leverage	利用	Our approach leverages 3D Gaussian Splatting (3DGS) based …
	benchmark	基准	一套标准化的评估体系
	Baseline	基线	简单传统的基础模型或方法
	pipeline	流水线	一系列按顺序执行的数据处理步骤或阶段每个步骤负责特定的任务，并将结果传递给下一个步骤，最终完成一个完整的流程。这种设计方式能够使复杂的过程变得模块化和易于管理
SOTA	the current state-of-the-art methods	当前最先进的方法	指在某一特定任务或数据集上，当前表现最好的模型或方法。指某一领域或技术中当前最高水平的研究成果或技术方案。它代表了特定时间段内经过验证的最优方法，常用于学术论文或技术报告中凸显创新性和先进性。
	survey	综述
	paper	论文
	Conference Paper	会议论文
	Jounal Article	期刊论文
	Thesis	学位论文
	open-ended	开放式的
	approach	方法
i.e.	id est	即	She’s studying a STEM subject, i.e., physics. 她在学习STEM学科，也就是物理学。
CCF	China Computer Federation	中国计算机协会
	propose	提出	is proposed to address the challenges in
	Label Smoothing	标签平滑	防止模型过拟合和过度自信，导致降低了泛化能力
	regularization	正则化
	scale	缩放	scaled 缩放
	tokenization	词元化	把一段文字，变成一组Token OpenAI的GPT，tiktok，1000个token对应750个英文单词或500个汉字
	architecture	架构
	Bibliography	参考文献
	Literature Review	文献综述
	Ablation study	消融实验	通过去除或修改模型的不同模块，来验证每个模块的贡献
	case study	案例研究
ACM	Association for Computing Machinery	美国计算机协会
IEEE	Institute of Electrical and Electronics Engineers	电气电子工程师学会
	enumeration	枚举
PI	Principal Investigator	独立学术带头人、独立项目负责人

在这里插入图片描述

例如，在机器学习领域，一个典型的pipeline可能包含以下几个步骤：
①数据预处理：包括数据清洗、缺失值填充、异常值处理等。
②特征工程：从原始数据中提取有用的特征，进行特征选择或者创建新的特征。
③模型训练：使用经过处理的数据训练机器学习模型。
④模型评估：对训练好的模型进行评估，检查其准确性和有效性。
⑤模型部署：将训练好的模型部署到生产环境中，以便实时或批量地对新数据进行预测。

(3)深度学习 DL

根据AI领域两位泰斗斯图亚特·罗素（Stuart Russell）和彼得·诺维格（Peter Norvig）合著的经典著作《人工智能：一种现代的方法》，人工智能的核心目标是通过计算机程序或机器来模拟人类智能，涵盖语言理解、问题解决、学习、认知和决策等多方面能力。

PPO、DPO、GRPO都是post-training阶段的大模型对齐算法 (Alignment)，都属于RLHF：
(1)PPO是代价最高，效果最好的。(传统在线强化学习方案，训练代价最高、工程最难，效果上限高，但落地成本极高)。[OpenAI的GPT在早期RLHF时用的就是PPO]
(2)DPO是实现最简化的，成本最低，(训练稳定易复现)，效果略低于PPO和GRPO。目前业界首选。
(3)GRPO属于在DPO和PPO之间取了折中，只牺牲极少效果，就能大幅降低对齐成本，性价比最高。(DPO成本最低，PPO效果最好)。DeepSeek用的便是GRPO对齐算法

详情可跳转：强化学习RL

GRPO是deepseek能火的一个关键原因之一，在稍微牺牲了一点效果的情况下，大幅度降低了成本
主观打分：
PPO效果10分，DPO效果9分，GRPO效果9.5分
PPO成本10分，DPO成本1分，GRPO成本2.5分

缩写	英文全称	中文全称	核心思想
MoE	Mixture of Experts	混合专家模型	MoE将传统单一的"通才"模型拆分为多个功能独立的专家子网络，每个专家专注于处理特定类型的数据或任务
PPO	Proximal Policy Optimization	近端策略优化	策略梯度方法：在策略梯度方法中引入"近端约束"，防止策略更新幅度过大
DPO	Direct Preference Optimization	直接偏好优化	绕过显式的奖励模型(Reward Model)，直接从人类偏好数据中学习策略
GRPO	Group Relative Policy Optimization	组相对策略优化	随机化 + 策略梯度方法： DeepSeek提出的PPO变体，通过组内采样和相对奖励评估降低训练成本。对每个问题采样一组输出，用组内奖励的相对排名（而非绝对值或单独的价值模型）计算优势函数；省去独立Critic模型，减少显存开销
TRPO	Trust Region Policy Optimization	信任区域策略优化	信任区域 + 策略梯度方法：通过严格的数学约束确保策略更新在"信任区域"内进行，保证单调改进
	train	训练	训练阶段：分为预训练(pre-train)和后训练(post-train)
	inference	推理	推理阶段：例如有few shot和zero shot
	zero-shot learning	零样本学习	推理阶段：用户用AI模型，直接提问
	few-shot learning	小样本学习	推理阶段：用户用AI模型，举几个例子让AI按照这种规范，再提问
	batch size	批量大小
	epochs	迭代轮次
LR	learning rate	学习率	学习率太高，模型会在最优解附近反复横跳；学习率太低，模型收敛太慢
	Training Set	训练集
	Validation Set	验证集
	Test Set	测试集
	trade-off	权衡
	activation function	激活函数
	retrain on	启用了重新训练
	retrain off	禁用了重新训练
MLP	Multilayer Perceptron	多层感知器
FC	Fully connected neural network	全连接神经网络	也被称为 “多层感知机 MLP”。全连接神经网络是前馈神经网络的一个典型实现
FFN	Feed-Forward (Neural) Network	前馈神经网络	“前馈”强调信息流向无环，但不限定层间如何连接——不仅可以是全连接，也可以是稀疏连接（如卷积层）、局部连接等。例如，卷积神经网络(CNN)中的卷积层也是前馈结构，但它并不属于全连接网络。
	backbone network	主干网络
RLHF	Reinforcement Learning with Human Feedback	基于人类反馈的强化学习、人类反馈对齐
	encoder	编码器
	decoder	解码器
Tensor	张量
	compress	压缩
	pooling	池化
	context	上下文
	sparse	稀疏的
	semantic	语义的，图像区域的，区域分割
FL	federated learning	联邦学习	分布式机器学习方法
	supervised learning	强监督学习
	weakly supervised learning	弱监督学习
	semi-supervised learning	半监督学习
	self-supervised learning	自监督学习
	unsupervised learning	无监督学习
CNN	Convolutional Neural Networks	卷积神经网络
GAN	Generative Adversarial Network	生成对抗网络

1.联邦学习（Federated Learning）是一种分布式机器学习方法，它允许模型在多个分散的边缘设备或服务器上进行训练，而不需要将数据集中到一个中心位置。这种方法特别适合于处理敏感数据（如个人隐私信息），因为它减少了数据泄露的风险。
2.联邦学习允许各参与方在本地对数据进行训练，而不是将数据集中到一个中心服务器。通过加密机制下的参数交换，各参与方可以在不泄露数据隐私的情况下，共同构建一个虚拟的全局模型。

(4)计算机视觉 CV

缩写	英文全称	中文释义	拓展
	salient object detection	显著目标检测
BER	Boundary Error Rate	边界误差率
MAE	Mean Absolute Error	平均绝对误差
$F_β$	F-beta score	Fβ 分数	综合精确率和召回率的指标，β 用于调整两者权重
Acc	accuracy rate	准确率
IoU	Intersection over Union	交并比	交集与并集的比率。它是用来衡量两个集合重叠程度的一种指标，通常用于图像分割和目标检测中，评估预测结果与真实标签的匹配程度
mIoU	mean Intersection over Union	平均交并比
CGFormer	CV+Generative Models		计算机视觉+图像生成
ViT	Vision Transformer	视觉Transformer	ViT (Vision Transformer) 是一种用于图像识别的深度学习模型，基于 Transformer 架构，最初由 Google Research 团队于 2020 年提出。它将 Transformer 应用到计算机视觉任务，打破了卷积神经网络（CNN）在视觉任务中的长期主导地位。 ViT的核心思想是将图像划分为一系列的“补丁” (patches)，然后将这些补丁视为序列输入到 Transformer 模型中进行处理。
	multimodal	多模态
LVLMs	large vision-language models	大视觉语言模型
YOLO	You Only Look Once	“你只看一次”	YOLOv5做目标检测
LLaVA	Large Language and Vision Assistant	大语言和视觉助手	是一种多模态大模型
CLIP	Contrastive Language-Image Pretraining	对比语言-图像预训练	也是一种多模态大模型 zero-shot CLIP的核心思想是通过对比学习（contrastive learning），在图像和文本之间建立一个共享的表示空间，使得模型能够理解和关联图像与文本之间的语义关系
DETR	DEtection TRansformers	基于Transformer的检测模型
VQA	Visual Question Answering	视觉问答	理解图像内容并回答
ReID	Person Re-Identification	行人重识别
	image inpainting	图像修复
SR	super-resolution	超分辨率
	voxel	体素，体元，立体像素
	pixel	像素
	translation invariance	平移不变性
SSIM	Structural Similarity Index	结构相似性指数	SSIM 更侧重图像的结构相似度，越接近1表示图像质量越好。在很多应用中，SSIM 比 PSNR 更能准确反映图像质量，因为它考虑了人眼对图像结构的敏感度。
PSNR	Peak Signal-to-Noise Ratio	峰值信噪比	PSNR 主要衡量图像的像素差异，越大表示图像质量越好
SIFT	Scale Invariant Feature Transform	尺寸不变特征变换

1.ReID（Person Re-Identification，行人重识别）是计算机视觉领域的一项核心技术，旨在跨不同摄像头或场景识别同一行人。简单来说，它的任务是：给定一个目标行人图像（查询图像），从大量不同摄像头拍摄的候选图像库中，找到属于同一人的图像。主要用于智能安防、智能零售行业。

2.IoU评估单个预测和真实标注之间的重叠程度。
mIoU则是对所有类别的IoU进行平均，常用于多类别的评估
(1)IoU用于评估两个区域（例如预测区域和真实标注区域）之间的重叠程度。它通过计算预测区域与真实区域的交集与并集的比值来衡量：
在这里插入图片描述
其中，A和B分别表示预测区域和真实标注区域。IoU值越高，表示预测的区域与真实标注区域越重合，性能越好。
(2)IoU（mean Intersection over Union）： mIoU是IoU在多个类别上的平均值，通常用于评估多分类问题中的性能，特别是在语义分割中。它是对每个类别的IoU值求平均，计算公式为：
在这里插入图片描述
其中，N是类别的数量，
IoU𝑖 表示第i个类别的IoU值。mIoU提供了一个整体的性能评价，能够反映在多个类别上模型的表现。

3.DETR
DETR（DEtection TRansformers）是一种基于Transformer的目标检测模型，它由Facebook AI Research（FAIR）团队在2020年提出。DETR模型的创新之处在于，借助Transformer模型的强大能力，避免了传统目标检测方法中复杂的先验框架、区域提议网络（RPN）和非最大抑制（NMS）等步骤，简化了目标检测的工作流程。
总结：DETR利用Transformer架构简化了目标检测的流程，同时提升了模型的灵活性和精度。

4.CLIP（Contrastive Language-Image Pretraining）是由OpenAI于2021年提出的一种基于对比学习的跨模态模型，旨在通过联合训练图像和文本数据来建立图像和文本之间的关联。CLIP的主要目标是使模型能够理解文本和图像之间的相似性，从而能够执行多种跨模态任务，如图像分类、图像生成、零-shot学习等。
CLIP最大的亮点之一是其zero-shot学习能力。

(5)自然语言处理 NLP

2022年11月30日，OpenAI发布GPT-3.5，标志着AI行业的真正启动，迅速推动了AI的普及化。
2023年3月14日，OpenAI发布了GPT-4，是首款多模态大模型，支持文本+图像的输入，生成文本输出。
2024年11月，人工智能公司 Anthropic 推出了一种开放标准协议：模型上下文协议(Model Context Protocol，简称 MCP)。旨在解决大型语言模型（LLM）与外部数据源和工具之间的集成问题。

缩写	英文	中文	拓展
	fine-tuning	微调	Tunable(火焰图标)表示该模块的参数是可调整、可训练的 Frozen(雪花图标)：表示该模块的参数是固定、不可训练的
CoT	chain-of-thought	思维链
ToT	tree of thought	思维树
GPT	Generative Pre-trained Transformer	生成式预训练变换模型
BERT	Bidirectional Encoder Representations from Transformers	基于Transformer的双向编码器表示
TR	Transformer	变换器、转换器、变形金刚
GRU	gated recurrent unit	门控循环单元 (RNN的一种变体)
LSTM	long short-term memory	长短期记忆模型 (RNN的一种变体)
RNN	Recurrent Neural Network	循环神经网络
	one-hot	独热编码
Q,K,V	Query、Key、Value	查询、键、值
	few-shot	少样本
	zero-shot	零样本
	few-shot fine-tuning	少样本微调
	token	词元
B	billion	十亿参数
	AI Agent	人工智能代理、智能体
ICL	in-context learning	上下文学习
	emergence	涌现
NLP	Natural Language Processing	自然语言处理
AI	Artificial Intelligence	人工智能

1.BERT：
由Google于2018年提出。BERT的核心创新是能够在上下文中同时考虑词语的左右信息，这与传统的语言模型（如单向RNN或LSTM）不同，后者只能从左到右或从右到左进行训练。

2.端到端：

在自然语言处理（NLP）领域中，“端到端”（End-to-End）指的是一种模型架构，其中输入数据经过一系列的自动化处理步骤，直到产生最终输出，整个过程中没有人工干预或中间的手动特征工程。
传统的NLP系统通常包括多个处理阶段，如分词、词性标注、命名实体识别等，每个阶段都需要人工设计特征。而端到端模型则通过深度学习或其他自动化方式，让模型从原始输入（例如文本或语音）直接学习到最终任务的输出（如分类标签、生成文本或翻译结果）。
例如，传统的机器翻译系统可能会先将输入句子分解为词或短语，然后逐步进行翻译。而端到端的神经机器翻译（NMT）系统会直接将一个完整的句子输入到模型中，经过训练后，模型能够从输入的源语言直接输出目标语言的翻译结果，无需手动设计特征。
总的来说，端到端模型具有简化流程、自动化特征学习和更高效的特点，因此在现代NLP中得到广泛应用。

3.vLLM
(1)项目简介：
vLLM is a fast and easy-to-use libaray for LLM inference and serving.
vLLM是一个开源的大模型推理加速框架，由伯克利大学的LMSYS组织开发
(2)功能特性：
①高效的内存管理：通过PageAttention技术，vLLM实现了对注意力机制中键值(KV)缓存的高效管理，减少了内存浪费
②兼容 OpenAI 的API服务器
③多硬件平台支持

(6)大语言模型 LLM

缩写	英文	中文	拓展
	Prompt Engineering	提示词工程	关注"如何与AI对话"
	Context Engineering	上下文工程	关注"给AI提供什么信息" 例如，Skill
	Harness Engineering		Agent = LLM + Harness 关注让AI持续工作
	Regression	回归、回退	模型改了参数导致性能下降叫回退。改了一个bug导致其他模块不能用了，这种测试叫回归测试
Eval	evaluate	评估
	Training	训练	需要极高的带宽 (HBM的强项)，因为要频繁更新权重。
	Inference	推理	需要极大的容量 (LPDDR的强项)，因为要把整个 DeepSeek-V3(几百GB)装进显存里。
GPU	Graphics Processing Unit	图形处理器	GPU是这是显卡的大脑，负责计算显卡是Graphics Card，代码调用的是GPU来进行计算，VRAM是显卡上专门用来存储图像、纹理和 AI模型参数的地方，当报错Out of Memory时，说明显存(VRAM)不够了
VRAM	Video Random Access Memory	显存	VRAM直译是“视频随机存取存储器” 俗称“显卡的存储器”，即显存
OOM	CUDA out of memory	显存不足	模型训练时，显卡的显存(VRAM)不足
SFT	Supervised Fine‑Tuning	监督微调	SFT侧重「学会怎么做」——教模型“该怎么回答”
RFT	Reinforcement Fine‑Tuning	强化微调	RFT侧重「怎么做得更好」——在“会回答”的基础上，让回答更符合人类的喜好
ChatGPT 5.2 Thinking			知识截止 2025-08-31 可“extended thinking”深度思考，博主亲自测试深度思考时间长达5min43s
Gemini 3 Pro			长上下文：文档给出 100 万输入 / 6.4 万输出 token，知识截点 2025 年 1 月。多模态输入：在 Vertex AI 侧明确支持从文本、音频、图片、视频、PDF、代码库等来源理解海量信息。
Claude Sonnet 4			Anthropic 公司推出的一款大型语言模型（LLM）变体，属于其最新一代 Claude 4 系列的产品线之一支持最高 100 万 token 上下文
LLaMA	Large Language Model Meta AI	Meta AI大语言模型	llama是美洲大羊驼，所以缩写就用了这个LLaMA。该系列模型昵称也为羊驼系大模型 Meta的前身是FaceBook
ChatGLM		清华智谱AI
LLM	Large Language Model	大语言模型
MLLM	Multimodal Large Language Model	多模态大模型	讲 [文本、图像、音频、视频] 作为输入内容，通常基于 Transformer，将不同模态编码后映射到统一语言空间
VLM	Vision Language Model	视觉语言模型	理解图片
Video LLM	Video Large Language Models	视频大语言模型	理解视频。提出时间：2022年
VLA	Vision-Language Alignment	视觉语言对齐	专注于将图像和文本映射到统一的语义空间
vLLM	Virtual Large Language Model	虚拟大语言模型	提升推理速度，优化内存使用效率，解决“KV缓存”问题
LoRA	Low-Rank Adaptation	低秩自适应	LoRA是一种用于大模型微调(Fine-tuning)的技术
	Scaling Laws	扩展定律
		模型压缩、裁剪、量化、反量化	是深度学习领域中用于模型轻量化的核心技术，目的是在尽可能不损失模型精度的前提下，减小模型的体积、降低计算复杂度，让模型能部署在算力有限的设备上（如手机、嵌入式设备、边缘计算节点）。
RAG	Retrieval-Augmented Generation	检索增强生成	RAG是一种结合了检索和生成的模型架构，用于提升大语言模型(LLM)的上下文理解和生成能力。提出时间2020年。
Hierarchical RAG	Hierarchical Retrieval-Augmented Generation	层次化检索增强生成模型	提出时间2021年，Facebook AI Reseach团队
RL	Reinforcement Learning	强化学习	机器学习的一个重要分支，专注于通过试错和奖励机制来训练智能体(Agent)完成任务。与监督学习和无监督学习不同，强化学习不依赖于标记的数据集，而是通过智能体与环境的互动来学习最优策略.。
	End-to-End	端到端

(7)具身智能、空间感知、机器人、强化学习

缩写	英文	中文	拓展
ckpt	checkpoint	检查点	强化学习训练中保存模型权重、训练配置、日志的目录
rsl_rl	Robotic Systems Lab - Reinforcement Learning	机器人系统实验室 - 强化学习	rsl_rl 是一个库，由 ETH Zurich 的机器人系统实验室开发，专注机器人强化学习（非通用 RL）开发主体：这个库由瑞士苏黎世联邦理工学院(ETH Zurich)的 Robotic Systems Lab (RSL) (机器人系统实验室)开发，该实验室专注于 legged 机器人(四足 / 双足机器人)、移动机器人的控制与强化学习研究。核心定位：rsl_rl 是一个轻量级、高性能的强化学习(RL)库，专门针对机器人控制场景优化(而非通用 RL)，底层基于PyTorch实现，支持GPU加速，适配机器人仿真/实机部署。
SR	success rate	成功率
SPL	Success weighted by Path Length	路径长度加权成功率
	Visual Robot	视觉机器人
	Navigation	导航
	Locomotion	运动
	embodied intelligence	具身智能	embody 体现、embodied 具身的
	embedded	嵌入式的	embed 嵌入、embedded 嵌入式的
	spatial	空间的

(8)推荐系统

缩写	英文	中文
SR	Sequential Recommendation	序列推荐
CF	Collaborative Filtering	协同过滤
RS	recommender system	推荐系统
MMRSs	multimodal recommender systems	多模态推荐系统
	cold-start issues	冷启动问题
	item	物品、商品
	user	用户
	behavior	行为

(9)计算机图形学

缩写	英文	中文
OpenGL	Open Graphics Library	开放式图形库
GPU	Graphics Processing Unit	图形处理器
	context	上下文
	vector	向量
	matrix	矩阵
	vertex	顶点
	coordinate	坐标
	frame of reference	参考系
	texture	纹理
	lighting、illumination	光照、照明
	transformation	变换
	render	渲染
	translation	平移
	scale / scaling	缩放
	rotation	旋转
	shear	剪切
	perspective	视角
	visualization	可视化
	homogeneous	同类的
	reflection	映射
	isotropic	各向同性的

(10)AI嵌入式、物联网

缩写	英文全称	中文释义
	Edge Computing	边缘计算
	Federated Learning	联邦学习
	Distributed System	分布式系统
AIoT	Artificial Intelligence & Internet of Things	人工智能物联网
IoT	Internet of Things	物联网
RTOS	real-time operating system	实时操作系统
NFC	Near Field Communication	近场通信

(11)人机交互

缩写	英文	中文	拓展
HCI	Human-Computer Interaction	人机交互
AR	Augmented Reality	增强现实	AR 是将数字信息（如图像、视频、3D模型、文字）叠加在真实世界视图上的技术。它不是取代现实，而是“增强”现实。
VR	Virtual Reality	虚拟现实	VR 是一种完全沉浸式的计算机生成环境。它通过屏蔽用户对真实世界的视觉和听觉，将其完全带入一个数字合成的世界中
MR	Mixed Reality	混合现实	它是 AR 的高级形式，不仅将虚拟物体叠加在现实中，还让虚拟物体能与真实环境进行物理互动（例如，一个虚拟球碰到真实的桌子会反弹）。目前业界常将高端的 AR 设备也称为 MR 设备。
UX	User Experience	用户体验
UED	User Experience Design	用户体验设计 (五个层次和关键要素)

AR应用场景：

教育：扫描课本图片，跳出立体的动物或历史场景模型。
导航：在手机地图上看到的实景箭头指引。
零售与装修：在购买家具前，通过手机摄像头看沙发摆在家里的效果（如宜家APP）。
工业维修：维修工人戴上眼镜，眼前直接显示机器的内部结构图或维修步骤提示。

(12)控制算法

缩写	英文	中文	拓展
PID	Proportional-Integral-Derivative Control	比例-微分-积分	PID是一种百年经典控制算法：u(t)=Kp×e(t)

4.就业领域

(1)职场

缩写	英文全称	中文释义	拓展
	sign off	最终的签字确认
DevOps	Development and Operations	软件开发和IT运维
OC	offer call	口头offer / offer letter
PM	product manager	产品经理
HC	head count	招聘名额
ld	leader	上级领导
pl	project leader	项目领导者、项目组长
mt	mentor	企业导师
QA	Quality Assurance	质量保证工程师	区分测开、QA、测试
	Consultant	顾问，技术咨询驻场
	Contractor	外包技术人员、合同工
OD	Outsourcing Dispatch	外包派遣
	被challange	被质疑，被认为不合理或者被要求提供更多依据
	total package	总包
	base	月薪
	all hands meeting	公司全员大会
PRD	Product Requirement Document	产品需求文档
BU	Business Unit	业务单元，车BU是华为智能汽车解决方案事业部的缩写
FIRE	Financial Independence & Retire Early	财务独立，提早退休
	group	集团

邮件：

缩写	英文全称	中文全称
FYI	For Your Information	供你参考、仅通知转发(无需回复) (当你发送邮件给某人，只是想让他们知道某些信息，不需要他们采取行动、不需要回复时，就可以用FYI)
CC	Carbon Copy	抄送
BCC	Blind Carbon Copy	密送
ASAP	As Soon As Possible	尽快行动
ETA	Estimated Time of Arrival	预计完成时间

(2)芯片

更多芯片领域术语可参考：芯片验证(CV,Chip Validation)、芯片测试

缩写	英文全称	中文释义	拓展
	Compute Cluster	计算集群
	Compute throughput	计算吞吐量	芯片单位时间内可完成的计算任务量，核心性能指标
	AI training and inference	AI训练和推理
	buyoff	验收	机器验证：Machine buyoff 设备验收
CPU	Central Processing Unit	中央处理单元	万能工，但并行能力差，啥活都能干啥活都不精通。适合做统筹调度的大脑
GPU	Graphics Processing Unit	图形处理单元	有几十个处理单元，适用于并行计算，专门为图形处理，也可用于AI训练。功耗高
NPU	Neural Network Processing Unit	神经网络处理单元	AI专才。专为矩阵运算、激活函数等适用。功耗低，适合边缘设备计算
TPU	Tensor Processing Unit	张量处理单元	谷歌专门为TensorFlow设计的硬件加速，但只适配谷歌生态
IRQ	Interrupt Request	外部中断请求
	Root Cause	根本原因
	errata	勘误表
	A-B-A Swap Test	交叉测试	交叉测试是芯片及模块故障诊断中的“金标准”之一，通过“故障随器件走”或“不随器件走”这一下交换验证过程，帮你快速锁定故障来源。
FPS	frames per second	每秒帧数	是一个衡量性能、衡量画面流畅度的重要指标，表示每秒渲染或显示的画面帧数
	vendor	供应商	公司A下订单给公司B，A是采购商(purchaser)，B是供应商(vendor)
	idle	闲置状态	即不跑case和模型时
RPM	Revolutions Per Minute	每分钟转速	芯片板卡的风扇转速
I²C	Inter-Integrated Circuit	I²C总线	一种串行通信协议，串行通信总线，连接微控制器和外围设备，简单、灵活、可靠
	wafer	晶圆
	die	晶粒，单颗裸芯
	chip	芯片
	validation	验证	芯片验证 Chip Validation
	lane	通道数	PCIe x4：四个lane，带宽是x1带宽的4倍
PCIe	Peripheral Component Interconnect Express	外设组件互连扩展	PCI Express 或 PCIe总线
misc	miscellaneous	杂项
GB	Gabian	电路设计工具
	efuse	电子熔断器	类似ROM，写一些固定值。efuse 是一个内建的电路，在芯片制造后或使用过程中进行一些不可逆的配置或锁定操作
EVB	Evaluation Board	评估板，绿色无壳大卡
PRB	Prototype Board	原型板，带壳的小卡
DSP	Digital Signal Processor	数字信号处理器
SoC	System on Chip	片上系统
AMD	Advanced Micro Devices, Inc.	美国超威半导体公司
	Supermicro	超微
	overview	概述、综述	spec overview
BU	Bring Up	芯片点亮
	profiling	性能分析
IC	integrated circuit	集成电路
IP	Intellectual Property	知识产权	用于芯片设计的知识产权或设计模块，可复用的IP模块
RISC	Reduced Instruction Set Computer	精简指令集计算机
Spec	Specification	规格、规范或技术参数
SiP	System in Package	系统级封装
ROM	read only memory	只读存储器
RAM	random access memory	随机存取存储器
SRAM	Static RAM	静态随机存取存储器
DRAM	Dynamic RAM	动态随机存取存储器
SDRAM	Synchronous Dynamic RAM	同步动态RAM
DDR	Double Data Rate	双倍数据速率

(3)自动驾驶

缩写	英文全称	中文释义
LiDAR		激光雷达
	radar	雷达
AGV	Automated Guided Vehicle	自动导引车
	latency / delay	延迟、响应时间
	World Models	世界模型
SLAM	Simultaneous Localization and Mapping	同步定位与建图
Occ	Occupancy	占用
BEV	bird’s-eye view	鸟瞰图
	point cloud	点云
	time series	时序
	fisheye camera	鱼眼相机
	multi-source Information Fusion	多源信息融合
	Autonomous Driving	自动驾驶

(4)音视频

缩写	英文全称	中文释义	拓展
CODEC		编解码	CODEC = Encoder + Decoder 核心功能是将数据从一种格式转换为另一种格式，主要用于压缩存储和高效传输，同时保证数据能被正确还原

1.CODEC有软件实现，也有硬件实现。

2.CODEC 由两个核心部分组成：
(1)编码器 (Encoder)：将原始数据（如音频、视频、文本）转换为压缩 / 编码格式，目的是减小数据体积，便于存储或网络传输
(2)解码器 (Decoder)：将编码后的数据还原为原始格式，供播放、显示或进一步处理

本质：CODEC 是数据的 “翻译官”，解决 “大数据如何高效流转” 的问题 —— 通过去除冗余信息（无损压缩）或利用人类感知特性舍弃次要信息（有损压缩）来实现高效存储与传输。

二、数学

中文	英文全称	缩写	符号
奇异值	Singular Value
奇异值分解	Singular Value Decomposition	SVD
复数	complex number
实部	real part
虚部	imaginary part
矩阵	matrix
极值	extremum
极值点	extremum point
当且仅当	if and only if	iff
因子	factor
约数、除数	divisor
递推数列	recursive sequence
指数	exponent
指数的	exponential
积分	intergral	int	$\int$
行列式	determinant	det	\| \|
迹	trace	tr
独立同分布	independent identically distributed	iid
随机变量	random variable	r.v.

三、机械、材料

单词	中文
shear	剪切
chrome	铬(一种金属) Google Chrome 谷歌浏览器
pantograph	受电弓
coupler	车钩

谷歌Chrome浏览器的名称来源于"Chrome"这个单词，而不是"browser"，主要是因为它所借鉴的其中一个特性——简洁和速度。"Chrome"是指一种高光泽的金属，同时也是一个简洁的单词，有助于传达速度和精致的意象。此外，"Chrome"还可以被理解为一种表面处理技术，使其具有光滑、闪亮的外观。因此，谷歌选择使用"Chrome"作为其浏览器的名称，以强调其速度、简洁和闪亮的特性。

四、医药

单词	中文	缩写
Directions	使用说明
rinse	v.用清水冲洗
lightweight	轻量级、轻量级的
heavyweight	重量级、重量级的
dermatologist	皮肤科医生、皮肤学者
encapsulated	密封的
retinol	维A醇、维生素A1、视黄醇
hyaluronic acid	玻尿酸、透明质酸
Hydrate	v.补水	Hydrates intensely 强烈补水 carbohydrate n.碳水化合物
vitamin C	维生素C	VC
vitamin C essence	维C精华
serum	精华液、乳清、血清
niacinamide	烟酰胺
ceramide	神经酰胺
licorice root extract	甘草根提取物
post-acne mark(s)	痘印
pore(s)	毛孔
Non-comedogenic	不含致痘成分
CeraVe	适乐肤
sunscreen	防晒霜
replumps fine lines	修复细纹

五、英美计量单位

容积计量单位	容量
liter (升)	1L = 1000ml
pint (品脱)	1 pint = 0.568升 = 20液体盎司
quart (夸脱)	1 quart = 2 pint
gallon (加仑)	1 gallon = 4 quart = 4.55L
bushel (蒲式耳)	1 bushel = 8 gallon