芯片行业术语和概念

原创已于 2026-07-05 12:40:48 修改 · 139 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

收录于

芯片验证

于 2026-07-05 12:26:04 首次发布

文章目录

一、术语表 Glossary
二、芯片相关的概念

一、术语表 Glossary

1.岗位介绍

https://blog.csdn.net/Edward1027/article/details/162600482

2.芯片IP

芯片IP核：PCIe、MC、MMU、SIP、LLC、DTE、SP、VPU、CVP、GMU

Term缩写	英文全称	中文含义	分类	功能
MAS	Micro-Architecture Specification	微架构规范		电子工程领域：MAS主要被用于描述计算机硬件设计中的微架构层次，它涵盖了处理器设计的细节，如指令集、缓存系统和流水线结构等在计算机硬件设计、系统架构和软件优化中。软件开发者可能会使用MAS来理解和优化设备的性能，或者硬件工程师在开发新型处理器时会参考MAS来确保其设计的高效性和兼容性
IP核	Intellectual Property Core	芯片知识产权核心		集成电路设计中预先设计好、经过验证的、可以重复使用的功能模块
PCIe	PCI Express，Peripheral Component Interconnect Express	外设组件互连扩展总线	接口类IP	主机/外设间高速通信
MC	Memory Controller	存储控制器	存储/内存类IP	DRAM/SRAM读写管理
SIP	Scalable Intelligent Processor	可扩展智能处理器
LLC	last level cache	末级cache
DTE	Data Transformation Engine	数据传输引擎	数据传输类IP	片上/片外数据搬运
GDTE	General Data Transmission Engine	通用数据传输引擎
CDTE	Cluster DTE	集群DTE
ODTE	Off-chip DTE
SDTE	SIP DTE
MMU	Memory Management Unit	内存管理单元
SSM	System & Security Management	系统与安全管理
SP	Scheduling Processor	调度处理器
CVP	Compute Vision Processor	计算视觉处理器	视觉/图像类处理IP	机器视觉处理
VPU	Video Processing Unit	视频处理单元	处理类IP	VPU Codec：VPU编解码器
GMU	Global Management Unit	全局管理单元
DPF	Debug Profiler
XMC	Address Map/Hash Client for CF/DF address	址映射转换单元		进行地址转换和映射
VMS	Virtual Memory System	虚拟内存系统		VM_Sys for host memory address manage VM_Sys for PTE based address translation
IH	Interrupt Handler	中断处理器
SP	Schedule Processer	调度处理器
RDMA	remote DMA	远程-直接内存访问
MDMA	MCU DMA，Microcontroller Unit-Direct Memory Access	微控制器-直接内存访问

3.芯片级通信协议

Term缩写	英文全称	中文含义	拓展
JTAG	Joint Test Action Group	联合测试行为组织	JTAG 是一种标准化的芯片级调试和测试接口协议，官方名称为 IEEE 1149.1 标准，主要用于集成电路(IC)的测试、调试和编程
SPI	Serial Peripheral Interface	串行外设接口
I²C	Inter-Integrated Circuit	I²C总线	串行通信协议，芯片之间的低速通信，连接微控制器和外围设备
UART	Universal Asynchronous Receiver/Transmitter	通用异步收发传输器

4.板卡级

Term缩写	英文全称	中文含义	拓展
GPIO	General Purpose Input/Output	通用输入输出端口	GPIO属于引脚功能，不属于芯片协议。微控制器MCU、单片机的接口
	Gold Finger	金手指	在电脑内存条、显卡上，有一排金黄色导电触片，就是大家俗称的“金手指”。在PCB设计制作行业中的“金手指”，是由connector连接器作为PCB板对外连接网络的出口。
	pin	引脚	是芯片封装体向外引出的金属针脚，用于和外部电路进行电气连接。可以将其想象成芯片与外界沟通的“触角”
PCB	printed circuit board	印刷电路板	PCB板有金手指

在这里插入图片描述

5.芯片级

Term缩写	英文全称	中文含义	拓展
ASIC	Application - Specific Integrated Circuit	专用集成电路	ASIC是专用的，与之相反的是通用芯片应特定用户要求和特定电子系统的需求专门设计、制造的集成电路，和 CPU、GPU 这类适配多种任务的通用芯片不同，ASIC 相当于为单一或一类特定任务量身打造，能最大限度去除冗余功能，专注提升目标任务的效率。
DSA	Domain-Specific Architecture	领域专用架构	DSA和GPU的核心区别在于设计哲学：GPU：为图形和高并行通用计算（如AI训练）设计，保留了较强的可编程性，但能效不是最优。DSA：针对特定领域（如AI推理、自动驾驶）做极致优化，放弃部分通用性以换取更高能效和性能密度。一句话总结：GPU是“并行通用处理器”，DSA是“领域专用加速器”；GPU更灵活，DSA能效更高。燧原的计算卡就是DSA，算不上GPU，因为没有图形光栅渲染功能，只能做AI计算。【显示卡 or AI计算卡】。但是燧原的DSA做不了所有的科学计算，仅仅能做矩阵运算。
GPU	Graphics Processing Unit	图形处理器	专门加速图形渲染（顶点处理、像素着色、纹理映射等）
GPGPU	General-Purpose Graphics Processing Unit	通用图形处理器	在 GPU 架构基础上，使其能高效处理非图形的通用并行计算任务它的核心思想是：让原本专为渲染图形而生的 GPU，能够处理通用的科学计算和并行计算任务。它与普通 GPU 的核心区别在于：普通 GPU：硬件电路为图形渲染的固定流程（如顶点处理、像素着色）做了大量优化，功能相对固定。 GPGPU：在硬件上保留了 GPU 的大规模并行计算能力，同时通过软件（如英伟达的 CUDA）将其通用化。开发者可以用它来运行 AI 训练、物理模拟等非图形任务。 DSA（领域专用架构）：为特定领域（如 AI）做定向优化，像一把“专用钥匙”。能效高，但通用性有限。 GPGPU（通用图形处理器）：为广泛的通用并行计算而设计，像一把“万能工具”。牺牲了一定的能效，但换来了极高的灵活性。
SoC	System on Chip	片上系统、系统级芯片	SoC：把整个计算机系统集成到一块芯片上传统芯片是一个芯片单独负责一个功能，而SoC是将多个芯片的功能(即一个完整的系统)集成到一个芯片上，包含处理器、存储器、输入输出接口等多个功能模块，如CPU、GPU、AI引擎、Wi-Fi、蓝牙等功能
NoC	Network on Chip	片上网络	片上网络是一种在单个芯片内部，用于各功能模块之间高效互联的通信架构。传统片内模块之间常靠总线（bus）通信，但随着核心数量和功能复杂度的增加，总线带宽和可扩展性都成为瓶颈。NoC 通过网格、环形或分层交换网络，把各功能块（IP 核）、处理器核、存储器控制器等节点用路由器和链路互联起来，支持并行、高带宽、低延迟的数据传输，并且更易于扩展和功耗管理。
PHY	Physical Layer	物理层	是通信系统中负责信号传输和接收的部分。PHY通常包括各种硬件组件，它们用于转换信号格式，使得数据能够在不同的物理介质（如电缆、光纤、无线信道等）中进行传输。 PHY (Physical Layer) 物理层： ①PCS (Physical Coding Sublayer)：物理编码子层 ②PMA (Physical Medium Attachment)：物理介质附加子层 PHY代表千兆以太网的物理层，包括物理编码子层Physical Coding Sublayer (PCS)，依附物理介质子层 Physical MediumAttachment (PMA) 以及自动协商层 (AUTONEG)。MEDIUM表示最底层的信号传输介质。
SDMEM	Scalar Data Memory	标量数据内存	存放标量数据，包括：简单的变量 (如 int i、bool flag)、循环计数器、内存地址指针、控制状态寄存器
VDMEM	Vector Data Memory	向量数据内存	存放向量数据，包括：计算负载。例如图像的像素矩阵、神经网络的权重(Weights)、特征图(Feature Maps)。向量运算单元(SIMD)在用VDMEM，负责大规模并行计算
VARAM	Vector Array RAM	向量阵列内存	待计算的向量数组、或者计算过程中的中间结果(Accumulator) 它是 VDMEM 的“前站”。数据从VDMEM取出来后，可能会先放在VARAM里排好队，供计算单元以极低延迟读取。
RO	Ring Oscillator	环形振荡器	ATE阶段记录，判断芯片是哪种Corner
SA	Systerm Adaptor
	bus arbitration	总线仲裁
DF	Data Fabric	数据结构
CF	Control Fabric	控制结构
ESL	Ethernet Smart Link
	architecture	架构
ECCL	Enlightened Collective Communication Library	集体通信库	ECCL 主要专注于在大规模集群和多GPU系统上进行集体通信，目的是提高通信效率
NCCL	NVIDIA Collective Communications Library		NCCL 是 NVIDIA 提供的通信库，专门优化了深度学习训练中的集体通信操作，通常用于多个 GPU 之间的同步和数据交换
HPC	High Performance Computing	高性能计算

在这里插入图片描述

SY是DSA，其他四家是GPU
在这里插入图片描述

6.芯片设计

缩写	英文全称	中文含义	拓展
EDA	Electronic Desgin Automation	电子设计自动化	主流厂商：Synopsys、Cadence、Mentor Graphics
HDL	Hardware Description Language	硬件描述语言	用于描述数字电路和系统的硬件结构和行为，如Verilog和VHDL
RTL	Register Transfer Level	寄存器传输级	是一种对数字电路进行抽象描述的层次，在这个层次上，电路的行为是通过寄存器之间的数据传输和操作来描述的。将数字电路看作由寄存器和组合逻辑构成的系统，代码主要描述数据如何从一个寄存器经过组合逻辑的处理传递到下一个寄存器
RTL	Register-Transfer Level Module	寄存器传输级模块	用硬件描述语言 (Verilog/SystemVerilog) 编写的数字电路代码，描述数据在寄存器之间的传输和变换
RTL code	Register Transfer Level	寄存器传输级	RTL code是硬件本身的代码 (Verilog/VHDL) 它描述的是芯片硬件长什么样：1.有哪些寄存器 2.数据怎么在模块之间流动 3.状态机、总线、接口、时序逻辑。即用Verilog/SystemVerilog ，描述寄存器之间数据怎么传输、怎么运算 RTL code：造硬件的代码 ROM code：存在硬件里、上电就跑的程序
ROM code			ROM code = 固化在 ROM 里的程序代码，芯片上电后，CPU 第一个执行的就是它。内容一般是：1.启动代码 (boot code) 2.初始化代码 (配置时钟、DDR、外设) 3.底层固件 4.小的控制程序
	Synthesis	综合	在芯片设计中，是指将RTL级别的代码转换为门级网表(Gate-Level Netlist)的过程
DFx	Design for Everything	面向X的设计
DFT	Design For Test/Testability	面向测试的设计、可测试性设计	核心原则是通过设计优化使产品在制造和使用阶段易于测试、故障诊断与隔离，从而降低测试成本、提高缺陷检出率在芯片设计阶段就植入专用测试电路(如扫描链、边界扫描、内建自测试BIST等)，解决流片后芯片内部逻辑难以被ATE设备直接检测的问题。以此提升芯片测试覆盖率、降低量产测试成本、缩短测试时间
DFD	Design for Debug	面向调试的设计	预留调试接口和逻辑，方便芯片研发阶段的问题定位
DFM	Design for Manufacture	面向制造的设计
DFP	Design For Profiling	面向分析的设计
DFP	Design for Power	面向功耗的设计
DFP	Design for Performance	面向性能的设计
DFY	Design for Yield	面向良率的设计
DFR	Design for Reliability	面向可靠性的设计
DFC	Design for Cost	面向成本的设计
DFS	Design for Security	面向安全的设计

7.芯片制造、量产

Term缩写	英文全称	中文含义	拓展
LOTNO	Lot Number	批次号	用来标识这一批芯片/板卡来自哪一批生产或来料
QTY	Quantity	数量	指这个批次里参与本次统计的总数（样本数）
	Unit Cell	晶胞	是晶体结构的基本重复单元。在半导体材料的晶体结构研究和设计中经常被用到
	wafer	晶圆	高纯度单晶硅制成的圆形薄片，表面会通过光刻、蚀刻等工艺批量制造出成百上千个相同的集成电路单元。 wafer切割下来的叫做die
	Die	芯片的裸片/晶粒	Die 是指芯片的裸片，即从硅晶圆（Wafer）上切割下来的单一芯片。包含了芯片的实际电路和功能
	chip	芯片	die经过封装后变为chip。一个芯片可能一个Die，也可能两个Die
	dual-chip	双芯片的	efsmt -dualchip show -d dtu.*
	board	板卡	一张板卡可能一颗芯片，也可能两颗芯片(一卡双芯)
Fabless		无晶圆厂	是指那些只进行芯片设计，而没有自己的芯片制造工厂的半导体公司
Fab	fabrication	制造、加工
SKU			同一款芯片，根据不同的设计要求做的不同的板卡
	tape out	流片
	mass production / volume production	量产
EVB	Evaluation Board	评估板，绿色无壳大卡
PRB	Prototype Board	原型板，带壳的小卡
MSN	Manufacturer Serial Number	制造商序列号
MPN	Manufacturer Product Number	制造商产品号
SOP	Standard Operating Procedure	标准操作程序
ECN	Engineering Change Notice	工程变更通知	流程是产品设计、制造和生产过程中用来管理和记录工程变更的正式流程
EOL	End of Life	生命周期结束	EOL：指的是某个产品、部件、服务或技术在其生命周期中的结束阶段，意味着该产品或部件将不再生产、销售或支持。通常，EOL标志着产品不再提供正式的技术支持、修复或升级

8.芯片验证

缩写	英文全称	中文含义	拓展
IRQ	Interrupt Request	中断请求
RAS	Reliability — Availability — Serviceability	可靠性( Reliability )、可用性( Availability ) 与可维护性( Serviceability )	RAS 是Reliability (可靠性)、Availability (可用性)、Serviceability (可维护性 / 可服务性) 的缩写，是计算机硬件工程领域的核心概念，用于衡量系统稳定性、持续服务能力和维护便捷性。在关键任务系统 (金融、医疗、电信、云计算、高性能计算) 中，RAS 设计直接决定业务连续性与数据安全，是企业级系统与消费级系统的核心区别之一。
MAS	Micro Architecture Specification	微架构规范	MAS，简称spec。是芯片IP的完整规格书。必看，反复看，天天看。
PG	Programming Guide	编程指南	Design给Chip Validation同事的开发“测试case”的编程指南，用来约束芯片IP的测试条件
	Calibration	校准
	Pre-Silicon Verification	硅前验证
	Post-Silicon Validation	硅后验证
UVM	Universal Verification Methodology	通用验证方法学	是芯片验证领域的行业标准验证框架，基于SystemVerilog的验证方法学库(类库)
	align	(地址)对齐	地址对齐：addr align、地址非对齐：地址非align
	constraint	约束，限制	验证case有些限制要求
	dependence	依赖、依靠	指是否需要其他同事的帮助，是否有上游依赖
	errata	勘误表
	waveform	波形
	sanity case	健全测试、冒烟测试	sanity test 健全测试 Sanity case是软件或芯片验证(IC)中的一种早期、快速的测试手段，属于冒烟测试(smoke test)的一种
ipmi	Intelligent Platform Management Interface	智能平台管理接口	核心用于服务器 / 硬件设备的带外管理，依赖BMC，通用工具
HAL	Hardware Abstraction Layer	硬件抽象层	是底层软件中承上启下的核心组件，本质是一套屏蔽硬件差异的统一接口层
Tcl	Tool Command Language	工具命令语言	自动化工具开发与系统集成，尤其在芯片 / EDA 领域应用极广
RALF	Register Abstraction Layer Format	寄存器抽象层格式	是寄存器定义文件，DE给的，用工具生成所需要的header file 在芯片RTL领域，.ralf 文件是寄存器抽象层格式（Register Abstraction Layer Format）的缩写。这个文件是连接设计规范与验证实现的桥梁，作为工具链（尤其是Synopsys的ralgen）的标准化输入文件，用于自动化生成验证环境所需的寄存器模型（RAL Model）和RTL代码。
Spec	Specification	芯片设计规格书
	Clock Frequency	时钟频率	也叫主频，是指芯片内部时钟信号的振荡频率，它决定了芯片每秒钟能够执行的指令数
IP validation		芯片IP验证
	Root Cause	根本原因
	errata	勘误表
	A-B-A Swap Test	交叉测试	板级故障排除方法。它的核心思想是通过在“坏板”和“好板”之间互换可疑器件，来判断故障究竟是出在器件本身，还是出在电路板或系统其它部分。

Verification：确认“我们做对了设计”。
Validation：确认“我们做了正确的产品”。

层级关系（从下到上）：

┌─────────────────────────────────────────┐
│              SoC (顶层)                  │
│   整个芯片系统，包含所有模块              │
└─────────────────────────────────────────┘
                    ▲
                    │ 实例化
┌─────────────────────────────────────────┐
│           子系统 (Subsystem)             │
│   如：显示子系统、音频子系统              │
└─────────────────────────────────────────┘
                    ▲
                    │ 实例化
┌─────────────────────────────────────────┐
│            RTL 模块 (底层)               │
│   如：UART 模块、FIFO 模块、状态机        │
└─────────────────────────────────────────┘

验证也分层级：
- 模块级验证 → 验证单个 RTL 模块
- 子系统验证 → 验证模块组合
- 系统级验证 → 验证完整 SoC

9.芯片测试

缩写	英文全称	中文含义	拓展
DUT	Device Under Test	被测器件	需要验证的芯片 RTL 设计
	Harvest	芯片收割 / 功能提取	指通过选择性禁用有缺陷 / 冗余的功能模块或调整性能参数（如降频、降规格），将原本不符合高端产品标准的芯片 “挽救” 为合格的中低端产品，从而最大化晶圆利用率与良率的制造策略
	trial run	试运行
CP	Chip Probing	晶圆测试
FT	Final Test	成品测试
ATE	Automatic Test Equipment	自动测试设备	检查芯片的电气特性和基本功能是否符合设计要求
BU	bringup	(芯片) 点亮
SLT	System Level Test	系统级测试 (筛芯片)
BLT	Board Level Test	板级测试 (筛板卡)
Burn-In	Burn-in Test	烧机老化测试	是让芯片在高温、高电压等加速老化条件下工作一段时间(通常为24h)，以此筛选出早期失效的产品
BLR	Board Level Reliability	板卡级可靠性
	Package Reliability	封装可靠性	是衡量封装对芯片保护以及长期使用稳定性的指标
	Yield	良率	是指在半导体制造过程中，合格芯片的产比例
TFLOPS	TFLOPS: Tera Floating Point Operations Per Second	每秒 1万亿次浮点运算	t：T是一万亿，1×10¹²，即 1000G flo：Floating Point，浮点数 ps：每秒是衡量计算机性能，特别是在执行浮点运算时的能力的一个单位
PFLOPS	Peta FLOPS: Peta Floating Point Operations Per Second	每秒 1000万亿次浮点运算	1 GFLOPS = 10⁹ 每秒10亿次 1 TFLOPS = 10¹² 每秒1万亿次 1 PFLOPS = 10¹⁵ 每秒 1000 万亿次换算：1 PFLOPS = 1000 TFLOPS

10.寄存器、efuse

缩写	英文全称	中文全称	拓展
reg	register	寄存器
	sticky register	粘性寄存器	是指在计算机硬件（尤其是PCIe等总线设备）中，在发生系统级或热复位（如Warm Reset、Hot Reset）时，其保存的数值或状态不会被清除的特殊寄存器
BAR	Base Address Register	基址寄存器
eFuse	electronic fuse	电熔断(电子保险丝)	可用作一次性可编程存储器(OTP)，也可用于电路过流、过压等保护
OTP	One Time Programmable	一次性可编程存储器	eFuse 是 OTP 的一种物理实现方式，但并非所有 OTP 都基于 eFuse

11.PVT：电压、电源、功耗、温度、Profiling

缩写	英文全称	中文全称	拓展
PVT	Process-Voltage-Temperature	工艺、电压、温度	工艺、电压、温度是影响芯片性能和稳定性的三大核心环境变量。芯片的电气特性（如运行速度、功耗、时序、漏电率）会随这三个因素的变化而改变，因此在芯片的设计、验证、测试阶段，必须充分考虑 PVT 条件，确保芯片在各种极端场景下都能正常工作。
Corner 芯片	Process Corner	工艺角	5种工艺角：TT、FF、SS、FS、SF
TT 芯片	Typical-Typical	典型工艺	NMOS、PMOS 均为标称性能，无明显偏差
FF 芯片	Fast-Fast	快速工艺
SS 芯片	Slow-Slow	慢速工艺
FS 芯片	Fast-Slow		工艺类型为FS，NMOS性能为快速，PMOS性能为慢速核心验证目标为：下降沿主导的时序路径
SF 芯片	Slow-Fast		工艺类型为FS，NMOS性能为慢速，PMOS性能为快速核心验证目标为：上升沿主导的时序路径
Vmin	Minimum Voltage	最低工作电压	指芯片或电路在正常工作状态下的最小电压。这是芯片或电路能够正常运行所需的最低电压。举例：某芯片标称供电 1.0V，规格要求工作电压范围 0.9V ~ 1.1V：Vnom = 1.0 V (标准电压)，Vmin = 0.9 V (厂家定义的最低工作电压)，Vmax = 1.1 V(最高耐压) Efuse已烧写Vmin（频点SKU1 187/800/857/923/1000/1090，SKU2 500/600/700，开GD）
GB	GuardBand	防护带 / 裕量	GuardBand 是在芯片的电气参数、时序、电压 / 频率等关键指标上设置的冗余余量
DPM	Dynamic Power Management	动态电源管理	根据实时负载动态调整功耗：当芯片负载较低时，降低 CPU 电压和频率，显著减少动态功耗
CTF	Critical Thermal Fault	临界热故障	超过温度门槛限制，则过温的红灯亮起
VRM	Voltage Regulator Module	电压调节模块	用来降压稳压，可以用来表示电源芯片的温度。VRM 本质是芯片的 “专属电源管家”。
PN结	P–N junction	PN 结	是将掺杂了受主杂质(P 型)和施主杂质(N 型)的两种半导体材料在同一晶体中相邻区域结合起来的接口结构
Tj	Junction Temperature	结温	半导体器件内部 PN 结处的实际温度，即发热最集中的位置。我们指的是efsmt -thermal list 中 VT0-VT4 五个传感器中温度的最大值，是实测温度
TjMax		最高温限制
Profiling	profiling	性能分析	通过工具对程序运行过程进行测量，定位资源消耗瓶颈，以指导性能优化的方法
	power	功率
	Power Consumption	功耗	是指芯片在工作过程中消耗的电能。在移动设备等对电池续航要求高的应用场景中，低功耗芯片非常关键
IDDQ	Iddle Drain Quiescent current 或Quiescent Power Supply Current	静态电源电流	静态静态漏电流、静态工作电流 (静态)
$\frac{dI}{dt}$	Dynamic Current	动态电流	didt是电流的微分，就是动态电流

在这里插入图片描述

5种Corner芯片工艺工况 (TT/FF/SS/FS/SF) 应用场景速查表

工艺工况	英文全称	核心晶体管性能特征	主要应用场景	验证 / 测试目标
Corner 芯片			分类：TT(典型工艺角)、FF(最快工艺角)、SS(最慢工艺角)、FS(不对称)、SF(不对称)。比如JY遇到过3FF的corner芯片，“3FF是最快的corner，电流也最大
TT芯片	Typical-Typical	NMOS、PMOS 均为标称性能，无明显偏差	1.芯片设计基准验证 2.常规功能与性能仿真 3.功耗与频率的标称值标定	确认芯片在理想工艺条件下的基础功能、性能和功耗指标，作为其他工况的对比基准
FF	Fast-Fast	NMOS、PMOS 均为最快速度，漏电流偏大	1.芯片极限性能测试(最高运行频率) 2.漏电流上限验证 3.高速接口时序裕量测试	验证芯片的性能上限，排查高速运行时的时序冲突、信号完整性问题，评估最大漏电流对功耗的影响
SS	Slow-Slow	NMOS、PMOS 均为最慢速度，漏电流偏小	1.芯片最坏工况稳定性验证 2.最低工作电压测试 3.低温 / 高温极端环境下的功能测试	确认芯片在工艺、电压、温度（PVT）最差组合下的可靠性，避免出现时序不满足、功能失效的问题
FS	Fast-Slow	NMOS快速，PMOS慢速	1.组合逻辑时序不对称性验证 2.下降沿主导的时序路径测试 3.逻辑门电平转换稳定性验证	排查因NMOS 和 PMOS 速度差异导致的下降沿过快、上升沿过慢的时序裕量不足问题
SF	Slow-Fast	NMOS慢速，PMOS快速	1.电平转换电路可靠性验证 2.上升沿主导的时序路径测试 3.电源管理模块稳定性验证	解决因 PMOS 过快、NMOS 过慢引发的上升沿时序异常，保障电平转换、电源控制等模块的正常工作

PVT：

Process（工艺）
指芯片制造过程中的工艺偏差。即使是同一批次、同一生产线生产的芯片，也会因为光刻、蚀刻、掺杂等步骤的细微差异，导致晶体管的性能（如开关速度、阈值电压）存在个体差别。工艺偏差通常分为 TT（典型工艺）、FF（快速工艺）、SS（慢速工艺）等类型，分别对应晶体管性能的典型、最优、最差情况。
Voltage（电压）
指芯片工作时的供电电压。电压越高，晶体管开关速度越快，芯片运行频率越高，但功耗和发热也会随之增加；电压过低则可能导致芯片时序不满足要求，甚至出现逻辑错误、无法启动。芯片设计时会定义标称电压（如 1.0V），同时也会考虑电压波动的范围（如 ±5%）。
Temperature（温度）
指芯片工作时的核心温度。温度升高会使晶体管载流子迁移率下降，开关速度变慢，同时漏电电流增大，进一步加剧发热；温度过低则可能提升晶体管性能，但也可能影响某些封装材料或接口的稳定性。芯片的工作温度范围通常分为商业级（0℃_{70℃）、工业级（-40℃}85℃）、汽车级（-40℃~125℃）等。

11.复位操作

深入理解PCIe复位：Cold Reset, Warm Reset, Hot Reset与FLR的对比与实践

英文全称	中文含义	拓展
Function Level Rest	功能级复位	针对单个功能的软复位
Fundamental Reset	基本复位	影响整个物理设备的最强力复位。包括：Cold Reset、Warm Reset、Hot Reset
Cold Reset	冷复位	断电重启
Warm Reset	暖复位	与Cold Reset的唯一区别：电源保持稳定。这省去了电源上下电的物理过程，速度可能稍快。
Hot Reset	热复位

重置环境：
1.flr :
2.hot reset
3.warmboot(热启动)：用命令行reboot进行重启
4.DC boot(直流电启动)：按电源键重启
5.AC boot(交流电启动)：通过PDU断电
6.cold reboot (冷启动)：完全关闭电源

12.平台

Term缩写	英文全称	中文含义	拓展
Emu	Emulator	硬件仿真器	常见的Emulation有：Palladium、Zebu、合见 Emulatior是一种介于软件逻辑仿真和FPGA原型验证(Prototyping)之间的高性能硬件验证工具。它通过专用的硬件阵列(如定制化ASIC或大规模FPGA阵列)来映射待验证的RTL设计，从而在硬件层面加速执行验证过程。帮助开发人员在芯片或设备还未制造出来之前，通过模拟来测试和验证硬件设计的功能和性能。
	Palladium	帕拉丁	Cadence的Palladium，编译速度极快
	Zebu	泽布	Synopsys的Zebu，运行速度最快
VDK	Virtualizer Development Kit	虚拟开发套件	由新思科技(Synopsys)推出，用软件模拟出一整套虚拟硬件平台(CPU、内存、外设、总线等)，让你在真实芯片/板卡出来之前，就能跑、调试、测试完整的二进制软件(驱动、OS、应用) 流片前的早期验证，寄存器级。软件建模，CPU在跑，比较慢经典流程：架构 → VDK 建模 → 软件 / 固件开发 → RTL 设计 → FPGA 原型 → 流片
PDU	Power Distribution Unit	电源分配单元	是数据中心和服务器环境中用于管理电力分配的关键设备，它通过控制电源通断来实现AC boot（交流电启动）过程中的断电操作
BMC	Baseboard Management Controller	基板管理控制器	BMC的作用：远程访问主机屏幕
ODM	Original Design Manufacturer	原始设计制造商	ODM = 设计 + 制造全包在电子、计算机和硬件制造行业，它指的是一种商业模式：一家公司 (ODM 厂商) 负责产品的设计、研发和制造，然后将成品贴上另一家公司 (品牌商) 的商标进行销售。通俗地说，就是 “品牌方出钱出牌子，ODM 方出技术出工厂”。
OEM	Original Equipment Manufacturer	原始设备制造商
AVSBus		一个为低功耗、嵌入式和传感器应用设计的通信总线协议
	vendor	供应商
smi	System Management Interface	系统管理接口	与ipmi是跨厂商不同，smi是各家自己开发的
smt	System Management Tool	系统管理工具
FW	FirmWare	固件
RPM	Revolutions Per Minute	每分钟转速
KMD	Kernel Mode Driver	核心模式驱动程序
SILICON	Silicon	硅	硬件本身，是真实的平台
EVB	Evaluation Board	评估板	用于评估和测试特定芯片或系统，通常具有预设功能
PRB	Prototyping Board	原型板	提供一个可定制的硬件平台，用于快速原型开发和设计验证，灵活性更高

13.嵌入式

Term缩写	英文全称	中文含义	拓展
	单片机		Raspberry Pi 树莓派、Arduino
MCU	Microcontroller Unit	微控制器	例如：STM32，XMC
DSP	Digital Signal Processor	数字信号处理器	专为高速数字信号处理算法（如滤波、傅里叶变换、卷积、矩阵运算等）优化的微处理器
FPGA	Field-Programmable Gate Array	现场可编程门阵列	FPGA 是一种可由用户在出厂后反复配置的半导体器件，内部由大量可编程逻辑单元及可配置互连组成。特点：①可重构：设计者可根据需求反复下载不同的逻辑功能。②并行处理：每个逻辑单元独立工作，天然支持并行计算。③硬件加速：对于特定算法，FPGA 可实现硬件级加速，性能远超通用 CPU

14.大模型

Term缩写	英文全称	中文含义	拓展
ONNX	Open Neural Network Exchange	开放神经网络交换格式	跨框架通用模型中间交换标准，解决不同训练框架(PyTorch、TensorFlow)模型互不兼容的问题

二、芯片相关的概念

1.芯片结构

(1)wafer：晶圆

晶圆，是指硅半导体集成电路制作所用的硅晶片，由于其形状为圆形，故称为晶圆。
在这里插入图片描述

(2)Die：晶粒

Die指的是芯片未封装前的晶粒，是从硅晶圆（wafer）上用激光或刀具切割而成的小片，每一个小片就是一个独立的功能芯片die，一旦这些die完成其功能和测试过程，它们就会被封装起来，形成我们熟知的芯片（chip）。晶粒是组成多晶体的外形不规则的小晶体，而每个晶粒有时又有若干个位向稍有差异的亚晶粒所组成。晶粒的平均直径通常在0.015~0.25mm范围内，而亚晶粒的平均直径通常为0.001mm数量级。

在这里插入图片描述

(3)SoC

SoC 是一种将计算机系统的多个组件集成到一个芯片上的设计方案，广泛应用于需要高度集成和低功耗的设备中。SoC的典型组件包括CPU、GPU、内存控制器、数字信号处理器（DSP）、输入/输出接口，以及专用功能模块（如音频、视频处理模块等），都集成在单一的芯片内

传统芯片和SoC举例：
(1)传统芯片：
①Intel Core i9：这是一个CPU芯片，只负责中央处理功能。
②NVIDIA GTX 1080：这是一个GPU芯片，专门处理图形计算任务。
(2)SoC具有更高的集成度、低功耗和空间优化。
Apple A14 Bionic：这是一款典型的SoC，包含了CPU核心、GPU、神经网络引擎、图像信号处理器(ISP)、存储控制器等多个功能模块，广泛用于iPhone、iPad等设备。

2.芯片设计

(1)EDA

国际EDA：synopsis(ZeBu)
国产EDA/硅前硬件仿真平台：华大九天、帕拉丁(Palladium)、合见工业软件

帕拉丁比起合见的优点：方便看波形，波形可以实时显示；抓波形方便，可以写脚本逻辑，在信号变化的时候自动抓波形

3.芯片验证

(1)芯片IP

1.概念
IP(Intellectual Property)，知识产权。
IP模块是指在芯片设计中可以重复使用的功能模块或电路块。
IP 模块可以是由设计公司开发的，也可以从第三方供应商购买，用于集成到系统级芯片（SoC）中

2.IP 模块的常见类型：
①PCIe
②MC
③SSM_FW
④VPU
⑤SIP
⑥SP
⑦GDTE
⑧GMU
⑨CVP

①CPU IP(处理器IP)：例如ARM的Cortex系列。
②GPU IP(图形处理IP)：例如NVIDIA IP，例如 GPU 核心，用于图形处理和加速
③MC IP(存储控制器IP)：例如 DDR、eMMC、Flash 控制器，用于管理存储器
④通信接口IP：例如 PCIe、USB、I²C、SPI 等。
⑤安全IP：例如加密模块，用于数据加密和解密

3.IP的作用：
这些 IP 模块可以帮助设计人员减少设计周期、降低开发成本，并确保功能的可靠性。

IP 模块是指在芯片设计中可以重复使用的功能模块，帮助简化和加速设计过程。它们通常经过严格的验证，确保可靠性和兼容性，是现代复杂系统和芯片设计中不可或缺的构件。

(2)ralf文件

RALF（Register Abstraction Layer File）是一种用于描述硬件设计中寄存器和内存结构的文本格式，广泛应用于SoC（System on Chip）验证中，尤其是在UVM（Universal Verification Methodology）环境下。

RALF文件简介
RALF文件采用类似Tcl的语法，结构化地描述了寄存器、字段、寄存器文件、内存、块（block）和系统（system）等元素。

寄存器（register）：由一个或多个字段（field）组成，表示硬件中的寄存器。
字段（field）：寄存器的最小可访问单元，通常对应硬件中的一位或多位。
寄存器文件（regfile）：由多个寄存器组成的集合。
内存（memory）：用于描述存储器区域。
块（block）：逻辑功能单元，包含寄存器和内存。
系统（system）：由多个块或子系统组成的顶层结构。

这些元素通过层次化的结构组织，便于描述复杂的硬件设计。

4.底软 (底层软件)

(1)简介

底软就是底层软件的简称，它是位于软件架构最底层、直接与硬件交互的软件集合，是上层应用程序操控硬件的核心桥梁。

简单来说，没有底软，硬件就是一块 “裸板”，既无法被操作系统识别，也无法完成任何数据传输或计算任务。

(2)核心运行组件：Firmware、Driver、HAL

(1)Firmware (固件)
(2)Driver (驱动程序)
(3)HAL (硬件抽象层)：基于驱动做二次封装，提供标准化接口屏蔽不同硬件的差异

(3)配套工具组件：smi、smt、validaiton suite、ipmitool

(1)smi 工具：指 System Management Interface 工具，用于直接访问硬件的管理接口，比如读写 PCIe 设备的配置空间、查询芯片温度 / 功耗、配置硬件参数。完全面向底层硬件，属于典型的底软调试工具。例如：nvidia-smi
(2)smt工具
(3)validation suite工具
(4)ipmitool

在这里插入图片描述

5.存储：内存、存储颗粒

在这里插入图片描述

为了理解区别，我们把数据比作货物，把内存比作公路：

(1)LPDDR

LPDDR5 (经济型高速路)：
这是一条 8 车道的高速路。
路况很好，车也省油（省电）。
优势：造价便宜，路可以修得很长很长（容量可以做得很大，比如 256GB）。
劣势：爆发力不够，如果瞬间涌入海量车流，会堵车。

(2)GDDR

GDDR6X (赛车道)：
这是一条 32 车道的超级公路。
车速极快，但非常费油（耗电、发热）。
优势：玩游戏时，每一帧画面需要瞬间传完，它最合适。

(3)HBM

HBM3 (立体交通枢纽)：
这不仅是公路，这是1024车道的超宽路面，甚至是地下的高频磁悬浮列车。
优势：吞吐量惊人。用来训练大模型时，几千亿个参数需要频繁进出，只有它扛得住。
劣势：造价极其昂贵，而且受限于物理空间，很难把“停车场”修得很大（容量扩充难，单颗通常只有 24GB/36GB，凑出 80GB 很难）。

6.工艺

(1)Corner芯片介绍

https://www.gloomyghost.com/live/20250204.aspx

<1>Corner芯片的分类：PVT

在一片wafer上，不可能每个芯片的载流子平均漂移速度都是一样的，随着电压、温度不同，它们的特性也会不同。

把他们分类就有了PVT(Process，Voltage，Temperature)：
①Process：工艺参数波动（即工艺角）
②Voltage：供电电压变化（如±10%）
③Temperature:工作温度范围（如-40°C~125°C）

也就是Corner先分为 Process Corner、Voltage Corner、Temperature Corner。
Process Corner(工艺角Corner)又分为五种：

①TT：Typical N Typical P：NMOS 和 PMOS 都是典型工艺速度
②FF：Fast N Fast P：NMOS 和 PMOS 都偏快
③SS：Slow N Slow P：NMOS 和 PMOS 都偏慢
④FS：Fast N Slow P：NMOS 快，PMOS 慢（不对称）
⑤SF：Slow N Fast P：NMOS 慢，PMOS 快（不对称）

<2>Process Corner 工艺角：TT、FF、SS、FS、SF

1.工艺角的定义及产生原因
芯片制造过程中存在工艺偏差，如掺杂浓度、扩散深度、刻蚀程度等，导致不同批次、同一批次不同晶圆以及同一晶圆不同芯片之间的性能存在差异。为了描述这种差异，引入了工艺角的概念。

2.常见的工艺角类型：5种
(1)TT (Typical - Typical)：代表典型工艺角，此时晶体管的各项参数都在标称值或平均值附近，芯片性能处于设计预期的典型状态，通常作为基准用于芯片设计和验证。

(2)FF (Fast - Fast)：表示快速工艺角，NMOS 和 PMOS 的性能都偏向快速，即晶体管的饱和电流大，阈值电压小，运行速度快。这种工艺角下芯片的工作频率可能较高，但功耗和电源完整性等方面可能面临更大挑战。

(3)SS (Slow - Slow)：是慢速工艺角，所有晶体管的工作速度都比平均速度慢，饱和电流小，阈值电压大。芯片在 SS 工艺角下性能受限，但电源完整性可能相对较好。

(4)FS (Fast - Slow)：指 NMOS 速度快，PMOS 速度慢的工艺角。

(5)SF (Slow - Fast)：与 FS 相反，是 NMOS 速度慢，PMOS 速度快的工艺角。

在这里插入图片描述

注： SS、 TT、FF 分别是左下角的corner, 中心、右上角corner

在这里插入图片描述

<3>3FF Corner芯片

3FF Corner：
专指 3nm 级 FinFET 工艺，基于第三代 FinFET 技术

FinFET（鳍式场效应晶体管，Fin Field-Effect Transistor）是一种三维结构的晶体管，通过立体架构解决了传统平面 MOSFET 在纳米级工艺下面临的短沟道效应和漏电流问题，是目前集成电路（IC）制造的主流技术。

(2)Harvest

Harvest (芯片收割/ 功能提取)
核心目标：提升整体良率，创造差异化产品
操作范围：涵盖功能禁用、性能降档、规格调整等综合策略
应用场景：制造良率优化、产品线丰富化、成本控制
实施结果：产生不同档次产品（如高端芯片→中端 / 入门级）

(3)Tj温度：结温

结温（Junction Temperature, Tj）：半导体器件内部 PN 结处的实际温度，即发热最集中的位置。

Tj(Junction Temperature)即结温，指的是半导体器件内部 PN 结处的温度，通常高于器件外壳温度（Tc）和环境温度（Ta）。结温直接影响器件的电学性能、可靠性和寿命，是热设计和热管理的核心指标。

1.Tj的概念
在这里插入图片描述

Tj的计算
在这里插入图片描述

7.芯片与显卡

(1)CPU、GPU、NPU、TPU、LPU

CPU 适用于通用计算任务。
GPU 适合大规模并行处理，尤其是图形和AI训练。
NPU 专为AI推理任务设计，具有更高效的神经网络运算能力。NPU是一种专门针对神经网络计算进行特殊优化设计的集成电路元件，擅长处理视频、图像、语言类多媒体数据。

在这里插入图片描述

(2)目前市面上的GPU芯片：V100、A100、H100

V100适合基础的AI训练和推理任务。
A100是数据中心的通用高性能GPU，适合多种计算任务。
H100是目前性能最强的GPU，特别适合大规模AI模型训练和高性能计算。
H200和H800是针对中国市场设计的受限版GPU，性能稍逊于H100，但仍然具备强大的计算能力

(3)显卡

<1>GTX

GTX (Giga Texel Shader eXtreme)
定位：传统的高性能图形渲染。
代表型号： GTX 1080 Ti, GTX 1660, GTX 1650 (你的显卡)。
核心技术：光栅化（Rasterization）。

<2>RTX

RTX (Ray Tracing Texel eXtreme)
定位：实时光线追踪 + AI 人工智能计算。
代表型号： RTX 2060, RTX 3090, RTX 4090。
核心技术：除了传统核心外，它多了两个专门的硬件单元：

RT Cores (光线追踪核心)：专门用来算“光线是怎么从物体上弹射的”。在 Isaac Sim 这种仿真器里，为了让机器人看到的画面和真实世界一样（比如镜面反射、阴影），必须用到它。
Tensor Cores (张量核心)：专门用来算 $\times 4$ 矩阵乘法。这是深度学习的命根子。有了它，跑 PyTorch/TensorFlow 的速度会几倍、几十倍地提升。DLSS（深度学习超级采样）也是靠它实现的。