芯片行业术语和概念

一、术语表 Glossary

1.岗位介绍

https://blog.csdn.net/Edward1027/article/details/162600482


2.芯片IP

芯片IP核:PCIe、MC、MMU、SIP、LLC、DTE、SP、VPU、CVP、GMU

Term缩写英文全称中文含义分类功能
MASMicro-Architecture Specification微架构规范电子工程领域:MAS主要被用于描述计算机硬件设计中的微架构层次,它涵盖了处理器设计的细节,如指令集、缓存系统和流水线结构等
在计算机硬件设计、系统架构和软件优化中。软件开发者可能会使用MAS来理解和优化设备的性能,或者硬件工程师在开发新型处理器时会参考MAS来确保其设计的高效性和兼容性
IP核Intellectual Property Core芯片知识产权核心集成电路设计中预先设计好、经过验证的、可以重复使用的功能模块
PCIePCI Express,Peripheral Component Interconnect Express外设组件互连扩展总线接口类IP主机/外设间高速通信
MCMemory Controller存储控制器存储/内存类IPDRAM/SRAM读写管理
SIPScalable Intelligent Processor可扩展智能处理器
LLClast level cache末级cache
DTEData Transformation Engine数据传输引擎数据传输类IP片上/片外数据搬运
GDTEGeneral Data Transmission Engine通用数据传输引擎
CDTECluster DTE集群DTE
ODTEOff-chip DTE
SDTESIP DTE
MMUMemory Management Unit内存管理单元
SSMSystem & Security Management系统与安全管理
SPScheduling Processor调度处理器
CVPCompute Vision Processor计算视觉处理器视觉/图像类处理IP机器视觉处理
VPUVideo Processing Unit视频处理单元处理类IPVPU Codec:VPU编解码器
GMUGlobal Management Unit全局管理单元
DPFDebug Profiler
XMCAddress Map/Hash Client for CF/DF address址映射转换单元进行地址转换和映射
VMSVirtual Memory System虚拟内存系统VM_Sys for host memory address manage
VM_Sys for PTE based address translation
IHInterrupt Handler中断处理器
SPSchedule Processer调度处理器
RDMAremote DMA远程-直接内存访问
MDMAMCU DMA,Microcontroller Unit-Direct Memory Access微控制器-直接内存访问

3.芯片级通信协议

Term缩写英文全称中文含义拓展
JTAGJoint Test Action Group联合测试行为组织JTAG 是一种标准化的 芯片级调试和测试接口协议,官方名称为 IEEE 1149.1 标准,主要用于集成电路(IC)的测试、调试和编程
SPISerial Peripheral Interface串行外设接口
I²CInter-Integrated CircuitI²C总线串行通信协议,芯片之间的低速通信,连接微控制器和外围设备
UARTUniversal Asynchronous Receiver/Transmitter通用异步收发传输器

4.板卡级

Term缩写英文全称中文含义拓展
GPIOGeneral Purpose Input/Output通用输入输出端口GPIO属于引脚功能,不属于芯片协议。
微控制器MCU、单片机的接口
Gold Finger金手指在电脑内存条、显卡上,有一排金黄色导电触片,就是大家俗称的“金手指”。
在PCB设计制作行业中的“金手指”,是由connector连接器作为PCB板对外连接网络的出口。
pin引脚是芯片封装体向外引出的金属针脚,用于和外部电路进行电气连接。可以将其想象成芯片与外界沟通的“触角”
PCBprinted circuit board印刷电路板PCB板有金手指

在这里插入图片描述


5.芯片级

Term缩写英文全称中文含义拓展
ASICApplication - Specific Integrated Circuit专用集成电路ASIC是专用的,与之相反的是通用芯片
应特定用户要求和特定电子系统的需求专门设计、制造的集成电路,和 CPU、GPU 这类适配多种任务的通用芯片不同,ASIC 相当于为单一或一类特定任务量身打造,能最大限度去除冗余功能,专注提升目标任务的效率。
DSADomain-Specific Architecture领域专用架构DSA和GPU的核心区别在于设计哲学:GPU:为图形和高并行通用计算(如AI训练)设计,保留了较强的可编程性,但能效不是最优。DSA:针对特定领域(如AI推理、自动驾驶)做极致优化,放弃部分通用性以换取更高能效和性能密度。一句话总结:GPU是“并行通用处理器”,DSA是“领域专用加速器”;GPU更灵活,DSA能效更高。
燧原的计算卡就是DSA,算不上GPU,因为没有图形光栅渲染功能,只能做AI计算。【显示卡 or AI计算卡】。但是燧原的DSA做不了所有的科学计算,仅仅能做矩阵运算。
GPUGraphics Processing Unit图形处理器专门加速图形渲染(顶点处理、像素着色、纹理映射等)
GPGPUGeneral-Purpose Graphics Processing Unit通用图形处理器在 GPU 架构基础上,使其能高效处理非图形的通用并行计算任务
它的核心思想是:让原本专为渲染图形而生的 GPU,能够处理通用的科学计算和并行计算任务。
它与普通 GPU 的核心区别在于:
普通 GPU:硬件电路为图形渲染的固定流程(如顶点处理、像素着色)做了大量优化,功能相对固定。
GPGPU:在硬件上保留了 GPU 的大规模并行计算能力,同时通过软件(如英伟达的 CUDA)将其通用化。开发者可以用它来运行 AI 训练、物理模拟等非图形任务。

DSA(领域专用架构):为 特定领域(如 AI)做定向优化,像一把“专用钥匙”。能效高,但通用性有限。
GPGPU(通用图形处理器):为 广泛的通用并行计算 而设计,像一把“万能工具”。牺牲了一定的能效,但换来了极高的灵活性。
SoCSystem on Chip片上系统、系统级芯片SoC:把整个计算机系统集成到一块芯片上
传统芯片是一个芯片单独负责一个功能,而SoC是将多个芯片的功能(即一个完整的系统)集成到一个芯片上,包含处理器、存储器、输入输出接口等多个功能模块,如CPU、GPU、AI引擎、Wi-Fi、蓝牙等功能
NoCNetwork on Chip片上网络片上网络是一种在单个芯片内部,用于各功能模块之间高效互联的通信架构。传统片内模块之间常靠总线(bus)通信,但随着核心数量和功能复杂度的增加,总线带宽和可扩展性都成为瓶颈。NoC 通过网格、环形或分层交换网络,把各功能块(IP 核)、处理器核、存储器控制器等节点用路由器和链路互联起来,支持并行、高带宽、低延迟的数据传输,并且更易于扩展和功耗管理。
PHYPhysical Layer物理层是通信系统中负责信号传输和接收的部分。PHY通常包括各种硬件组件,它们用于转换信号格式,使得数据能够在不同的物理介质(如电缆、光纤、无线信道等)中进行传输。
PHY (Physical Layer) 物理层:
①PCS (Physical Coding Sublayer):物理编码子层
②PMA (Physical Medium Attachment):物理介质附加子层
PHY代表千兆以太网的物理层,包括物理编码子层Physical Coding Sublayer (PCS),依附物理介质子层 Physical MediumAttachment (PMA) 以及自动协商层 (AUTONEG)。MEDIUM表示最底层的信号传输介质。
SDMEMScalar Data Memory标量数据内存存放标量数据,包括:简单的变量 (如 int i、bool flag)、循环计数器、内存地址指针、控制状态寄存器
VDMEMVector Data Memory向量数据内存存放向量数据,包括:计算负载。例如图像的像素矩阵、神经网络的权重(Weights)、特征图(Feature Maps)。
向量运算单元(SIMD)在用VDMEM,负责大规模并行计算
VARAMVector Array RAM向量阵列内存待计算的向量数组、或者计算过程中的中间结果(Accumulator)
它是 VDMEM 的“前站”。数据从VDMEM取出来后,可能会先放在VARAM里排好队,供计算单元以极低延迟读取。
RORing Oscillator环形振荡器ATE阶段记录,判断芯片是哪种Corner
SASysterm Adaptor
bus arbitration总线仲裁
DFData Fabric数据结构
CFControl Fabric控制结构
ESLEthernet Smart Link
architecture架构
ECCLEnlightened Collective Communication Library集体通信库ECCL 主要专注于在大规模集群和多GPU系统上进行集体通信,目的是提高通信效率
NCCLNVIDIA Collective Communications LibraryNCCL 是 NVIDIA 提供的通信库,专门优化了深度学习训练中的集体通信操作,通常用于多个 GPU 之间的同步和数据交换
HPCHigh Performance Computing高性能计算

在这里插入图片描述


在这里插入图片描述


SY是DSA,其他四家是GPU
在这里插入图片描述


6.芯片设计

缩写英文全称中文含义拓展
EDAElectronic Desgin Automation电子设计自动化主流厂商:Synopsys、Cadence、Mentor Graphics
HDLHardware Description Language硬件描述语言用于描述数字电路和系统的硬件结构和行为,如Verilog和VHDL
RTLRegister Transfer Level寄存器传输级是一种对数字电路进行抽象描述的层次,在这个层次上,电路的行为是通过寄存器之间的数据传输和操作来描述的。
将数字电路看作由寄存器和组合逻辑构成的系统,代码主要描述数据如何从一个寄存器经过组合逻辑的处理传递到下一个寄存器
RTLRegister-Transfer Level Module寄存器传输级模块用硬件描述语言 (Verilog/SystemVerilog) 编写的数字电路代码,描述数据在寄存器之间的传输和变换
RTL codeRegister Transfer Level寄存器传输级RTL code是硬件本身的代码 (Verilog/VHDL)
它描述的是芯片硬件长什么样:1.有哪些寄存器 2.数据怎么在模块之间流动 3.状态机、总线、接口、时序逻辑。即用Verilog/SystemVerilog ,描述寄存器之间数据怎么传输、怎么运算
RTL code:造硬件的代码
ROM code:存在硬件里、上电就跑的程序
ROM codeROM code = 固化在 ROM 里的程序代码,芯片上电后,CPU 第一个执行的就是它。
内容一般是:1.启动代码 (boot code) 2.初始化代码 (配置时钟、DDR、外设) 3.底层固件 4.小的控制程序
Synthesis综合在芯片设计中,是指将RTL级别的代码转换为门级网表(Gate-Level Netlist)的过程
DFxDesign for Everything面向X的设计
DFTDesign For Test/Testability面向测试的设计、可测试性设计核心原则是通过设计优化使产品在制造和使用阶段易于测试、故障诊断与隔离,从而降低测试成本、提高缺陷检出率
在芯片设计阶段就植入专用测试电路(如扫描链、边界扫描、内建自测试BIST等),解决流片后芯片内部逻辑难以被ATE设备直接检测的问题。
以此提升芯片测试覆盖率、降低量产测试成本、缩短测试时间
DFDDesign for Debug面向调试的设计预留调试接口和逻辑,方便芯片研发阶段的问题定位
DFMDesign for Manufacture面向制造的设计
DFPDesign For Profiling面向分析的设计
DFPDesign for Power面向功耗的设计
DFPDesign for Performance面向性能的设计
DFYDesign for Yield面向良率的设计
DFRDesign for Reliability面向可靠性的设计
DFCDesign for Cost面向成本的设计
DFSDesign for Security面向安全的设计

7.芯片制造、量产

Term缩写英文全称中文含义拓展
LOTNOLot Number批次号用来标识这一批芯片/板卡来自哪一批生产或来料
QTYQuantity数量指这个批次里参与本次统计的总数(样本数)
Unit Cell晶胞是晶体结构的基本重复单元。在半导体材料的晶体结构研究和设计中经常被用到
wafer晶圆高纯度单晶硅制成的圆形薄片,表面会通过光刻、蚀刻等工艺批量制造出成百上千个相同的集成电路单元。
wafer切割下来的叫做die
Die芯片的裸片/晶粒Die 是指芯片的 裸片,即从硅晶圆(Wafer)上切割下来的单一芯片。包含了芯片的实际电路和功能
chip芯片die经过封装后变为chip。一个芯片可能一个Die,也可能两个Die
dual-chip双芯片的efsmt -dualchip show -d dtu.*
board板卡一张板卡可能一颗芯片,也可能两颗芯片(一卡双芯)
Fabless无晶圆厂是指那些只进行芯片设计,而没有自己的芯片制造工厂的半导体公司
Fabfabrication制造、加工
SKU同一款芯片,根据不同的设计要求做的不同的板卡
tape out流片
mass production / volume production量产
EVBEvaluation Board评估板,绿色无壳大卡
PRBPrototype Board原型板,带壳的小卡
MSNManufacturer Serial Number制造商序列号
MPNManufacturer Product Number制造商产品号
SOPStandard Operating Procedure标准操作程序
ECNEngineering Change Notice工程变更通知流程是产品设计、制造和生产过程中用来管理和记录工程变更的正式流程
EOLEnd of Life生命周期结束EOL:指的是某个产品、部件、服务或技术在其生命周期中的结束阶段,意味着该产品或部件将不再生产、销售或支持。通常,EOL标志着产品不再提供正式的技术支持、修复或升级

8.芯片验证

缩写英文全称中文含义拓展
IRQInterrupt Request中断请求
RASReliability — Availability — Serviceability可靠性( Reliability )、可用性( Availability ) 与 可维护性( Serviceability )RAS 是Reliability (可靠性)、Availability (可用性)、Serviceability (可维护性 / 可服务性) 的缩写,是计算机硬件工程领域的核心概念,用于衡量系统稳定性、持续服务能力和维护便捷性。在关键任务系统 (金融、医疗、电信、云计算、高性能计算) 中,RAS 设计直接决定业务连续性与数据安全,是企业级系统与消费级系统的核心区别之一。
MASMicro Architecture Specification微架构规范MAS,简称spec。是芯片IP的完整规格书。必看,反复看,天天看。
PGProgramming Guide编程指南Design给Chip Validation同事的开发“测试case”的编程指南,用来约束芯片IP的测试条件
Calibration校准
Pre-Silicon Verification硅前验证
Post-Silicon Validation硅后验证
UVMUniversal Verification Methodology通用验证方法学是芯片验证领域的行业标准验证框架,基于SystemVerilog的验证方法学库(类库)
align(地址)对齐地址对齐:addr align、地址非对齐:地址非align
constraint约束,限制验证case有些限制要求
dependence依赖、依靠指是否需要其他同事的帮助,是否有上游依赖
errata勘误表
waveform波形
sanity case健全测试、冒烟测试sanity test 健全测试
Sanity case是软件或芯片验证(IC)中的一种早期、快速的测试手段,属于冒烟测试(smoke test)的一种
ipmiIntelligent Platform Management Interface智能平台管理接口核心用于服务器 / 硬件设备的带外管理,依赖BMC,通用工具
HALHardware Abstraction Layer硬件抽象层是底层软件中承上启下的核心组件,本质是一套屏蔽硬件差异的统一接口层
TclTool Command Language工具命令语言自动化工具开发与系统集成,尤其在芯片 / EDA 领域应用极广
RALFRegister Abstraction Layer Format寄存器抽象层格式是寄存器定义文件,DE给的,用工具生成所需要的header file
在芯片RTL领域,.ralf 文件是寄存器抽象层格式(Register Abstraction Layer Format)的缩写。
这个文件是连接设计规范与验证实现的桥梁,作为工具链(尤其是Synopsys的ralgen)的标准化输入文件,用于自动化生成验证环境所需的寄存器模型(RAL Model)和RTL代码。
SpecSpecification芯片设计规格书
Clock Frequency时钟频率也叫主频,是指芯片内部时钟信号的振荡频率,它决定了芯片每秒钟能够执行的指令数
IP validation芯片IP验证
Root Cause根本原因
errata勘误表
A-B-A Swap Test交叉测试板级故障排除方法。它的核心思想是通过在“坏板”和“好板”之间互换可疑器件,来判断故障究竟是出在器件本身,还是出在电路板或系统其它部分。

Verification:确认“我们做对了设计”。
Validation:确认“我们做了正确的产品”。


层级关系(从下到上):

┌─────────────────────────────────────────┐
│              SoC (顶层)                  │
│   整个芯片系统,包含所有模块              │
└─────────────────────────────────────────┘
                    ▲
                    │ 实例化
┌─────────────────────────────────────────┐
│           子系统 (Subsystem)             │
│   如:显示子系统、音频子系统              │
└─────────────────────────────────────────┘
                    ▲
                    │ 实例化
┌─────────────────────────────────────────┐
│            RTL 模块 (底层)               │
│   如:UART 模块、FIFO 模块、状态机        │
└─────────────────────────────────────────┘

验证也分层级:
- 模块级验证 → 验证单个 RTL 模块
- 子系统验证 → 验证模块组合
- 系统级验证 → 验证完整 SoC

9.芯片测试

缩写英文全称中文含义拓展
DUTDevice Under Test被测器件需要验证的芯片 RTL 设计
Harvest芯片收割 / 功能提取指通过选择性禁用有缺陷 / 冗余的功能模块或调整性能参数(如降频、降规格),将原本不符合高端产品标准的芯片 “挽救” 为合格的中低端产品,从而最大化晶圆利用率与良率的制造策略
trial run试运行
CPChip Probing晶圆测试
FTFinal Test成品测试
ATEAutomatic Test Equipment自动测试设备检查芯片的电气特性和基本功能是否符合设计要求
BUbringup(芯片) 点亮
SLTSystem Level Test系统级测试 (筛芯片)
BLTBoard Level Test板级测试 (筛板卡)
Burn-InBurn-in Test烧机老化测试是让芯片在高温、高电压等加速老化条件下工作一段时间(通常为24h),以此筛选出早期失效的产品
BLRBoard Level Reliability板卡级可靠性
Package Reliability封装可靠性是衡量封装对芯片保护以及长期使用稳定性的指标
Yield良率是指在半导体制造过程中,合格芯片的产比例
TFLOPSTFLOPS:
Tera Floating Point Operations Per Second
每秒 1万亿次 浮点运算t:T是一万亿,1×1012,即 1000G
flo:Floating Point,浮点数
ps:每秒
是衡量计算机性能,特别是在执行浮点运算时的能力的一个单位
PFLOPSPeta FLOPS:
Peta Floating Point Operations Per Second
每秒 1000万亿次 浮点运算1 GFLOPS = 10⁹ 每秒10亿次
1 TFLOPS = 10¹² 每秒1万亿次
1 PFLOPS = 10¹⁵ 每秒 1000 万亿次
换算:1 PFLOPS = 1000 TFLOPS

10.寄存器、efuse

缩写英文全称中文全称拓展
regregister寄存器
sticky register粘性寄存器是指在计算机硬件(尤其是PCIe等总线设备)中,在发生系统级或热复位(如Warm Reset、Hot Reset)时,其保存的数值或状态不会被清除的特殊寄存器
BARBase Address Register基址寄存器
eFuseelectronic fuse电熔断(电子保险丝)可用作一次性可编程存储器(OTP),也可用于电路过流、过压等保护
OTPOne Time Programmable一次性可编程存储器eFuse 是 OTP 的一种物理实现方式,但并非所有 OTP 都基于 eFuse

11.PVT:电压、电源、功耗、温度、Profiling

缩写英文全称中文全称拓展
PVTProcess-Voltage-Temperature工艺、电压、温度工艺、电压、温度是影响芯片性能和稳定性的三大核心环境变量。
芯片的电气特性(如运行速度、功耗、时序、漏电率)会随这三个因素的变化而改变,因此在芯片的设计、验证、测试阶段,必须充分考虑 PVT 条件,确保芯片在各种极端场景下都能正常工作。
Corner 芯片Process Corner工艺角5种工艺角:TT、FF、SS、FS、SF
TT 芯片Typical-Typical典型工艺NMOS、PMOS 均为标称性能,无明显偏差
FF 芯片Fast-Fast快速工艺
SS 芯片Slow-Slow慢速工艺
FS 芯片Fast-Slow工艺类型为FS,NMOS性能为快速,PMOS性能为慢速
核心验证目标为:下降沿主导的时序路径
SF 芯片Slow-Fast工艺类型为FS,NMOS性能为慢速,PMOS性能为快速
核心验证目标为:上升沿主导的时序路径
VminMinimum Voltage最低工作电压指芯片或电路在正常工作状态下的最小电压。这是芯片或电路能够正常运行所需的最低电压。
举例:某芯片标称供电 1.0V,规格要求工作电压范围 0.9V ~ 1.1V:Vnom = 1.0 V (标准电压),Vmin = 0.9 V (厂家定义的最低工作电压),Vmax = 1.1 V(最高耐压)
Efuse已烧写Vmin(频点SKU1 187/800/857/923/1000/1090,SKU2 500/600/700,开GD)
GBGuardBand防护带 / 裕量GuardBand 是在芯片的电气参数、时序、电压 / 频率等关键指标上设置的冗余余量
DPMDynamic Power Management动态电源管理根据实时负载动态调整功耗:
当芯片负载较低时,降低 CPU 电压和频率,显著减少动态功耗
CTFCritical Thermal Fault临界热故障超过温度门槛限制,则过温的红灯亮起
VRMVoltage Regulator Module电压调节模块用来降压稳压,可以用来表示电源芯片的温度。VRM 本质是芯片的 “专属电源管家”。
PN结P–N junctionPN 结是将掺杂了受主杂质(P 型)和施主杂质(N 型)的两种半导体材料在同一晶体中相邻区域结合起来的接口结构
TjJunction Temperature结温半导体器件内部 PN 结处的实际温度,即发热最集中的位置。我们指的是efsmt -thermal list 中 VT0-VT4 五个传感器中温度的最大值,是实测温度
TjMax最高温限制
Profilingprofiling性能分析通过工具对程序运行过程进行测量,定位资源消耗瓶颈,以指导性能优化的方法
power功率
Power Consumption功耗是指芯片在工作过程中消耗的电能。在移动设备等对电池续航要求高的应用场景中,低功耗芯片非常关键
IDDQIddle Drain Quiescent current
或Quiescent Power Supply Current
静态电源电流静态静态漏电流、静态工作电流 (静态)
d I d t \frac{dI}{dt} dtdIDynamic Current动态电流didt是电流的微分,就是动态电流

在这里插入图片描述


5种Corner芯片工艺工况 (TT/FF/SS/FS/SF) 应用场景速查表

工艺工况英文全称核心晶体管性能特征主要应用场景验证 / 测试目标
Corner 芯片分类:TT(典型工艺角)、FF(最快工艺角)、SS(最慢工艺角)、FS(不对称)、SF(不对称)。
比如JY遇到过3FF的corner芯片,“3FF是最快的corner,电流也最大
TT芯片Typical-TypicalNMOS、PMOS 均为标称性能,无明显偏差1.芯片设计基准验证
2.常规功能与性能仿真
3.功耗与频率的标称值标定
确认芯片在理想工艺条件下的基础功能、性能和功耗指标,作为其他工况的对比基准
FFFast-FastNMOS、PMOS 均为最快速度,漏电流偏大1.芯片极限性能测试(最高运行频率)
2.漏电流上限验证
3.高速接口时序裕量测试
验证芯片的性能上限,排查高速运行时的时序冲突、信号完整性问题,评估最大漏电流对功耗的影响
SSSlow-SlowNMOS、PMOS 均为最慢速度,漏电流偏小1.芯片最坏工况稳定性验证
2.最低工作电压测试
3.低温 / 高温极端环境下的功能测试
确认芯片在工艺、电压、温度(PVT)最差组合下的可靠性,避免出现时序不满足、功能失效的问题
FSFast-SlowNMOS快速,PMOS慢速1.组合逻辑时序不对称性验证
2.下降沿主导的时序路径测试
3.逻辑门电平转换稳定性验证
排查因NMOS 和 PMOS 速度差异导致的下降沿过快、上升沿过慢的时序裕量不足问题
SFSlow-FastNMOS慢速,PMOS快速1.电平转换电路可靠性验证
2.上升沿主导的时序路径测试
3.电源管理模块稳定性验证
解决因 PMOS 过快、NMOS 过慢引发的上升沿时序异常,保障电平转换、电源控制等模块的正常工作

PVT:

  • Process(工艺)
  • 指芯片制造过程中的工艺偏差。即使是同一批次、同一生产线生产的芯片,也会因为光刻、蚀刻、掺杂等步骤的细微差异,导致晶体管的性能(如开关速度、阈值电压)存在个体差别。工艺偏差通常分为 TT(典型工艺)、FF(快速工艺)、SS(慢速工艺) 等类型,分别对应晶体管性能的典型、最优、最差情况。
  • Voltage(电压)
  • 指芯片工作时的供电电压。电压越高,晶体管开关速度越快,芯片运行频率越高,但功耗和发热也会随之增加;电压过低则可能导致芯片时序不满足要求,甚至出现逻辑错误、无法启动。芯片设计时会定义 标称电压(如 1.0V),同时也会考虑电压波动的范围(如 ±5%)。
  • Temperature(温度)
  • 指芯片工作时的核心温度。温度升高会使晶体管载流子迁移率下降,开关速度变慢,同时漏电电流增大,进一步加剧发热;温度过低则可能提升晶体管性能,但也可能影响某些封装材料或接口的稳定性。芯片的工作温度范围通常分为 商业级(0℃70℃)、工业级(-40℃85℃)、汽车级(-40℃~125℃) 等。

11.复位操作

深入理解PCIe复位:Cold Reset, Warm Reset, Hot Reset与FLR的对比与实践

英文全称中文含义拓展
Function Level Rest功能级复位针对单个功能的软复位
Fundamental Reset基本复位影响整个物理设备的最强力复位。包括:Cold Reset、Warm Reset、Hot Reset
Cold Reset冷复位断电重启
Warm Reset暖复位与Cold Reset的唯一区别:电源保持稳定。这省去了电源上下电的物理过程,速度可能稍快。
Hot Reset热复位

重置环境:
1.flr :
2.hot reset
3.warmboot(热启动):用命令行reboot进行重启
4.DC boot(直流电启动):按电源键重启
5.AC boot(交流电启动):通过PDU断电
6.cold reboot (冷启动):完全关闭电源


12.平台

Term缩写英文全称中文含义拓展
EmuEmulator硬件仿真器常见的Emulation有:Palladium、Zebu、合见
Emulatior是一种介于软件逻辑仿真和FPGA原型验证(Prototyping)之间的高性能硬件验证工具。它通过专用的硬件阵列(如定制化ASIC或大规模FPGA阵列)来映射待验证的RTL设计,从而在硬件层面加速执行验证过程。帮助开发人员在芯片或设备还未制造出来之前,通过模拟来测试和验证硬件设计的功能和性能。
Palladium帕拉丁Cadence的Palladium,编译速度极快
Zebu泽布Synopsys的Zebu,运行速度最快
VDKVirtualizer Development Kit虚拟开发套件由新思科技(Synopsys)推出,用软件模拟出一整套虚拟硬件平台(CPU、内存、外设、总线等),让你在真实芯片/板卡出来之前,就能跑、调试、测试完整的二进制软件(驱动、OS、应用)
流片前的早期验证,寄存器级。
软件建模,CPU在跑,比较慢
经典流程:架构 → VDK 建模 → 软件 / 固件开发 → RTL 设计 → FPGA 原型 → 流片
PDUPower Distribution Unit电源分配单元是数据中心和服务器环境中用于管理电力分配的关键设备,它通过控制电源通断来实现AC boot(交流电启动)过程中的断电操作
BMCBaseboard Management Controller基板管理控制器BMC的作用:远程访问主机屏幕
ODMOriginal Design Manufacturer原始设计制造商ODM = 设计 + 制造 全包
在电子、计算机和硬件制造行业,它指的是一种商业模式:一家公司 (ODM 厂商) 负责产品的设计、研发和制造,然后将成品贴上另一家公司 (品牌商) 的商标进行销售。
通俗地说,就是 “品牌方出钱出牌子,ODM 方出技术出工厂”。
OEMOriginal Equipment Manufacturer原始设备制造商
AVSBus一个为低功耗、嵌入式和传感器应用设计的通信总线协议
vendor供应商
smiSystem Management Interface系统管理接口ipmi是跨厂商不同,smi是各家自己开发的
smtSystem Management Tool系统管理工具
FWFirmWare固件
RPMRevolutions Per Minute每分钟转速
KMDKernel Mode Driver核心模式驱动程序
SILICONSilicon硬件本身,是真实的平台
EVBEvaluation Board评估板用于评估和测试特定芯片或系统,通常具有预设功能
PRBPrototyping Board原型板提供一个可定制的硬件平台,用于快速原型开发和设计验证,灵活性更高

13.嵌入式

Term缩写英文全称中文含义拓展
单片机Raspberry Pi 树莓派、Arduino
MCUMicrocontroller Unit微控制器例如:STM32,XMC
DSPDigital Signal Processor数字信号处理器专为高速数字信号处理算法(如滤波、傅里叶变换、卷积、矩阵运算等)优化的微处理器
FPGAField-Programmable Gate Array现场可编程门阵列FPGA 是一种可由用户在出厂后反复配置的半导体器件,内部由大量可编程逻辑单元及可配置互连组成。
特点:①可重构:设计者可根据需求反复下载不同的逻辑功能。②并行处理:每个逻辑单元独立工作,天然支持并行计算。③硬件加速:对于特定算法,FPGA 可实现硬件级加速,性能远超通用 CPU

14.大模型

Term缩写英文全称中文含义拓展
ONNXOpen Neural Network Exchange开放神经网络交换格式跨框架通用模型中间交换标准,解决不同训练框架(PyTorch、TensorFlow)模型互不兼容的问题



二、芯片相关的概念

1.芯片结构

(1)wafer:晶圆

晶圆,是指硅半导体集成电路制作所用的硅晶片,由于其形状为圆形,故称为晶圆。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


(2)Die:晶粒

Die指的是芯片未封装前的晶粒,是从硅晶圆(wafer)上用激光或刀具切割而成的小片,每一个小片就是一个独立的功能芯片die,一旦这些die完成其功能和测试过程,它们就会被封装起来,形成我们熟知的芯片(chip)。晶粒是组成多晶体的外形不规则的小晶体,而每个晶粒有时又有若干个位向稍有差异的亚晶粒所组成。晶粒的平均直径通常在0.015~0.25mm范围内,而亚晶粒的平均直径通常为0.001mm数量级。

在这里插入图片描述


(3)SoC

SoC 是一种将 计算机系统的多个组件集成到一个芯片上 的设计方案,广泛应用于需要高度集成和低功耗的设备中。SoC的典型组件包括CPU、GPU、内存控制器、数字信号处理器(DSP)、输入/输出接口,以及专用功能模块(如音频、视频处理模块等),都集成在单一的芯片内


传统芯片和SoC举例:
(1)传统芯片:
①Intel Core i9:这是一个CPU芯片,只负责中央处理功能。
②NVIDIA GTX 1080:这是一个GPU芯片,专门处理图形计算任务。
(2)SoC具有更高的集成度、低功耗和空间优化。
Apple A14 Bionic:这是一款典型的SoC,包含了CPU核心、GPU、神经网络引擎、图像信号处理器(ISP)、存储控制器等多个功能模块,广泛用于iPhone、iPad等设备。


2.芯片设计

(1)EDA

国际EDA:synopsis(ZeBu)
国产EDA/硅前硬件仿真平台:华大九天、帕拉丁(Palladium)、合见工业软件

帕拉丁 比起 合见的优点:方便看波形,波形可以实时显示;抓波形方便,可以写脚本逻辑,在信号变化的时候自动抓波形


3.芯片验证

(1)芯片IP

1.概念
IP(Intellectual Property),知识产权
IP模块是指在芯片设计中可以重复使用的功能模块或电路块
IP 模块可以是由设计公司开发的,也可以从第三方供应商购买,用于集成到系统级芯片(SoC)中

2.IP 模块的常见类型:
①PCIe
②MC
③SSM_FW
④VPU
⑤SIP
⑥SP
⑦GDTE
⑧GMU
⑨CVP


CPU IP(处理器IP):例如ARM的Cortex系列。
GPU IP(图形处理IP):例如NVIDIA IP,例如 GPU 核心,用于图形处理和加速
MC IP(存储控制器IP):例如 DDR、eMMC、Flash 控制器,用于管理存储器
通信接口IP:例如 PCIe、USB、I²C、SPI 等。
⑤安全IP:例如加密模块,用于数据加密和解密

3.IP的作用:
这些 IP 模块可以帮助设计人员减少设计周期、降低开发成本,并确保功能的可靠性。

IP 模块是指在芯片设计中可以重复使用的功能模块,帮助简化和加速设计过程。它们通常经过严格的验证,确保可靠性和兼容性,是现代复杂系统和芯片设计中不可或缺的构件。


(2)ralf文件

RALF(Register Abstraction Layer File)是一种用于描述硬件设计中寄存器和内存结构的文本格式,广泛应用于SoC(System on Chip)验证中,尤其是在UVM(Universal Verification Methodology)环境下。

RALF文件简介
RALF文件采用类似Tcl的语法,结构化地描述了寄存器、字段、寄存器文件、内存、块(block)和系统(system)等元素。

  • 寄存器(register):由一个或多个字段(field)组成,表示硬件中的寄存器。
  • 字段(field):寄存器的最小可访问单元,通常对应硬件中的一位或多位。
  • 寄存器文件(regfile):由多个寄存器组成的集合。
  • 内存(memory):用于描述存储器区域。
  • 块(block):逻辑功能单元,包含寄存器和内存。
  • 系统(system):由多个块或子系统组成的顶层结构。

这些元素通过层次化的结构组织,便于描述复杂的硬件设计。


4.底软 (底层软件)

(1)简介

底软就是底层软件的简称,它是位于软件架构最底层、直接与硬件交互的软件集合,是上层应用程序操控硬件的核心桥梁。

简单来说,没有底软,硬件就是一块 “裸板”,既无法被操作系统识别,也无法完成任何数据传输或计算任务。


(2)核心运行组件:Firmware、Driver、HAL

(1)Firmware (固件)
(2)Driver (驱动程序)
(3)HAL (硬件抽象层):基于驱动做二次封装,提供标准化接口屏蔽不同硬件的差异


(3)配套工具组件:smi、smt、validaiton suite、ipmitool

(1)smi 工具:指 System Management Interface 工具,用于直接访问硬件的管理接口,比如读写 PCIe 设备的配置空间、查询芯片温度 / 功耗、配置硬件参数。完全面向底层硬件,属于典型的底软调试工具。例如:nvidia-smi
(2)smt工具
(3)validation suite工具
(4)ipmitool

在这里插入图片描述


5.存储:内存、存储颗粒

在这里插入图片描述

为了理解区别,我们把数据比作货物,把内存比作公路:

(1)LPDDR

LPDDR5 (经济型高速路):
这是一条 8 车道 的高速路。
路况很好,车也省油(省电)。
优势: 造价便宜,路可以修得很长很长(容量可以做得很大,比如 256GB)。
劣势: 爆发力不够,如果瞬间涌入海量车流,会堵车。

(2)GDDR

GDDR6X (赛车道):
这是一条 32 车道 的超级公路。
车速极快,但非常费油(耗电、发热)。
优势: 玩游戏时,每一帧画面需要瞬间传完,它最合适。

(3)HBM

HBM3 (立体交通枢纽):
这不仅是公路,这是1024车道的超宽路面,甚至是地下的高频磁悬浮列车。
优势: 吞吐量惊人。用来训练大模型时,几千亿个参数需要频繁进出,只有它扛得住。
劣势: 造价极其昂贵,而且受限于物理空间,很难把“停车场”修得很大(容量扩充难,单颗通常只有 24GB/36GB,凑出 80GB 很难)。


6.工艺

(1)Corner芯片介绍

https://www.gloomyghost.com/live/20250204.aspx

<1>Corner芯片的分类:PVT

在一片wafer上,不可能每个芯片的载流子平均漂移速度都是一样的,随着电压、温度不同,它们的特性也会不同。

把他们分类就有了PVT(Process,Voltage,Temperature):
Process:工艺参数波动(即工艺角)
Voltage:供电电压变化(如±10%)
Temperature:工作温度范围(如-40°C~125°C)

也就是Corner先分为 Process Corner、Voltage Corner、Temperature Corner。
Process Corner(工艺角Corner)又分为五种:

TT:Typical N Typical P:NMOS 和 PMOS 都是典型工艺速度
FF:Fast N Fast P:NMOS 和 PMOS 都偏快
SS:Slow N Slow P:NMOS 和 PMOS 都偏慢
FS:Fast N Slow P:NMOS 快,PMOS 慢(不对称)
SF:Slow N Fast P:NMOS 慢,PMOS 快(不对称)


<2>Process Corner 工艺角:TT、FF、SS、FS、SF

1.工艺角的定义及产生原因
芯片制造过程中存在工艺偏差,如掺杂浓度、扩散深度、刻蚀程度等,导致不同批次、同一批次不同晶圆以及同一晶圆不同芯片之间的性能存在差异。为了描述这种差异,引入了工艺角的概念。


2.常见的工艺角类型:5种
(1)TT (Typical - Typical):代表典型工艺角,此时晶体管的各项参数都在标称值或平均值附近,芯片性能处于设计预期的典型状态,通常作为基准用于芯片设计和验证。

(2)FF (Fast - Fast):表示快速工艺角,NMOS 和 PMOS 的性能都偏向快速,即晶体管的饱和电流大,阈值电压小,运行速度快。这种工艺角下芯片的工作频率可能较高,但功耗和电源完整性等方面可能面临更大挑战。

(3)SS (Slow - Slow):是慢速工艺角,所有晶体管的工作速度都比平均速度慢,饱和电流小,阈值电压大。芯片在 SS 工艺角下性能受限,但电源完整性可能相对较好。

(4)FS (Fast - Slow):指 NMOS 速度快,PMOS 速度慢的工艺角。

(5)SF (Slow - Fast):与 FS 相反,是 NMOS 速度慢,PMOS 速度快的工艺角。


在这里插入图片描述
在这里插入图片描述

注: SS、 TT、FF 分别是左下角的corner, 中心、右上角corner

在这里插入图片描述


<3>3FF Corner芯片

3FF Corner:
专指 3nm 级 FinFET 工艺,基于第三代 FinFET 技术

FinFET(鳍式场效应晶体管,Fin Field-Effect Transistor)是一种三维结构的晶体管,通过立体架构解决了传统平面 MOSFET 在纳米级工艺下面临的短沟道效应和漏电流问题,是目前集成电路(IC)制造的主流技术。


(2)Harvest

Harvest (芯片收割/ 功能提取)
核心目标:提升整体良率,创造差异化产品
操作范围:涵盖功能禁用、性能降档、规格调整等综合策略
应用场景:制造良率优化、产品线丰富化、成本控制
实施结果:产生不同档次产品(如高端芯片→中端 / 入门级)


(3)Tj温度:结温

结温(Junction Temperature, Tj):半导体器件内部 PN 结处的实际温度,即发热最集中的位置。

Tj(Junction Temperature)即结温,指的是半导体器件内部 PN 结处的温度,通常高于器件外壳温度(Tc)和环境温度(Ta)。结温直接影响器件的电学性能、可靠性和寿命,是热设计和热管理的核心指标。


1.Tj的概念
在这里插入图片描述


Tj的计算
在这里插入图片描述


7.芯片与显卡

(1)CPU、GPU、NPU、TPU、LPU

CPU 适用于通用计算任务。
GPU 适合大规模并行处理,尤其是图形和AI训练。
NPU 专为AI推理任务设计,具有更高效的神经网络运算能力。NPU是一种专门针对神经网络计算进行特殊优化设计的集成电路元件,擅长处理视频、图像、语言类多媒体数据。

在这里插入图片描述


(2)目前市面上的GPU芯片:V100、A100、H100

V100适合基础的AI训练和推理任务。
A100是数据中心的通用高性能GPU,适合多种计算任务。
H100是目前性能最强的GPU,特别适合大规模AI模型训练和高性能计算。
H200和H800是针对中国市场设计的受限版GPU,性能稍逊于H100,但仍然具备强大的计算能力


(3)显卡

<1>GTX

GTX (Giga Texel Shader eXtreme)
定位: 传统的高性能图形渲染。
代表型号: GTX 1080 Ti, GTX 1660, GTX 1650 (你的显卡)。
核心技术: 光栅化(Rasterization)。


<2>RTX

RTX (Ray Tracing Texel eXtreme)
定位: 实时光线追踪 + AI 人工智能计算。
代表型号: RTX 2060, RTX 3090, RTX 4090。
核心技术: 除了传统核心外,它多了两个专门的硬件单元:

  • RT Cores (光线追踪核心): 专门用来算“光线是怎么从物体上弹射的”。在 Isaac Sim 这种仿真器里,为了让机器人看到的画面和真实世界一样(比如镜面反射、阴影),必须用到它。
  • Tensor Cores (张量核心): 专门用来算 4 × 4 4 \times 4 4×4 矩阵乘法。这是深度学习的命根子。有了它,跑 PyTorch/TensorFlow 的速度会几倍、几十倍地提升。DLSS(深度学习超级采样)也是靠它实现的。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员爱德华

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值