第01篇：数学基础速查——大模型工程师的“最小够用集“

最新推荐文章于 2026-07-02 00:08:09 发布

原创最新推荐文章于 2026-07-02 00:08:09 发布 · 9 阅读

0 GEO检测

收录于

当前文章被以下社区和专栏收录：

大模型工程师修炼手记专栏收录该内容

30 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

前置知识：高中数学。是的，你没看错。大模型需要的数学远比你想的少，但远比你想的深。

引言：为什么工程师要学数学？

我见过太多工程师绕开数学直接上手 PyTorch——model.train()、optimizer.step()，跑通了就完事。直到某天 loss 变成 nan，梯度消失得像人生希望，你才意识到：不懂数学的工程师，调试模型全靠运气。

但好消息是：大模型所需的数学知识有一个"最小够用集"。你不需要成为数学家，只需要理解这些概念在大模型中具体出现在哪里、为什么这么设计、出了什么问题怎么修。

这篇文章就是这份"最小够用集"的完整呈现。我们不会推导所有公式（那是数学教材的事），但我们会告诉你每个公式在大模型代码中的对应位置。

一、线性代数：矩阵是深度学习的"原子货币"

1.1 矩阵乘法：一切计算的底层操作

大模型的前向传播，本质上就是一连串矩阵乘法：

输入嵌入:    X [batch, seq_len, d_model]
@ 权重矩阵: W [d_model, d_head * n_heads]
─────────────────────────────────────
= 线性输出:  Y [batch, seq_len, d_model]

标签

#人工智能

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Tom·Ge

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

AI工程实战指南：从技术选型到智能体架构的决策速查手册

weixin_30591551的博客

04-24

264

在构建AI应用时，技术选型与架构设计是决定项目成败的关键环节。从基础的提示工程、RAG系统到前沿的智能体架构，开发者需要理解不同技术的核心原理与适用边界。提示工程通过设计有效的指令引导大语言模型输出，是控制成本与效果的基础手段；RAG系统则通过结合检索与生成技术，为模型提供外部知识，是构建可靠知识库应用的核心。这些技术的价值在于，它们能将前沿的AI能力高效、稳定地落地于实际业务场景，如智能客服、数据分析与内容创作。本文提供的速查手册，正是基于大量工程实践，为开发者在面对提示工程策略选择、RAG架构配置以及智

大模型确定性解码：中间层归零的技术与商业逻辑

bdk82924

06-13

695

大模型推理正从‘租用算力’转向‘购买确定性结果’，其核心是输出字节级一致、可验证、可审计的响应。这一范式迁移由确定性解码（deterministic decoding）驱动，依托静态KV Cache预分配、整数化Attention计算和原子化协议响应三大技术支柱，从根本上消除传统中间层（如重试、缓存、流式解析、格式兜底）存在的必要性。它不仅提升P95延迟稳定性与错误率控制能力，更直接降低服务器、带宽、开发维护及合规审计等全链路TCO。当前已进入‘进行时’——Anthropic等厂商通过SLA契约、计费模型与

参与评论您还未登录，请先登录后发表或查看评论

AI速查表项目合规实战：从GDPR到技术实现的全流程指南

weixin_34122604的博客

06-22

449

在构建涉及人工智能处理用户数据的应用时，数据合规是开发者必须面对的核心挑战。其基本原理在于，任何对个人数据的收集、处理和跨境传输，都需遵循“合法、公平、透明”及“数据最小化”等核心原则，以确保用户对其数据拥有充分控制权。这不仅是一项法律义务，更是构建可信赖、可持续技术产品的基石。从技术价值看，合规设计能有效规避天价罚款与声誉风险，将隐私保护转化为产品的核心竞争力。在应用场景上，尤其对于内置AI问答、摘要生成等交互功能的SaaS工具或知识库项目，用户输入可能包含各类个人信息，使得合规框架的融入至关重要。本文聚

大模型数据科学外科手术：不重训精准修正pandas等API错误

ajwh64482的博客

06-15

458

大语言模型（LLM）在数据科学任务中常因领域知识缺失而产生系统性代码错误，如混淆pandas的groupby().size()与count()、scikit-learn中fit_transform()调用时机错误等。其根源在于通用预训练未覆盖高精度API语义与结构约束。传统微调易引发能力退化与部署膨胀，而‘外科手术式编辑’通过在冻结权重前提下，对注意力、激活或权重层进行毫米级干预，实现定向行为矫正。该技术依托神经元探针定位、偏置注入与热更新机制，在保障SQL/Python通用能力不变的前提下，显著提升pan

大模型文本水印技术原理与实战部署指南

weixin_30530939的博客

06-28

386

大语言模型（LLM）生成内容的溯源与可信验证，正成为AIGC时代的关键基础设施。文本水印作为一种不可见、统计学可验证的隐式标识技术，通过调控词元采样概率分布，在不改变语义和可读性的前提下嵌入鲁棒签名。其核心在于绿色集动态哈希、概率扰动与二项检验检测机制，兼顾隐蔽性、抗改写性与低开销。该技术已广泛应用于教育防代写、平台内容标注、AIGC版权存证等场景，尤其适配Llama、Qwen等开源模型的本地化部署。本文深入解析watermarking库的参数调优（gamma/delta）、检测误报归因及中文分词适配等工程

大模型MoE稀疏激活原理：解析GPT-4的2%计算量真相

weixin_34221332的博客

06-27

302

混合专家（MoE）是突破大模型算力瓶颈的核心架构，其本质是通过门控网络实现条件计算——仅对每个token激活少量专家子网络，从而大幅降低单次推理的FLOPs与显存开销。原理上，它以空间换时间，用海量参数换取稀疏化执行；技术价值在于在保持模型容量的同时，将有效计算量压缩至稠密架构的约2%，显著提升吞吐与能效比；典型应用场景包括高并发API服务、低延迟对话系统及GPU资源受限的私有化部署。本文深入拆解‘1.8万亿参数’与‘2%稀疏激活’背后的动态路由、专家分片与硬件协同机制，揭示MoE落地中不可忽视的通信、负载

LangChain：从“链”到“智能体”，一篇带你跑通全套AI应用

qq_59998784的博客

06-22

5800

本文是一份LangChain 的实战全指南，从零开始带你构建 AI 应用。文章围绕 LangChain 的核心变革展开，内容涵盖：快速上手、LCEL 表达式语言、模型与工具、记忆系统、RAG 检索增强生成、Deep Agents（深度智能体）从流水线式的“链”到带自我验证的“深度智能体”，LangChain 正在重新定义 AI 应用的开发范式。

大模型原生能力崛起：RAG与Agent中间层正在‘蒸发’

weixin_34109408的博客

06-29

742

在大语言模型技术演进中，‘中间层抽象’正从工程必需品转向成本负担。随着Claude等模型原生支持tool use、嵌套system message、动态token协商等能力，传统RAG编排层、Agent路由层和LLM网关等模块的工程价值、运维必要性与经济合理性同步归零。这一趋势本质是模型对用户意图的理解与执行能力内化，使端到端推理替代多服务协同成为更优TCO（总拥有成本）路径。开发者需从‘指挥模型’转向‘与模型协作者’，核心能力转向tool契约设计、schema驱动提示工程与轻量级可观测性建设——这标志着A

大模型量化实战：从INT4加速到边缘部署的完整工程指南

love android

06-16

502

量化（Quantization）是将高精度浮点模型压缩为低比特整型表示的核心技术，其本质是通过缩放因子（Scale）与零点（Zero-point）建立浮点值与离散整数间的线性映射，在保障可接受精度损失的前提下，显著降低显存占用、提升计算吞吐，并支撑大模型（Big AI Models）在GPU服务器、边缘设备乃至端侧芯片上的实际落地。该技术已超越学术概念，成为LLM服务API开发、金融/医疗等垂类模型上线、低成本硬件选型的关键基础设施。本文聚焦工程实操，覆盖PTQ与QAT等主流路线差异、权重仅量化（WOQ）与

多子品牌、多产品线实体区分，避免站内权重互相稀释

SEO_juper的博客

06-26

5172

2026 年谷歌 AI 实体检索、知识图谱体系下，多子品牌、多产品线站点天然存在权重稀释、实体模糊、关键词内耗三大运营隐患，很多站点盲目扩充产品与品牌页面，却忽略实体隔离底层优化，导致外链、内容投入无法转化为对应流量收益。整套实体区分、权重收拢体系逻辑分为四层递进动作：第一，搭建二级分层隔离 URL 架构，从页面存放路径切割不同业务实体；第二，配置差异化 Organization、ProductGroup 结构化数据，给谷歌提供机器可读的独立实体标识，搭配 LinkedIn 外部档案完成交叉核验；

15_项目实战一_用LangChain搭建个人知识库问答助手

yang13739765227的博客

06-29

1929

文档 -> 切分 -> 向量化 -> 向量库 -> 检索 -> 拼 Prompt -> 模型生成答案但真正做一个个人知识库问答助手时，你会发现问题不止这些。用户不是只放一个.txtPDF 论文。Word 需求文档。Markdown 技术笔记。会议纪要。项目说明。API 文档。个人学习资料。这篇文章讲了什么？根据我上传的所有资料，LangGraph 和 LangChain Agent 的区别是什么？支持多格式文档加载。自动切分长文档。为每个 chunk 保存来源信息。

【架构实战】基于 Docker 与异构计算的企业级 AI 视频管理平台：打破 GB28181/RTSP 协议壁垒，全源码交付的私有化部署方案

tt120326的博客

06-29

1690

本文探讨了泛安防与边缘智能融合背景下传统视频监控系统的重构需求。作者作为资深安防架构师，指出当前行业面临协议异构、硬件适配难等核心痛点，提出通过容器化微服务架构和统一流媒体中台实现技术突破。重点介绍的企业级AI视频管理平台具有三大创新：1）支持多协议高并发接入的流媒体中台；2）异构计算三层解耦架构；3）全源码交付赋能二次开发。该方案可降低95%开发成本，提供从算法部署到数据标注的全栈能力，并开放演示环境供技术评估。文章为安防系统智能化转型提供了切实可行的架构参考。

机器学习周报五十一

weixin_60864619的博客

06-28

345

本周阅读了论文Animatable 3D Gaussian，对LBS如何将高斯点映射到观测空间有了了解，形成对完整的高斯泼溅重建人体的流程的认识。3D gaussian Animate中的很多流程都比较复杂，但是其中的deformer模块还一直被继续使用到现在，已经对LBS蒙皮等操作的描述，让我了解到高斯泼溅重建人体的完整流程。

从“AI焦虑“到“AI从容“：欢娱影视“AI万象剧库“战略的技术伦理与产业路径解析

ruhilong的博客

06-29

1122

2026年Q1微短剧市场分析：AI量产繁荣下的品质困境与技术伦理思考核心数据：行业AI短剧占比达95%，但播放量破亿作品仅占0.6% 真人短剧以2%的产量占比贡献25倍于AI剧的播放总量欢娱影视推出"AI万象剧库"，坚持"真人实拍+AI辅助"模式关键发现：技术效率与内容品质出现结构性矛盾 AI在叙事原创性、审美体系、表演本真性方面存在明显局限欢娱模式确立"4K实拍基底+AI视觉优化"技术边界行业将分层为流量型AI剧、标准实拍剧和精品复

物理AI赋能智能制造：从感知到决策的工业智能体架构

qq_32181623的博客

06-29

377

物理AI（Physical AI）正在重塑智能制造的底层逻辑——从在数字空间处理符号，到在物理世界中感知、推理和行动。本文从物理AI的四维能力模型出发，提出知识图谱增强的制造智能体架构：以知识图谱为语义底座，以神经符号AI为推理引擎，以数字孪生为交互桥梁，构建面向工业场景的感知-推理-决策闭环。结合工业5G专网、具身机器人量产等产业趋势，本文分析了该架构在预测性维护、工艺优化、质量管控等场景的应用路径，并探讨了从自动化到智能化的演进方向。

#RAG系统混合检索

2602_95606446的博客

06-26

1918

*踩坑提醒**：script_score方式会对全库做cosine计算，数据量大了之后单次查询可能超过30秒。**方案一：批处理。** 单次推理改成batch推理，30对一起过，延迟从1.2秒降到0.4秒。** 30个候选减少到20个，rerank延迟降到0.25秒。m=16，ef_construction=100是平衡召回率和索引速度的参数，实测这个配置下索引速度约800条/秒，召回率比flat检索下降不到1%。faiss本地索引每天凌晨从ES同步一次，查询延迟约100ms，召回率约0.75，能用。

【图像去雾】matlab实现基于深色通道先验的单幅图像去雾算法研究

m0_53407570的博客

06-30

770

本文系统研究了基于深色通道先验的单幅图像去雾算法，从大气散射模型和深色通道统计规律出发，完整阐述了深色通道计算、大气光强估计、透射率估计与细化（引导滤波）、图像复原及后处理增强的全流程。文章不仅给出了详细的数学推导和算法流程图，还提供了生产级的MATLAB完整源码，包括主函数、初始化脚本、参数配置类、深色通道计算、雾密度估计、去雾处理、图像合成等模块化代码，并通过多组实验从主观视觉和客观指标（PSNR、SSIM、FADE）两个维度验证了算法的有效性和鲁棒性。同时，文章针对不同雾霾浓度和应用场景给出了参数调节

实测AI从零生成Vue3后台系统，附设计到源码全流程

Lemonliyi的博客

07-01

275

分享一个跨境电商后台管理系统案例，AI生成产品界面同时输出Vue/React的工程代码。

免费开源项目文档：基于BP神经网络的交通标志识别系统设计与实现