RAG-分块策略

原创

已于 2025-04-19 23:11:34 修改 · 1.2k 阅读

标签

#人工智能 #深度学习 #RAG

收录于

于 2025-04-18 19:36:05 首次发布

分块策略在检索增强生成（RAG）方法中起着至关重要的作用，它使文档能够被划分为可管理的部分，同时保持上下文。每种方法都有其特定的优势，适用于特定的用例。将大型数据文件拆分为更易于管理的段是提高LLM应用效率的最关键步骤之一。目标是向LLM提供完成特定任务所需的确切信息，不多也不少。

分块涉及将文本划分为可管理的单元或“块”，以实现高效处理。这种分割对于语义搜索、信息检索和生成式 AI 应用等任务至关重要。每个块都保留上下文和语义完整性，以确保结果连贯。

策略名称	描述	优点	缺点	实施建议
固定长度分块	将文本按预定义长度（如基于令牌或字符）分割，适合简单文档或快速处理。	简单性、统一性、效率	上下文丢失、相关性问题、潜在信息丢失	选择合适大小，考虑使用重叠窗口以保持上下文
基于句子的分块	按句子边界分割，确保每个块是完整的思想，适合短响应如客户查询。	保持上下文、易于实现、更好的可读性	块大小不一致、不适合长句、控制力弱	使用NLP库检测句子，必要时合并短句
段落分块	将文档按段落分割，每个段落通常包含完整想法或主题，适合结构化文档