利用提示工程，提升LLM将自然语言转化为SQL的准确性

原创

已于 2024-01-03 10:22:48 修改 · 2.4k 阅读

·

27

·

标签

#大语言模型 #LLM

于 2024-01-02 20:51:25 首次发布

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

大型语言模型 (LLM) 已展现出理解自然语言提示并生成连贯响应的卓越能力。这为将自然语言翻译成 SQL 等结构化查询语言开辟了新的可能性。过去，编写 SQL 查询需要技术专业知识，而LLM允许任何人用简单的英语描述他们想要的内容，并自动生成相应的 SQL 代码。

当利用LLM将自然语言转换为 SQL 查询时，提示词至关重要。使用 Anthropic 的两个模型（Claude instant 1.1、Claude 2），并使用不同的提示工程技术评估了spider数据集上的 SQL 查询准确性（执行准确性）。从较高的层面来看，在进行自然语言到 SQL 的转换时，提示工程有几个重要的考虑因素：

使用清晰的说明–简单明了的自然语言提示更容易让LLM理解和翻译。
提供足够的上下文 --LLM 需要了解用户的请求查询语义以及有关数据库模式的详细信息，例如表和列名称。
包括示例 --提供一些自然语言和对应SQ的示例，可以帮助指导 LLM 以正确的语法生成查询。
利用 RAG（检索增强生成）–检索与用户查询相关的自然语言和 SQL 示例，可以提高准确性。

在这篇博客中，我将使用我的基准测试结果来帮助您了解上述每种提示策略如何影响自然语言到 SQL 转换的准确性。

操作说明

当使用 LLM 从自然语言生成 SQL 时，在提示中提供清晰的说明对于控制模型的输出至关重要。在我对 Claude 模型的实验中，一种有效的策略是在提示中使用 XML 标签来注释不同的组件。 XML 标签就像指令一样，准确地告诉模型如何格式化 SQL。例如，指示模型在之间编写查询可以减少详细输出。如果没有这条指令，Claude模型可能会非常健谈。它倾向于解释 SQL 结构，这会增加后处理的复杂性并不必要地消耗更多的输出标记。在 <table_schema> </table_schema> 之间添加表标记告诉模型上下文开始和结束的位置。

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。