大模型语言简介

大模型语言能做什么

信息提取

将长段文字中的信息抽取出来并且以结构化的方式输出。相比起传统NLP的方式,大模型在泛化能力上有非常大的提升,并且开发成本要低2个数量级。应用场景包括:论文论点论据提取、用户画像提取、舆情分析、病例结构化、助贷数据清洗、销售质检等

信息检索

传统的信息检索系统只能以文字来匹配正文并且只能以原文片段返回,或者对于垂直场景只能是结构性的卡片,而大模型则可以为你通读结果并根据你的查询生成针对性的回答,带来全新的搜索体验。应用场景包括:知识搜索、视频搜索、文本检索、商品搜索、简历检索、房产检索等

文本生成

通过指令(Prompt)让大模型自动生成文字,包括电子邮件、短信、文章、新闻报道、社交媒体帖子等各种文本内容。相较传统以规则和模板的方式大模型提供了完全不同的体验,这也是大模型最先跑通的商业模式。应用场景包括:立项报告生成、科研报告生成、新闻文章生成、商品文案生成、会议纪要生成、数据分析报告生成等

对话系统

机器和用户进行对话的系统通常用于客服和助手类的场景,但原有客服都基于问答对或者规则来进行对话,难以达到真人的水平,但是大模型在上下文,理解和回答文生成上带来全新的体验。应用场景包括:智能客服、语音助手、游戏NPC、虚拟社交、情感陪伴、智能陪练等

辅助开发

自动生成代码,提高开发效率,减少人工编写代码的工作量。还可以辅助编写代码,帮助开发人员更快地完成编码工作并减少错误。自动分析已有的代码并提供重构和优化的建议,提高测试的准确性和效率,减少人工编写测试代码的工作量。同时,大模型可根据用户提供的部署描述自动生成部署脚本,并监控应用程序的性能。应用场景包括:AI建站、智能RPA、代码生成、测试用例生成、代码审查等

Agent

大模型Agent能力在学术界可以这样定义Agent =大型模型 +记忆 + 主动规划 +Function-call使用,其中基座模型能力至关重要。 过去强化学习基于深度学习框架可让Agent学到技能,但本身并没有真正理解问题和技能,泛化性较差,只能用于特定领域,代表性应用是围棋领域的AlphaGo。
LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让aqent 具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的agent成为可能。
应用场景包括:智能工单、智能商品推荐、智能事实查询、智能辅导、智能房产推荐、智能出行助手等

大模型构建应用的4个阶段

预训练 —— 通用能力

在这里插入图片描述

微调 —— 领域能力

在这里插入图片描述

prompt工程 —— 任务能力

在这里插入图片描述

产品化/工程化 —— 产品能力

在这里插入图片描述

写指令思考框架

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值