阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪

简介: 阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪

阿里云 AI 神器通义听悟上线了,宣称是身边的 AI 学习助手。这名字听着挺玄乎的,通义听悟到底是个什么玩意?具体有什么用呢?下面我们一起来看看它有什么神器的地方。

通义听悟介绍

通义听悟是接入了阿里大模型的聚焦音视频内容的工作学习AI助手。基础的功能包含以下几点:

  • 实时语音转写,生成智能记录
  • 文件转写,音视频文件快速上传转成文字
  • 实时翻译,大幅提升跨语言写作效率
  • 快速标记内容,整理内容重点信息,智能全文概要

针对一些细分场景,听悟还设置了不少「宝藏功能」:打开 Chrome 插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的「开会替身」,在静音情况下入会 AI 可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR 等群体整理访谈更高效。
通义听悟 Chrome 插件将在近期对所有用户开放下载

具体到玩法,正如通义听悟的「自我介绍」中所说:

  • 如果你是一名职场人士,通义听悟可以帮你记录和回顾你的每一场会议;

  • 如果你是一位学生朋友,通义听悟可以让你不遗漏老师讲授的每一个重点;

  • 如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈;

  • 如果你想以最快的时间看完你最喜爱的视频博主的直播分享,通义听悟可以使你以成倍的速度抓住最精彩的内容。

接下来,让我们看看通义听悟的本领如何。

实测通义听悟

学啥新东西第一个想到的就是去 B 站看看有没有免费课程。

有时候没空看视频,就想能不能把视频中的对话转成文字,这样就不需要自己手动做笔记了,每次回顾只看文字稿就行了。

如何把视频中 UP 主说的话转成文字? 之前一直没找到好使的工具,用了通义听悟,确实不错。

在「通义听悟」上传了一个 30 min 的老蒋解读 B 站商业化的视频,大该用了2 分钟就完成了转文字。

让我震惊的是,不是单纯的视频对话转文字, AI 自动帮你做了总结、分了段落 ...

自动生成的全文概要

自动生成的章节速览

自动生成的对话文字

说实话,用到视频转文字、自动总结功能,对平时自学的小伙伴确实是一个不错的助手,更多的功能,等着大家一起去发现,感兴趣的去申请内测吧!
通义听悟: https://tingwu.aliyun.com/u/6WXvEJc0Jc00JJ30

目录
相关文章
|
2月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
483 30
|
2月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
443 1
|
2月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
400 121
|
2月前
|
人工智能 人机交互 知识图谱
当AI学会“融会贯通”:多模态大模型如何重塑未来
当AI学会“融会贯通”:多模态大模型如何重塑未来
312 114
|
2月前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
1380 16
构建AI智能体:一、初识AI大模型与API调用
|
2月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
576 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
2月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
651 42
|
3月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
997 50