SF
阿里云大数据AI技术
阿里云大数据AI技术
注册登录
关注博客
注册登录
主页
关于
RSS
Post-Training on PAI (1):一文览尽开源强化学习框架在PAI平台的应用
阿里云大数据AI
6 月 27 日
阅读 4 分钟
70
Post-Training(即模型后训练)作为大模型落地的重要一环,能显著优化模型性能,适配特定领域需求。相比于 Pre-Training(即模型预训练),Post-Training 阶段对计算资源和数据资源需求更小,更易迭代,因此备受推崇。
PAI-TurboX: 面向自动驾驶的训练推理加速框架
阿里云大数据AI
6 月 25 日
阅读 4 分钟
228
自动驾驶领域对高效且实时的数据处理能力提出了极高要求。如何优化深度学习模型的训练与推理流程,提升计算资源利用率,缩短模型迭代周期,并在保证精度的同时,实现低延迟、高吞吐量的部署,始终是行业面临的核心挑战。针对这些难题,PAI-TurboX为自动驾驶场景中的复杂数据预处理、离线大规模模型训练和实时智能驾驶推...
【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
阿里云大数据AI
6 月 23 日
阅读 2 分钟
203
MiniMax-M1 模型是由 MiniMax 公司6月17日全新推出的大语言模型,使用 hybrid Mixture-of-Experts (MoE) 架构,并使用了 lightning attention 机制。 MiniMax 公司称其为世界上第一个开源的大规模混合架构的推理模型。
PAI推理重磅发布模型权重服务,大幅降低冷启动与扩容时长
阿里云大数据AI
6 月 20 日
阅读 2 分钟
235
随着大语言模型(LLM)参数量呈现指数级增长,如开源模型 DeepSeekV3-671B 已达 700GB+ 规模,模型加载耗时已成为影响推理服务效率的关键瓶颈,在弹性扩容、多实例部署等场景因模型加载耗时过长,影响了服务扩展的敏捷性和模型部署的效率。
DistilQwen-ThoughtX蒸馏模型在PAI-ModelGallery的训练、评测、压缩及部署实践
阿里云大数据AI
6 月 13 日
阅读 6 分钟
303
随着大语言模型(LLM)规模和计算需求增长,如何高效应用这些模型成为关键挑战。阿里云PAI团队推出 EasyDistill开源框架(GitHub链接),简化大模型的知识蒸馏过程,显著降低计算成本,同时保持高性能。基于 EasyDistill 训练的 DistilQwen-ThoughtX 系列模型,结合创新的变长思维链推理技术,能够根据任务难度自适应调...
从MaxCompute到Milvus:通过DataWorks进行数据同步,实现海量数据高效相似性检索
阿里云大数据AI
6 月 12 日
阅读 5 分钟
399
在如今大数据和人工智能应用场景中,企业往往需要对存储在云数据仓库(如云原生大数据计算服务 MaxCompute)中的大规模结构化数据进行向量化处理,以支持高效的向量检索和相似性分析等AI应用。
一体系数据平台的进化:基于阿里云 EMR Serverless Spark的持续演进
阿里云大数据AI
6 月 10 日
阅读 4 分钟
416
一体系汽配供应链平台(以下简称一体系),专注提供高品质发动机、变速箱、底盘技术零部件,融汇优质实体资源和创新互联网科技,为上游品牌商提供高效的下沉渠道,为下游零售商带来可信赖的产品和服务,让采购更便捷可靠,实现行业数字化转型。
ES Serverless 8.17王牌发布:向量检索「火力全开」,智能扩缩「秒级响应」!
阿里云大数据AI
6 月 9 日
阅读 4 分钟
343
随着生成式AI与实时数据分析需求激增,开发者亟需兼顾高性能、低成本且免运维的检索服务。阿里云 Elasticsearch Serverless 基于官方8.17版本,深度融合无服务器架构与分层扩展能力,面向信息检索、向量搜索、语义分析等通用场景,提供全托管服务。
Fusion引擎赋能:流利说如何用阿里云Serverless Spark实现数仓计算加速
阿里云大数据AI
5 月 30 日
阅读 3 分钟
472
行业流利说是领先的科技驱动的教育公司,公司自主研发了领先的英语口语评测、写作打分引擎和深度自适应学习系统,致力于为用户提供一整套系统性的英语学习解决方案,从听、说、读、写多个维度提升用户的英语水平。
DistilQwen-ThoughtX:变长思维链推理模型,超越DeepSeek蒸馏模型
阿里云大数据AI
5 月 30 日
阅读 8 分钟
547
近年来,自然语言处理(NLP)领域以大语言模型(LLM)的出现为标志,发生了深刻变革,引领了语言理解、生成和推理任务的进步。其中,进步尤其显著的是深度推理模型的发展,如 OpenAI 的 o1、DeepSeek-R1 和 QwQ-32B 等,它们在数学问题、代码生成等复杂推理任务中表现突出。这些模型的成功很大程度上得益于使用思维链(C...
阿里云人工智能平台PAI开源EasyDistill框架助力大语言模型轻松瘦身
阿里云大数据AI
5 月 29 日
阅读 9 分钟
456
随着大型语言模型(LLM)的复杂性和规模不断增长,对于许多研究人员和企业而言,如何有效地利用这些庞大的模型变得愈发重要。然而,巨大的计算需求和训练成本为模型的广泛应用设置了障碍。知识蒸馏是一种将大模型的知识转移到小模型的方法,其核心思想是在不显著降低性能的前提下,通过训练将复杂的模型转化为更小、更高...
火热邀测!DataWorks数据集成支持大模型AI处理
阿里云大数据AI
5 月 28 日
阅读 3 分钟
307
数字化浪潮下,数据已成为企业的“新石油”,但如何从海量、异构的数据矿藏中精准提炼价值,始终是AI时代的关键命题。传统的数据集成方案往往面临链路复杂、处理低效、非结构化数据支持薄弱等瓶颈。阿里云大数据开发治理平台 DataWorks 数据集成智能升级,以“ AI 释放数据价值”为核心,推出数据集成支持大模型 AI 处理功能...
客户案例| DataWorks x 婚礼纪:智能一站式数据开发治理平台让千万新人的幸福时刻“数智化”
阿里云大数据AI
5 月 26 日
阅读 3 分钟
442
婚礼纪是杭州火烧云科技有限公司推出的结婚服务平台,业务覆盖婚宴酒店、婚纱摄影、婚礼策划等结婚服务全产业链,致力于打造满足结婚一切所需的全能服务生态,平台年服务超2000万对新人,合作商家超20万家。
Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
阿里云大数据AI
5 月 22 日
阅读 5 分钟
450
NVIDIA Cosmos 是一个世界基础模型(WFMs, world foundation models)开发平台,用于推动物理 AI 的发展,包含先进的视觉标记器、护栏以及加速视频数据处理工具管线。它专为加速智能驾驶汽车和机器人领域的合成数据生成、AI 模型训练与评估而设计。
企业级AI搜索解决方案:阿里云AI搜索开放平台
阿里云大数据AI
5 月 22 日
阅读 3 分钟
375
随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。
构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践
阿里云大数据AI
5 月 20 日
阅读 6 分钟
826
大模型是“大数据加大算力+强算法”结合的产物。数据毋庸置疑是 AI 的养料,海量、高质量的多模数据对模型训练精度至关重要;算力则是 AI 的基石,大规模数据处理、模型训练需要依赖大量 CPU 及 GPU 算力;算法是 AI 的骨架,优秀的算法框架可以大大提升数据处理及模型训练效果。
StarRocks+Paimon落地阿里日志采集:万亿级实时数据秒级查询
阿里云大数据AI
5 月 19 日
阅读 7 分钟
364
A+流量分析平台是阿里集团统一的全域流量数据分析平台。从页面&小站&活动&APP等作为切入点,在经过埋点、采集、计算后,构建出宏观的概览数据、坑位效果、类目成交转化、路径分析、用户细分等,致力于打造流量数据分析闭环,快速帮助业务发现流量问题&提升流量转化。当前,流量采集团队每天需要的日志数据达到万亿级,在...
云上玩转 Qwen3 系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用
阿里云大数据AI
5 月 15 日
阅读 5 分钟
375
本文详细介绍了如何使用 LangStudio 和 Qwen3 构建基于MCP协议的 Hologres ChatBI 智能 Agent 应用。该应用通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该...
开源大数据平台建设经典案例合集
阿里云大数据AI
5 月 13 日
阅读 5 分钟
373
开源大数据平台建设经典案例合集阿里云开源大数据平台 E-MapReduce(简称“EMR”)是云原生开源大数据平台,为客户提供简单易集成的 Hadoop、Hive、Spark、StarRocks、Flink、Presto、ClickHouse 等开源大数据计算和存储引擎。EMR 计算资源支持灵活的弹性控制,支持 on ECS、on ACK 以及 Serverless 多种部署形态。
阿里云 AI 搜索开放平台新增:服务开发能力
阿里云大数据AI
5 月 8 日
阅读 3 分钟
472
随着 AI 技术的快速发展,用户对 以算法驱动的 AI 搜索相关能力需求日益增长。AI 搜索开放平台已提供20+原子化服务能力,可灵活组合搭建AI搜索。本期发布将重点解决用户在代码开发中的不便,通过集成 dsw 能力,新增 notebook 功能,为用户提供更便捷的代码编写、调试及运行环境,进一步提升服务调试体验。
云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用
阿里云大数据AI
5 月 7 日
阅读 5 分钟
701
本文详细介绍了如何使用LangStudio和Qwen3构建基于RAG和联网搜索的AI智能问答应用。该应用通过将RAG、web search等技术和阿里最新的推理模型Qwen3编排在一个应用流中,为大模型提供了额外的联网搜索和特定领域知识库检索的能力,提升了智能回答的效果,较少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足...
Hologres x 函数计算 x Qwen3,对接MCP构建企业级数据分析 Agent
阿里云大数据AI
5 月 6 日
阅读 5 分钟
521
大模型(LLM)在数据分析领域潜力巨大,但在实际落地中,企业面临实时数据接入、动态调用工具链、上下文记忆短和跨系统数据整合等挑战。MCP(模型上下文协议)提供了很好的解决思路。通过标准化接口架构,将 AI 模型的决策逻辑与外部资源解耦,形成 "智能大脑 + 外接四肢" 的协同模式,旨在解决大模型与外部工具、数据源...
AI 搜索开放平台 x Qwen3:智能搜索全栈解决方案新升级
阿里云大数据AI
5 月 6 日
阅读 2 分钟
504
随着 AI 技术的飞速发展,搜索已不仅是“查找信息”,更是“创造价值”的核心引擎。阿里云 AI 搜索开放平台与 Qwen3 模型的深度融合,为企业和开发者提供了从基础能力到复杂场景的全栈解决方案,让智能搜索的落地门槛更低、效率更高、体验更佳。
DataWorks Copilot 集成 Qwen3-235B-A22B混合推理模型,AI 效能再升级!
阿里云大数据AI
4 月 30 日
阅读 2 分钟
425
刚刚,阿里云一站式智能大数据开发治理平台 DataWorks 正式接入 Qwen3 模型,可支持235B最大尺寸。用户通过 DataWorks Copilot 智能助手即可调用该模型,通过自然语言交互完成多种代码操作,实现数据开发、数据分析的快速实现。
PAI Model Gallery 支持云上一键部署 Qwen3 全尺寸模型
阿里云大数据AI
4 月 29 日
阅读 3 分钟
1.2k
Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家(MOE)模型。基于广泛的训练,Qwen3 在推理、指令跟随、Agent 能力和多语言支持方面取得了突破性的进展,具有以下关键特性:
PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit
阿里云大数据AI
4 月 28 日
阅读 4 分钟
447
4月27日,阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit([链接]),性能达到开源 SOTA。Step1X-Edit模型总参数量为19B,实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持文字替换、风格迁移等11 类高频图像编辑任务类...
云上玩转DeepSeek系列之六:DeepSeek云端加速版发布,具备超高推理性能
阿里云大数据AI
4 月 28 日
阅读 3 分钟
637
作为国内首个千亿级开源 MoE 模型,DeepSeek-R1 凭借其卓越的代码生成与复杂推理能力,已成为开发者构建智能应用的首选。然而,原始模型在产业落地中面临严峻挑战,部署 671B 满血版模型不仅硬件门槛要求很高,同时吞吐效率和响应延迟也受到了制约。
演讲实录:中小企业如何快速构建AI应用?
阿里云大数据AI
4 月 28 日
阅读 5 分钟
379
AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。
千万级数据秒级响应!碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践
阿里云大数据AI
4 月 27 日
阅读 4 分钟
388
作者:邹佳华 碧桂园服务大数据运维高级工程师田明 碧桂园服务数据开发高级工程师指导人:杜鹏 部门总经理背景介绍公司介绍碧桂园服务(以下简称“碧服”)是中国领先的综合物业管理服务运营商,以“服务成就美好生活”为使命,业务覆盖住宅、商业物业、写字楼、产业园、学校、公园、公建等多种业态。作为行业领先的综合服务...
通过阿里云Milvus与通义千问VL大模型,快速实现多模态搜索
阿里云大数据AI
4 月 24 日
阅读 19 分钟
773
本文主要演示了如何使用阿里云向量检索服务Milvus版与通义千问VL大模型,提取图片特征,并使用多模态Embedding模型,快速实现多模态搜索。
1
(current)
2
3
4
下一页
1
(current)
下一页