阿里云文档 2025-12-01

调用CheckModelFeatureFGFeature检查模型特征FG配置-人工智能平台 PAI-阿里云

检查FG配置内容是否正确,是否满足所有规则。

阿里云文档 2025-11-26

使用EAS自定义部署vLLM大语言模型在线服务-人工智能平台 PAI-阿里云

通过EAS可以快速将模型部署为在线推理服务。本文以vLLM框架部署Qwen3-0.6B模型为例,介绍使用EAS部署服务并调用的全流程。

阿里云文档 2025-09-15

特征生成fg.json和EasyRec模型config配置案例

本文通过如下示例为您说明如何配置特征生成配置文件fg.json和模型配置文件config。

阿里云文档 2025-07-24

如何在DSW上对CosyVoice2.0模型进行调优

本文为您介绍如何在阿里PAI-DSW上微调CosyVoice2.0模型。

文章 2025-06-20 来自:开发者社区

PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长

随着大语言模型(LLM)参数量呈现指数级增长,如开源模型 DeepSeekV3-671B 已达 700GB+ 规模,模型加载耗时已成为影响推理服务效率的关键瓶颈,在弹性扩容、多实例部署等场景因模型加载耗时过长,影响了服务扩展的敏捷性和模型部署的效率。 针对上述挑战,阿里云人工智能平台 PAI 创新性地发布了模型权重服务功能,大幅降低冷启动与扩容时长,解决模型加载耗时过长的业界难...

PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长
阿里云文档 2025-05-27

BladeLLM模型量化

针对LLM模型量化,BladeLLM提供了高效易用的量化功能,包括仅权重量化(weight_only_quant)和权重激活联合量化(act_and_weight_quant),集成了若干主流有效的量化算法,如GPTQ、 AWQ、 SmoothQuant等,同时支持INT8、INT4、FP8等多种数据类型的量化。本文为您介绍如何进行模型量化操作。

问答 2023-08-14 来自:开发者社区

机器学习PAI配置了share_embedding后模型和权重文件变大了是什么原因?

机器学习PAI配置了share_embedding后模型和权重文件变大了是什么原因?

问答 2023-07-22 来自:开发者社区

想请教一下机器学习PAI,单目标模型样本加权,关于权重的设置,有没有什么推荐的做法?

想请教一下机器学习PAI,单目标模型样本加权,关于权重的设置,有没有什么推荐的做法?

问答 2023-06-05 来自:开发者社区

在机器学习PAI使用Pipeline组件训练出来的随机森林模型,怎么输出各个特征的权重呢?

在机器学习PAI使用Pipeline组件训练出来的随机森林模型,怎么输出各个特征的权重呢?

问答 2023-05-29 来自:开发者社区

机器学习PAI若模型已优化且关闭权重优化,如果需要切换模型应该不需要重新跑一轮模型优化吧?

看到Blade社区支持diffusers库的pr,机器学习PAI若模型已优化且关闭权重优化,如果需要切换模型,是只需要在执行推理前,额外调用pipeline.from_pretrained()加载新模型参数,应该不需要重新跑一轮模型优化吧?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注