容器服务Kubernetes版授权策略的相关内容

阿里云文档 2025-12-25

为PD分离推理服务配置弹性伸缩策略

在Prefill-Decode（PD）分离的LLM推理架构中，Prefill和Decode阶段的资源需求差异巨大，传统的CPU/GPU利用率指标无法有效指导弹性伸缩。本方案以Dynamo框架为例，介绍如何利用KEDA，根据NATS消息队列的积压情况，为Prefill角色配置独立的弹性伸缩策略，实现资源按需分配，优化服务成本与性能。

阿里云文档 2025-12-22

DescribePolicyGovernanceInCluster：查询集群策略治理的审计日志与违规情况-容器服务 Kubernetes 版 ACK-阿里云

ACK集群容器安全策略供了种类丰富的内置规则库，包括Compliance、Infra、K8s-general和PSP，旨在确保容器在生产环境中的安全运行。您可以调用DescribePolicyGovernanceInCluster接口，查询目标集群策略治理的详细信息，例如集群当前启用的不同等级策略计数统计、策略治理审计日志、拦截和告警情况等。

阿里云文档 2025-12-22

调用DeletePolicyInstance删除策略规则实例-容器服务 Kubernetes 版 ACK-阿里云

您可以调用DeletePolicyInstance接口，在指定集群中删除策略规则实例。

阿里云文档 2025-12-22

调用DeployPolicyInstance API部署策略规则实例-容器服务 Kubernetes 版 ACK-阿里云

您可以在ACK集群中选择安全策略类型，配置策略实例的治理动作（告警或拦截）、作用的命名空间范围等，以创建并部署一个策略实例。您可以调用DeployPolicyInstance接口，在指定集群的命名空间中部署策略规则实例。

阿里云文档 2025-06-09

使用Gateway with Inference Extension实现生成式AI推理服务灰度发布

通过Gateway with Inference Extension组件，您可以在生成式AI推理服务中实现更换、升级使用的基础模型或者对多个LoRA模型进行灰度更新，将服务中断的时间降至最低。本文介绍如何使用Gateway with Inference Extension组件对生成式AI推理服务进行渐进式灰度发布。

文章 2024-09-03 来自：开发者社区