文章 2025-10-21 来自:开发者社区

阿里云ACK托管集群Pro版共享GPU调度操作指南

本文详细介绍了在阿里云容器服务ACK托管集群Pro版中,通过共享GPU调度实现GPU显存和算力精细化分配的操作指南。 一、核心功能概述 ACK托管集群Pro版支持为应用申请GPU显存和算力资源,实现以下两种任务模式: • 仅申请显存 • 同时申请显存和算力 注意: 两种任务模式不能共存于同一节点。 二、...

阿里云文档 2025-09-17

跨命名空间共享数据集

Fluid利用Kubernetes的命名空间(Namespace)资源隔离特性,确保了数据集在计算任务与数据访问层面的安全控制,有效满足了跨团队数据隔离的需求。更进一步,Fluid实现了跨命名空间的数据访问及缓存资源共享,这意味着公开数据集能够在多个团队间复用,实现了单次缓存、多团队共享的高效模式,增强了数据的利用效率与管理的灵活性,为研发团队间的协同作业提供了便利。本文介绍如何配置跨命名空间共享...

阿里云文档 2025-09-04

【组件升级】共享GPU调度组件升级公告

共享GPU调度组件的隔离模块cGPU版本小于1.5.13时,残留进程可能导致小概率的内核崩溃。

阿里云文档 2025-06-11

在ACK Edge集群中使用共享GPU调度能力

通过共享GPU调度能力,您可以将多个Pod调度到同一张GPU卡上,以共享GPU的计算资源,从而提高GPU的利用率并节省成本。在实现GPU共享调度的同时,确保运行在同一张GPU上的多个容器之间能够互相隔离,并根据各自申请的资源使用量运行,避免某个容器的资源使用量超标,进而影响其他容器的正常工作。本文介绍如何在ACK Edge集群中使用共享GPU调度能力。

阿里云文档 2025-03-07

通过ack-co-scheduler使用共享GPU调度

共享GPU调度作为一种资源管理策略,允许多个任务或进程共享同一GPU。您可以在注册集群中使用共享GPU调度,帮您解决传统GPU调度的资源浪费问题,从而提升GPU利用率。

阿里云文档 2025-02-06

使用MPS(Multi-Process Service,多进程服务)实现GPU共享和显存隔离能力

共享GPU调度支持通过NVIDIA MPS(Multi-Process Service)作为底层GPU隔离模块,实现多个Pod共享同一张GPU卡,并确保各Pod之间的显存隔离。本文将为您介绍如何启用NVIDIA MPS隔离功能,并将其与共享GPU调度组件集成使用。

文章 2024-08-19 来自:开发者社区

在k8S中,Pod如何实现数据持久化?数据共享?跨节点Pod如何实现数据共享?

在 Kubernetes (k8S) 中,同一个 Pod 内实现数据持久化和数据共享的方式主要通过使用 Volume(卷)来完成。Volume 是 Kubernetes 提供的一种抽象,它代表了宿主机上的一个目录或存储设备,可以被 Pod 中的一个或多个容器挂载并访问。 1. 数据持久化: EmptyDir: 在 Pod 创建时自动创建一个空目录,所有容器都可以读写此...

文章 2024-08-19 来自:开发者社区

在k8S中,共享存储的作用是什么?

在Kubernetes(k8s)中,共享存储的作用至关重要,特别是对于有状态应用或需要持久化数据的应用。共享存储机制允许不同节点上的Pod访问和共享同一份数据,即使当Pod由于任何原因重新调度到集群中的其他节点时,也能继续使用相同的数据集。具体作用包括: 数据持久化:共享存储服务提供了一种方法,使得容器内的数据能够跨越容器生命周期,确保重启、迁移或删除容器时,关键数据不会丢失...

文章 2023-11-22 来自:开发者社区

kubernetes GPU共享的困境和破局

kubernetes GPU的困境和破局随着人工智能与机器学习技术的快速发展,在 Kubernetes 上运行模型训练、图像处理类程序的需求日益增加,而实现这类需求的基础,就是 Kubernetes 对 GPU 等硬件加速设备的支持与管理。kubernetes 调度 GPU-使用篇Kubernetes 支持对节点上的 AMD 和 NVIDIA GPU (图形处理单元)进行管理,目前处于实验状态。....

文章 2023-11-21 来自:开发者社区

k8s教程(pod篇)-容器共享volume

同一个 Pod 中的多个容器能够共享Pod级别的存储卷 Volume。Volume 可以被定义为各种类型,多个容器各自进行挂载操作,将一个 Volume挂载为容器内部需要的目录,如图所示:在下面的例子中,在 Pod 内包含两个容器:tomcat 和 busybox,在 Pod 级别设置 Volume “app-logs”,用于 tomcat 容器向其中写日志文件,busybox 容器从中读日志文....

k8s教程(pod篇)-容器共享volume

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注