阿里云文档 2025-04-22

ACCL:阿里云自研高性能集合通信库

ACCL(Alibaba Collective Communication Library)是阿里云自研的,基于NCCL(Nvidia Collective Communication Library)开发的集合通信库。它结合阿里云自身网络特点以及丰富的大模型任务通信调优经验,可为客户任务提供更高的通信性能,并且具备一定的故障诊断和自愈能力。本文为您介绍ACCL的主要特性和安装方法。

阿里云文档 2025-04-14

在不同类型的设备中安装Blade的方法

Blade的安装包括了Wheel包和SDK。在CPU和CUDA环境中,您需要安装Wheel包进行模型优化,同时安装SDK部署模型推理。而在移动设备或嵌入式系统等端侧设备中,只需安装Wheel包优化模型。经过Blade优化处理后,输出MNN模型,然后您可以使用MNN部署模型推理。本文详细介绍如何在不同类型的设备中分别安装Blade。

阿里云文档 2025-01-21

PAI文本生成方法

阿里云PAI提供智能文创解决方案,帮助您快速搭建囊括模型离线训练、离线预测和在线部署的端到端全链路构建流程。旨在从冗长、重复的文本序列中抽取、精炼或总结出要点信息,实现各类文本生成任务,包括文本摘要生成、新闻标题生成、文案生成、问题生成、作文生成和古诗生成等。

阿里云文档 2024-07-22

服务启动之前,用户如何定义hookfunc方法

本文为您介绍如何在服务启动前进行hook处理操作。

文章 2024-07-13 来自:开发者社区

在机器学习和数据科学中,数据预处理是一个至关重要的步骤。数据规范化(或称为特征缩放)是预处理的一种常见技术,它可以帮助我们改进模型的性能。`sklearn.preprocessing`模块提供了多种数据规范化的方法,其中`StandardScaler`和`MinMaxScaler`是最常用的两种。

1. 引言 在机器学习和数据科学中,数据预处理是一个至关重要的步骤。数据规范化(或称为特征缩放)是预处理的一种常见技术,它可以帮助我们改进模型的性能。sklearn.preprocessing模块提供了多种数据规范化的方法,其中StandardScaler和MinMaxScaler是最常用的两种。 StandardScaler...

阿里云文档 2024-02-19

高斯混合模型训练组件的配置方法

高斯混合模型(Gaussian Mixture Model)表示在总体分布中包含K个高斯子分布的概率模型。您可以使用高斯混合模型训练组件实现模型分类。本文为您介绍高斯混合模型训练组件的配置方法。

文章 2023-05-16 来自:开发者社区

机器学习 - 数据预处理中的 特征离散化 方法

可供参考的三种特征离散化方法在数据分析中,我们认为在某个范围内取值过于密集的特征认为是取值”连续“的特征。出于某些需求经常需要将这些”连续特征进行离散化“。本文介绍三种比较实用的数据离散化方法。李俊才的个人博客方法1:尺度缩小法这种方法是对于数值元素的一种简单粗暴的方法。离散化的目的不就是减少取值数目吗。那么好,只要把数据除以某个值,大数就变小数,抹掉小数位,自然取值个数就少了很多。很显然,这种....

机器学习 - 数据预处理中的 特征离散化 方法
文章 2022-06-13 来自:开发者社区

机器学习:盘点最常见的7种数据预处理方法和原理

目录1 数据规范化1.1 最值归一化1.2 Z-Score规范化2 类别平衡化2.1 阈值移动2.2 欠采样法(undersampling)2.3 过采样法(oversampling)3 连续值离散化4 缺失值处理5 哑言编码6 正则化6.1 L1正则6.2 L2正则7 数据降维1 数据规范化量纲,指将一个物理导出量用若干基本量的乘方之积表示出来的表达式。数据的比较需要关注两点——绝对数值和量纲....

机器学习:盘点最常见的7种数据预处理方法和原理

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注