阿里云文档 2025-12-23

微调、部署并实现Llama-3模型的高效推理

Meta已开源Llama-3,推出了8B和70B两种参数量的大语言模型。阿里云PAI灵骏智算服务是面向大规模深度学习场景的智算产品,提供一站式的异构计算资源和AI工程化平台。本方案将为您介绍如何使用阿里云PAI灵骏智算服务,以及基于Meta-Llama-3-8B的开源模型和Megatron的训练流程,进行模型微调、离线推理验证,并实现在线服务部署。

文章 2025-05-28 来自:开发者社区

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

前言 知识蒸馏是一种将大模型的知识转移到小模型的方法,其核心思想是在不显著降低性能的前提下,通过训练将复杂的模型转化为更小、更高效的版本。通过这种方式,知识蒸馏不仅能够有效降低计算成本,还能够提高模型在资源受限环境中的适应性,从而为大规模应用提供可能。在此背景下,阿里云人工智能平台(PAI)推出了一款新的开源工具包——EasyDistill ,旨在简化大型语言模型的知识蒸馏过程,助力参数...

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身
阿里云文档 2025-04-11

AI开源项目有哪些

阿里云的AI及大数据开源项目包括用于全自动分布式深度学习系统的TePDist和NLP开发与应用工具包EasyNLP,您可以根据需要选择合适的项目。

文章 2022-06-13 来自:开发者社区

阿里云机器学习PAI开源中文NLP算法框架EasyNLP,助力NLP大模型落地

作者:临在、岑鸣、熊兮一 导读随着 BERT、Megatron、GPT-3 等预训练模型在NLP领域取得瞩目的成果,越来越多团队投身到超大规模训练中,这使得训练模型的规模从亿级别发展到了千亿甚至万亿的规模。然而,这类超大规模的模型运用于实际场景中仍然有一些挑战。首先,模型参数量过大使得训练和推理速度过慢且部署成本极高;其次在很多实际场景中数据量不足的问题仍然制约着大模型在小样本场景中的应用,提高....

阿里云机器学习PAI开源中文NLP算法框架EasyNLP,助力NLP大模型落地
文章 2022-02-17 来自:开发者社区

年度大盘点:机器学习开源项目及框架

        我们先来看看Mybridge AI 中排名靠前的顶级开源项目,再聊聊机器学习今年都有哪些发展,最后探寻下新的一年中会有哪些有值得我们期待的事情。 顶级的开源项目 BERT BERT,全称为Bidirectional Encoder Representations from Transformers,是一种基于TensorFlow解决自然语言处...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注