DeepMind 发布 AlphaGenome,1 秒内完成所有模态和细胞类型的变异效应预测

6 月 26 日
阅读 4 分钟
251
谷歌 DeepMind 的 Alpha 系列再添新成员——AlphaGenome,其能够更全面、准确地预测人类 DNA 序列中单个变异或突变,如何影响一系列调控基因的生物过程。
封面图

【vLLM 学习】Disaggregated Prefill

6 月 25 日
阅读 4 分钟
403
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/disaggregated_prefill.py {代码...}
封面图

从全心脏模型到基于 LLM 的疾病网络分析,清华长庚医院李栋从数据视角剖析医疗大模型发展趋势

6 月 25 日
阅读 5 分钟
335
随着人工智能技术的不断深入成熟,AI 也赋予了医疗领域一场深刻的变革——通过整合多源数据与智能算法,为医疗行业的效率提升、精准诊断都提供了全新解决方案。医疗数据作为大模型的「燃料」,也是医疗决策的核心载体,它的角色至关重要,尤其是在中国医疗体系加速数字化转型的背景下,从数据角度解析医疗模型更是创新的必...
封面图

狂揽 2.6k stars,MonkeyOCR-3B 在英文文档解析任务上超越 72B 模型,性能达 SOTA

6 月 24 日
阅读 3 分钟
400
如今,OCR(光学字符识别)技术早已不再局限于文字识别,而正逐步演化为更复杂的文档解析系统。从最初的简单字符提取,到近年来兴起的多模态大模型,OCR 已融入了版面理解、语义识别与结构还原等任务,在文档识别、字幕识别、物流分拣、文献资料检索等领域广泛落地,而丰富的应用场景之下也对模型提出了更加严苛的要求。
封面图

【Triton 教程】triton_language.full

6 月 24 日
阅读 1 分钟
341
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

继 Evo 2 之后,Arc Institute 发布首个虚拟细胞模型 STATE,训练数据涉及 70 种不同细胞系

6 月 24 日
阅读 7 分钟
349
众所周知,人体由不同类型的细胞组成——免疫细胞在感染发生时可引发炎症反应以抵御病原体;干细胞具有分化潜能,可生成多种组织类型;而癌细胞则通过逃避生长调控信号,实现异常增殖。尽管这些细胞在功能和形态上差异巨大,但它们几乎都拥有相同的基因组。细胞的独特性并非来自 DNA 序列本身的差异,而是源于它们如何调控...
封面图

【TVM 教程】在 TVM 中使用 Bring Your Own Datatypes

6 月 23 日
阅读 12 分钟
453
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]作者:Gus Smith, Andrew Liu
封面图

成本大幅降低!Distill-Any-Depth 实现高精度深度估计;入选 CVPR 2025!Real-IADD 解锁工业检测新高度

6 月 23 日
阅读 7 分钟
521
单目度量深度估计是一种计算机视觉技术,旨在从单张 RGB 图像中预测绝对深度。这项技术在自动驾驶、增强现实、机器人技术和 3D 场景理解等领域有着广泛的应用。
封面图

入选 ICML 2025!哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型,神经认知结果预测任务上性能提升 15%

6 月 23 日
阅读 5 分钟
647
在人工智能技术突飞猛进的当下,大型视觉-语言模型(LVLMs)正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域,这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持,已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域,LVLMs 通过对 TB 级文本语料的学习,在机器翻译、文本...
封面图

在线教程丨获 CVPR 2025 最佳论文,通用 3D 视觉模型 VGGT 推理速度可达秒级

6 月 20 日
阅读 2 分钟
792
6 月 13 日,全球计算机视觉三大顶级会议之一 CVPR 2025 公布了最佳论文等奖项。根据官方数据,CVPR 2025 共收到了超 4 万名作者提交的 13,008 篇论文,相较去年的投稿数量增长了 13%,大会最终接收论文 2,872 篇,整体接受率约为 22.1% 。
封面图

AI 论文周报|最大医疗推理数据集 ReasonMed 含 37 万样本;微软/北大/清华提出强化学习预训练,提升下一 Token 预测准确性

6 月 19 日
阅读 3 分钟
648
在 AI 技术迅速发展的今天,学术界的研究成果及其研究论文层出不穷。据《科学智能白皮书 2025》显示,全球人工智能期刊论文数量在过去十年间激增至 3 倍多——从 30.89 万篇增至 95.45 万篇。这些庞大的数据背后,不仅仅科研人员们智慧的凝聚,更是他们攻坚克难、探索未来的烙印。 从 Transformer 架构让语言模型实现跨越...
封面图

MIT 团队利用大模型筛选 25 类水泥熟料替代材料,相当于减排 12 亿吨温室气体

6 月 19 日
阅读 7 分钟
693
水泥生产是全球温室气体(GHG)排放的主要来源之一,其排放量占全球人为 GHG 排放的 6% 以上。这一环境负担主要源于水泥熟料的生产过程,包括高温(>950°C)煅烧石灰石(CaCO₃→CaO+CO₂)的化学反应,以及高能耗的工艺要求。随着全球基础设施需求的增长和人口扩张,据麻省理工团队论文介绍,预计到 2050 年水泥产量将...
封面图

【vLLM 学习】Disaggregated Prefill Lmcache

6 月 18 日
阅读 4 分钟
795
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/disaggregated_prefill_lmcache.py {代码...}
封面图

整合多源植物转录组数据,山东理工大学等构建 PlantLncBoost 模型,跨物种 lncRNA 预测准确率最高达 96%

6 月 18 日
阅读 6 分钟
798
在植物科学领域,长非编码 RNA(lncRNA)的研究正逐渐成为焦点。 2020 年发表的一篇关于植物 lncRNA 研究的论文指出,lncRNA 在植物的生长发育和环境适应过程中发挥着关键作用。例如,有研究发现,某些 lncRNA 能够通过与蛋白质相互作用来调控植物的开花时间,从而影响植物的繁殖策略。这种精细的调控机制对于理解植物如...
封面图

【TVM 教程】如何使用 TVM Pass Instrument

6 月 17 日
阅读 27 分钟
834
可以通过向 tvm.transform.PassContext 提供 tvm.ir.instrument.PassInstrument 实例列表来检测 Pass。我们提供了一个用于收集计时信息的 pass 工具(tvm.ir.instrument.PassTimingInstrument),可以通过 tvm.instrument.pass_instrument() 装饰器使用扩展机制。
封面图

【Triton 教程】triton_language.cat

6 月 17 日
阅读 1 分钟
860
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

早鸟票倒计时|TVM/Triton/TileLang 同台炫技,Meet AI Compiler 邀你一同解锁 AI 编译器的无限可能!

6 月 17 日
阅读 4 分钟
798
HyperAI 超神经将于 7 月 5 日在北京市中关村举办第 7 期 Meet AI Compiler 技术沙龙。本次活动邀请了来自 AMD 、沐曦集成电路、字节跳动、北京大学的 4 位资深专家,从底层编译到上层应用,多视角探索 AI 编译器的前沿实践。此外,上海创智学院助理教授、 Apache TVM PMC 冯思远将担任圆桌环节的主持人,与众位讲师一起...
封面图

从石英到铁电材料,哈佛大学提出等变机器学习框架,加速材料大规模电场模拟

6 月 16 日
阅读 5 分钟
774
计算材料科学作为现代材料科学领域的前沿研究方向,承担着解析材料微观结构与预测宏观性能的关键使命。该学科以第一性原理为基石,基于量子力学等基础物理定律,致力于精确预测真实材料的可实验测量性质,从而深入理解材料在外部刺激下的响应机制。这些响应特性涵盖线性、非线性及耦合效应,是决定电介质、铁电体、多铁...
封面图

训练成本砍半!OmniConsistency 用 2.6k 张图实现 SOTA 效果;Wan2.1-VACE-14B 解锁视频生成新维度

6 月 16 日
阅读 7 分钟
739
在数字视觉技术蓬勃发展的今天,开源模型在图像风格化上取得了显著突破。然而在风格化一致性方面仍与商业模型存在明显差距。为突破这一技术瓶颈,Show Lab 创新性地推出了 OmniConsistency,这是一种基于大规模扩散变换器构建的一致性插件,旨在弥合开源方法与商业模型之间的性能差距。
封面图

【vLLM 学习】Data Parallel

6 月 13 日
阅读 5 分钟
868
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/data_parallel.py {代码...}
封面图

在线教程丨刷新 TTS 模型 SOTA,OpenAudio S1 基于 200 万小时音频数据训练,深刻理解情感及语音细节

6 月 13 日
阅读 3 分钟
892
近年来,TTS(Text-to-Speech,文本转语音)模型经历了从拼接式语音合成到统计参数合成,再到神经网络 TTS(Neural TTS)的迭代,在技术层面呈现出端到端、模块融合的趋势,在应用层面呈现出多语言、高自然度、丰富情感变化的效果升级。
封面图

基于 8.6 万蛋白质结构数据,融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

6 月 12 日
阅读 7 分钟
962
在细胞这个「工厂」中,氮-氧-硫(NOS)键就像一个可逆的「智能开关」,能够根据环境中的氧化还原变化调节酶活性。 2021 年,来自德国哥廷根乔治奥古斯特大学的团队,通过研究淋病奈瑟氏球菌的转醛醇酶,发现了存在于赖氨酸和半胱氨酸之间的 NOS 键。这项研究超越了单一病原体和酶的研究范畴,为跨学科的蛋白质科学、药...
封面图

入选 ICML 2025,清华/人大提出统一生物分子动力学模拟器 UniSim

6 月 11 日
阅读 5 分钟
995
清华大学刘洋老师组、人民大学高瓴人工智能学院黄文炳老师组共同提出了一种统一的生物分子时间粗化(time-coarsened)动力学模拟器 UniSim 。该方法在大量 3D 分子结构数据上通过去噪 + 力场混合预训练获得统一的全原子表示模型,基于随机差值(stochastic interpolant)生成式框架学习分子在长时间步长下的转移向量场(...
封面图

【Triton 教程】triton_language.arange

6 月 10 日
阅读 1 分钟
1k
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

活动预告 | AMD/沐曦/字节/北京大学/上海创智齐聚北京,从底层编译到场景应用的多视角探索

6 月 10 日
阅读 4 分钟
998
在 AI 变革千行百业的时代,一场关于效率、可部署性与算力可持续性的技术革命正悄然发生。作为承上启下的关键中间件,AI 编译器串联起了底层硬件与上层应用。无论是已在业界广泛应用的 TVM,还是近年来快速崛起的 Triton,亦或是今年年初才崭露头角的算子编程语言 TileLang,编译技术已不仅仅是让模型「跑得起来」的基本...
封面图

【TVM 教程】如何使用 TVM Pass Infra

6 月 9 日
阅读 20 分钟
1.1k
随着 Relay/tir 中优化 Pass 数的增加,手动执行并维护它们的依赖关系变得难以处理。因此我们引入了一个基础架构来管理优化 Pass,并使其适用于 TVM 堆栈中 IR 的不同层。
封面图

8k 长序列建模,蛋白质语言模型 Prot42 仅利用目标蛋白序列即可生成高亲和力结合剂

6 月 9 日
阅读 6 分钟
1.2k
蛋白质结合剂(如抗体、抑制肽)在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上,高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术,但这类方法普遍面临资源消耗巨大、研发周期冗长的挑战,且受限于蛋白质序列组合复杂性的固有瓶颈。
封面图

【vLLM 学习】Cpu Offload Lmcache

6 月 6 日
阅读 2 分钟
1.4k
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/cpu_offload_lmcache.py {代码...}
封面图

获 1.3 亿美元融资,NewLimit 利用机器学习指导表观遗传程序设计,延长人类健康寿命研究已有初级成果

6 月 6 日
阅读 5 分钟
1.3k
盛年不重来,一日难再晨。一直以来,「时间」似涓涓流水,永不停息且难以逆转, 时光流转所带来的衰老困扰着一代又一代人。古有秦始皇、汉武帝、唐太宗等伟大帝王寻仙问道追求长生,亦有传说中的亚瑟王圣杯得之即可返老还童。当时代的指针落在 21 世纪,随着人们对于生命科学的研究不断深入,虽然已经鲜有人提及「永生」...
封面图

告别代码烦恼!Seed-Coder 解锁高效编程;Mixture-of-Thoughts 涵盖多领域数据,实现高质量推理

6 月 6 日
阅读 7 分钟
1.3k
在大模型竞争日益激烈、不断「卷技术、卷规模」的趋势下,如何提升模型实际可用性和任务表现,成为了更关键的问题。其中,代码能力是衡量大模型可用性和任务表现的重要指标。基于此,字节跳动 Seed 团队发布了轻量级但功能强大的开源代码大语言模型——Seed-Coder-8B-Instruct 。
封面图