7 大数学推理数据集汇总,覆盖算术推理/符号逻辑/视觉数学/几何分析

今天 03:34
阅读 3 分钟
11
随着大模型能力的迅速跃迁,数学推理正从人类独有的智性活动,演变为人工智能领域最具挑战性的前沿方向之一。逻辑推演、公式运算与多步思考等原本依赖人类理性的任务,如今正被机器逐步「理解」与「习得」。然而,不同于语言理解或图像识别,数学推理要求模型不仅能理解题目的表层含义,更要洞察其背后的逻辑结构,这使...
封面图

内含教程|MIT 等推出 BindCraft,直接调用 AF2,实现蛋白质结合体的智能化设计

今天 03:29
阅读 3 分钟
11
在生命体系中,蛋白质很少单独发挥其生物学功能,而是依赖于蛋白质-蛋白质相互作用(PPI)来执行复杂的生物学过程。因此,设计能够特异性靶向和调控 PPI 的蛋白质结合物具有巨大的治疗和生物技术潜力。然而,传统的蛋白质结合物生成方法,例如免疫接种、抗体库筛选或定向进化,通常费力费时,并且对靶位的控制有限。
封面图

文档解析新 SOTA!MinerU 新版本创新「由粗到细」两阶段解析策略;S2S 领域基准首发!腾讯最新基准数据集评测语音模型能力

10 月 20 日
阅读 8 分钟
106
在数字化浪潮下,各行各业积累了海量的非结构化文档数据,尤其是以 PDF 格式为主的学术论文、报告、表单等等。将这些文档高效、精准地转化为机器可读的结构化数据,是实现信息自动化提取、文档管理和智能分析的重要前提,也是释放数据价值的关键一步。
封面图

入选 NeurIPS 2025,英伟达提出 ERDM 模型,解长期预报难题,中远期预报持续领先 EDM 基准

10 月 20 日
阅读 5 分钟
138
中期天气预报(≤15 天)是科学界长期面临的重大挑战。大气作为典型的混沌系统,对初始条件极为敏感,微小误差会迅速放大,导致预报偏离实际。虽然集合数值天气预报通过多组扰动模拟来估计不确定性,已成为主流方法,但其计算资源随精度与时效要求的提升呈指数增长。这一瓶颈正推动学界转向数据驱动的新途径寻求突破。
封面图

AI 论文周报丨递归推理方法/轻量级解码器架构/深度卷积神经网络架构……多领域前沿动态一览

10 月 17 日
阅读 2 分钟
404
语言智能体的长期目标是通过自身经验不断学习与优化,最终在复杂的真实世界任务中超越人类表现。然而在许多环境中,仅依靠经验数据并使用强化学习训练智能体仍面临巨大挑战,这些环境或缺乏可验证的奖励信号(如网页交互),或需要低效的长时程轨迹回放(如多轮工具使用)。因此,当前大多数智能体仍依赖专家数据的监督...
封面图

MOF 结构 36 年终获诺奖:当 AI 读懂化学,金属有机框架正迈向生成式研究时代

10 月 17 日
阅读 6 分钟
375
2025 年 10 月 8 日,诺贝尔化学奖在瑞典揭幕。瑞典皇家科学院决定将 2025 年诺贝尔化学奖授予日本京都大学教授北川进、墨尔本大学教授 Richard Robson 和加州大学伯克利分校教授 Omar Yaghi,以表彰其在「金属有机框架」(MOF,Metal–Organic Frameworks)领域的研究贡献。这个经历了超过 30 年市场验证的研究领域,此...
封面图

AI 预判等离子体「暴走」,MIT 等基于机器学习实现小样本下的等离子体动力学高精度预测

10 月 16 日
阅读 4 分钟
384
直接提起「托卡马克装置」,你可能觉得陌生。如果这样去介绍:托卡马克装置是通向最理想能源——核聚变能的重要技术之一,或许会有「原来是你」的感悟。不过这里的「核能」并非核电站的核裂变,而是更高能、清洁、安全、几乎无放射废料的核聚变。
封面图

活动推荐丨工业和信息化部人才交流中心「AI 赋能材料科学关键技术应用」研修班—杭州站

10 月 15 日
阅读 2 分钟
480
材料工业是国民经济的基础产业,新材料是材料工业发展的先导,人工智能与材料科学的结合应用已经成为推动科技创新和工业进步的重要力量。为重塑材料科学研究新范式,推动人工智能+材料科学交叉型复合人才培养,我中心将于 10 月 24 日-26 日在杭州举办第五期「人工智能赋能材料科学关键技术应用」高级研修班。现将有关事...
封面图

入选 NeurIPS 2025,多伦多大学等提出 Ctrl-DNA 框架,实现特定细胞基因表达的「靶向控制」

10 月 15 日
阅读 6 分钟
500
精准调控特定细胞的基因表达对于基因治疗、合成生物学等领域的进展至关重要,此过程依赖于被称为「顺式调控元件(Cis-Regulatory elements, CRE)」的一类 DNA 序列,如启动子(Promoter)、增强子(Enhancer),它们就像基因的「开关」一样,决定基因在目标细胞中「启动」或「关闭」,同时避免在其他正常细胞中异常激活...
封面图

NeurIPS 2025 丨华中科大等发布 OCRBench v2,Gemini 获中文榜冠军但分数仅及格

10 月 14 日
阅读 3 分钟
571
过去几十年间,光学字符识别(OCR, Optical Character Recognition)技术的定位与价值经历了从传统图像识别工具到智能信息系统核心能力的巨大演进,最初,其主要是将印刷体或手写文字从图像中提取并转换为可被计算机理解的文本数据。如今,随着深度学习和多模态模型的发展,丰富需求的驱动下,OCR 的技术边界也在不断扩...
封面图

香港大学等提出增量天气预报模型 VA-MoE,参数精简 75% 仍达 SOTA 性能

10 月 13 日
阅读 5 分钟
590
天气预报作为影响社会运行与防灾决策的关键领域,始终面临大气系统复杂多变带来的巨大挑战,每一次预报能力的提升都对人类生产生活意义深远。长期以来,数值天气预报(NWP)一直是该领域的主流手段,它依托大气动力学方程组,通过求解偏微分方程模拟温度、气压、风速等关键变量的演变过程,实现对天气系统的数值化推演。
封面图

从微信灰度测试到 Google/字节/小红书等下场,AI 播客能否抢滩 AIGC 新蓝海?

10 月 11 日
阅读 4 分钟
627
平时有阅读公众号习惯的朋友们,前段时间可能已经注意到,微信上线了一个全新的功能——「快讯」。在这一板块中,用户不仅能阅读每日资讯,还能收听一档由男女两位主播以对谈形式带来的快讯播客,涵盖热点速递、国际新闻等多个环节。更有趣的点在于,播客标题的下方明确标注了「由 AI 生成」的相关字眼,这正是微信在进行...
封面图

在线教程|算力成本骤降!苹果基于流匹配方法,推出蛋白质折叠模型 Ml-simplefold

10 月 11 日
阅读 2 分钟
584
2025 年 9 月,苹果公司推出了轻量级蛋白质折叠预测 AI 模型 Ml-simplefold 。作为第一个基于流匹配的蛋白质折叠模型,在 CAMEO22 和 CASP14 等权威基准测试中,SimpleFold 在降低计算成本后,仍显示出与 AlphaFold2 、 RoseTTAFold2 等顶尖模型相当的性能。同时其小规模版本 SimpleFold-100M 的表现同样具有竞争力。
封面图

科幻照进现实:那些电影里的 AI,如今实现了多少?

10 月 10 日
阅读 5 分钟
616
节假日的闲暇时光,重温经典电影似乎成了一种特别的仪式。而在众多精彩影片里,科幻片总能凭借天马行空的想象抓住我们的目光,尤其是那些鲜活的 AI 角色,总会在不经意间勾起我们的好奇。
封面图

6 大 OCR 模型汇总,谷歌/IBM/腾讯/小红书/清华大学等重磅开源,轻量级架构实现识别精度与效率跃升

10 月 10 日
阅读 2 分钟
801
在人工智能的诸多应用中,OCR(Optical Character Recognition,光学字符识别)无疑是最为成熟且贴近实际场景的技术之一。顾名思义,OCR 的核心目标是将图片、扫描文档、街景、票据甚至手写文本中的字符,自动转化为可编辑、可检索的数字文本。早期的 OCR 多依赖规则与模板,功能单一,往往只能识别印刷体字符;随着深度...
封面图

马斯克/Sam Altman/比尔·盖茨强推!10 本 AI 领域必读书,从基础科普到风险分析

10 月 9 日
阅读 4 分钟
776
国庆长假不只是休闲小憩的时刻,也是充电思考的好机会。 HyperAI 超神经特别精选了一份 AI 领域必读书单:从马斯克对生存危机的风险思考、 OpenAI 创始人对智能原理的硬核关注,到机器学习基本原理的科普、行业落地的实用指南……这个假期,不妨用阅读打开视野,在书籍的陪伴下把握人工智能的现在与未来。
封面图

定向设计目标稳定材料,麻省理工学院开发 SCIGEN,可适配任意预训练扩散模型

10 月 9 日
阅读 6 分钟
819
在材料科学领域,材料的量子特性(如拓扑绝缘、超导、磁有序等)并非孤立存在,而是由其原子排列的对称性、晶格几何形态等结构特性直接决定,这为通过调控结构定向设计量子材料提供了理论依据。然而,想要实现从「理论可能性」到「实际可用性」的跨越并非易事——受限于结构调控的复杂性、相关数据的稀缺性等现实因素,设...
封面图

在线教程丨百倍提速,类脑脉冲大模型 SpikingBrain-1.0 实现推理效率数量级提升

9 月 30 日
阅读 3 分钟
1.3k
人工智能的快速发展几乎都离不开一个核心架构——Transformer 。自从 2017 年被提出以来,Transformer 以其并行化的计算能力和强大的建模效果,成为大模型架构的主流标准。无论是 GPT 系列、 LLaMA,还是国内的 Qwen 系列,它们都建立在 Transformer 的基础上。
封面图

遥感目标检测数据集汇总,覆盖城市问题/工业安全/农业健康/室内场景……

9 月 29 日
阅读 3 分钟
1.1k
随着人工智能与遥感技术的深度融合,遥感目标检测正在成为计算机视觉领域最具活力的研究方向之一。尤其在卫星影像与无人机航拍的推动下,目标检测技术不仅能识别自然场景中的人物、车辆、建筑,更能够在复杂的地理环境中实现对滑坡、农作物的精细化检测。可以说,目标检测为我们提供了洞察世界的「机器之眼」,让人类第...
封面图

新材料研发提速!上海交通大学团队开发新 AI 材料设计模型 CGformer,融合全局注意力机制

9 月 29 日
阅读 5 分钟
1.2k
人工智能正深刻重塑材料科学研发范式,在加速新材料发现与性能优化中展现出突破性价值。通过高通量计算与机器学习的深度融合,传统「试错法」存在的实验周期长、资源消耗大等痛点被有效破解,材料探索进入到「计算驱动-实验验证」的高效迭代阶段。然而随着人类技术和生活方式的革新,新能源、航空航天等领域对新材料的性...
封面图

AI 论文周报丨视觉语言模型应用/不稳定奇点族新发现/强化学习……一文了解多领域创新趋势与前沿动态

9 月 28 日
阅读 2 分钟
1.1k
全向视觉(omnidirectional vision)凭借 360 度视角感知环境的能力,已在机器人、工业检测和环境监测等领域变得日益关键。相较于传统的针孔视觉,全向视觉能够提供对环境的全局感知,显著提升了场景理解的完整性与决策的可靠性。然而,该领域的基础研究长期以来落后于传统针孔视觉的发展。
封面图

华东师范大学本科生打造 AI Agent 领域论文平台,Awesome AI Agents Live 看遍智能体最新论文

9 月 28 日
阅读 3 分钟
1.3k
在 AI Agent 成为学界与业界焦点的当下,研究人员每天都要面对不断涌现的新论文与实验成果。如何快速追踪、分类和浏览这些研究,正在成为一大难题。
封面图

英伟达提出 ReaSyn,借鉴思维链类比分子合成,实现超高重建率与路径多样性

9 月 26 日
阅读 5 分钟
1.1k
在现代药物研发中,核心挑战在于从近乎无限的化学空间中精准定位具有治疗潜力的分子。传统研发常陷入「双重困境」:化学空间极其庞大,仅 10 个原子可能构成的分子数就高达 10⁶⁰  种,筛选难度堪比大海捞针;同时候选分子还需满足活性、毒性、溶解性等多重要求,导致研发周期常超过 10 年、成本达数十亿美元,最终成功率...
封面图

香港科技大学提出融合神经网络框架,高效预测蛋白质序列的多金属结合位点

9 月 25 日
阅读 4 分钟
1.3k
金属离子在生命过程中扮演着不可或缺的角色,锌作为路易斯酸参与水解酶催化,铁是呼吸链中电子传递的关键载体,镁则为 RNA 折叠成稳定三级结构的必需品。尽管蛋白质数据库中积累了大量高分辨率的金属蛋白结构,但通过实验方法鉴定金属-蛋白质相互作用仍然耗时费力且成本高昂。因此,基于残基水平的金属结合位点计算预测...
封面图

在线教程丨影视级视频生成模型 Wan2.2-S2V-14B,仅需静态图和音频可生成分钟级数字人视频

9 月 24 日
阅读 2 分钟
1.2k
HyperAI 超神经在前段时间,为大家带来了阿里巴巴旗下通义万相实验室开源的 AI 视频生成模型 Wan2.2 的在线教程,作为全球首个 MoE 架构视频模型,Wan2.2 以电影级的生成效果与高效的计算效率为我们带来了深刻的印象。不知道亲自体验过的朋友们有怎样的感受呢?欢迎分享在评论区。
封面图

Qwen3-Max 参数规模超万亿,多项基准测试达 SOTA,预告推理增强版本达奥数竞赛满分水平

9 月 24 日
阅读 3 分钟
1.2k
今天(9 月 24 日),一年一度的云栖大会正式开幕,这个阿里云秀肌肉的舞台上,AI 无疑是主角,从开源模型到 Agent 应用,再到服务器等基础设施以及开发者生态,其全面展示了在这一轮 AI 竞速赛中的技术竞争力。据 Hugging Face 榜单显示,基于通义千问二次开发的衍生模型数量已达到 17 万,超过美国 Llama 系列,稳居全...
封面图

在线教程丨 41 个案例中的生成成功率达 100%,RFdiffusion2 基于化学反应实现原子级别蛋白质生成

9 月 23 日
阅读 3 分钟
1.1k
此前,生成式蛋白质设计模型 RFdiffusion 主要通过对理想活性位点的描述,实现精确固定位点的蛋白质结构生成。然而,该方法存在难以解决的 2 大局限:
封面图

David Baker 团队重磅更新,RFantibody 实现特定靶向的定制化抗体开发;拓展视觉理解边界!VisualOverload 推动复杂场景推理新突破

9 月 22 日
阅读 7 分钟
857
抗体是当前蛋白质治疗药物中的主力军,全球已有超过 160 种抗体药物获批上市,预计未来 5 年市场规模将高达 4,450 亿美元。尽管抗体药物备受学界与产业界的青睐,但治疗性抗体的开发仍主要依靠动物免疫或从大型抗体库中筛选候选分子。这些方法不仅耗时费力,而且往往难以根据靶点上的特定表位,精准地设计出与之匹配的全...
封面图

机器学习 vs. 动力学模型,Ai2 最新研究:仅需 2 分钟,ACE2 可完成一次 4 个月季节预报

9 月 22 日
阅读 5 分钟
1.3k
从农田灌溉规划到寒潮灾害防控,季节尺度天气预报是防灾减灾、农业生产与能源调度的关键支撑。长期以来,这类预报依赖基于物理方程的动力模式,而随着 AI 发展,机器学习模型在关键指标上已媲美传统模型,部分场景精度更优。
封面图

AI 论文周报丨强化学习/树结构框架/图谱检索增强生成新范式……一文速览多领域最新成果

9 月 19 日
阅读 2 分钟
1k
近年来,强化学习在推动大语言模型能力边界方面取得了显著成果,已逐渐成为将大语言模型转化为推理语言模型的核心方法。随着该领域快速发展,强化学习在 LRM 方向的进一步规模化正面临一系列基础性挑战,不仅体现在计算资源的限制上,更涉及算法设计、训练数据供给以及基础设施支撑等多个方面。
封面图