目录
基本信息
发布时间:2024-04-29
发布团队:Google DeepMind
论文:Capabilities of Gemini Models in Medicine
代码链接:不开源,目前只有数据集的relabeled代码链接:https://huggingface.co/datasets/katielink/med-gemini-medqa-relabeled
总体情况介绍
- 基于 Google 强大的 Gemini 模型 构建的多模态医学模型
- 在涵盖文本、多模态和长上下文应用的14个医学基准测试中对Med - Gemini进行评估,在其中10个测试中创造了新的最佳性能,并且在所有能够直接比较的基准测试中都超越了GPT - 4模型系列
- 针对临床推理进行优化的Med - Gemini在MedQA测试中使用一种新的不确定性引导搜索策略,达到了91.1%的最先进性能。
动机和对应的解决方法(6大挑战)

模型总体概述
Med-Gemini建立在Gemini家族的基础上,采用了增强的transformer架构,并结合了Mixture-of-Experts (MoE)架构。这使得模型在处理复杂和长文本以及多模态数据时,能高效地扩展和推理
- 提升临床推理能力: 通过自我训练和网络搜索集成,Med-Gemini 能够更准确地进行诊断和推理,并在 MedQA (USMLE) 等基准测试中取得了当前最佳性能
- 改进多模态性能: 通过微调和定制编码器,Med-Gemini 可以更好地理解和处理多种医学数据模态,如文本、图像、视频和生物信号
- 强大的长文本处

1909

被折叠的 条评论
为什么被折叠?



