谷歌开源MedGemma1.5:医疗AI实现三维影像分析关键突破

2026.04.17 10:20
近日谷歌开源医疗AI模型MedGemma1.5,核心突破在于原生支持CT、MRI三维扫描及病理学数字切片分析,能精准处理高维度医疗数据,在胸部X光标注等场景表现优异。该模型开源后将推动医疗AI技术普惠,助力基层诊断效率提升。

医疗影像分析是AI在医疗领域落地的核心场景之一,但传统模型大多聚焦二维影像处理,对CT、MRI这类三维数据的解析能力有限;加上多数商业模型采用闭源模式,技术的普及和迭代也受到了限制。最近,谷歌开源了医疗AI模型MedGemma1.5,它以处理高维度医疗数据为核心突破点,给行业带来了新的技术选择。

MedGemma1.5的核心能力集中在三个方面:首先,它原生支持CT和MRI三维扫描数据,不用把立体影像拆成二维切片就能直接分析,能捕捉病灶在空间中的位置、大小以及和周围组织的关联信息,减少信息丢失;其次,它支持病理学数字切片的微观分析,能识别细胞形态异常、组织病变等细节,满足病理诊断的高精度要求;另外,在胸部X光分析上,它能实现精准标注,自动识别肺部结节、肺炎等常见病变。

从技术层面看,MedGemma1.5基于谷歌Gemma基础模型架构优化而来,针对医疗数据高维度、多模态的特点,调整了输入层和特征提取模块。它采用分层注意力机制处理三维影像的空间信息,同时引入领域自适应预训练策略,用大量标注医疗数据做微调,保证在专业场景下性能稳定。而且,模型保持了轻量化设计,可以部署在普通医疗工作站上,降低了硬件门槛。

这个模型开源的意义在于打破技术壁垒,让全球的医疗机构和科研团队都能自由使用并进行二次开发。对基层医疗场景来说,MedGemma1.5能帮助那些缺乏高端设备和专业人才的机构提升诊断效率;在科研领域,开源模式会加速医疗AI算法的迭代,推动更多创新应用落地。

行业动态上,国际医疗AI研究联盟最近发布的《2024年医疗AI开源趋势报告》显示,过去一年里开源医疗AI模型的应用覆盖率增长了27%,其中三维影像处理类模型的需求增速最快;竞争对手方面,OpenAI的GPT-4V模型在医疗影像识别任务中表现不错,但目前还是闭源商业服务;国内的百度文心医疗大模型最近更新了二维影像分析模块,它的三维处理功能预计2024年第四季度上线,会和MedGemma1.5形成直接竞争。

作品声明:内容由AI生成

快报

更多

18:00

中国铝业总经理张瑞忠:随着二季度下游全面进入旺季,电解铝库存将逐步进入去库通道

17:58

国家发改委:积极扩大国内有效需求,加快培育壮大新动能,推动产业园区规范发展

17:54

长盈精密:暂未向张雪机车供货

17:54

东莞东阳光云智算科技有限公司成立,注册资本1亿

17:53

华为非凡大师系列发布首款女表

17:52

南向资金今日净卖出约39亿港元,盈富基金遭卖出居前

17:50

和邦生物:拟投77.47亿元建设年产60万吨蛋氨酸项目

17:50

和邦生物:一季度净利润同比增长1287%,蛋氨酸产、销量增加

17:50

茂莱光学:光通信业务处于起步阶段,收入占比低

17:49

浦项制铁宣布向印度合资钢厂注资1.6万亿韩元

17:48

上期所同意PT ETERNAL NICKEL INDUSTRY“PTENICO”牌电解镍注册

17:47

赛轮轮胎:拟投2.85亿美元建设埃及轮胎扩建项目

17:47

立讯精密:800G和1.6T光模块在国内外客户进展顺利,2027年Q3~Q4批量交付CPC

17:46

截至2025年底中国注册无人机共328.7万架

17:45

严控药物滥用,普瑞巴林、愈美制剂等成瘾性药品监管全面升级

17:43

商汤医疗再获超5亿元融资,估值突破10亿美元

17:42

中国推理GPU独角兽曦望再获超10亿元融资

17:40

陕西旅游:澄清“持有500股成第八大股东”媒体报道

17:39

李在明首次访印:涉霍尔木兹海峡,呼吁韩印联手

17:38

国盛证券:一季度净利润146.87万元,同比下降97.91%

Baidu
map