搜索
当前所在位置:首页 >> 娱乐

【广州学院曝光最新】国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地

发布时间:2025-09-13 13:21:42 作者:n 点击:18 【 字体:


12月28日,国内由信通院主办的首个数据“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,医疗源蚂蚁百蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,专科助力这将有助于提升大模型在医疗领域的推理专业性。 国内首个医疗专科推理数据集开源,集开<strong>广州学院曝光最新</strong>蚂蚁百灵大模型助力行业落地蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理数据集

在医疗行业,通用型语言模型在应对医疗问诊时,模型会直接给出答案,行业而医生则会根据专业知识进行反复的国内症状探讨,才能给出答案。首个数据另外,医疗源蚂蚁百大模型的专科助力幻觉问题和推理能力不足,当前高质量的推理中文医学专科数据集又较为稀缺,这对训练出色的集开医疗领域大模型提出了挑战。

为克服这些难题,蚂蚁集团与上海仁济医院泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例数据的武汉医科大学实拍攻略方式,推出了首个中文医疗专科问答推理数据集RJUA-QA,这也是业内首个临床专科数据集。

数据集由训练、验证、测试三部分组成,包含2132个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了97.6%以上的泌尿科就医人群,能真实复刻诊疗场景。数据集能提高大模型在医疗诊断推理方面的能力,并作为在严肃可控场景下应用的评测基准。

顾进杰进一步介绍了蚂蚁百灵大模型在医疗领域的技术进展。“专业性、可控性、轻量化是大模型技术在医疗行业落地的三个重要挑战和机会。”顾进杰说道。

专业性上,由于医疗行业有超百个科室,每个专科和疾病,都需要专业的调试。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎,进一步推动中国专业医疗数据集的构建与开放。

在可控性方面,百灵大模型结合知识图谱技术,让大模型的每一个回答都有据可依。“生成内容可以满足不同医院、不同科目的定制需求,包括风格与调性等”,顾进杰说。蚂蚁集团在超大规模图学习和知识图谱技术长期积累,今年联合OpenKG发布的OpenSPG开源项目,重新定义了工业界的知识图谱语义架构,知识检索增强技术也是大幅提升大模型正确性与可控性的重要课题。

医疗行业有数据隐私、专业知识和系统自主性的需求,考虑到机构的算力成本与便捷部署,百灵大模型还攻坚了轻量化技术。在12月份开源的模型轻量化框架(PIA)中,集成了模型剪枝、压缩、量化、推理加速等全链路环节的优化,具备开箱即用、功能无损、低代码接入等优点,可在天级别完成10倍以上压缩比。

据雷峰网(公众号:雷峰网)了解,目前,蚂蚁百灵大模型在中英文的医疗考试以及基准测试达到或超过了GPT4水准,例如,在中文医疗LLM评测榜单promptCBLUE上,取得A榜第一,B榜第二的成绩;在国际医疗问答榜单PubMedQA中,以80.6%的准确率取得了前五的成绩,而且是前十中参数量最小的模型,更适合被机构部署和使用。


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地

阅读全文
相关推荐

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场 ...

牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团

牵手五大顶尖高校教授   “云阙智能”打造AIGC智囊团
大模型竞争已进入白热化阶段,盲目卷资源已不再是长久之计,AI 创业公司的可持续性和科学性则是更重要的考量因素。在这一背景下,背靠强大高校,有科研能力、学术资源和充足的后备人才作为补充,变得愈发重要。2 ...

大模型「进化手册」:AI 原生应用该如何落地?

大模型「进化手册」:AI 原生应用该如何落地?
狂奔两百多天后,大模型战役进入了第二幕。作为新一代基础设施,大模型本身并不直接产生价值,智能时代的未来不会仅仅是大模型本身,而将是大模型生态体系。业内共识是,在大模型之上开发出来的 AI 原生应用,才 ...

5 款好用的 AI 知识搜索引擎,揭开智能搜索新篇章丨AI 情报局

5 款好用的 AI 知识搜索引擎,揭开智能搜索新篇章丨AI 情报局
欢迎来到“AI情报局”,我们提供最热的AI产品推荐、人工智能最新动态和创新案例。帮助AI开发者、创业者、产品等专业人士保持信息的前沿性,促进知识的共享与交流。添加vx:aitechreview向我们投 ...

中国等国能否说服俄罗斯谈判?外交部回应

中国等国能否说服俄罗斯谈判?外交部回应
中国和其他全球南方国家能否说服俄罗斯停止升级战争、坐下来谈判?外交部回应2025年9月10日外交部发言人林剑主持例行记者会,部分内容如下:乌通社记者:昨天,俄罗斯军队对顿涅茨克地区的亚罗瓦村发动空袭。 ...

曝阶跃星辰正在进行估值20亿美元融资;OpenAI放宽股票限制;Suno和Udio遭三大唱片公司起诉丨AI情报局

曝阶跃星辰正在进行估值20亿美元融资;OpenAI放宽股票限制;Suno和Udio遭三大唱片公司起诉丨AI情报局
融资快报曝阶跃星辰正进行新一轮融资:阶跃星辰由微软前全球副总裁姜大昕创办,在自研大模型、应用产品先后亮相后,垒起更大的雪球。据悉,阶跃星辰正在进行一轮估值20亿美元的新融资,阿里巴巴再次出现在布局传闻 ...

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0
「雷峰网(公众号:雷峰网)」二十多年前,搜索引擎的发明极大地方便了人们获取信息,很快搜索引擎便成为互联网时代第一流量入口,谷歌、百度更是凭借搜索引擎在 PC 互联网时代占据统治地位,成为两大巨头,多年 ...

对话零一万物:大模型产品要找到 TC

对话零一万物:大模型产品要找到 TC
【雷峰网(公众号:雷峰网)】近日,大模型独角兽零一万物又开发布会了!上次零一万物以下简称“零一”)开发布会还是在 2023 年 11 月,宣布成立后的模型首秀:发布中英双语大模型“Yi”,并将其开源。 ...

中国等国能否说服俄罗斯谈判?外交部回应

中国等国能否说服俄罗斯谈判?外交部回应
中国和其他全球南方国家能否说服俄罗斯停止升级战争、坐下来谈判?外交部回应2025年9月10日外交部发言人林剑主持例行记者会,部分内容如下:乌通社记者:昨天,俄罗斯军队对顿涅茨克地区的亚罗瓦村发动空袭。 ...

人大 Sora 思辩:Sora 到底懂不懂物理世界?

人大 Sora 思辩:Sora 到底懂不懂物理世界?
Sora 发布至今,虽然仍未正式对外开放,但对其技术细节、切实影响的讨论从未停歇。讨论的背后,是为了探索人工智能的更本质问题。对旧有视觉生成思路的检验和校正,是 Sora 带来的直观影响。在此基础上, ...

为每个用户提供专属定制服务,OPPO 安第斯大模型的新卷法

为每个用户提供专属定制服务,OPPO 安第斯大模型的新卷法
作者丨郭 思编辑丨陈彩娴ChatGPT热潮引发的百模大战,在持续了大半年之后,模型的参数已经卷到极限,越来越多的公司开始意识到,百模大战的下半场,落地应用才是值得卷的地方。而当聚光灯打在OPPO这个手 ...

大模型时代下的数字安全答案,藏在一本实战指南里

大模型时代下的数字安全答案,藏在一本实战指南里
作者:郭思编辑:陈彩娴在大模型不断成熟的背景下,企业也日益倾向于在云端大规模应用AI技术。这一进程中,以往可能忽视的数据资源,突显出了前所未有的战略意义,数据的价值评估随之动态调整。与此同时,企业上云 ...
返回顶部