时间:2024-06-23 20:46:35来源:新媒体
张少霆的办公桌上摆着作家马伯庸的《大医》。这一讲述医者寻觅救国之法的渐悟心路的长篇小说,和商汤医疗健康大模型“大医”的名字异曲同工。张少霆2018年加入商汤科技后,就一直耕耘智慧医疗领域。机器智慧与医者仁心的无缝交融,在他的带领下轮廓逐渐清晰。
“智慧医疗已迈入3.0时代,我们也在加速推进医疗大模型的研发和落地。”张少霆说,“国内通用大模型的发展短期内面临算力等挑战,但在垂直领域大模型的研发还有机会。通过与场景、需求紧密结合,国内医疗大模型发展有着广阔的前景。”
缓解医疗难题 AI全方位赋能
计算机和医疗,单拎出任何一个,都需要等身的研究资料作支撑。两者的跨界融合,难度可想而知。
发展至今,智慧医疗主要经历了三个阶段。1.0时代以信息化建设为主,行业主要关注利用互联网、物联网技术,实现技术模块、服务流程从0到1的建设。随着人工智能技术的出现,融易新媒体消息,智慧医疗也迈入2.0时代,医院开始将其应用于医学影像分析、临床辅助决策等领域,但此时AI赋能仍集中在“单点应用”上,还未实现“一盘棋”。
“生成式人工智能技术方兴未艾,智慧医疗走进3.0时代。更多的医疗机构开始思考,如何通过顶层设计,利用大模型为全流程提供全方位赋能,实现对整个医疗生态的革新重塑。”张少霆表示,商汤自2018年开始布局智慧医疗业务,深度参与了智慧医疗2.0时代的建设。过去几年间,利用AI技术赋能医学图像分析,推出了近30款AI辅助诊疗产品,帮助合作医院大幅提升了影像、病理诊疗效率。
在张少霆眼中,人工智能是能够比较快速解决优质医疗资源不足和分布不均衡的方法之一,“纵向上来说,优质医疗资源能够‘下得来’;横向层面,医疗资源的分布能够‘铺得开’”。
在ChatGPT还未问世之际,张少霆就带领团队一头扎进医疗垂类语言大模型的研发中,“大医”雏形渐显。“行业有观点认为,所有产品都该用大模型技术重做一遍。虽然有些绝对,但投射到医疗领域,大模型技术的确有望帮助海量的医疗场景实现智慧化升级。”
应用铺天盖地“大医”大展身手
“大医”,首先是位学富五车的“大先生”,研发团队用超过300亿tokens(词元)的高质量医学数据加以训练。商汤“日日新”大模型体系面世后,训练数据完整升级、训练方法有效提升,得益于此,“大医”也不断“上新”。
技术上“顶天立地”还不够,临床应用还得“铺天盖地”。据介绍,“大医”的能力已经覆盖了健康管理、患者服务、临床诊疗、医学科研四大领域超过20个细分医疗场景。“‘大医’可以通过自然语言交互,高效准确地实现智能导诊、预问诊、云陪诊、诊后随访等工作,显著改善患者就医体验。”张少霆举例说,“临床诊疗环节,‘大医’也可以辅助医生开展临床决策,帮助医生提升诊疗效率和准确率。”
在所有大模型赋能的垂直领域中,医疗可以算是最特殊的一个。其中一个原因就是容错率特别低——这不难理解。然而,这点对于不时“一本正经地胡说八道”的大模型来说,却是很大的挑战。为此,除了让“大医”尽可能多地“学”,商汤研发团队还自建了一套检索增强的生成框架,支持用户将自有知识库作为插件与“大医”系统集成,这一框架能利用外部知识库,在生成回答前先信息检索,显著提升了回答的准确度。
在临床中,存在大量长病程患者,在对这部分患者诊疗时,需要结合病史信息进行推理决策,这对模型的“记忆力”提出了高要求。而“大医”则具备了长程记忆存取能力,不受模型上下文长度限制,还支持接入外部插件补充记忆存储空间。有了这个能力,个性化诊疗不再是难事。
扩大能力半径 模型一展宏图
从去年10月面向产业端提供服务以来,“大医”已在国内包括新华医院、瑞金医院等三甲医院落地,其能力得到了一致认可。经过专业医学评测,“大医”在检验检查问答、电子病历生成、线上问诊、导诊、随访、辅助诊断决策等多项医疗任务上的表现已经超越了GPT-4。
毫无疑问,大模型技术是催生新质生产力的重要引擎。在医疗领域,它“新”在何方?在张少霆看来,一方面是借助大模型,革新过去已经用上AI的医疗场景,实现效率的进一步提升;另一方面则是利用大模型解决过去无法用AI解决的问题。
“医疗行业存在很多长尾疾病,发病量小、数据少,依靠之前大数据加精标注的传统AI研发范式,很难解决。有了医疗大模型就可以在预训练基础模型之上,用少量样本数据完成模型训练,能够让人工智能技术覆盖更广泛的疾病。”他解释。