天士力数智中医药大模型文章入选高引用研究
http://www.dsblog.net 2026-02-06 12:47:10
近日,天士力数智中医药团队发表在国际权威期刊《美国医学信息学协会杂志》的论文《Lingdan: enhancing encoding of traditional Chinese medicine knowledge for clinical reasoning tasks with large language models》,成为该刊近期被引用次数最多的文章之一,标志着中医智能化研究已获国际学术界广泛关注与认可。


在全球大语言模型如ChatGPT等技术迅速发展的背景下,中医古籍《黄帝内经》《本草纲目》等凝聚的千年智慧,却因文言文表述、独特理论体系与复杂语法,对现代AI构成了显著挑战。如何让前沿AI真正理解并运用中医知识,成为关键研究问题。
为此,数智中医药团队联合北京交通大学医学智能研究所的周雪忠教授团队深度合作,共同研发打造真正懂中医、会辨证、能开方的大型语言模型——灵丹(Lingdan),实现了在中医临床推理任务上的重要突破。
01
数据工程:构建中医知识新体系
研究团队构建了三大核心数据集,为AI学习中医奠定基础:
中医预训练数据集(TCMPT):包含1.6亿个词元,涵盖古籍、教材、病历、药典、药品说明书等多源知识;
中成药问答数据集(TCPM Dialogue):通过“知识问答化”技术生成20万组高质量对话,涵盖主治,配伍等关键信息;
脾胃病处方推荐数据集(SSHPR):基于广安门医院的临床诊疗数据,包含3.9万条结构化医案,专注中医处方智能推荐。
团队还创新性地提出了中医交互式诊断对话框架(TCM-IDDF),基于思维链技术模拟真实诊疗流程。
02
三大模型:实现中医AI的
“理、法、方、药”全栈能力
基于高质量数据集,团队研发了覆盖不同场景的中医AI模型系列:
灵丹预训练模型(Lingdan Pre-trained):在通用大模型基础上注入中医知识,构建底层理解能力;
灵丹中成药对话模型(Lingdan-TCPM-Chat):支持多轮辨证与中成药推荐;
灵丹处方推荐模型(Lingdan-PR):针对中医处方推荐任场景优化的专业模型。
测试显示,处方推荐模型在Top@20 F1分数上比最佳基线模型提升18.39%,展现出优秀泛化能力。研究还发现,通过随机调整处方药味顺序进行数据增强,可显著提升模型鲁棒性、减少“AI幻觉”,体现了中医“方有合群之妙用”的配伍智慧。
- 市数据局专班赴天士力数智调研 共绘新图景
- AI赋能中药领域创新 天士力交出硬核答卷
- 闫凯境出席全国工商联十三届四次执委会议
- 天士力|《普洱茶感官风味轮》团体标准发布
- 天士力数智本草大模型通过国家级备案认证
- ·《三生健康宝典》纸质实体书全国发售
- ·理想华莱年度工作总结表彰会举行
- ·如新创新与品质再获认可
- ·安利独家赞助全球健康峰会
- ·清晨翎硕年度盛典收官
- ·东方药林华中总部落成
- ·金天国际5S品质馆亮相美业盛会
- ·卫康声明坚决打击不实言论









