TCM-SD: A Benchmark for Probing Syndrome Differentiation via Natural Language Processing

计算机科学 水准点(测量) 人工智能 领域(数学分析) 自然语言处理 领域(数学) 任务(项目管理) 机器学习 比例(比率) 自然语言 深度学习 数据科学 物理 数学分析 经济 量子力学 管理 纯数学 数学 地理 大地测量学
作者
Mucheng Ren,Heyan Huang,Yuxiang Zhou,Qianwen Cao,Yuan Bu,Yang Gao
出处
期刊:Lecture Notes in Computer Science 卷期号:: 247-263 被引量:3
标识
DOI:10.1007/978-3-031-18315-7_16
摘要

Traditional Chinese Medicine (TCM) is a natural, safe, and effective therapy that has spread and been applied worldwide. The unique TCM diagnosis and treatment system requires a comprehensive analysis of a patient’s symptoms hidden in the clinical record written in free text. Prior studies have shown that this system can be informationized and intelligentized with the aid of artificial intelligence (AI) technology, such as natural language processing (NLP). However, existing datasets are not of sufficient quality nor quantity to support the further development of data-driven AI technology in TCM. Therefore, in this paper, we focus on the core task of the TCM diagnosis and treatment system—syndrome differentiation (SD)—and we introduce the first public large-scale benchmark for SD, called TCM-SD. Our benchmark contains 54,152 real-world clinical records covering 148 syndromes. Furthermore, we collect a large-scale unlabelled textual corpus in the field of TCM and propose a domain-specific pre-trained language model, called ZY-BERT. We conducted experiments using deep neural networks to establish a strong performance baseline, reveal various challenges in SD, and prove the potential of domain-specific pre-trained language model. Our study and analysis reveal opportunities for incorporating computer science and linguistics knowledge to explore the empirical validity of TCM theories.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
立里完成签到 ,获得积分10
4秒前
羊羊完成签到 ,获得积分10
4秒前
木光发布了新的文献求助10
6秒前
科研通AI2S应助流星雨采纳,获得10
11秒前
小蘑菇应助坚强的亦云-333采纳,获得10
12秒前
陈JY完成签到 ,获得积分10
12秒前
尘沫莫发布了新的文献求助10
12秒前
Hou完成签到 ,获得积分10
13秒前
14秒前
Ida完成签到 ,获得积分10
16秒前
16秒前
Jasper应助Fiona03采纳,获得100
17秒前
阿怪完成签到 ,获得积分10
18秒前
高兴123发布了新的文献求助30
19秒前
zdw完成签到,获得积分10
19秒前
seven发布了新的文献求助10
20秒前
良辰应助金金采纳,获得10
23秒前
小白完成签到,获得积分10
26秒前
26秒前
27秒前
中岛悠斗完成签到,获得积分10
27秒前
28秒前
33秒前
lit完成签到 ,获得积分10
34秒前
35秒前
小蘑菇应助旋转蒸发采纳,获得10
35秒前
yuhanz完成签到 ,获得积分10
37秒前
迪迦发布了新的文献求助100
37秒前
37秒前
等待从阳发布了新的文献求助30
37秒前
123完成签到 ,获得积分10
39秒前
39秒前
学疯发布了新的文献求助10
39秒前
尘沫莫完成签到,获得积分10
40秒前
hhhhhhmt发布了新的文献求助10
42秒前
流星雨发布了新的文献求助10
42秒前
壮观果汁完成签到 ,获得积分10
43秒前
Billie发布了新的文献求助10
44秒前
Lee完成签到,获得积分10
44秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
The First Nuclear Era: The Life and Times of a Technological Fixer 500
Unusual formation of 4-diazo-3-nitriminopyrazoles upon acid nitration of pyrazolo[3,4-d][1,2,3]triazoles 500
岡本唐貴自伝的回想画集 500
Distinct Aggregation Behaviors and Rheological Responses of Two Terminally Functionalized Polyisoprenes with Different Quadruple Hydrogen Bonding Motifs 450
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3671896
求助须知:如何正确求助?哪些是违规求助? 3228416
关于积分的说明 9780572
捐赠科研通 2938947
什么是DOI,文献DOI怎么找? 1610304
邀请新用户注册赠送积分活动 760650
科研通“疑难数据库(出版商)”最低求助积分说明 736133