A domain adaptive pre-training language model for sentence classification of Chinese electronic medical record

计算机科学 判决 语言模型 规范化(社会学) F1得分 人工智能 领域(数学分析) 水准点(测量) 统一医学语言系统 自然语言处理 病历 命名实体识别 情报检索 医学 数学分析 数学 管理 大地测量学 社会学 人类学 经济 放射科 任务(项目管理) 地理
作者
Yuting Zou,Peng Zhang,Yunchao Ling,Daqing Lv,Ziming Li,Lu Shen,Guoqing Zhang
标识
DOI:10.1109/bibm58861.2023.10386068
摘要

Accurately extracting and classifying Chinese electronic medical record (EMR), which contain huge amounts of valuable medical information, have promising practical application and medical value in the health care of China. While the pivotal issue has gathered escalating attention, the bulk of current research is directed towards operations conducted at the document or entity level within medical records. Only a restricted body of work addresses these concerns at the sentence level, a critical aspect for downstream tasks like medical information retrieval, diagnosis normalization, and question answering. In this paper, we present a domain adaptive pre-training language model named CEMR-LM for sentence classification of Chinese EMRs. CEMR-LM acquires Chinese medical domain knowledge through the utilization of copious unlabeled clinical corpus for pre-training the language model. This is fortified by combining fine-tuning strategy and a dual-channel mechanism, which collectively contribute to the model’s heightened performance. Experiments on the benchmark dataset and real world hospital dataset both demonstrate that CEMR-LM is superior to the state-of-the-art methods. Furthermore, CEMR-LM possesses the capability to elucidate indicative elements within medical records by visualizing of the attention weights embedded within the model. The implemented code and experimental datasets are available online at https://github.com/BioMedBigDataCenter/CEMR-LM.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Hello应助科研通管家采纳,获得10
2秒前
情怀应助科研通管家采纳,获得10
2秒前
英俊的铭应助科研通管家采纳,获得10
2秒前
上官若男应助科研通管家采纳,获得10
2秒前
2秒前
田様应助科研通管家采纳,获得10
2秒前
幽默雨应助科研通管家采纳,获得10
2秒前
桐桐应助科研通管家采纳,获得10
2秒前
小马甲应助科研通管家采纳,获得10
2秒前
科目三应助科研通管家采纳,获得10
2秒前
汉堡包应助科研通管家采纳,获得10
2秒前
lvlei完成签到 ,获得积分20
3秒前
努力学习发布了新的文献求助10
4秒前
CodeCraft应助yu采纳,获得10
6秒前
子平完成签到 ,获得积分10
8秒前
卡卡发布了新的文献求助50
8秒前
顾矜应助111采纳,获得10
8秒前
ww417发布了新的文献求助10
9秒前
田様应助幽默莞采纳,获得10
9秒前
华仔应助难过的蜜粉采纳,获得10
9秒前
fifteen发布了新的文献求助10
10秒前
halona发布了新的文献求助10
11秒前
11秒前
热塑性哈士奇完成签到,获得积分10
12秒前
Renee应助嗨哈尼采纳,获得10
12秒前
科研通AI2S应助忐忑的猪采纳,获得10
13秒前
13秒前
最爱学习的亚子完成签到,获得积分10
14秒前
Peng发布了新的文献求助50
14秒前
英俊的铭应助dinson999采纳,获得10
15秒前
15秒前
15秒前
16秒前
16秒前
无魇完成签到,获得积分10
17秒前
小二郎应助努力学习采纳,获得30
18秒前
18秒前
18秒前
rrrrrrry发布了新的文献求助10
18秒前
Polong完成签到,获得积分10
19秒前
高分求助中
Evolution 10000
ISSN 2159-8274 EISSN 2159-8290 1000
Becoming: An Introduction to Jung's Concept of Individuation 600
Ore genesis in the Zambian Copperbelt with particular reference to the northern sector of the Chambishi basin 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3160857
求助须知:如何正确求助?哪些是违规求助? 2812058
关于积分的说明 7894301
捐赠科研通 2470980
什么是DOI,文献DOI怎么找? 1315808
科研通“疑难数据库(出版商)”最低求助积分说明 631003
版权声明 602068