发布文献求助

清晨好，您是今天最早来到科研通的研友！由于当前在线用户较少，发布求助请尽量完整地填写文献信息，科研通机器人24小时在线，伴您科研之路漫漫前行！

A Hybrid Machine Learning Method for the De-identification of Un-Structured Narrative Clinical Text in Multi-center Chinese Electronic Medical Records Data

电子病历人工智能病历前提支持向量机机器学习中心（范畴论）计算机科学鉴定（生物学）自然语言处理情报检索医学化学哲学放射科互联网隐私语言学植物生物结晶学

作者

Meng Jin,Kai Zhang,Yunhaonan Yang,Shuanglian Xie,Kai Song,Yonghua Hu,Xiaoyuan Bao

标识

DOI：10.1109/icbk.2019.00023

摘要

The premise of the full use of unstructured electronic medical records is to maintain the fully protection of a patient's information privacy. Presently, in prior of processing the electronic medical record date, identification and removing of relevant information which can be used to identify a patient is a research hotspot nowadays. There are very few methods in de-identification of Chinese electronic medical records and their cross-center performance is poor. Therefore we develop a de-identification method which is a mixture of rule-based methods and machine learning methods. The method was tested on 700 electronic medical records from six hospitals. Five-fold cross test was used to evaluate the results of c5.0, Random Forest, SVM and XGBOOST. Leave-one-out test was used to evaluate CRF. And the F1 Measure of machine learning reached 91.18% in PHI_Names, 98.21% in PHI_MEDICALID, 95.74% in PHI_OTHERNFC, 97.14% in PHI_GEO, 89.19% in PHI_DATES, and 91.49% in PHI_TEL. And the F1 Measure of rule-based methods reached 93.00% in PHI_Names, 97.00% in PHI_MEDICALID, 97.00% in PHI_OTHERNFC, 97.00% in PHI_GEO, 96.00% in PHI_DATES, and 89.00% in PHI_TEL.

求助该文献

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒每天60秒读懂世界·精选全球要闻 (2026-1-2)

更新

2025年影响因子查询已上线 (2025-6-18)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 科研通AI6.1上传了应助文件

8秒前; 徐萌完成签到，获得积分10

11秒前; 量子星尘发布了新的文献求助10

14秒前; 研友_nxw2xL完成签到，获得积分10

16秒前; 如歌完成签到，获得积分10

25秒前; 科研通管家关闭了王麒的文献求助

25秒前; ding的应助被Marshall采纳，获得10

47秒前; zhangjianzeng完成签到，获得积分10

51秒前; woxinyouyou完成签到，获得积分10

52秒前; ding上传了应助文件

59秒前; 赵一完成签到，获得积分10

1分钟前; Marshall发布了新的文献求助10

1分钟前; 科研通AI2S上传了应助文件

1分钟前; sonicker完成签到，获得积分10

1分钟前; dawnfrf完成签到，获得积分10

1分钟前; ding的应助被jjyyy采纳，获得10

1分钟前; JamesPei的应助被桃子e采纳，获得10

1分钟前; minjeong完成签到，获得积分10

1分钟前; JamesPei上传了应助文件

2分钟前; 量子星尘发布了新的文献求助10

2分钟前; 桃子e发布了新的文献求助10

2分钟前; 顾矜上传了应助文件

2分钟前; 蝎子莱莱xth完成签到，获得积分10

2分钟前; 怕黑小伙发布了新的文献求助10

2分钟前; ding上传了应助文件

2分钟前; 氢锂钠钾铷铯钫完成签到，获得积分10

2分钟前; Square完成签到，获得积分10

2分钟前; jjyyy发布了新的文献求助10

2分钟前; 科研通管家关闭了量子星尘的文献求助

2分钟前; 科研通AI2S的应助被科研通管家采纳，获得10

2分钟前; 科研通AI6.1的应助被xiaoyu采纳，获得10

2分钟前; 披着羊皮的狼完成签到，获得积分10

3分钟前; 科研通AI6.1的应助被桃子e采纳，获得10

3分钟前; 科研通AI6.1上传了应助文件

3分钟前; 桃子e发布了新的文献求助10

4分钟前; 科研通AI2S上传了应助文件

4分钟前; Edward发布了新的文献求助10

4分钟前; 科研通AI6.1的应助被科研通管家采纳，获得10

4分钟前; CipherSage的应助被科研通管家采纳，获得10

4分钟前; zzhui完成签到，获得积分10

4分钟前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Encyclopedia of Quaternary Science Reference Third edition 6000; Encyclopedia of Forensic and Legal Medicine Third Edition 5000; Introduction to strong mixing conditions volume 1-3 5000; Aerospace Engineering Education During the First Century of Flight 3000; Electron Energy Loss Spectroscopy 1500; Tip-in balloon grenadoplasty for uncrossable chronic total occlusions 1000

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 5788937; 求助须知：如何正确求助？哪些是违规求助？ 5713498; 关于积分的说明 15474025; 捐赠科研通 4916906; 什么是DOI，文献DOI怎么找？ 2646617; 邀请新用户注册赠送积分活动 1594299; 关于科研通互助平台的介绍 1548721

今日热心研友

等待的香魔

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2026 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：821889395【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通