已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

DeshengNet: An Information Extraction Model for Table in Digital Documents

计算机科学 表(数据库) 子网 棱锥(几何) 启发式 特征提取 领域(数学) 数据挖掘 人工智能 特征(语言学) 情报检索 机器学习
作者
Xiangben Hu,Jielin Jiang,Zhichen Hu,Tao Huang,Shengjun Xue,Xiaolong Xu
标识
DOI:10.1109/dasc-picom-cbdcom-cyberscitech52372.2021.00099
摘要

In the scholarly literature, tables carry a huge amount of information. In the traditional information extraction of the table, researcher often spend a lot of manpower to intergrate information. Using computer vision technology can imporve the efficiency of gathering data. However, in the literature of academic, too many negative samples often lead to poor result. In response to the previous problem, this paper proposes DeshengNet based on deep learning table information extraction in digital documents. Firstly, the feature map of literature pictures is obtained through the deep residual network. Then, the multi-scale features are merged with the feature pyramid network. Afterwards, the class box subnet is used for table positioning. Aiming at the problem of too many negative samples in the paper. The focal loss method is used for training. After detection, the spatial features of the table are used for heuristic extraction. The experimental results show that the method proposed in this paper can be applied to the industrial field and serve the researcher.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
cz应助永字号采纳,获得10
1秒前
A2ure完成签到,获得积分10
1秒前
笑笑完成签到 ,获得积分10
2秒前
义气平卉发布了新的文献求助10
6秒前
爱吃汉堡包的金鲤鱼完成签到,获得积分10
8秒前
8秒前
李健应助平淡醉卉采纳,获得10
9秒前
11秒前
阿治完成签到 ,获得积分10
17秒前
21秒前
英俊的铭应助daisylili采纳,获得10
21秒前
23秒前
24秒前
smdoctor发布了新的文献求助10
25秒前
平淡醉卉发布了新的文献求助10
28秒前
小呆完成签到 ,获得积分10
30秒前
大灰狼完成签到 ,获得积分10
32秒前
打打应助YYL采纳,获得10
32秒前
32秒前
莫欣宇完成签到 ,获得积分10
33秒前
情怀应助Albafika采纳,获得30
34秒前
Matberry完成签到 ,获得积分10
35秒前
37秒前
多麻少辣发布了新的文献求助10
41秒前
42秒前
42秒前
42秒前
852应助科研通管家采纳,获得10
43秒前
隐形曼青应助科研通管家采纳,获得10
43秒前
43秒前
桐桐应助科研通管家采纳,获得10
43秒前
Owen应助科研通管家采纳,获得10
43秒前
彭于晏应助科研通管家采纳,获得10
43秒前
44秒前
Albafika发布了新的文献求助30
46秒前
呼君伟完成签到,获得积分10
51秒前
执着的曼文完成签到,获得积分10
52秒前
俊俊完成签到 ,获得积分10
56秒前
56秒前
carryxu完成签到,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Handbook of pharmaceutical excipients, Ninth edition 5000
Kinesiophobia : a new view of chronic pain behavior 5000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000
Digital Twins of Advanced Materials Processing 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 化学工程 生物化学 物理 计算机科学 内科学 复合材料 催化作用 物理化学 光电子学 电极 冶金 细胞生物学 基因
热门帖子
关注 科研通微信公众号,转发送积分 6020684
求助须知:如何正确求助?哪些是违规求助? 7621595
关于积分的说明 16165459
捐赠科研通 5168424
什么是DOI,文献DOI怎么找? 2766036
邀请新用户注册赠送积分活动 1748280
关于科研通互助平台的介绍 1636036