Dictionary‐Based Automated Information Extraction From Geological Documents Using a Deep Learning Algorithm

计算机科学 杠杆(统计) 知识抽取 领域(数学分析) 领域知识 构造(python库) 情报检索 信息抽取 数据挖掘 地球科学 人工智能 地质学 数学 数学分析 程序设计语言
作者
Qinjun Qiu,Zhong Xie,Liang Wu,Liufeng Tao
出处
期刊:Earth and Space Science [Wiley]
卷期号:7 (3) 被引量:41
标识
DOI:10.1029/2019ea000993
摘要

Abstract Massive unstructured geoscience data are buried in geological reports. Geological text classification provides opportunities to leverage this wealth of data for geology and mineralization research. Existing studies of massive geoscience documents/reports have not provided effective classification results for further knowledge discovery and data mining and often lack adequate domain‐specific knowledge. In this paper, we present a novel and unified framework (namely, Dic‐Att‐BiLSTM) that combines domain‐specific knowledge and bidirectional long short‐term memory (BiLSTM) for effective geological text classification. Dic‐Att‐BiLSTM benefits from a matching strategy by incorporating domain‐specific knowledge developed based on geoscience ontology to grasp the linguistic geoscience clues. Furthermore, Dic‐Att‐BiLSTM brings together the capacity of a geoscience dictionary matching approach and an attention mechanism to construct a dictionary attention layer. Finally, the network framework of Dic‐Att‐BiLSTM can utilize domain‐specific knowledge and classify geological text automatically. Experimental verifications are conducted on two constructed data sets, and the results clearly indicate that Dic‐Att‐BiLSTM outperforms other state‐of‐the‐art text classification models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
owoow完成签到,获得积分20
1秒前
3秒前
难摧发布了新的文献求助10
3秒前
Orange应助阿腾采纳,获得10
3秒前
4秒前
昨夜星辰完成签到,获得积分10
4秒前
5秒前
owoow发布了新的文献求助10
5秒前
6秒前
6秒前
proteinpurify发布了新的文献求助10
8秒前
辰星发布了新的文献求助10
8秒前
南北发布了新的文献求助10
12秒前
rynchee完成签到 ,获得积分10
13秒前
13秒前
14秒前
lob7完成签到,获得积分10
14秒前
糊糊完成签到 ,获得积分10
15秒前
16秒前
研友_LN7AOn发布了新的文献求助10
16秒前
PatrickW发布了新的文献求助50
17秒前
辰星发布了新的文献求助10
18秒前
19秒前
Xxxxzzz发布了新的文献求助10
19秒前
owoow发布了新的文献求助10
20秒前
CipherSage应助阿腾采纳,获得30
22秒前
传奇3应助合适的梦菡采纳,获得10
22秒前
23秒前
susu发布了新的文献求助10
23秒前
xiaofei完成签到 ,获得积分10
24秒前
26秒前
26秒前
徐大平的阿拉完成签到,获得积分10
27秒前
赘婿应助stupid采纳,获得10
27秒前
喵总发布了新的文献求助10
28秒前
29秒前
29秒前
大个应助乐观的中心采纳,获得10
30秒前
30秒前
高分求助中
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
宽禁带半导体紫外光电探测器 588
Chen Hansheng: China’s Last Romantic Revolutionary 500
COSMETIC DERMATOLOGY & SKINCARE PRACTICE 388
Case Research: The Case Writing Process 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3141967
求助须知:如何正确求助?哪些是违规求助? 2792975
关于积分的说明 7804827
捐赠科研通 2449305
什么是DOI,文献DOI怎么找? 1303150
科研通“疑难数据库(出版商)”最低求助积分说明 626807
版权声明 601291