An Interdisciplinary Literature Classifier Based on Multi-task Multi-label Learning

计算机科学 人工智能 机器学习 分类器(UML) 决策树 多任务学习 人工神经网络 支持向量机 任务(项目管理) 领域(数学) 卷积神经网络
作者
Lianxi Wang,Zhuolin Chen,Nankai Lin,Xixuan Huang
标识
DOI:10.1109/ialp54817.2021.9675234
摘要

Interdisciplinary integration is one of the motive power of scientific innovation and development. In order to improve the classification effect of interdisciplinary literature, this paper adopts multi-task learning method to learn interdisciplinary literature categories with similar research topic. Aiming at the imbalance and intersectionality of the distribution of the categories of the literature in the field of Library and Information Science, this paper proposes a classification framework for interdisciplinary literature based on multi-task learning. The framework is based on BERT and improves the classification effect of the model in minority categories by introducing the machine reading comprehension task, which predicts the position of keywords in titles and abstracts. The results show that the multi-task learning method is more effective than decision tree, support vector machine, convolutional neural network, recurrent neural network and pre-trained models. In addition, compared with cost-sensitive method, the proposed method is more helpful for the minority class, and its Macro-F1 value has reached 74.84%.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
微笑襄完成签到 ,获得积分10
刚刚
Ann完成签到,获得积分10
1秒前
魔术师完成签到 ,获得积分10
1秒前
liwenhao发布了新的文献求助10
1秒前
在下李大飞完成签到,获得积分10
1秒前
布布发布了新的文献求助10
2秒前
2秒前
CodeCraft应助余小胖采纳,获得10
3秒前
翟小灰发布了新的文献求助10
3秒前
彭大啦啦完成签到,获得积分10
3秒前
冰阔罗完成签到,获得积分10
3秒前
4秒前
刻苦的美女完成签到 ,获得积分10
4秒前
hyx发布了新的文献求助10
4秒前
海鲭发布了新的文献求助10
5秒前
5秒前
依古比古完成签到 ,获得积分10
5秒前
cyt发布了新的文献求助10
5秒前
闪闪的方盒完成签到,获得积分10
5秒前
英姑应助周海涛采纳,获得10
5秒前
6秒前
咩鹿酱完成签到,获得积分10
6秒前
6秒前
曾经的代曼完成签到,获得积分10
6秒前
海里的鱼额完成签到 ,获得积分10
6秒前
七七发布了新的文献求助10
6秒前
卡夫卡的熊完成签到 ,获得积分10
7秒前
高大的阑香完成签到,获得积分10
7秒前
CanLiu完成签到,获得积分10
7秒前
打打应助Leon_nomoreLess采纳,获得10
7秒前
chunjianghua完成签到,获得积分10
7秒前
leo_zjm完成签到,获得积分10
7秒前
洋了个洋完成签到,获得积分10
7秒前
888完成签到,获得积分10
8秒前
淡然冬灵发布了新的文献求助30
8秒前
8秒前
小爽完成签到,获得积分0
9秒前
9秒前
糖丸完成签到,获得积分10
9秒前
娇气的铃铛完成签到,获得积分10
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Reproduction Third Edition 3000
Comprehensive Methanol Science Production, Applications, and Emerging Technologies 2000
From Victimization to Aggression 1000
化妆品原料学 1000
小学科学课程与教学 500
Study and Interlaboratory Validation of Simultaneous LC-MS/MS Method for Food Allergens Using Model Processed Foods 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5645554
求助须知:如何正确求助?哪些是违规求助? 4769221
关于积分的说明 15030506
捐赠科研通 4804229
什么是DOI,文献DOI怎么找? 2568855
邀请新用户注册赠送积分活动 1526056
关于科研通互助平台的介绍 1485654