Self‐supervised short text classification with heterogeneous graph neural networks

计算机科学 利用 人工智能 图形 机器学习 人工神经网络 任务(项目管理) 情绪分析 自然语言处理 理论计算机科学 管理 经济 计算机安全
作者
Meng Cao,Jinliang Yuan,Hualei Yu,Baoming Zhang,Chongjun Wang
出处
期刊:Expert Systems [Wiley]
卷期号:40 (6)
标识
DOI:10.1111/exsy.13249
摘要

Abstract Short text classification has been a fundamental task in natural language processing, which benefits various applications, such as sentiment analysis, news tagging, and intent recommendation. However, classifying short texts is challenging due to the information sparsity in the text corpus. Besides, the performance of existing machine learning classification models largely relies on sufficient training data, yet labels can be scarce and expensive to obtain in real‐world text classification scenarios. In this article, we propose a novel self‐supervised short text classification method. Specifically, we first model the short text corpus as a heterogeneous graph to address the information sparsity problem. Then, we introduce a self‐attention‐based heterogeneous graph neural network model to learn short text embeddings. In addition, we adopt a self‐supervised learning framework to exploit internal and external similarities among short texts. Experiments on five real‐world short text benchmarks validate the effectiveness of our proposed method compared with the state‐of‐the‐art methods.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
在水一方应助科研通管家采纳,获得10
刚刚
Susan发布了新的文献求助10
1秒前
夹夹发布了新的文献求助10
1秒前
TIWOSS发布了新的文献求助10
1秒前
1秒前
科研通AI2S应助科研通管家采纳,获得10
2秒前
2秒前
2秒前
天天快乐应助科研通管家采纳,获得10
3秒前
3秒前
zxswuyin完成签到,获得积分10
3秒前
lcy666llll发布了新的文献求助10
3秒前
hao发布了新的文献求助10
3秒前
4秒前
4秒前
4秒前
sagitar应助宁阿霜采纳,获得50
4秒前
学术渣渣发布了新的文献求助10
4秒前
万能图书馆应助Slence采纳,获得10
4秒前
白白完成签到,获得积分10
4秒前
4秒前
程瑞哲完成签到,获得积分10
4秒前
你的名字发布了新的文献求助10
5秒前
5秒前
老武完成签到,获得积分10
5秒前
搜集达人应助逯逯静依采纳,获得10
6秒前
6秒前
执着的导师应助任鑫悦采纳,获得10
6秒前
Lucas应助qiu采纳,获得10
7秒前
cool小郑发布了新的文献求助10
7秒前
SciGPT应助刘珍荣采纳,获得10
7秒前
7秒前
给你做个pet完成签到 ,获得积分10
7秒前
bkagyin应助达瓦里氏采纳,获得10
8秒前
追光发布了新的文献求助10
8秒前
sansan完成签到 ,获得积分10
8秒前
hao发布了新的文献求助10
9秒前
nine2652发布了新的文献求助10
9秒前
ye完成签到,获得积分10
9秒前
9秒前
高分求助中
Cronologia da história de Macau 5000
Matrix Methods in Data Mining and Pattern Recognition 510
C语言程序设计(微课版) 500
Interactions of Vowel Quality and Prosody in East Slavic 500
Vander's Renal Physiology第10版 500
Forensic Science An Introduction to Scientific and Investigative Techniques 6th Edition 400
Reaction of 3-Methylenedihydro-(3H)furan-2-one with Diazoalkanes. Syntheses and Crystal Structures of Spiranic Cyclopropyl Compounds 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7093650
求助须知:如何正确求助?哪些是违规求助? 8750652
关于积分的说明 18508018
捐赠科研通 6645815
什么是DOI,文献DOI怎么找? 3136883
关于科研通互助平台的介绍 2244701
邀请新用户注册赠送积分活动 2111719