已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Topic2Labels: A framework to annotate and classify the social media data through LDA topics and deep learning models for crisis response

潜在Dirichlet分配 计算机科学 人工智能 社会化媒体 深度学习 特征学习 机器学习 特征(语言学) 主题模型 学习排名 标记数据 自编码 特征工程 代表(政治) 背景(考古学) 秩(图论) 编码器 一般化 排名(信息检索) 万维网 古生物学 哲学 政治学 法学 数学分析 组合数学 操作系统 政治 生物 语言学 数学
作者
Junaid Abdul Wahid,Lei Shi,Yufei Gao,Bei Yang,Lin Wei,Yongcai Tao,Shabir Hussain,Muhammad Ayoub,Imam Yagoub
出处
期刊:Expert Systems With Applications [Elsevier BV]
卷期号:195: 116562-116562 被引量:32
标识
DOI:10.1016/j.eswa.2022.116562
摘要

The abundant use of social media impacts every aspect of life, including crisis management. Disaster management needs real-time data to be used in machine learning and deep learning models to aid their decision making. Mostly the data that is newly generated from social media is unstructured and unlabeled. Current text classification models based on supervised deep learning models heavily rely on human-labeled data that very small size and imbalanced in the context of disasters, ultimately affecting the generalization of models. In this study, we propose Topic2labels (T2L) framework which provides an automated way of labeling the data through LDA (latent dirichlet allocation) topic modeling approach and utilize Bert (the bidirectional encoder representation from transformer) embeddings for construction of feature vector to be employed to classify the data contextually. Our framework consists of three layers. In the first layer, we adopt LDA to generate the topics from the data, and develop a new algorithm to rank the topics, and map the highest ranked dominant topic into label to annotate the data. In the second layer, we transform the labeled text into feature representation through Bert embeddings and in the third layer we leveraged deep learning models as classifiers to classify the textual data into multiple categories. Experimental results on crisis-related datasets show that our framework performs better in terms of classification performance and yields improvement as compared to other baseline approaches.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
George完成签到,获得积分10
1秒前
FIN应助ceeray23采纳,获得30
7秒前
马拉疯兔子完成签到 ,获得积分10
8秒前
10秒前
10秒前
Sulin发布了新的文献求助10
15秒前
15秒前
MchemG应助动听凝安采纳,获得10
19秒前
桐桐应助Bin_Liu采纳,获得10
21秒前
科研通AI5应助小吴采纳,获得10
28秒前
45秒前
46秒前
MchemG应助动听凝安采纳,获得10
46秒前
46秒前
如意纸鹤完成签到 ,获得积分10
46秒前
GGGrigor完成签到,获得积分10
46秒前
peterwei272完成签到 ,获得积分10
46秒前
义气发卡完成签到 ,获得积分10
47秒前
Friday发布了新的文献求助10
49秒前
WizBLue发布了新的文献求助20
49秒前
hdn完成签到,获得积分10
50秒前
AAZ发布了新的文献求助10
53秒前
55秒前
YifanWang应助西米采纳,获得20
55秒前
58秒前
Wxxxxx完成签到 ,获得积分10
59秒前
59秒前
大模型应助愉快的草丛采纳,获得10
1分钟前
英俊的铭应助Friday采纳,获得10
1分钟前
心灵美的笑卉完成签到,获得积分10
1分钟前
江流有声完成签到 ,获得积分10
1分钟前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
林狗完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
CEN完成签到,获得积分10
1分钟前
搞搞科研发布了新的文献求助10
1分钟前
1分钟前
CEN发布了新的文献求助10
1分钟前
杨无敌完成签到 ,获得积分10
1分钟前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
Crystal Nonlinear Optics: with SNLO examples (Second Edition) 500
Essentials of Performance Analysis in Sport 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3733317
求助须知:如何正确求助?哪些是违规求助? 3277552
关于积分的说明 10003186
捐赠科研通 2993445
什么是DOI,文献DOI怎么找? 1642702
邀请新用户注册赠送积分活动 780596
科研通“疑难数据库(出版商)”最低求助积分说明 748912