清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Selecting and combining complementary feature representations and classifiers for hate speech detection

计算机科学 启发式 讽刺 人工智能 特征选择 机器学习 特征提取 任务(项目管理) 选择(遗传算法) 语音识别 自然语言处理 艺术 文学类 操作系统 经济 管理 讽刺
作者
Rafael M. O. Cruz,Woshington V. de Sousa,George D. C. Cavalcanti
出处
期刊:Online Social Networks and Media [Elsevier]
卷期号:28: 100194-100194 被引量:6
标识
DOI:10.1016/j.osnem.2021.100194
摘要

Hate speech is a major issue in social networks due to the high volume of data generated daily. Recent works demonstrate the usefulness of machine learning (ML) in dealing with the nuances required to distinguish between hateful posts from just sarcasm or offensive language. Many ML solutions for hate speech detection have been proposed by either changing how features are extracted from the text or the classification algorithm employed. However, most works consider only one type of feature extraction and classification algorithm. This work argues that a combination of multiple feature extraction techniques and different classification models is needed. We propose a framework to analyze the relationship between multiple feature extraction and classification techniques to understand how they complement each other. The framework is used to select a subset of complementary techniques to compose a robust multiple classifiers system (MCS) for hate speech detection. The experimental study considering four hate speech classification datasets demonstrates that the proposed framework is a promising methodology for analyzing and designing high-performing MCS for this task. MCS system obtained using the proposed framework significantly outperforms the combination of all models and the homogeneous and heterogeneous selection heuristics, demonstrating the importance of having a proper selection scheme. Source code, figures and dataset splits can be found in the GitHub repository: https://github.com/Menelau/Hate-Speech-MCS.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
沧海一粟米完成签到 ,获得积分10
10秒前
喵星人发布了新的文献求助10
16秒前
空白完成签到 ,获得积分10
18秒前
追寻念云完成签到 ,获得积分10
28秒前
JasonWu完成签到 ,获得积分10
34秒前
亮总完成签到 ,获得积分10
35秒前
45秒前
数乱了梨花完成签到 ,获得积分10
45秒前
mineave完成签到 ,获得积分10
51秒前
玛琳卡迪马完成签到 ,获得积分10
52秒前
dominic12361完成签到 ,获得积分10
1分钟前
海鹏完成签到 ,获得积分10
1分钟前
科研菜鸡完成签到 ,获得积分10
1分钟前
灵巧的翠风完成签到 ,获得积分10
1分钟前
四个金太阳完成签到 ,获得积分20
1分钟前
doreen完成签到 ,获得积分10
1分钟前
wuhao完成签到 ,获得积分10
1分钟前
5mg完成签到,获得积分20
1分钟前
小小aa16完成签到,获得积分10
1分钟前
Karry完成签到 ,获得积分10
2分钟前
坟里唱情歌完成签到 ,获得积分10
2分钟前
甜乎贝贝完成签到 ,获得积分10
2分钟前
小小果妈完成签到 ,获得积分10
2分钟前
西洲完成签到 ,获得积分10
2分钟前
简奥斯汀完成签到 ,获得积分10
2分钟前
Glory完成签到 ,获得积分10
2分钟前
糊涂的青烟完成签到 ,获得积分10
3分钟前
秋夜临完成签到,获得积分10
3分钟前
大水完成签到 ,获得积分10
3分钟前
3分钟前
小白白白完成签到 ,获得积分10
4分钟前
容若发布了新的文献求助10
4分钟前
4分钟前
李健应助Lancelot采纳,获得10
4分钟前
Philthee完成签到,获得积分10
4分钟前
共享精神应助李lll采纳,获得10
4分钟前
容若完成签到,获得积分10
4分钟前
CHAI发布了新的文献求助10
4分钟前
喵星人发布了新的文献求助10
4分钟前
开放访天完成签到 ,获得积分10
4分钟前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Diagnostic immunohistochemistry : theranostic and genomic applications 6th Edition 500
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 400
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3155031
求助须知:如何正确求助?哪些是违规求助? 2805746
关于积分的说明 7865891
捐赠科研通 2464004
什么是DOI,文献DOI怎么找? 1311698
科研通“疑难数据库(出版商)”最低求助积分说明 629728
版权声明 601856