An abusive text detection system based on enhanced abusive and non-abusive word lists

计算机科学 文字2vec 人工智能 自然语言处理 虐待关系 词(群论) 余弦相似度 俚语 社会化媒体 机器学习 计算机安全 万维网 毒物控制 聚类分析 家庭暴力 语言学 伤害预防 哲学 环境卫生 医学 嵌入
作者
Ho Suk Lee,Hong Rae Lee,Jun U. Park,Yo-Sub Han
出处
期刊:Decision Support Systems [Elsevier BV]
卷期号:113: 22-31 被引量:42
标识
DOI:10.1016/j.dss.2018.06.009
摘要

Abusive text (indiscriminate slang, abusive language, and profanity) on the Internet is not just a message but rather a tool for very serious and brutal cyber violence. It has become an important problem to devise a method for detecting and preventing abusive text online. However, the intentional obfuscation of words and phrases makes this task very difficult and challenging. We design a decision system that successfully detects (obfuscated) abusive text using an unsupervised learning of abusive words based on word2vec's skip-gram and the cosine similarity. The system also deploys several efficient gadgets for filtering abusive text such as blacklists, n-grams, edit-distance metrics, mixed languages, abbreviations, punctuation, and words with special characters to detect the intentional obfuscation of abusive words. We integrate both an unsupervised learning method and efficient gadgets into a single system that enhances abusive and non-abusive word lists. The integrated decision system based on the enhanced word lists shows a precision of 94.08%, a recall of 80.79%, and an f-score of 86.93% in malicious word detection for news article comments, a precision of 89.97%, a recall of 80.55%, and an f-score 85.00% for online community comments, and a precision of 90.65%, a recall of 93.57%, and an f-score 92.09% for Twitter tweets. We expect that our approach can help to improve the current abusive word detection system, which is crucial for several web-based services including social networking services and online games.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
哥哥完成签到,获得积分10
4秒前
淡淡的无敌完成签到 ,获得积分10
6秒前
量子星尘发布了新的文献求助10
8秒前
lhn完成签到 ,获得积分10
10秒前
禾页完成签到 ,获得积分10
16秒前
19秒前
wuju给wuju的求助进行了留言
19秒前
量子星尘发布了新的文献求助10
21秒前
24秒前
娟娟完成签到 ,获得积分10
28秒前
29秒前
量子星尘发布了新的文献求助10
37秒前
友露呀-完成签到 ,获得积分10
41秒前
冯小路完成签到 ,获得积分10
48秒前
量子星尘发布了新的文献求助10
52秒前
852应助美丽心情采纳,获得10
58秒前
光亮白山完成签到 ,获得积分10
59秒前
奇异完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
江三村完成签到 ,获得积分0
1分钟前
xiaowanzi完成签到 ,获得积分10
1分钟前
21完成签到 ,获得积分10
1分钟前
1分钟前
友露呀-关注了科研通微信公众号
1分钟前
wuju发布了新的文献求助10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
1分钟前
斜阳完成签到 ,获得积分10
1分钟前
蒹葭苍苍完成签到 ,获得积分10
1分钟前
调皮平蓝完成签到,获得积分10
1分钟前
猪鼓励完成签到,获得积分10
1分钟前
mrconli完成签到,获得积分10
1分钟前
Maestro_S应助科研通管家采纳,获得10
1分钟前
Maestro_S应助科研通管家采纳,获得10
1分钟前
Maestro_S应助科研通管家采纳,获得10
1分钟前
1分钟前
落寞的幻竹完成签到,获得积分10
1分钟前
ldr888完成签到,获得积分10
1分钟前
量子星尘发布了新的文献求助20
1分钟前
Nancy完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Handbook of Milkfat Fractionation Technology and Application, by Kerry E. Kaylegian and Robert C. Lindsay, AOCS Press, 1995 1000
Athena操作手册 500
The Affinity Designer Manual - Version 2: A Step-by-Step Beginner's Guide 500
Affinity Designer Essentials: A Complete Guide to Vector Art: Your Ultimate Handbook for High-Quality Vector Graphics 500
Optimisation de cristallisation en solution de deux composés organiques en vue de leur purification 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5044251
求助须知:如何正确求助?哪些是违规求助? 4274024
关于积分的说明 13323099
捐赠科研通 4087533
什么是DOI,文献DOI怎么找? 2236362
邀请新用户注册赠送积分活动 1243756
关于科研通互助平台的介绍 1171704