Deep Learning‐ and Word Embedding‐Based Heterogeneous Classifier Ensembles for Text Classification

人工智能 计算机科学 文字嵌入 分类器(UML) 自然语言处理 词(群论) 嵌入 数学 几何学
作者
Zeynep Hilal Kilimci,Selim Akyokuş
出处
期刊:Complexity [Hindawi Publishing Corporation]
卷期号:2018 (1) 被引量:81
标识
DOI:10.1155/2018/7130146
摘要

The use of ensemble learning, deep learning, and effective document representation methods is currently some of the most common trends to improve the overall accuracy of a text classification/categorization system. Ensemble learning is an approach to raise the overall accuracy of a classification system by utilizing multiple classifiers. Deep learning‐based methods provide better results in many applications when compared with the other conventional machine learning algorithms. Word embeddings enable representation of words learned from a corpus as vectors that provide a mapping of words with similar meaning to have similar representation. In this study, we use different document representations with the benefit of word embeddings and an ensemble of base classifiers for text classification. The ensemble of base classifiers includes traditional machine learning algorithms such as naïve Bayes, support vector machine, and random forest and a deep learning‐based conventional network classifier. We analysed the classification accuracy of different document representations by employing an ensemble of classifiers on eight different datasets. Experimental results demonstrate that the usage of heterogeneous ensembles together with deep learning methods and word embeddings enhances the classification performance of texts.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
星辰大海应助跳跃的曼荷采纳,获得10
1秒前
mark707发布了新的文献求助30
1秒前
1秒前
1秒前
Raine完成签到,获得积分10
2秒前
3秒前
鱼块完成签到,获得积分20
3秒前
颜靖仇发布了新的文献求助10
3秒前
3秒前
3秒前
何止完成签到,获得积分10
3秒前
3秒前
jxq完成签到,获得积分10
4秒前
李健的小迷弟应助linman采纳,获得10
4秒前
赘婿应助十一采纳,获得10
5秒前
一一完成签到,获得积分10
5秒前
5秒前
5秒前
6秒前
6秒前
随性发布了新的文献求助10
7秒前
金启维发布了新的文献求助10
7秒前
8秒前
林一洋发布了新的文献求助10
8秒前
8秒前
小鱼发布了新的文献求助10
8秒前
荣高烽发布了新的文献求助10
9秒前
赘婿应助晓晓采纳,获得10
10秒前
阔达莺完成签到,获得积分10
10秒前
10秒前
欣喜谷槐完成签到,获得积分10
10秒前
renlangfen发布了新的文献求助10
10秒前
10秒前
ymm发布了新的文献求助10
11秒前
12秒前
12秒前
Savior应助龙龙哥的迷糊采纳,获得10
12秒前
橙以澄完成签到,获得积分10
12秒前
13秒前
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
卤化钙钛矿人工突触的研究 1000
Engineering for calcareous sediments : proceedings of the International Conference on Calcareous Sediments, Perth 15-18 March 1988 / edited by R.J. Jewell, D.C. Andrews 1000
Continuing Syntax 1000
Signals, Systems, and Signal Processing 610
2026 Hospital Accreditation Standards 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6264842
求助须知:如何正确求助?哪些是违规求助? 8086598
关于积分的说明 16900453
捐赠科研通 5335245
什么是DOI,文献DOI怎么找? 2839690
邀请新用户注册赠送积分活动 1817007
关于科研通互助平台的介绍 1670573