An overview of topic modeling methods and tools

数据科学
作者
Bhagyashree Vyankatrao Barde,Anant Madhavrao Bainwad
出处
期刊:International Conference Intelligent Computing and Control Systems 卷期号:: 745-750 被引量:31
标识
DOI:10.1109/iccons.2017.8250563
摘要

Topic modeling is a powerful technique for analysis of a huge collection of a document. Topic modeling is used for discovering hidden structure from the collection of a document. The topic is viewed as a recurring pattern of co-occurring words. A topic includes a group of words that often occurs together. Topic modeling can link words with the same context and differentiate across the uses of words with different meanings. In this paper, we discuss methods of Topic Modeling which includes Vector Space Model (VSM), Latent Semantic Indexing (LSI), Probabilistic Latent Semantic Analysis (PLSA), Latent Dirichlet Allocation (LDA) with their features and limitations. After that, we will discuss tools available for topic modeling such as Gensim, Standford topic modeling toolbox, MALLET, BigARTM. Then some of the applications of Topic Modeling covered. Topic models have a wide range of applications like tag recommendation, text categorization, keyword extraction, information filtering and similarity search in the fields of text mining, information retrieval.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
细心难摧完成签到 ,获得积分10
1秒前
研都不研了完成签到 ,获得积分10
1秒前
bleach完成签到 ,获得积分10
14秒前
奋斗的妙海完成签到 ,获得积分0
18秒前
拾壹完成签到,获得积分10
19秒前
单小芫完成签到 ,获得积分10
27秒前
Jau完成签到,获得积分0
28秒前
zhouxiuqing完成签到,获得积分20
30秒前
菠萝水手完成签到,获得积分10
35秒前
41秒前
DianaLee完成签到 ,获得积分10
42秒前
梦欢完成签到,获得积分10
42秒前
刻苦的新烟完成签到 ,获得积分0
45秒前
科研通AI6.1应助小蓝采纳,获得10
45秒前
46秒前
66完成签到,获得积分10
50秒前
zy发布了新的文献求助10
50秒前
zhh完成签到,获得积分10
51秒前
miemie66完成签到,获得积分10
56秒前
57秒前
肥猫完成签到,获得积分10
1分钟前
Wz完成签到 ,获得积分10
1分钟前
小七完成签到 ,获得积分10
1分钟前
shl完成签到 ,获得积分10
1分钟前
清风明月完成签到 ,获得积分10
1分钟前
小蓝完成签到,获得积分20
1分钟前
carly完成签到 ,获得积分10
1分钟前
John完成签到,获得积分10
1分钟前
漫才完成签到 ,获得积分10
1分钟前
yanmh完成签到,获得积分10
1分钟前
天天快乐应助zy采纳,获得10
1分钟前
13633501455完成签到 ,获得积分10
1分钟前
Liuruijia完成签到 ,获得积分10
1分钟前
arniu2008应助科研通管家采纳,获得60
1分钟前
Owen应助科研通管家采纳,获得10
1分钟前
haprier完成签到 ,获得积分10
1分钟前
1分钟前
平安完成签到 ,获得积分10
1分钟前
打打应助缥缈靖雁采纳,获得10
1分钟前
78888完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Various Faces of Animal Metaphor in English and Polish 800
Signals, Systems, and Signal Processing 610
Unlocking Chemical Thinking: Reimagining Chemistry Teaching and Learning 555
Photodetectors: From Ultraviolet to Infrared 500
On the Dragon Seas, a sailor's adventures in the far east 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6355714
求助须知:如何正确求助?哪些是违规求助? 8170509
关于积分的说明 17200939
捐赠科研通 5411733
什么是DOI,文献DOI怎么找? 2864357
邀请新用户注册赠送积分活动 1841893
关于科研通互助平台的介绍 1690224