Automatic Text Summarization Using Gensim Word2Vec and K-Means Clustering Algorithm

自动汇总 文字2vec 计算机科学 自然语言处理 聚类分析 阅读(过程) 情报检索 人工智能 点(几何) 判决 文本图 文档聚类 过程(计算) 文本处理 特征(语言学) 领域(数学分析) 多文档摘要 特征提取 语言学 哲学 数学分析 操作系统 嵌入 数学 几何学
作者
Mofiz Mojib Haider,Md. Arman Hossin,Hasibur Rashid Mahi,Hossain Arif
出处
期刊:2017 IEEE Region 10 Symposium (TENSYMP) 卷期号:: 283-286 被引量:40
标识
DOI:10.1109/tensymp50017.2020.9230670
摘要

The significance of text summarization in the Natural Language Processing (NLP) community has now expanded because of the staggering increase in virtual textual materials. Text summary is the process created from one or multiple texts which convey important insight in a little form of the main text. Multiple text summarization technique assists to pick indispensable points of the original texts reducing time and effort require reading the whole document. The question was approached from a different point of view, in a different domain by using different concepts. Extractive and abstractive are the two main methods of summing up text. Though extractive summary is primarily concerned with what summary content the frequency of words, phrases, and sentences from the original document should be used. This research proposes a sentence based clustering algorithm (K-Means) for a single document. For feature extraction, we have used Gensim word2vec which is intended to automatically extract semantic topics from documents in the most efficient way possible.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
毛豆应助梓涵采纳,获得10
刚刚
共享精神应助过时的笙采纳,获得10
1秒前
Sulley发布了新的文献求助10
1秒前
初次完成签到 ,获得积分10
2秒前
zzx发布了新的文献求助10
4秒前
小赵发布了新的文献求助10
5秒前
Neonoes完成签到 ,获得积分10
5秒前
6秒前
6秒前
6秒前
yyauthor完成签到,获得积分10
7秒前
文泽完成签到,获得积分10
10秒前
辽东浅墨发布了新的文献求助20
11秒前
张达发布了新的文献求助10
11秒前
upsoar完成签到,获得积分10
12秒前
Akim应助季1采纳,获得30
13秒前
FashionBoy应助典雅的如南采纳,获得10
14秒前
Xuan_Y完成签到,获得积分10
16秒前
小牟小牟发布了新的文献求助10
17秒前
18秒前
cfplhys完成签到,获得积分10
19秒前
钢笔完成签到,获得积分10
19秒前
20秒前
噜lu发布了新的文献求助30
20秒前
22秒前
iourcc发布了新的文献求助10
22秒前
幸福的雪枫完成签到 ,获得积分10
23秒前
AFsumo发布了新的文献求助10
24秒前
25秒前
英俊的铭应助hk1900采纳,获得10
25秒前
25秒前
26秒前
季1完成签到,获得积分10
26秒前
香蕉觅云应助张达采纳,获得10
27秒前
36456657应助Qin采纳,获得10
27秒前
在水一方应助Pan采纳,获得50
28秒前
19950220发布了新的文献求助10
28秒前
29秒前
peng完成签到,获得积分10
29秒前
科研通AI2S应助iourcc采纳,获得10
29秒前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1500
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
The Oxford Handbook of Educational Psychology 600
有EBL数据库的大佬进 Matrix Mathematics 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 纳米技术 物理 计算机科学 化学工程 基因 复合材料 遗传学 物理化学 免疫学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3416783
求助须知:如何正确求助?哪些是违规求助? 3018648
关于积分的说明 8884570
捐赠科研通 2705843
什么是DOI,文献DOI怎么找? 1483963
科研通“疑难数据库(出版商)”最低求助积分说明 685830
邀请新用户注册赠送积分活动 681060