清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Text mining techniques for patent analysis

计算机科学 术语 专利可视化 过程(计算) 集合(抽象数据类型) 鉴定(生物学) 情报检索 数据挖掘 领域(数学分析) 关联规则学习 分割 信息抽取 人工智能 数据科学 哲学 数学分析 操作系统 生物 植物 程序设计语言 语言学 数学
作者
Yuen‐Hsien Tseng,Chi-Jen Lin,Yu-I Lin
出处
期刊:Information Processing and Management [Elsevier BV]
卷期号:43 (5): 1216-1247 被引量:664
标识
DOI:10.1016/j.ipm.2006.11.011
摘要

Patent documents contain important research results. However, they are lengthy and rich in technical terminology such that it takes a lot of human efforts for analyses. Automatic tools for assisting patent engineers or decision makers in patent analysis are in great demand. This paper describes a series of text mining techniques that conforms to the analytical process used by patent analysts. These techniques include text segmentation, summary extraction, feature selection, term association, cluster generation, topic identification, and information mapping. The issues of efficiency and effectiveness are considered in the design of these techniques. Some important features of the proposed methodology include a rigorous approach to verify the usefulness of segment extracts as the document surrogates, a corpus- and dictionary-free algorithm for keyphrase extraction, an efficient co-word analysis method that can be applied to large volume of patents, and an automatic procedure to create generic cluster titles for ease of result interpretation. Evaluation of these techniques was conducted. The results confirm that the machine-generated summaries do preserve more important content words than some other sections for classification. To demonstrate the feasibility, the proposed methodology was applied to a real-world patent set for domain analysis and mapping, which shows that our approach is more effective than existing classification systems. The attempt in this paper to automate the whole process not only helps create final patent maps for topic analyses, but also facilitates or improves other patent analysis tasks such as patent classification, organization, knowledge sharing, and prior art searches.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
4秒前
yingzaifeixiang完成签到 ,获得积分10
5秒前
oaoalaa完成签到 ,获得积分10
7秒前
8秒前
婉莹完成签到 ,获得积分0
8秒前
9秒前
lilylian完成签到,获得积分10
23秒前
春景当思完成签到,获得积分10
45秒前
默默完成签到 ,获得积分10
56秒前
WenJun完成签到,获得积分10
1分钟前
NexusExplorer应助汎影采纳,获得10
1分钟前
苦咖啡行僧完成签到 ,获得积分10
1分钟前
Antonio完成签到 ,获得积分10
1分钟前
YZ完成签到 ,获得积分10
1分钟前
1分钟前
雨后完成签到 ,获得积分10
1分钟前
无辜的行云完成签到 ,获得积分0
1分钟前
汎影发布了新的文献求助10
1分钟前
雪流星完成签到 ,获得积分10
2分钟前
genau000完成签到 ,获得积分10
2分钟前
蛋妮完成签到 ,获得积分10
2分钟前
狐狸小姐完成签到 ,获得积分10
2分钟前
俊逸的盛男完成签到 ,获得积分10
2分钟前
汎影完成签到,获得积分10
2分钟前
汎影发布了新的文献求助10
2分钟前
华仔应助xun采纳,获得10
3分钟前
drizzling完成签到,获得积分10
3分钟前
真的OK完成签到,获得积分10
3分钟前
洋芋饭饭完成签到,获得积分10
3分钟前
Drizzle完成签到,获得积分20
3分钟前
ys1008完成签到,获得积分10
3分钟前
研友_ZlxBXZ发布了新的文献求助10
4分钟前
快递乱跑完成签到 ,获得积分10
4分钟前
x银河里完成签到 ,获得积分10
4分钟前
科研狗完成签到 ,获得积分10
4分钟前
皮皮完成签到 ,获得积分10
4分钟前
缥缈的背包完成签到 ,获得积分10
5分钟前
5分钟前
zxd发布了新的文献求助10
5分钟前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
Evaluating the Cardiometabolic Efficacy and Safety of Lipoprotein Lipase Pathway Targets in Combination With Approved Lipid-Lowering Targets: A Drug Target Mendelian Randomization Study 500
Crystal Nonlinear Optics: with SNLO examples (Second Edition) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3733437
求助须知:如何正确求助?哪些是违规求助? 3277618
关于积分的说明 10003554
捐赠科研通 2993665
什么是DOI,文献DOI怎么找? 1642790
邀请新用户注册赠送积分活动 780644
科研通“疑难数据库(出版商)”最低求助积分说明 748926