Discovering trends in text databases

短语 计算机科学 时间戳 子序列 名词短语 情报检索 领域(数学分析) 词(群论) 数据库 期限(时间) 自然语言处理 语言学 数学 量子力学 物理 名词 数学分析 计算机安全 哲学 有界函数
作者
Brian Lent,Rakesh Agrawal,Ramakrishnan Srikant
出处
期刊:Knowledge Discovery and Data Mining 卷期号:: 227-230 被引量:211
链接
摘要

We address the problem of discovering trends in text databases. Trends can be used, for example, to discover that a company is shifting interests from one domain to another. We are given a database V of documents. Each document consists of one or more text fields and a timestamp. The unit of text is a word and a phrase is a list of words. (We defer the discussion of more complex structures till the “Methodology” secl-inn Ao.aw.;,tc.rl ..r;th r...rh nhrano ;a s h;rtmw nf the YAVU., ~uu”~Icu”n,L& ““lull \.uIUIA yuLCll”U I” Lo ,YYUY”~ y “I Yll” frequency of occurrence of the phrase, obtained by partitioning the documents based upon their timestamps. The frequency of occurrence in a particular time period is the number of documents that contain the phrase. (Other measures of frequency are possible, e.g. counting each occurrence of the phrase in a document.) A trend is a specific subsequence of the history of a phrase that satisfies the users’ query over the histories. For example, the user may specify a “spike” query to finds those phrases whose frequency of occurrence increased and then decreased.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
CodeCraft应助Shellingford采纳,获得10
刚刚
兴奋雁蓉完成签到,获得积分10
刚刚
刚刚
田様应助俏皮秋烟采纳,获得10
刚刚
EASA完成签到,获得积分10
1秒前
山鱿木完成签到,获得积分20
2秒前
刘伟完成签到,获得积分10
2秒前
科研通AI6应助活力元龙采纳,获得10
2秒前
3秒前
wanci应助LP829采纳,获得10
3秒前
Lq发布了新的文献求助10
3秒前
fan完成签到,获得积分10
4秒前
蔷薇之花完成签到 ,获得积分20
4秒前
无花果应助笑一笑采纳,获得10
4秒前
锅锅关注了科研通微信公众号
4秒前
5秒前
可爱的函函应助wanglixiang采纳,获得10
6秒前
Orange应助ghx采纳,获得20
6秒前
7秒前
9秒前
大模型应助木马木马采纳,获得10
10秒前
11秒前
cxd完成签到,获得积分10
11秒前
PCEEN发布了新的文献求助10
12秒前
12秒前
FashionBoy应助iiiii采纳,获得10
12秒前
文献发布了新的文献求助10
12秒前
13秒前
谦让的鹏煊完成签到,获得积分10
13秒前
14秒前
15秒前
FashionBoy应助精神世界采纳,获得10
15秒前
热心破茧完成签到,获得积分10
15秒前
蔷薇之花发布了新的文献求助10
16秒前
Sam完成签到,获得积分10
16秒前
笑一笑发布了新的文献求助10
16秒前
hejiayan完成签到,获得积分10
16秒前
科研通AI2S应助susuu采纳,获得10
17秒前
sky木槿完成签到 ,获得积分10
17秒前
境屾完成签到,获得积分10
17秒前
高分求助中
Encyclopedia of Immunobiology Second Edition 5000
List of 1,091 Public Pension Profiles by Region 1621
Les Mantodea de Guyane: Insecta, Polyneoptera [The Mantids of French Guiana] | NHBS Field Guides & Natural History 1500
The Victim–Offender Overlap During the Global Pandemic: A Comparative Study Across Western and Non-Western Countries 1000
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
Brittle fracture in welded ships 1000
King Tyrant 680
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5580550
求助须知:如何正确求助?哪些是违规求助? 4665376
关于积分的说明 14755842
捐赠科研通 4606862
什么是DOI,文献DOI怎么找? 2528078
邀请新用户注册赠送积分活动 1497365
关于科研通互助平台的介绍 1466331