Learning to Sketch: A Neural Approach to Item Frequency Estimation in Streaming Data

计算机科学 素描 人工智能 估计 人工神经网络 机器学习 语音识别 模式识别(心理学) 计算机视觉 算法 管理 经济
作者
Yukun Cao,Yuan Feng,Hairu Wang,Xike Xie,S. Kevin Zhou
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [Institute of Electrical and Electronics Engineers]
卷期号:46 (11): 7136-7153 被引量:6
标识
DOI:10.1109/tpami.2024.3388589
摘要

Recently, there has been a trend of designing neural data structures to go beyond handcrafted data structures by leveraging patterns of data distributions for better accuracy and adaptivity. Sketches are widely used data structures in real-time web analysis, network monitoring, and self-driving to estimate item frequencies of data streams within limited space. However, existing sketches have not fully exploited the patterns of the data stream distributions, making it challenging to tightly couple them with neural networks that excel at memorizing pattern information. Starting from the premise, we envision a pure neural data structure as a base sketch, which we term the meta-sketch, to reinvent the base structure of conventional sketches. The meta-sketch learns basic sketching abilities from meta-tasks constituted with synthetic datasets following Zipf distributions in the pre-training phase and can be quickly adapted to real (skewed) distributions in the adaption phase. The meta-sketch not only surpasses its competitors in sketching conventional data streams but also holds good potential in supporting more complex streaming data, such as multimedia and graph stream scenarios. Extensive experiments demonstrate the superiority of the meta-sketch and offer insights into its working mechanism.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
无亞完成签到,获得积分10
刚刚
刚刚
无极微光应助野性的笙采纳,获得20
1秒前
朴实笑萍发布了新的文献求助10
1秒前
南街楼完成签到,获得积分10
1秒前
123发布了新的文献求助20
2秒前
2秒前
丁真完成签到,获得积分10
2秒前
3秒前
3秒前
怡然梦玉完成签到 ,获得积分10
3秒前
3秒前
4秒前
Xyy发布了新的文献求助10
4秒前
春春发布了新的文献求助10
4秒前
传奇3应助lxkx采纳,获得10
4秒前
4秒前
冷静的鑫磊完成签到,获得积分10
4秒前
qh0305发布了新的文献求助10
5秒前
南街楼发布了新的文献求助10
6秒前
6秒前
Yu应助王宇琦采纳,获得10
6秒前
浮世清欢发布了新的文献求助30
6秒前
Lucas应助杜杜采纳,获得10
6秒前
7秒前
科研通AI6应助Luffy采纳,获得10
7秒前
研友_5Y9Z75完成签到 ,获得积分0
7秒前
自觉翠安应助xhd183采纳,获得10
7秒前
8秒前
唐姗姗完成签到,获得积分10
8秒前
小王完成签到,获得积分10
8秒前
meteor完成签到,获得积分10
8秒前
不安的可乐完成签到,获得积分10
9秒前
圆圆发布了新的文献求助10
9秒前
桐桐应助WD采纳,获得10
9秒前
ming发布了新的文献求助10
9秒前
9秒前
9秒前
9秒前
10秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Agriculture and Food Systems Third Edition 2000
Clinical Microbiology Procedures Handbook, Multi-Volume, 5th Edition 临床微生物学程序手册,多卷,第5版 2000
King Tyrant 720
Principles of Plasma Discharges and Materials Processing, 3rd Edition 400
The Synthesis of Simplified Analogues of Crambescin B Carboxylic Acid and Their Inhibitory Activity of Voltage-Gated Sodium Channels: New Aspects of Structure–Activity Relationships 400
El poder y la palabra: prensa y poder político en las dictaduras : el régimen de Franco ante la prensa y el periodismo 400
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5597707
求助须知:如何正确求助?哪些是违规求助? 4683245
关于积分的说明 14828935
捐赠科研通 4661452
什么是DOI,文献DOI怎么找? 2536795
邀请新用户注册赠送积分活动 1504402
关于科研通互助平台的介绍 1470232