A Sequential Addressing Subsampling Method for Massive Data Analysis Under Memory Constraint

计算机科学 估计员 样品(材料) 推论 约束(计算机辅助设计) 统计推断 数据挖掘 采样(信号处理) 样本量测定 人工智能 统计 数学 化学 几何学 滤波器(信号处理) 色谱法 计算机视觉
作者
Rui Pan,Yingqiu Zhu,Baishan Guo,Xuening Zhu,Hansheng Wang
出处
期刊:IEEE Transactions on Knowledge and Data Engineering [IEEE Computer Society]
卷期号:35 (9): 9502-9513 被引量:2
标识
DOI:10.1109/tkde.2023.3241075
摘要

The emergence of massive data in recent years brings challenges to automatic statistical inference. This is particularly true if the data are too numerous to be read into memory as a whole. Accordingly, new sampling techniques are needed to sample data from a hard drive. In this paper, we propose a sequential addressing subsampling (SAS) method that can sample data directly from the hard drive. The newly proposed SAS method is time saving in terms of addressing cost compared to that of the random addressing subsampling (RAS) method. Estimators (e.g., the sample mean) based on the SAS subsamples are constructed, and their properties are studied. We conduct a series of simulation studies to verify the finite sample performance of the proposed SAS estimators. The time cost is also compared between the SAS and RAS methods. An analysis of the airline data is presented for illustration purpose.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
我是老大应助tk采纳,获得10
刚刚
浮游应助追逐着幻光采纳,获得10
1秒前
善学以致用应助ZongzongXu采纳,获得10
2秒前
2秒前
2秒前
大模型应助沉静高山采纳,获得10
4秒前
脑洞疼应助charles采纳,获得10
5秒前
量子星尘发布了新的文献求助10
5秒前
444发布了新的文献求助10
5秒前
6秒前
曾经沛白完成签到 ,获得积分10
7秒前
7秒前
7秒前
8秒前
yuting发布了新的文献求助10
9秒前
9秒前
yuan完成签到,获得积分10
9秒前
怡然的沅完成签到,获得积分20
9秒前
马薄函发布了新的文献求助10
9秒前
0218完成签到,获得积分10
9秒前
CC完成签到,获得积分10
10秒前
打打应助生动的战斗机采纳,获得10
11秒前
99发布了新的文献求助10
11秒前
谦1发布了新的文献求助10
11秒前
深情安青应助科研通管家采纳,获得10
11秒前
领导范儿应助科研通管家采纳,获得10
11秒前
12秒前
pluto应助科研通管家采纳,获得10
12秒前
12秒前
wanci应助科研通管家采纳,获得10
12秒前
NexusExplorer应助科研通管家采纳,获得10
12秒前
科研通AI6应助科研通管家采纳,获得10
12秒前
12秒前
可爱的函函应助wu采纳,获得10
12秒前
大个应助科研通管家采纳,获得10
12秒前
星辰大海应助科研通管家采纳,获得30
12秒前
科研通AI6应助科研通管家采纳,获得10
12秒前
我是老大应助科研通管家采纳,获得10
13秒前
科研通AI5应助科研通管家采纳,获得10
13秒前
QOP应助科研通管家采纳,获得10
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Zeolites: From Fundamentals to Emerging Applications 1500
Architectural Corrosion and Critical Infrastructure 1000
Early Devonian echinoderms from Victoria (Rhombifera, Blastoidea and Ophiocistioidea) 1000
Hidden Generalizations Phonological Opacity in Optimality Theory 1000
2026国自然单细胞多组学大红书申报宝典 800
Real Analysis Theory of Measure and Integration 3rd Edition 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4914223
求助须知:如何正确求助?哪些是违规求助? 4188690
关于积分的说明 13008744
捐赠科研通 3957434
什么是DOI,文献DOI怎么找? 2169808
邀请新用户注册赠送积分活动 1188078
关于科研通互助平台的介绍 1095707