Online Learning and Decision-Making under Generalized Linear Model with High-Dimensional Data

估计员 极小极大 后悔 维数(图论) 数学优化 数学 Lasso(编程语言) 水准点(测量) 计算机科学 甲骨文公司 线性模型 算法 统计 组合数学 软件工程 大地测量学 万维网 地理
作者
Xue Wang,Mike Mingcheng Wei,Tao Yao
出处
期刊:Cornell University - arXiv 被引量:2
标识
DOI:10.48550/arxiv.1812.02962
摘要

We propose a minimax concave penalized multi-armed bandit algorithm under generalized linear model (G-MCP-Bandit) for a decision-maker facing high-dimensional data in an online learning and decision-making process. We demonstrate that the G-MCP-Bandit algorithm asymptotically achieves the optimal cumulative regret in the sample size dimension T , O(log T), and further attains a tight bound in the covariate dimension d, O(log d). In addition, we develop a linear approximation method, the 2-step weighted Lasso procedure, to identify the MCP estimator for the G-MCP-Bandit algorithm under non-iid samples. Under this procedure, the MCP estimator matches the oracle estimator with high probability and converges to the true parameters with the optimal convergence rate. Finally, through experiments based on synthetic data and two real datasets (warfarin dosing dataset and Tencent search advertising dataset), we show that the G-MCP-Bandit algorithm outperforms other benchmark algorithms, especially when there is a high level of data sparsity or the decision set is large.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
2秒前
3秒前
科研通AI6应助梅梅采纳,获得10
3秒前
3秒前
3秒前
小北发布了新的文献求助10
3秒前
4秒前
dktrrrr完成签到,获得积分10
5秒前
6秒前
果称发布了新的文献求助10
6秒前
王淳完成签到 ,获得积分10
6秒前
科研小白发布了新的文献求助50
7秒前
Owen应助2jz采纳,获得10
7秒前
灵长类发布了新的文献求助10
7秒前
生生完成签到 ,获得积分10
8秒前
忧郁的莫茗完成签到,获得积分10
8秒前
吴彦祖发布了新的文献求助10
8秒前
Owen应助ww采纳,获得10
8秒前
Doctor_wan89发布了新的文献求助10
9秒前
10秒前
10秒前
12秒前
12秒前
华仔应助哈哈采纳,获得10
13秒前
wp4455777发布了新的文献求助10
14秒前
长情不弱完成签到,获得积分10
14秒前
zzzpf发布了新的文献求助10
15秒前
15秒前
奋斗夏旋完成签到,获得积分10
15秒前
16秒前
16秒前
慧hui完成签到,获得积分20
16秒前
吴彦祖完成签到,获得积分10
16秒前
安南应助程意善采纳,获得10
16秒前
17秒前
17秒前
Doctor_wan89完成签到,获得积分10
18秒前
郝丽伟发布了新的文献求助10
19秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Zeolites: From Fundamentals to Emerging Applications 1500
Encyclopedia of Materials: Plastics and Polymers 1000
Architectural Corrosion and Critical Infrastructure 1000
Early Devonian echinoderms from Victoria (Rhombifera, Blastoidea and Ophiocistioidea) 1000
Hidden Generalizations Phonological Opacity in Optimality Theory 1000
Handbook of Social and Emotional Learning, Second Edition 900
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4924525
求助须知:如何正确求助?哪些是违规求助? 4194571
关于积分的说明 13029123
捐赠科研通 3966454
什么是DOI,文献DOI怎么找? 2173951
邀请新用户注册赠送积分活动 1191426
关于科研通互助平台的介绍 1100971