Online Learning and Decision-Making under Generalized Linear Model with High-Dimensional Data

估计员 极小极大 后悔 维数(图论) 数学优化 数学 Lasso(编程语言) 水准点(测量) 计算机科学 甲骨文公司 线性模型 算法 统计 组合数学 地理 万维网 软件工程 大地测量学
作者
Xue Wang,Mike Mingcheng Wei,Tao Yao
出处
期刊:Cornell University - arXiv 被引量:2
标识
DOI:10.48550/arxiv.1812.02962
摘要

We propose a minimax concave penalized multi-armed bandit algorithm under generalized linear model (G-MCP-Bandit) for a decision-maker facing high-dimensional data in an online learning and decision-making process. We demonstrate that the G-MCP-Bandit algorithm asymptotically achieves the optimal cumulative regret in the sample size dimension T , O(log T), and further attains a tight bound in the covariate dimension d, O(log d). In addition, we develop a linear approximation method, the 2-step weighted Lasso procedure, to identify the MCP estimator for the G-MCP-Bandit algorithm under non-iid samples. Under this procedure, the MCP estimator matches the oracle estimator with high probability and converges to the true parameters with the optimal convergence rate. Finally, through experiments based on synthetic data and two real datasets (warfarin dosing dataset and Tencent search advertising dataset), we show that the G-MCP-Bandit algorithm outperforms other benchmark algorithms, especially when there is a high level of data sparsity or the decision set is large.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
chuu发布了新的文献求助10
刚刚
欢呼的谷兰完成签到,获得积分10
2秒前
3秒前
盒子应助小鱼儿不语雨采纳,获得10
6秒前
华仔应助Heidi采纳,获得10
10秒前
eeeee完成签到,获得积分10
11秒前
田様应助lwxuan采纳,获得10
11秒前
12秒前
12秒前
15秒前
15秒前
天天快乐应助小叮当采纳,获得10
15秒前
16秒前
故城发布了新的文献求助10
18秒前
Lucas应助科研狗头军师采纳,获得10
19秒前
21秒前
llllllll完成签到,获得积分10
21秒前
22秒前
暴富小羊完成签到,获得积分20
23秒前
23秒前
Lynn完成签到,获得积分0
23秒前
24秒前
迅速孤容完成签到 ,获得积分10
24秒前
ding应助顾北采纳,获得10
27秒前
eeeee发布了新的文献求助10
28秒前
29秒前
十一发布了新的文献求助10
30秒前
自信的紫青完成签到,获得积分20
30秒前
英姑应助大妈采纳,获得10
30秒前
Jasper应助lurongjun采纳,获得50
31秒前
32秒前
孤蚀月发布了新的文献求助10
34秒前
右手边的幸福完成签到,获得积分10
35秒前
北方有俞完成签到,获得积分10
36秒前
顾北发布了新的文献求助10
38秒前
Moonflower发布了新的文献求助20
39秒前
1111完成签到,获得积分10
40秒前
科研小白发布了新的文献求助10
43秒前
Akim应助1111采纳,获得10
44秒前
Foch发布了新的文献求助10
44秒前
高分求助中
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 888
Le dégorgement réflexe des Acridiens 800
Defense against predation 800
Very-high-order BVD Schemes Using β-variable THINC Method 568
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3136252
求助须知:如何正确求助?哪些是违规求助? 2787284
关于积分的说明 7780707
捐赠科研通 2443292
什么是DOI,文献DOI怎么找? 1299034
科研通“疑难数据库(出版商)”最低求助积分说明 625318
版权声明 600888