Multimodal Dynamic Pricing

后悔 平滑度 数学优化 航程(航空) 动态定价 计算机科学 区间(图论) 功能(生物学) 多武装匪徒 非参数统计 匹配(统计) 上下界 数学 计量经济学 机器学习 经济 统计 组合数学 生物 数学分析 复合材料 微观经济学 材料科学 进化生物学
作者
Yining Wang,Boxiao Chen,David Simchi‐Levi
出处
期刊:Management Science [Institute for Operations Research and the Management Sciences]
卷期号:67 (10): 6136-6152 被引量:37
标识
DOI:10.1287/mnsc.2020.3819
摘要

We consider a single product dynamic pricing with demand learning. The candidate prices belong to a wide range of a price interval; the modeling of the demand functions is nonparametric in nature, imposing only smoothness regularity conditions. One important aspect of our model is the possibility of the expected reward function to be nonconcave and indeed multimodal, which leads to many conceptual and technical challenges. Our proposed algorithm is inspired by both the Upper-Confidence-Bound algorithm for multiarmed bandit and the Optimism-in-the-Face-of-Uncertainty principle arising from linear contextual bandits. The multiarmed bandit formulation arises from local-bin approximation of an unknown continuous demand function, and the linear contextual bandit formulation is then applied to obtain more accurate local polynomial approximators within each bin. Through rigorous regret analysis, we demonstrate that our proposed algorithm achieves optimal worst-case regret over a wide range of smooth function classes. More specifically, for k-times smooth functions and T selling periods, the regret of our proposed algorithm is [Formula: see text], which is shown to be optimal via the development of information theoretical lower bounds. We also show that in special cases, such as strongly concave or infinitely smooth reward functions, our algorithm achieves an [Formula: see text] regret, matching optimal regret established in previous works. Finally, we present computational results that verify the effectiveness of our method in numerical simulations. This paper was accepted by J. George Shanthikumar, big data analytics.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
沉默烨霖完成签到,获得积分10
1秒前
SYLH应助科研通管家采纳,获得10
1秒前
CipherSage应助科研通管家采纳,获得10
1秒前
刘昱君发布了新的文献求助30
1秒前
NexusExplorer应助科研通管家采纳,获得10
2秒前
Ava应助科研通管家采纳,获得10
2秒前
stszd完成签到,获得积分10
2秒前
2秒前
所所应助科研通管家采纳,获得10
2秒前
充电宝应助科研通管家采纳,获得10
2秒前
桐桐应助科研通管家采纳,获得10
2秒前
顾矜应助科研通管家采纳,获得10
2秒前
科研通AI2S应助科研通管家采纳,获得10
2秒前
SYLH应助科研通管家采纳,获得10
2秒前
桐桐应助科研通管家采纳,获得10
2秒前
情怀应助科研通管家采纳,获得10
2秒前
沉默烨霖发布了新的文献求助10
3秒前
练习者发布了新的文献求助10
4秒前
5秒前
LEETHEO完成签到,获得积分10
5秒前
自信雨安完成签到 ,获得积分10
7秒前
7秒前
7秒前
8秒前
俏皮短靴完成签到,获得积分10
8秒前
9秒前
小二郎应助happyrrc采纳,获得10
9秒前
10秒前
10秒前
zhangdatong发布了新的文献求助30
10秒前
小王完成签到,获得积分10
11秒前
1824100624完成签到,获得积分10
11秒前
忐忑的可仁完成签到,获得积分20
12秒前
Serendipity给mm的求助进行了留言
13秒前
yemuan完成签到,获得积分0
13秒前
烨小冯完成签到,获得积分10
13秒前
13秒前
道阻且长发布了新的文献求助10
14秒前
是风动完成签到 ,获得积分10
14秒前
董小李完成签到,获得积分10
14秒前
高分求助中
Continuum Thermodynamics and Material Modelling 4000
Production Logging: Theoretical and Interpretive Elements 2700
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
El viaje de una vida: Memorias de María Lecea 800
Theory of Block Polymer Self-Assembly 750
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3512208
求助须知:如何正确求助?哪些是违规求助? 3094667
关于积分的说明 9224183
捐赠科研通 2789467
什么是DOI,文献DOI怎么找? 1530709
邀请新用户注册赠送积分活动 711048
科研通“疑难数据库(出版商)”最低求助积分说明 706518