Deep Reinforcement Learning (DRL): Another Perspective for Unsupervised Wireless Localization

计算机科学 RSS 强化学习 无线 马尔可夫决策过程 蓝牙 无线网络 无监督学习 位置感知 人工智能 过程(计算) 机器学习 无线传感器网络 马尔可夫过程 计算机网络 电信 统计 操作系统 数学
作者
You Li,Xin Hu,Yuan Zhuang,Zhouzheng Gao,Peng Zhang,Naser El‐Sheimy
出处
期刊:IEEE Internet of Things Journal [Institute of Electrical and Electronics Engineers]
卷期号:7 (7): 6279-6287 被引量:34
标识
DOI:10.1109/jiot.2019.2957778
摘要

Location is key to spatialize internet-of-things (IoT) data. However, it is challenging to use low-cost IoT devices for robust unsupervised localization (i.e., localization without training data that have known location labels). Thus, this paper proposes a deep reinforcement learning (DRL) based unsupervised wireless-localization method. The main contributions are as follows. (1) This paper proposes an approach to model a continuous wireless-localization process as a Markov decision process (MDP) and process it within a DRL framework. (2) To alleviate the challenge of obtaining rewards when using unlabeled data (e.g., daily-life crowdsourced data), this paper presents a reward-setting mechanism, which extracts robust landmark data from unlabeled wireless received signal strengths (RSS). (3) To ease requirements for model re-training when using DRL for localization, this paper uses RSS measurements together with agent location to construct DRL inputs. The proposed method was tested by using field testing data from multiple Bluetooth 5 smart ear tags in a pasture. Meanwhile, the experimental verification process reflected the advantages and challenges for using DRL in wireless localization.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
hao完成签到 ,获得积分10
2秒前
情怀应助乞丐采纳,获得10
2秒前
林妹妹完成签到,获得积分10
2秒前
Hello应助kigyccwh采纳,获得10
4秒前
4秒前
4秒前
皮皮完成签到 ,获得积分10
5秒前
5秒前
bmbm完成签到 ,获得积分20
6秒前
科研通AI5应助洋芋采纳,获得10
6秒前
7秒前
冲冲冲发布了新的文献求助10
7秒前
Priscilla发布了新的文献求助10
8秒前
今后应助Leona666采纳,获得10
8秒前
JayZZero发布了新的文献求助10
9秒前
京苏完成签到,获得积分10
9秒前
YOLO完成签到,获得积分10
10秒前
小吴小吴完成签到,获得积分10
10秒前
11秒前
SYLH应助Patty采纳,获得10
11秒前
hm发布了新的文献求助10
11秒前
11秒前
CodeCraft应助滴答滴答滴采纳,获得10
12秒前
Owen应助韩麒嘉采纳,获得10
12秒前
12秒前
勤恳迎梦完成签到,获得积分10
13秒前
15秒前
16秒前
17秒前
QJ完成签到,获得积分10
17秒前
zxh发布了新的文献求助10
17秒前
18秒前
18秒前
天天快乐应助hm采纳,获得10
19秒前
QJ发布了新的文献求助10
19秒前
perma123完成签到 ,获得积分10
20秒前
Priscilla完成签到,获得积分10
20秒前
20秒前
优美语风发布了新的文献求助10
20秒前
高分求助中
Genetics: From Genes to Genomes 3000
Continuum thermodynamics and material modelling 3000
Production Logging: Theoretical and Interpretive Elements 2500
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 2000
Applications of Emerging Nanomaterials and Nanotechnology 1111
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Theory of Block Polymer Self-Assembly 750
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3475278
求助须知:如何正确求助?哪些是违规求助? 3067370
关于积分的说明 9103709
捐赠科研通 2758761
什么是DOI,文献DOI怎么找? 1513790
邀请新用户注册赠送积分活动 699798
科研通“疑难数据库(出版商)”最低求助积分说明 699160