The value of human data annotation for machine learning based anomaly detection in environmental systems

异常检测 计算机科学 人工智能 机器学习 注释 异常(物理) 优势和劣势 无监督学习 过程(计算) 监督学习 数据挖掘 人工神经网络 哲学 物理 认识论 凝聚态物理 操作系统
作者
Stefania Russo,Michael D. Besmer,Frank Blumensaat,Damien Bouffard,Andy Disch,Frederik Hammes,Angelika Hess,Moritz Lürig,Blake Matthews,Camille Minaudo,Eberhard Morgenroth,Viet Tran-Khac,Kris Villez
出处
期刊:Water Research [Elsevier BV]
卷期号:206: 117695-117695 被引量:30
标识
DOI:10.1016/j.watres.2021.117695
摘要

Anomaly detection is the process of identifying unexpected data samples in datasets. Automated anomaly detection is either performed using supervised machine learning models, which require a labelled dataset for their calibration, or unsupervised models, which do not require labels. While academic research has produced a vast array of tools and machine learning models for automated anomaly detection, the research community focused on environmental systems still lacks a comparative analysis that is simultaneously comprehensive, objective, and systematic. This knowledge gap is addressed for the first time in this study, where 15 different supervised and unsupervised anomaly detection models are evaluated on 5 different environmental datasets from engineered and natural aquatic systems. To this end, anomaly detection performance, labelling efforts, as well as the impact of model and algorithm tuning are taken into account. As a result, our analysis reveals the relative strengths and weaknesses of the different approaches in an objective manner without bias for any particular paradigm in machine learning. Most importantly, our results show that expert-based data annotation is extremely valuable for anomaly detection based on machine learning.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Jasper应助jun采纳,获得10
1秒前
Cik发布了新的文献求助10
1秒前
研友_VZG7GZ应助Smile采纳,获得10
1秒前
zz完成签到,获得积分10
2秒前
又又发布了新的文献求助20
2秒前
大大乖兔发布了新的文献求助10
3秒前
慕青应助为什么不可用采纳,获得10
3秒前
3秒前
3秒前
3秒前
蒙眼过河完成签到,获得积分10
3秒前
牛波一发布了新的文献求助10
4秒前
4秒前
4秒前
CC发布了新的文献求助50
4秒前
Owen应助koly采纳,获得30
4秒前
闪闪白亦完成签到 ,获得积分10
4秒前
JamesPei应助研友_5Y9775采纳,获得10
5秒前
樘樘发布了新的文献求助10
6秒前
无花果应助郑雯予采纳,获得10
6秒前
CCsci完成签到 ,获得积分10
6秒前
苏苏发布了新的文献求助10
7秒前
开心友儿发布了新的文献求助10
7秒前
和谐念文发布了新的文献求助30
8秒前
min20210429发布了新的文献求助10
8秒前
8秒前
辛辛酱发布了新的文献求助10
9秒前
樘樘完成签到,获得积分10
10秒前
10秒前
还单身的晓夏完成签到,获得积分10
10秒前
迅速的萃发布了新的文献求助10
12秒前
许润培发布了新的文献求助10
12秒前
科研通AI6.1应助HIMINNN采纳,获得10
13秒前
14秒前
正好完成签到,获得积分10
15秒前
15秒前
ccmow完成签到,获得积分10
15秒前
orchid发布了新的文献求助10
16秒前
16秒前
空城旧梦完成签到 ,获得积分10
16秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Metallurgy at high pressures and high temperatures 2000
Tier 1 Checklists for Seismic Evaluation and Retrofit of Existing Buildings 1000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 1000
The Organic Chemistry of Biological Pathways Second Edition 1000
Free parameter models in liquid scintillation counting 1000
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6331174
求助须知:如何正确求助?哪些是违规求助? 8147605
关于积分的说明 17097129
捐赠科研通 5386857
什么是DOI,文献DOI怎么找? 2855984
邀请新用户注册赠送积分活动 1833404
关于科研通互助平台的介绍 1684801