SAWTab: Smoothed Adaptive Weighting for Tabular Data in Semi-supervised Learning

计算机科学 范畴变量 加权 代表(政治) 基数(数据建模) 人工智能 编码(内存) 一般化 机器学习 外部数据表示 空格(标点符号) 模式识别(心理学) 数据挖掘 数学 医学 放射科 数学分析 政治 政治学 法学 操作系统
作者
Morteza Mohammady Gharasuie,Fengjiao Wang,Omar Sharif,Ravi Mukkamala
出处
期刊:Lecture Notes in Computer Science 卷期号:: 316-328
标识
DOI:10.1007/978-981-97-2259-4_24
摘要

Self-supervised and Semi-supervised learning (SSL) on tabular data is an understudied topic. Despite some attempts, there are two major challenges: 1. Imbalanced nature in the tabular dataset; 2. The one-hot encoding used in these methods becomes less efficient for high-cardinality categorical features. To cope with the challenges, we propose SAWTab which uses a target encoding method, Conditional Probability Representation (CPR), for efficient representation in the input space of categorical features. We improve this representation by incorporating the unlabeled samples through pseudo-labels. Furthermore, we propose a Smooth Adaptive Weighting mechanism in the target encoding to mitigate the issue of noisy and biased pseudo-labels. Experimental results on various datasets and comparisons with existing frameworks show that SAWTab yields best test accuracy on all datasets. We find that pseudo-labels can help improve the input space representation in the SSL setting, which enhances the generalization of the learning algorithm.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
shy完成签到 ,获得积分10
1秒前
菜鸡5号发布了新的文献求助20
1秒前
2秒前
3秒前
qqq完成签到 ,获得积分10
3秒前
Cozy完成签到,获得积分10
5秒前
娜娜梨发布了新的文献求助10
5秒前
蓝桥兰灯完成签到,获得积分10
6秒前
6秒前
6秒前
abigail29发布了新的文献求助10
8秒前
小魏完成签到,获得积分10
9秒前
10秒前
001026Z完成签到,获得积分10
10秒前
哈哈就是你哦完成签到,获得积分20
11秒前
Karry发布了新的文献求助10
11秒前
燕燕于飞发布了新的文献求助10
11秒前
温柔冬天完成签到,获得积分10
11秒前
研友_Z33pmZ完成签到,获得积分10
11秒前
3152发布了新的文献求助30
12秒前
Ohh发布了新的文献求助10
12秒前
可爱的函函应助L_采纳,获得10
13秒前
武安发布了新的文献求助10
14秒前
14秒前
lala完成签到 ,获得积分10
15秒前
领导范儿应助燕燕于飞采纳,获得10
16秒前
16秒前
Mr.xu完成签到,获得积分10
18秒前
阿菜完成签到,获得积分10
18秒前
扑火飞蛾完成签到,获得积分10
18秒前
nffl完成签到,获得积分10
19秒前
顺利怀亦发布了新的文献求助10
19秒前
20秒前
DDS发布了新的文献求助10
23秒前
24秒前
深情安青应助科研通管家采纳,获得10
25秒前
土豆王完成签到,获得积分10
25秒前
wy.he应助科研通管家采纳,获得50
25秒前
科研通AI2S应助科研通管家采纳,获得10
25秒前
李爱国应助科研通管家采纳,获得10
25秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Applied Min-Max Approach to Missile Guidance and Control 5000
Metallurgy at high pressures and high temperatures 2000
Inorganic Chemistry Eighth Edition 1200
The Organic Chemistry of Biological Pathways Second Edition 1000
The Psychological Quest for Meaning 800
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6326655
求助须知:如何正确求助?哪些是违规求助? 8143385
关于积分的说明 17075120
捐赠科研通 5380254
什么是DOI,文献DOI怎么找? 2854344
邀请新用户注册赠送积分活动 1831959
关于科研通互助平台的介绍 1683204