TabDDPM: Modelling Tabular Data with Diffusion Models

计算机科学 图形 扩散 概率逻辑 数据挖掘 生成语法 特征(语言学) 生成模型 数据科学 机器学习 人工智能 理论计算机科学 语言学 热力学 物理 哲学
作者
Akim Kotelnikov,Dmitry Baranchuk,Ivan Rubachev,Artem Babenko
出处
期刊:Cornell University - arXiv 被引量:28
标识
DOI:10.48550/arxiv.2209.15421
摘要

Denoising diffusion probabilistic models are currently becoming the leading paradigm of generative modeling for many important data modalities. Being the most prevalent in the computer vision community, diffusion models have also recently gained some attention in other domains, including speech, NLP, and graph-like data. In this work, we investigate if the framework of diffusion models can be advantageous for general tabular problems, where datapoints are typically represented by vectors of heterogeneous features. The inherent heterogeneity of tabular data makes it quite challenging for accurate modeling, since the individual features can be of completely different nature, i.e., some of them can be continuous and some of them can be discrete. To address such data types, we introduce TabDDPM -- a diffusion model that can be universally applied to any tabular dataset and handles any type of feature. We extensively evaluate TabDDPM on a wide set of benchmarks and demonstrate its superiority over existing GAN/VAE alternatives, which is consistent with the advantage of diffusion models in other fields. Additionally, we show that TabDDPM is eligible for privacy-oriented setups, where the original datapoints cannot be publicly shared.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ruaruaburua发布了新的文献求助10
1秒前
1秒前
2秒前
2秒前
aria发布了新的文献求助20
2秒前
Aurora完成签到,获得积分20
3秒前
4秒前
吴陈发布了新的文献求助10
5秒前
5秒前
5秒前
songlf23发布了新的文献求助10
7秒前
Dan发布了新的文献求助10
7秒前
7秒前
明明就完成签到,获得积分10
7秒前
安静河马完成签到,获得积分10
7秒前
烟花应助完美的晓刚采纳,获得10
8秒前
晒太阳发布了新的文献求助50
8秒前
完美世界应助体贴怜翠采纳,获得20
8秒前
Anonyme完成签到,获得积分10
8秒前
CodeCraft应助wangyue2024采纳,获得10
8秒前
9秒前
子铭发布了新的文献求助10
9秒前
笨笨猪完成签到,获得积分10
9秒前
ab发布了新的文献求助10
10秒前
明明就发布了新的文献求助10
11秒前
dr_luo发布了新的文献求助10
11秒前
周周发布了新的文献求助150
11秒前
12秒前
酷波er应助豆皮下决心采纳,获得10
12秒前
华仔应助zfh1341采纳,获得10
12秒前
bluelu发布了新的文献求助10
12秒前
赘婿应助surain采纳,获得10
13秒前
栗子发布了新的文献求助10
13秒前
YKB发布了新的文献求助10
14秒前
15秒前
清脆靳发布了新的文献求助30
15秒前
16秒前
17秒前
18秒前
hhhh发布了新的文献求助10
19秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Kelsen’s Legacy: Legal Normativity, International Law and Democracy 1000
Conference Record, IAS Annual Meeting 1977 610
Interest Rate Modeling. Volume 3: Products and Risk Management 600
Interest Rate Modeling. Volume 2: Term Structure Models 600
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3542598
求助须知:如何正确求助?哪些是违规求助? 3119973
关于积分的说明 9341143
捐赠科研通 2818043
什么是DOI,文献DOI怎么找? 1549287
邀请新用户注册赠送积分活动 722093
科研通“疑难数据库(出版商)”最低求助积分说明 712928