Asymptotic Distribution-Free Independence Test for High-Dimension Data

维数(图论) 独立性(概率论) 考试(生物学) 渐近分布 计量经济学 应用数学 数学 组合数学 统计 地质学 古生物学 估计员
作者
Zhanrui Cai,Jing Lei,Kathryn Roeder
标识
DOI:10.1080/01621459.2023.2218030
摘要

Test of independence is of fundamental importance in modern data analysis, with broad applications in variable selection, graphical models, and causal inference. When the data is high dimensional and the potential dependence signal is sparse, independence testing becomes very challenging without distributional or structural assumptions. In this paper, we propose a general framework for independence testing by first fitting a classifier that distinguishes the joint and product distributions, and then testing the significance of the fitted classifier. This framework allows us to borrow the strength of the most advanced classification algorithms developed from the modern machine learning community, making it applicable to high dimensional, complex data. By combining a sample split and a fixed permutation, our test statistic has a universal, fixed Gaussian null distribution that is independent of the underlying data distribution. Extensive simulations demonstrate the advantages of the newly proposed test compared with existing methods. We further apply the new test to a single cell data set to test the independence between two types of single cell sequencing measurements, whose high dimensionality and sparsity make existing methods hard to apply.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
123456qi完成签到,获得积分10
2秒前
bigpluto完成签到,获得积分0
4秒前
重要的溪流完成签到,获得积分10
4秒前
DoctorSUN完成签到,获得积分10
5秒前
YANGMJ完成签到,获得积分10
6秒前
xiong完成签到,获得积分10
7秒前
8秒前
和谐的万宝路完成签到,获得积分10
8秒前
清秀凡霜完成签到,获得积分0
8秒前
科研人完成签到,获得积分10
10秒前
cttc发布了新的文献求助20
11秒前
wave完成签到,获得积分10
13秒前
MADAO完成签到 ,获得积分10
14秒前
土豆酱完成签到 ,获得积分10
18秒前
21秒前
健康的雁凡完成签到,获得积分10
21秒前
岳博完成签到,获得积分10
22秒前
三水完成签到,获得积分10
22秒前
Dreamhappy完成签到,获得积分10
23秒前
yuan完成签到,获得积分10
23秒前
99完成签到 ,获得积分10
24秒前
lzr完成签到 ,获得积分10
25秒前
Gavin完成签到,获得积分10
25秒前
YHBBZ完成签到 ,获得积分10
26秒前
昏睡的静丹完成签到,获得积分10
26秒前
27秒前
渠建武完成签到 ,获得积分10
28秒前
ljl完成签到,获得积分10
28秒前
kitsch完成签到 ,获得积分10
28秒前
百步穿小杨完成签到,获得积分10
29秒前
微笑的天抒完成签到,获得积分10
29秒前
1234@完成签到 ,获得积分10
30秒前
在水一方应助阳光胜采纳,获得10
30秒前
topsun发布了新的文献求助10
30秒前
科研通AI2S应助Darsine采纳,获得10
31秒前
兴奋平露完成签到,获得积分10
33秒前
单纯的乐曲完成签到,获得积分10
33秒前
111完成签到 ,获得积分10
34秒前
jason完成签到 ,获得积分10
36秒前
可爱的小福宝完成签到,获得积分10
38秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cronologia da história de Macau 5000
咳嗽・喀痰の診療ガイドライン第2版2025 800
Petrology and Plate Tectonics 800
Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600
Electrode Potentials 550
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7006371
求助须知:如何正确求助?哪些是违规求助? 8680875
关于积分的说明 18400296
捐赠科研通 6488698
什么是DOI,文献DOI怎么找? 3103201
关于科研通互助平台的介绍 2170878
邀请新用户注册赠送积分活动 2079366