Facing small and biased data dilemma in drug discovery with enhanced federated learning approaches

计算机科学 药物发现 困境 机器学习 联合学习 数据科学 人工智能 数据质量 数据挖掘 生物信息学 工程类 运营管理 生物 认识论 哲学 公制(单位)
作者
Zhaoping Xiong,Ziqiang Cheng,Xinyuan Lin,Chi Xu,Xiaohong Liu,Dingyan Wang,Xiaomin Luo,Yong Zhang,Hualiang Jiang,Nan Qiao,Mingyue Zheng
出处
期刊:Science China-life Sciences [Springer Nature]
卷期号:65 (3): 529-539 被引量:22
标识
DOI:10.1007/s11427-021-1946-0
摘要

Artificial intelligence (AI) models usually require large amounts of high-quality training data, which is in striking contrast to the situation of small and biased data faced by current drug discovery pipelines. The concept of federated learning has been proposed to utilize distributed data from different sources without leaking sensitive information of the data. This emerging decentralized machine learning paradigm is expected to dramatically improve the success rate of AI-powered drug discovery. Here, we simulated the federated learning process with different property and activity datasets from different sources, among which overlapping molecules with high or low biases exist in the recorded values. Beyond the benefit of gaining more data, we also demonstrated that federated training has a regularization effect superior to centralized training on the pooled datasets with high biases. Moreover, different network architectures for clients and aggregation algorithms for coordinators have been compared on the performance of federated learning, where personalized federated learning shows promising results. Our work demonstrates the applicability of federated learning in predicting drug-related properties and highlights its promising role in addressing the small and biased data dilemma in drug discovery.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Lll发布了新的文献求助10
1秒前
邢绿凝发布了新的文献求助10
1秒前
1秒前
1秒前
Jasper应助kame采纳,获得10
2秒前
3秒前
3秒前
wangmin关注了科研通微信公众号
3秒前
4秒前
YHY完成签到,获得积分10
4秒前
shisong发布了新的文献求助10
5秒前
yyyy完成签到,获得积分10
5秒前
5秒前
bkagyin应助lynn_zhang采纳,获得10
5秒前
scm发布了新的文献求助10
6秒前
li发布了新的文献求助10
6秒前
分歧者咋咋完成签到,获得积分10
7秒前
8秒前
文献查找完成签到,获得积分10
8秒前
Nahuy完成签到 ,获得积分10
9秒前
9秒前
时尚的八宝粥完成签到 ,获得积分10
9秒前
文静梦菡关注了科研通微信公众号
10秒前
yyyy发布了新的文献求助10
10秒前
chloe完成签到,获得积分10
11秒前
可爱的函函应助大白采纳,获得10
11秒前
星辰大海应助tough采纳,获得20
12秒前
12秒前
辕辰发布了新的文献求助10
12秒前
12秒前
13秒前
MZ完成签到,获得积分10
13秒前
shisong完成签到,获得积分10
14秒前
赵悦彤发布了新的文献求助10
14秒前
开心的白昼完成签到,获得积分10
15秒前
16秒前
Lucas应助DQY采纳,获得10
17秒前
星辰大海应助许三多采纳,获得10
17秒前
钮白桃发布了新的文献求助10
17秒前
流星止水完成签到 ,获得积分10
17秒前
高分求助中
Evolution 10000
ISSN 2159-8274 EISSN 2159-8290 1000
Becoming: An Introduction to Jung's Concept of Individuation 600
Distribution Dependent Stochastic Differential Equations 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3159344
求助须知:如何正确求助?哪些是违规求助? 2810413
关于积分的说明 7887812
捐赠科研通 2469306
什么是DOI,文献DOI怎么找? 1314746
科研通“疑难数据库(出版商)”最低求助积分说明 630710
版权声明 602012