BioCLIP: A Vision Foundation Model for the Tree of Life

多样性(控制论) 定制 计算机科学 树(集合论) 水准点(测量) 概化理论 编码(集合论) 人工智能 生物学数据 生命之树(生物学) 数据科学 机器学习 生物 地图学 地理 数学分析 生物化学 统计 系统发育学 数学 集合(抽象数据类型) 政治学 基因 法学 遗传学 程序设计语言
作者
Samuel Stevens,Jiaman Wu,Matthew J. Thompson,Elizabeth G Campolongo,Chan Hee Song,David Carlyn,Dong Li,Wasila Dahdul,Charles V. Stewart,Tanya Berger‐Wolf,Wei‐Lun Chao,Yu Su
出处
期刊:Cornell University - arXiv 被引量:5
标识
DOI:10.48550/arxiv.2311.18803
摘要

Images of the natural world, collected by a variety of cameras, from drones to individual phones, are increasingly abundant sources of biological information. There is an explosion of computational methods and tools, particularly computer vision, for extracting biologically relevant information from images for science and conservation. Yet most of these are bespoke approaches designed for a specific task and are not easily adaptable or extendable to new questions, contexts, and datasets. A vision model for general organismal biology questions on images is of timely need. To approach this, we curate and release TreeOfLife-10M, the largest and most diverse ML-ready dataset of biology images. We then develop BioCLIP, a foundation model for the tree of life, leveraging the unique properties of biology captured by TreeOfLife-10M, namely the abundance and variety of images of plants, animals, and fungi, together with the availability of rich structured biological knowledge. We rigorously benchmark our approach on diverse fine-grained biology classification tasks, and find that BioCLIP consistently and substantially outperforms existing baselines (by 17% to 20% absolute). Intrinsic evaluation reveals that BioCLIP has learned a hierarchical representation conforming to the tree of life, shedding light on its strong generalizability. Our code, models and data will be made available at https://github.com/Imageomics/bioclip.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
搁浅完成签到,获得积分10
刚刚
Ava应助LeoMH采纳,获得10
1秒前
玉米发布了新的文献求助10
2秒前
ding应助扬大小汤采纳,获得10
2秒前
王蕊发布了新的文献求助10
2秒前
今后应助slokni采纳,获得10
3秒前
orixero应助嘉丽的后花园采纳,获得10
4秒前
4秒前
mouxq发布了新的文献求助10
6秒前
8秒前
Mr. JDW发布了新的文献求助10
9秒前
9秒前
搁浅发布了新的文献求助10
10秒前
13秒前
ozy完成签到 ,获得积分10
13秒前
15秒前
简单完成签到 ,获得积分10
15秒前
赘婿应助liu采纳,获得10
15秒前
Somogyis驳回了syl应助
16秒前
独孤阳光完成签到,获得积分10
17秒前
cherlia发布了新的文献求助30
19秒前
Mr. JDW完成签到,获得积分10
21秒前
22秒前
田様应助orange9采纳,获得10
24秒前
吴WU完成签到,获得积分10
24秒前
Wayne72完成签到,获得积分10
25秒前
mjsdx发布了新的文献求助10
26秒前
phd发布了新的文献求助10
26秒前
28秒前
29秒前
slokni发布了新的文献求助10
33秒前
cherlia完成签到,获得积分10
34秒前
34秒前
Yuki完成签到 ,获得积分10
35秒前
35秒前
35秒前
35秒前
37秒前
38秒前
39秒前
高分求助中
Востребованный временем 2500
Hopemont Capacity Assessment Interview manual and scoring guide 1000
Injection and Compression Molding Fundamentals 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Mantids of the euro-mediterranean area 600
The Oxford Handbook of Educational Psychology 600
Mantodea of the World: Species Catalog Andrew M 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 基因 遗传学 化学工程 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3422593
求助须知:如何正确求助?哪些是违规求助? 3022882
关于积分的说明 8903083
捐赠科研通 2710404
什么是DOI,文献DOI怎么找? 1486403
科研通“疑难数据库(出版商)”最低求助积分说明 687061
邀请新用户注册赠送积分活动 682285