A Transferable Generative Framework for Multi-Label Zero-Shot Learning

人工智能 计算机科学 模式识别(心理学) 特征(语言学) 水准点(测量) 生成模型 判别式 图像(数学) 嵌入 班级(哲学) 对象(语法) 生成语法 哲学 语言学 大地测量学 地理
作者
Peirong Ma,Zhiquan He,Wu Ran,Hong Lu
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:34 (5): 3409-3423 被引量:5
标识
DOI:10.1109/tcsvt.2023.3324648
摘要

Multi-label zero-shot learning (MLZSL) is a more realistic and challenging task than single-label zero-shot learning (SLZSL), which aims to recognize multiple unseen classes in a single image. To adapt generative models to the MLZSL task and better recognize multiple unseen object categories in an image, this paper proposes a Transferable Generative Framework (TGF), which consists of a Multi-Label Semantic Embedding Autoencoders (SEAs), a Semantic-Related Multi-Label Feature Transformation Network (FTN) and a Multi-Label Feature Generation Networks (FGNs). First, SEAs adaptively encodes the class-level word vectors corresponding to each sample containing different number of classes into sample-level semantic embeddings with the same dimension. Then, FTN transforms global features extracted by a CNN pre-trained on single-label images into features that are semantic-related and more suitable for multi-label classification. Finally, FGNs generates both global and local features to better recognize the dominant and minor object categories in a multi-label image, respectively. Extensive experiments on three benchmark datasets show that TGF significantly outperforms state-of-the-arts. Specifically, compared with the previous best generative MLZSL method ( i.e ., Gen-MLZSL), TGF improves the mAP of the ZSL (GZSL) task by 5.4% (6.9%), 20.5% (27.9%), and 2.4% (3.9%) on NUS-WIDE, Open Images, and MS-COCO datasets, respectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
2秒前
昔年若许完成签到,获得积分10
2秒前
香蕉觅云应助Yan采纳,获得10
2秒前
2秒前
3秒前
4秒前
Ning00000完成签到 ,获得积分10
4秒前
ZXY123456789完成签到,获得积分20
4秒前
luoboxue发布了新的文献求助10
4秒前
子非鱼发布了新的文献求助10
5秒前
爽爽完成签到,获得积分10
5秒前
霜叶完成签到 ,获得积分10
5秒前
6秒前
guvbdki完成签到,获得积分10
6秒前
6秒前
泡泡糖发布了新的文献求助10
8秒前
喜羊羊和村长做朋友完成签到,获得积分10
8秒前
豆豆完成签到 ,获得积分10
8秒前
9秒前
脑洞疼应助昭拉采纳,获得10
9秒前
9秒前
10秒前
11秒前
bbdan发布了新的文献求助10
11秒前
ph0307发布了新的文献求助10
11秒前
guvbdki发布了新的文献求助10
12秒前
可爱的函函应助lfg采纳,获得30
12秒前
12秒前
wyfyq完成签到,获得积分10
12秒前
小毛毛发布了新的文献求助10
13秒前
华仔应助和谐一一采纳,获得10
14秒前
吨吨发布了新的文献求助10
14秒前
14秒前
奕奕完成签到,获得积分10
15秒前
ZXY123456789发布了新的文献求助10
15秒前
张豪杰发布了新的文献求助10
16秒前
煦123完成签到,获得积分20
16秒前
英俊的千万完成签到,获得积分10
16秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2500
Востребованный временем 2500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
지식생태학: 생태학, 죽은 지식을 깨우다 600
海南省蛇咬伤流行病学特征与预后影响因素分析 500
Neuromuscular and Electrodiagnostic Medicine Board Review 500
ランス多機能化技術による溶鋼脱ガス処理の高効率化の研究 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3461594
求助须知:如何正确求助?哪些是违规求助? 3055276
关于积分的说明 9047362
捐赠科研通 2745162
什么是DOI,文献DOI怎么找? 1505991
科研通“疑难数据库(出版商)”最低求助积分说明 695963
邀请新用户注册赠送积分活动 695363