清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Multi-modal Mutual Topic Reinforce Modeling for Cross-media Retrieval

计算机科学 判别式 情态动词 概率潜在语义分析 人工智能 模式 相互信息 水准点(测量) 一致性(知识库) 概率逻辑 主题模型 机器学习 图形模型 自然语言处理 班级(哲学) 过程(计算) 情报检索 社会科学 化学 大地测量学 社会学 高分子化学 地理 操作系统
作者
Yanfei Wang,Fei Wu,Jun Song,Xi Li,Yueting Zhuang
标识
DOI:10.1145/2647868.2654901
摘要

As an important and challenging problem in the multimedia area, multi-modal data understanding aims to explore the intrinsic semantic information across different modalities in a collaborative manner. To address this problem, a possible solution is to effectively and adaptively capture the common cross-modal semantic information by modeling the inherent correlations between the latent topics from different modalities. Motivated by this task, we propose a supervised multi-modal mutual topic reinforce modeling (M$^3$R) approach, which seeks to build a joint cross-modal probabilistic graphical model for discovering the mutually consistent semantic topics via appropriate interactions between model factors (e.g., categories, latent topics and observed multi-modal data). In principle, M$^3$R is capable of simultaneously accomplishing the following two learning tasks: 1) modality-specific (e.g., image-specific or text-specific ) latent topic learning; and 2) cross-modal mutual topic consistency learning. By investigating the cross-modal topic-related distribution information, M$^3$R encourages to disentangle the semantically consistent cross-modal topics (containing some common semantic information across different modalities). In other words, the semantically co-occurring cross-modal topics are reinforced by M$^3$R through adaptively passing the mutually reinforced messages to each other in the model-learning process. To further enhance the discriminative power of the learned latent topic representations, M$^3$R incorporates the auxiliary information (i.e., categories or labels) into the process of Bayesian modeling, which boosts the modeling capability of capturing the inter-class discriminative information. Experimental results over two benchmark datasets demonstrate the effectiveness of the proposed M$^3$R in cross-modal retrieval.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
量子星尘发布了新的文献求助10
13秒前
bc应助科研通管家采纳,获得10
15秒前
16秒前
睿睿斌斌完成签到,获得积分10
16秒前
lynn完成签到 ,获得积分10
18秒前
量子星尘发布了新的文献求助10
23秒前
26秒前
36秒前
量子星尘发布了新的文献求助10
40秒前
LT完成签到 ,获得积分0
42秒前
45秒前
量子星尘发布了新的文献求助10
54秒前
57秒前
poppysss完成签到,获得积分10
59秒前
量子星尘发布了新的文献求助10
1分钟前
1分钟前
飞云完成签到 ,获得积分10
1分钟前
1分钟前
量子星尘发布了新的文献求助10
1分钟前
1分钟前
量子星尘发布了新的文献求助10
1分钟前
1分钟前
dreamwalk完成签到 ,获得积分10
1分钟前
沉静香氛完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
Johnson完成签到 ,获得积分10
1分钟前
1分钟前
新奇完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
2分钟前
2分钟前
2分钟前
三人水明完成签到 ,获得积分10
2分钟前
量子星尘发布了新的文献求助10
2分钟前
青桔柠檬完成签到 ,获得积分10
2分钟前
bc应助科研通管家采纳,获得10
2分钟前
2分钟前
2分钟前
量子星尘发布了新的文献求助10
2分钟前
兜兜揣满糖完成签到 ,获得积分10
2分钟前
lingling完成签到 ,获得积分10
2分钟前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
Statistical Methods for the Social Sciences, Global Edition, 6th edition 600
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
Walter Gilbert: Selected Works 500
An Annotated Checklist of Dinosaur Species by Continent 500
岡本唐貴自伝的回想画集 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3661095
求助须知:如何正确求助?哪些是违规求助? 3222235
关于积分的说明 9744098
捐赠科研通 2931862
什么是DOI,文献DOI怎么找? 1605234
邀请新用户注册赠送积分活动 757780
科研通“疑难数据库(出版商)”最低求助积分说明 734549