IMKGA-SM: Interpretable Multimodal Knowledge Graph Answer Prediction via Sequence Modeling

计算机科学 人工智能 可解释性 机器学习 多模式学习 图形 推论 模式识别(心理学) 理论计算机科学
作者
Yilin Wen,Biao Luo,Yuqian Zhao
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2301.02445
摘要

Multimodal knowledge graph link prediction aims to improve the accuracy and efficiency of link prediction tasks for multimodal data. However, for complex multimodal information and sparse training data, it is usually difficult to achieve interpretability and high accuracy simultaneously for most methods. To address this difficulty, a new model is developed in this paper, namely Interpretable Multimodal Knowledge Graph Answer Prediction via Sequence Modeling (IMKGA-SM). First, a multi-modal fine-grained fusion method is proposed, and Vgg16 and Optical Character Recognition (OCR) techniques are adopted to effectively extract text information from images and images. Then, the knowledge graph link prediction task is modelled as an offline reinforcement learning Markov decision model, which is then abstracted into a unified sequence framework. An interactive perception-based reward expectation mechanism and a special causal masking mechanism are designed, which "converts" the query into an inference path. Then, an autoregressive dynamic gradient adjustment mechanism is proposed to alleviate the insufficient problem of multimodal optimization. Finally, two datasets are adopted for experiments, and the popular SOTA baselines are used for comparison. The results show that the developed IMKGA-SM achieves much better performance than SOTA baselines on multimodal link prediction datasets of different sizes.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
西门放狗发布了新的文献求助10
1秒前
Keira完成签到,获得积分10
2秒前
2秒前
wangruize发布了新的文献求助10
3秒前
3秒前
4秒前
完美世界应助Cici采纳,获得10
4秒前
5秒前
5秒前
旺旺猫尼完成签到,获得积分10
5秒前
Owen应助胖头鱼采纳,获得10
6秒前
6秒前
Akim应助渠安采纳,获得10
6秒前
万能图书馆应助灰色与青采纳,获得10
6秒前
苏紫梗桔发布了新的文献求助10
6秒前
8秒前
Xijiao_Mu发布了新的文献求助10
8秒前
既白发布了新的文献求助10
9秒前
aq发布了新的文献求助10
10秒前
ding应助charolte采纳,获得10
10秒前
10秒前
zy应助科研通管家采纳,获得20
11秒前
只是听说发布了新的文献求助10
11秒前
FashionBoy应助科研通管家采纳,获得10
11秒前
11秒前
wanci应助科研通管家采纳,获得10
11秒前
NexusExplorer应助科研通管家采纳,获得10
11秒前
11秒前
11秒前
科目三应助科研通管家采纳,获得10
11秒前
11秒前
11秒前
我是老大应助科研通管家采纳,获得10
11秒前
乐乐应助科研通管家采纳,获得10
12秒前
12秒前
FashionBoy应助科研通管家采纳,获得10
12秒前
星辰大海应助科研通管家采纳,获得30
12秒前
隐形曼青应助科研通管家采纳,获得10
12秒前
张欢馨应助科研通管家采纳,获得30
12秒前
12秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
晶种分解过程与铝酸钠溶液混合强度关系的探讨 8888
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
Signals, Systems, and Signal Processing 610
The Sage Handbook of Digital Labour 600
汪玉姣:《金钱与血脉:泰国侨批商业帝国的百年激荡(1850年代-1990年代)》(2025) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6416696
求助须知:如何正确求助?哪些是违规求助? 8235877
关于积分的说明 17493396
捐赠科研通 5469603
什么是DOI,文献DOI怎么找? 2889578
邀请新用户注册赠送积分活动 1866568
关于科研通互助平台的介绍 1703745