清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Multimodal fusion using learned text concepts for image categorization

人工智能 分类 计算机科学 模式识别(心理学) 图像(数学) 上下文图像分类 支持向量机 集合(抽象数据类型) 图像融合 融合 自然语言处理 计算机视觉 语言学 哲学 程序设计语言
作者
Qiang Zhu,Mei-Chen Yeh,Kwang‐Ting Cheng
标识
DOI:10.1145/1180639.1180698
摘要

Conventional image categorization techniques primarily rely on low-level visual cues. In this paper, we describe a multimodal fusion scheme which improves the image classification accuracy by incorporating the information derived from the embedded texts detected in the image under classification. Specific to each image category, a text concept is first learned from a set of labeled texts in images of the target category using Multiple Instance Learning [1]. For an image under classification which contains multiple detected text lines, we calculate a weighted Euclidian distance between each text line and the learned text concept of the target category. Subsequently, the minimum distance, along with low-level visual cues, are jointly used as the features for SVM-based classification. Experiments on a challenging image database demonstrate that the proposed fusion framework achieves a higher accuracy than the state-of-art methods for image classification.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
迈克老狼完成签到 ,获得积分10
3秒前
和谐续完成签到 ,获得积分10
3秒前
失眠的霸发布了新的文献求助10
4秒前
澄子完成签到 ,获得积分10
20秒前
坦率的从波完成签到 ,获得积分10
28秒前
clock完成签到 ,获得积分10
37秒前
我很好完成签到 ,获得积分10
39秒前
MchemG应助wpeng326采纳,获得100
52秒前
racill完成签到 ,获得积分10
53秒前
行云流水完成签到,获得积分10
57秒前
elsa622完成签到 ,获得积分10
58秒前
人类繁殖学完成签到 ,获得积分10
58秒前
无情夏寒完成签到 ,获得积分10
1分钟前
斯文的难破完成签到 ,获得积分10
1分钟前
al完成签到 ,获得积分10
1分钟前
宇文雨文完成签到 ,获得积分10
1分钟前
小荣布布完成签到 ,获得积分10
1分钟前
默默的筝完成签到 ,获得积分10
1分钟前
个性松完成签到 ,获得积分10
1分钟前
打打应助jjj采纳,获得10
1分钟前
沉默的友安完成签到 ,获得积分10
2分钟前
2分钟前
xiaofeixia完成签到 ,获得积分10
2分钟前
jjj发布了新的文献求助10
2分钟前
失眠的香蕉完成签到 ,获得积分10
2分钟前
青山完成签到,获得积分10
2分钟前
ramsey33完成签到 ,获得积分10
2分钟前
wpeng326完成签到,获得积分10
2分钟前
Air完成签到 ,获得积分10
2分钟前
满座完成签到 ,获得积分10
2分钟前
Akim应助雪山飞龙采纳,获得10
2分钟前
Vivian完成签到 ,获得积分10
2分钟前
Hello应助科研通管家采纳,获得10
2分钟前
2分钟前
小鱼女侠完成签到 ,获得积分10
2分钟前
3分钟前
雪山飞龙发布了新的文献求助10
3分钟前
丘比特应助hui27采纳,获得10
3分钟前
卖粥的果完成签到 ,获得积分10
3分钟前
绿色心情完成签到 ,获得积分10
3分钟前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
Evaluating the Cardiometabolic Efficacy and Safety of Lipoprotein Lipase Pathway Targets in Combination With Approved Lipid-Lowering Targets: A Drug Target Mendelian Randomization Study 500
Crystal Nonlinear Optics: with SNLO examples (Second Edition) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3733452
求助须知:如何正确求助?哪些是违规求助? 3277618
关于积分的说明 10003554
捐赠科研通 2993665
什么是DOI,文献DOI怎么找? 1642790
邀请新用户注册赠送积分活动 780644
科研通“疑难数据库(出版商)”最低求助积分说明 748926