An Image Captioning Model Based on SE-ResNest and EMSA

隐藏字幕 计算机科学 特征提取 人工智能 图像(数学) 过程(计算) 解码方法 特征(语言学) 编码器 表达式(计算机科学) 钥匙(锁) 模式识别(心理学) 算法 语言学 哲学 计算机安全 程序设计语言 操作系统
作者
Yuan Ren,Haisheng Li
标识
DOI:10.1109/prai59366.2023.10332008
摘要

In recent years, with the development of technologies such as deep learning and attention mechanism, image captions have made great progress. In the traditional image caption model, there are problems of insufficient feature extraction and inaccurate information expression in the decoding process. In view of the above problems, this paper builds a model based on the framework of encoder-decoder, proposes an improvement based on ResNest network architecture in the encoder, and adds Squeeze-and-Excitation module to obtain image feature information. An improved two-layer long short-term memory (LSTM) image caption generation model is proposed on the decoder. Through more efficient multi-head attention, the model can more accurately understand the relationship between features, and generate more accurate and specific text description statements based on complete semantic information. In this paper, experiments are carried out on Flickr8k and Flickr30k datasets. Through the comparative analysis of the experimental results of the evaluation indicators, it is proved that the proposed model can effectively realize image caption and improve the accuracy of generating text description statements.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
泓7完成签到,获得积分10
刚刚
赵雪完成签到 ,获得积分10
刚刚
orixero应助iron采纳,获得10
刚刚
小马甲应助DAISHU采纳,获得10
刚刚
LL完成签到,获得积分10
1秒前
香蕉觅云应助Johan采纳,获得10
1秒前
1秒前
酷波er应助你好呀采纳,获得10
1秒前
桐桐应助泡泡邮递员采纳,获得10
2秒前
Johnson完成签到,获得积分10
2秒前
任性怜阳发布了新的文献求助10
2秒前
研友_ZlxK6Z完成签到,获得积分10
2秒前
奶油草莓卷完成签到,获得积分10
2秒前
小李发布了新的文献求助10
3秒前
小鱼完成签到,获得积分20
3秒前
小蘑菇应助不要加糖采纳,获得10
3秒前
泓7发布了新的文献求助10
3秒前
3秒前
cyy完成签到 ,获得积分10
3秒前
kalcspin发布了新的文献求助10
5秒前
安静友灵完成签到,获得积分20
5秒前
Rui_Rui应助qq采纳,获得10
5秒前
5秒前
汤圆完成签到,获得积分10
5秒前
鸡柳先知完成签到,获得积分10
5秒前
5秒前
yuliuism发布了新的文献求助10
6秒前
Ava应助大气的哑铃采纳,获得10
6秒前
张昕璐发布了新的文献求助10
6秒前
6秒前
星辰大海应助LCQ采纳,获得10
7秒前
Jiaocm完成签到,获得积分10
8秒前
深情安青应助低调不单调采纳,获得10
8秒前
orixero应助Jovid采纳,获得30
8秒前
Augenstern完成签到,获得积分10
8秒前
Once完成签到,获得积分10
8秒前
9秒前
深情安青应助roy_chiang采纳,获得30
9秒前
淡淡士晋完成签到,获得积分10
10秒前
李爱国应助Summer采纳,获得10
10秒前
高分求助中
Cronologia da história de Macau 5000
Merrill's Atlas of Radiographic Positioning and Procedures - 3-Volume Set, 16th Edition 2000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
Matrix Methods in Data Mining and Pattern Recognition 510
Interactions of Vowel Quality and Prosody in East Slavic 500
Vander's Renal Physiology第10版 500
Animalia: Animal and Human Interaction in the Early Medieval English World (Exeter Studies in Medieval Europe) 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7129215
求助须知:如何正确求助?哪些是违规求助? 8779506
关于积分的说明 18559959
捐赠科研通 6710767
什么是DOI,文献DOI怎么找? 3151423
关于科研通互助平台的介绍 2274559
邀请新用户注册赠送积分活动 2125766