Image Captioning using Deep Learning Techniques

隐藏字幕 计算机科学 人工智能 卷积神经网络 自然语言处理 机器翻译 任务(项目管理) 深度学习 构造(python库) 自然语言 公制(单位) 任务分析 钥匙(锁) 图像(数学) 领域(数学) 语言模型 运营管理 计算机安全 管理 数学 纯数学 经济 程序设计语言
作者
Arunkumar Gopu,Pratyush Nishchal,Vishesh Mittal,Kuna Srinidhi
标识
DOI:10.1109/inc457730.2023.10263093
摘要

The automatic generation of image descriptions is leading the field of computer vision and natural language processing-based research. Image captioning is a key task that calls for a semantic understanding of the images and the capacity to create descriptions with right structure. Image captioning is a complex problem as it often demands accessing data that might not be visible in each scene. It will require logical thinking to evaluate or have in-depth knowledge about the object present in an image. In this study, we developed a multilayer Convolutional Neural Network to produce words that describe the images, and we used Long Short-Term Memory to accurately construct relevant sentences out of the words that are produced. To generate an accurate description, the Convolutional Neural Network (CNN) model first compares the targeted image against a huge dataset of training samples. In this study, we have used the Flickr 8k dataset. We have used the Bilingual Evaluation Understudy (BLEU) metric to determine how well our model is generating captions for the images. It evaluates the generated text that has been translated from one language to a different language to evaluate the effectiveness of the machine translation system. In this study, we have also used two pre-trained models (VGG16, and XceptionV3) for comparative study.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
fff完成签到 ,获得积分10
刚刚
万能图书馆应助稳重诗珊采纳,获得10
1秒前
昏睡的蟠桃应助魏笑白采纳,获得20
2秒前
余九完成签到,获得积分10
2秒前
啊啊啊完成签到,获得积分10
3秒前
3秒前
十年饮冰发布了新的文献求助30
4秒前
zyu发布了新的文献求助10
4秒前
科研通AI6.1应助哈哈哈采纳,获得10
4秒前
隐形曼青应助卑微小王采纳,获得10
5秒前
久芭完成签到 ,获得积分10
6秒前
lycoris完成签到,获得积分10
6秒前
聪明的阿呆完成签到,获得积分10
6秒前
molihuakai应助社恐小魏采纳,获得10
7秒前
lurui完成签到,获得积分10
7秒前
8秒前
8秒前
8秒前
gj2221423完成签到 ,获得积分10
9秒前
Z11驳回了爆米花应助
9秒前
Lucas应助风中的南风采纳,获得10
10秒前
酷波er应助xzj采纳,获得10
10秒前
11秒前
11秒前
11秒前
12秒前
Jason完成签到 ,获得积分10
12秒前
xiaolizi发布了新的文献求助10
12秒前
稳重诗珊发布了新的文献求助10
14秒前
gyyyyy发布了新的文献求助10
15秒前
15秒前
在水一方应助ZZW采纳,获得10
16秒前
aixuexi完成签到,获得积分10
16秒前
KingHok完成签到,获得积分10
16秒前
17秒前
17秒前
zyu完成签到,获得积分10
17秒前
丘比特应助lianqing采纳,获得10
17秒前
18秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Developing Genetic Editing Tools for Lysobacter 2000
卤化钙钛矿人工突触的研究 2000
Моделирование процессов самоорганизации в кристаллообразующих системах 1000
History of U.S. Space Surveillance and Satellite Cataloging 1000
Signals, Systems, and Signal Processing 610
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6519828
求助须知:如何正确求助?哪些是违规求助? 8312828
关于积分的说明 17777481
捐赠科研通 5621965
什么是DOI,文献DOI怎么找? 2926879
邀请新用户注册赠送积分活动 1903761
关于科研通互助平台的介绍 1764282