Incoherent reconstruction-free object recognition with mask-based lensless optics and the Transformer

人工智能 计算机科学 计算机视觉 图像传感器 编码 计算 MNIST数据库 迭代重建 视觉对象识别的认知神经科学 编码孔径 多路复用 模式识别(心理学) 光学 对象(语法) 物理 人工神经网络 算法 探测器 基因 电信 化学 生物化学
作者
Xiuxi Pan,Xiaohong Chen,Tomoya Nakamura,Masahiro Yamaguchi
出处
期刊:Optics Express [Optica Publishing Group]
卷期号:29 (23): 37962-37962 被引量:25
标识
DOI:10.1364/oe.443181
摘要

A mask-based lensless camera adopts a thin mask to optically encode the scene and records the encoded pattern on an image sensor. The lensless camera can be thinner, lighter and cheaper than the lensed camera. But additional computation is required to reconstruct an image from the encoded pattern. Considering that the significant application of the lensless camera could be inference, we propose to perform object recognition directly on the encoded pattern. Avoiding image reconstruction not only saves computational resources but also averts errors and artifacts in reconstruction. We theoretically analyze multiplexing property in mask-based lensless optics which maps local information in the scene to overlapping global information in the encoded pattern. To better extract global features, we propose a simplified Transformer-based architecture. This is the first time to study Transformer-based architecture for encoded pattern recognition in mask-based lensless optics. In the optical experiment, the proposed system achieves 91.47% accuracy on the Fashion MNIST and 96.64% ROC AUC on the cats-vs-dogs dataset. The feasibility of physical object recognition is also evaluated.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
犹豫板油关注了科研通微信公众号
刚刚
lihailong发布了新的文献求助10
1秒前
2秒前
3秒前
5秒前
Rondab应助sweat采纳,获得10
6秒前
完美世界应助why采纳,获得10
6秒前
ZTK完成签到,获得积分10
6秒前
7秒前
8秒前
梦追阳完成签到 ,获得积分10
8秒前
8秒前
8秒前
8秒前
丘比特应助百草园采纳,获得10
12秒前
喜悦的水云完成签到 ,获得积分10
12秒前
12秒前
RuiRui完成签到,获得积分10
12秒前
yj17ying发布了新的文献求助10
12秒前
隐形曼青应助堕落叔叔采纳,获得10
13秒前
友好凡霜发布了新的文献求助10
14秒前
赘婿应助大力的菠萝采纳,获得30
18秒前
19秒前
20秒前
22秒前
堕落叔叔完成签到,获得积分10
23秒前
yj17ying完成签到,获得积分10
23秒前
why发布了新的文献求助10
24秒前
郝薇薇薇薇儿完成签到,获得积分10
25秒前
25秒前
26秒前
啊Cu吖完成签到,获得积分10
28秒前
堕落叔叔发布了新的文献求助10
28秒前
小园饼干完成签到,获得积分10
28秒前
依依发布了新的文献求助10
29秒前
量子星尘发布了新的文献求助30
30秒前
你好完成签到,获得积分10
31秒前
31秒前
犹豫板油发布了新的文献求助30
32秒前
32秒前
高分求助中
The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 2400
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
A new approach to the extrapolation of accelerated life test data 1000
Cognitive Neuroscience: The Biology of the Mind 1000
Cognitive Neuroscience: The Biology of the Mind (Sixth Edition) 1000
Optimal Transport: A Comprehensive Introduction to Modeling, Analysis, Simulation, Applications 800
Official Methods of Analysis of AOAC INTERNATIONAL 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3959455
求助须知:如何正确求助?哪些是违规求助? 3505634
关于积分的说明 11125092
捐赠科研通 3237449
什么是DOI,文献DOI怎么找? 1789148
邀请新用户注册赠送积分活动 871583
科研通“疑难数据库(出版商)”最低求助积分说明 802858