A geometry-aware deep network for depth estimation in monocular endoscopy

计算机科学 一致性(知识库) 人工智能 概化理论 单眼 均方误差 计算机视觉 编码(集合论) GSM演进的增强数据速率 多边形网格 失真(音乐) 数学 统计 计算机图形学(图像) 集合(抽象数据类型) 放大器 程序设计语言 带宽(计算) 计算机网络
作者
Yongming Yang,Shuwei Shao,Tao Yang,Peng Wang,Zhuo Yang,Chengdong Wu,Hao Liu
出处
期刊:Engineering Applications of Artificial Intelligence [Elsevier BV]
卷期号:122: 105989-105989 被引量:21
标识
DOI:10.1016/j.engappai.2023.105989
摘要

Monocular depth estimation is critical for endoscopists to perform spatial perception and 3D navigation of surgical sites. However, most of the existing methods ignore the important geometric structural consistency, which inevitably leads to performance degradation and distortion of 3D reconstruction. To address this issue, we introduce a gradient loss to penalize edge fluctuations ambiguous around stepped edge structures and a normal loss to explicitly express the sensitivity to frequently small structures, and propose a geometric consistency loss to spreads the spatial information across the sample grids to constrain the global geometric anatomy structures. In addition, we develop a synthetic RGB-Depth dataset that captures the anatomical structures under reflections and illumination variations. The proposed method is extensively validated across different datasets and clinical images and achieves mean RMSE values of 0.066 (stomach), 0.029 (small intestine), and 0.139 (colon) on the EndoSLAM dataset. The generalizability of the proposed method achieves mean RMSE values of 12.604 (T1-L1), 9.930 (T2-L2), and 13.893 (T3-L3) on the ColonDepth dataset. The experimental results show that our method exceeds previous state-of-the-art competitors and generates more consistent depth maps and reasonable anatomical structures. The quality of intraoperative 3D structure perception from endoscopic videos of the proposed method meets the accuracy requirements of video-CT registration algorithms for endoscopic navigation. The dataset and the source code will be available at https://github.com/YYM-SIA/LINGMI-MR.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
我是老大应助虾仁采纳,获得10
2秒前
lhz发布了新的文献求助10
2秒前
CC完成签到,获得积分10
2秒前
WIK发布了新的文献求助10
3秒前
知性的千秋完成签到,获得积分10
3秒前
爆米花应助古月采纳,获得10
4秒前
VAE发布了新的文献求助10
4秒前
Star1983完成签到,获得积分10
5秒前
上官若男应助虹虹采纳,获得10
5秒前
rdxiaoxin关注了科研通微信公众号
5秒前
5秒前
7秒前
liangxiaona完成签到,获得积分10
7秒前
7秒前
8秒前
呵呵发布了新的文献求助10
8秒前
卡皮巴拉下班完成签到,获得积分10
8秒前
Frank完成签到,获得积分10
8秒前
zho发布了新的文献求助10
9秒前
lhz完成签到,获得积分10
10秒前
上官若男应助无语采纳,获得20
10秒前
草莓不梅发布了新的文献求助10
10秒前
田様应助Jstar采纳,获得10
11秒前
xiaosu发布了新的文献求助10
11秒前
11秒前
今后应助OIIII采纳,获得10
12秒前
哈哈呀完成签到 ,获得积分10
12秒前
12秒前
kingwill举报lihua求助涉嫌违规
12秒前
蜘蛛道理发布了新的文献求助10
13秒前
和谐晓啸完成签到,获得积分20
13秒前
14秒前
Yuchaoo发布了新的文献求助50
14秒前
阿kkk发布了新的文献求助10
15秒前
狂野白梅发布了新的文献求助10
16秒前
丘比特应助tivyg'lk采纳,获得10
17秒前
kira发布了新的文献求助10
17秒前
脑洞疼应助liubr_kyt采纳,获得10
17秒前
dzc应助搬砖达人采纳,获得10
18秒前
高分求助中
The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 2400
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
Optimal Transport: A Comprehensive Introduction to Modeling, Analysis, Simulation, Applications 800
Official Methods of Analysis of AOAC INTERNATIONAL 600
ACSM’s Guidelines for Exercise Testing and Prescription, 12th edition 588
Treatise on Geochemistry 500
T/CIET 1202-2025 可吸收再生氧化纤维素止血材料 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3954947
求助须知:如何正确求助?哪些是违规求助? 3501168
关于积分的说明 11102048
捐赠科研通 3231509
什么是DOI,文献DOI怎么找? 1786448
邀请新用户注册赠送积分活动 870058
科研通“疑难数据库(出版商)”最低求助积分说明 801798