Designing an encoder for StyleGAN image manipulation

计算机科学 编码器 发电机(电路理论) 失真(音乐) 人工智能 计算机视觉 图像编辑 图像(数学) 源代码 图像质量 反演(地质) 构造盆地 操作系统 生物 物理 量子力学 古生物学 功率(物理) 放大器 带宽(计算) 计算机网络
作者
Omer Tov,Yuval Alaluf,Yotam Nitzan,Or Patashnik,Daniel Cohen‐Or
出处
期刊:ACM Transactions on Graphics [Association for Computing Machinery]
卷期号:40 (4): 1-14 被引量:396
标识
DOI:10.1145/3450626.3459838
摘要

Recently, there has been a surge of diverse methods for performing image editing by employing pre-trained unconditional generators. Applying these methods on real images, however, remains a challenge, as it necessarily requires the inversion of the images into their latent space. To successfully invert a real image, one needs to find a latent code that reconstructs the input image accurately, and more importantly, allows for its meaningful manipulation. In this paper, we carefully study the latent space of StyleGAN, the state-of-the-art unconditional generator. We identify and analyze the existence of a distortion-editability tradeoff and a distortion-perception tradeoff within the StyleGAN latent space. We then suggest two principles for designing encoders in a manner that allows one to control the proximity of the inversions to regions that StyleGAN was originally trained on. We present an encoder based on our two principles that is specifically designed for facilitating editing on real images by balancing these tradeoffs. By evaluating its performance qualitatively and quantitatively on numerous challenging domains, including cars and horses, we show that our inversion method, followed by common editing techniques, achieves superior real-image editing quality, with only a small reconstruction accuracy drop.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小太阳发布了新的文献求助10
刚刚
3秒前
5秒前
zho应助123123采纳,获得10
7秒前
10秒前
云朵发布了新的文献求助30
11秒前
只谈风月完成签到,获得积分10
11秒前
大个应助pandada采纳,获得10
12秒前
13秒前
神途完成签到,获得积分10
14秒前
含蓄初之发布了新的文献求助10
16秒前
gao发布了新的文献求助10
16秒前
接收发布了新的文献求助10
17秒前
未来可期完成签到,获得积分10
18秒前
21秒前
21秒前
小蘑菇应助xihabitat采纳,获得10
21秒前
24秒前
李洪卓发布了新的文献求助10
27秒前
30秒前
自然的柠檬完成签到,获得积分10
35秒前
35秒前
李洪卓完成签到,获得积分10
35秒前
哎健身发布了新的文献求助10
39秒前
万能图书馆应助苻莞采纳,获得10
39秒前
43秒前
46秒前
47秒前
47秒前
一指流沙发布了新的文献求助10
48秒前
777发布了新的文献求助10
50秒前
亦久完成签到 ,获得积分10
50秒前
51秒前
51秒前
S.完成签到 ,获得积分10
52秒前
苻莞发布了新的文献求助10
53秒前
gao完成签到,获得积分20
56秒前
愤怒的映萱完成签到,获得积分10
57秒前
傅双庆应助苻莞采纳,获得10
1分钟前
科目三应助一指流沙采纳,获得10
1分钟前
高分求助中
LNG地下式貯槽指針(JGA指-107) 1000
LNG地上式貯槽指針 (JGA指 ; 108) 1000
Preparation and Characterization of Five Amino-Modified Hyper-Crosslinked Polymers and Performance Evaluation for Aged Transformer Oil Reclamation 700
Operative Techniques in Pediatric Orthopaedic Surgery 510
How Stories Change Us A Developmental Science of Stories from Fiction and Real Life 500
九经直音韵母研究 500
Full waveform acoustic data processing 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2930442
求助须知:如何正确求助?哪些是违规求助? 2582254
关于积分的说明 6963857
捐赠科研通 2230764
什么是DOI,文献DOI怎么找? 1185056
版权声明 589575
科研通“疑难数据库(出版商)”最低求助积分说明 580118