PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding

计算机科学 管道(软件) 嵌入 可控性 忠诚 一般化 代表(政治) 工作流程 人工智能 计算机工程 数据库 程序设计语言 电信 数学分析 数学 应用数学 政治 政治学 法学
作者
Zhen Li,Mingdeng Cao,Xintao Wang,Zhongang Qi,Ming‐Ming Cheng,Ying Shan
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2312.04461
摘要

Recent advances in text-to-image generation have made remarkable progress in synthesizing realistic human photos conditioned on given text prompts. However, existing personalized generation methods cannot simultaneously satisfy the requirements of high efficiency, promising identity (ID) fidelity, and flexible text controllability. In this work, we introduce PhotoMaker, an efficient personalized text-to-image generation method, which mainly encodes an arbitrary number of input ID images into a stack ID embedding for preserving ID information. Such an embedding, serving as a unified ID representation, can not only encapsulate the characteristics of the same input ID comprehensively, but also accommodate the characteristics of different IDs for subsequent integration. This paves the way for more intriguing and practically valuable applications. Besides, to drive the training of our PhotoMaker, we propose an ID-oriented data construction pipeline to assemble the training data. Under the nourishment of the dataset constructed through the proposed pipeline, our PhotoMaker demonstrates better ID preservation ability than test-time fine-tuning based methods, yet provides significant speed improvements, high-quality generation results, strong generalization capabilities, and a wide range of applications. Our project page is available at https://photo-maker.github.io/
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
每天都要开心完成签到 ,获得积分10
1秒前
bkagyin应助酶没美镁采纳,获得10
2秒前
姜玲完成签到,获得积分10
3秒前
烟花应助luckily采纳,获得10
3秒前
4秒前
米尔的猫完成签到,获得积分10
4秒前
啊啦啦完成签到,获得积分10
5秒前
白熊发布了新的文献求助10
5秒前
TsutsumiRyuu完成签到,获得积分10
8秒前
管理想完成签到,获得积分10
8秒前
10秒前
11秒前
12秒前
张豪杰完成签到,获得积分20
12秒前
13秒前
14秒前
15秒前
科科发布了新的文献求助10
15秒前
5165asd完成签到 ,获得积分10
16秒前
张豪杰发布了新的文献求助10
16秒前
鳗鱼歌曲完成签到,获得积分10
17秒前
17秒前
脑三问完成签到,获得积分0
17秒前
19秒前
luckily发布了新的文献求助10
19秒前
vanshaw.vs发布了新的文献求助10
19秒前
汉堡包应助刘云采纳,获得10
21秒前
LJYii发布了新的文献求助10
22秒前
科研通AI2S应助科研通管家采纳,获得10
23秒前
酷波er应助科研通管家采纳,获得10
23秒前
zzzg应助科研通管家采纳,获得10
23秒前
星辰大海应助科研通管家采纳,获得10
23秒前
英姑应助科研通管家采纳,获得10
23秒前
科目三应助科研通管家采纳,获得10
23秒前
大模型应助科研通管家采纳,获得10
23秒前
所所应助科研通管家采纳,获得10
23秒前
23秒前
科研通AI2S应助科研通管家采纳,获得10
23秒前
爆米花应助科研通管家采纳,获得10
23秒前
子凡应助科研通管家采纳,获得10
23秒前
高分求助中
Becoming: An Introduction to Jung's Concept of Individuation 600
Ore genesis in the Zambian Copperbelt with particular reference to the northern sector of the Chambishi basin 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
Die Gottesanbeterin: Mantis religiosa: 656 400
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3165215
求助须知:如何正确求助?哪些是违规求助? 2816263
关于积分的说明 7912059
捐赠科研通 2475954
什么是DOI,文献DOI怎么找? 1318452
科研通“疑难数据库(出版商)”最低求助积分说明 632171
版权声明 602388