Um ein Gesicht auf einem Foto zu altern, eine Frisur zu ändern oder zum Lächeln zu bringen, müssen Sie die Semantik studieren, die in den einzelnen Ebenen des trainierten GAN-Modells enthalten ist. Jüngste Studien zu generativen kontradiktorischen Netzwerken haben gezeigt, dass verschiedene Schichten unterschiedliche Semantiken synthetisierter Bilder enthalten: Einige sind für Farben verantwortlich, andere für Texturen usw.
. , . :
StyleCLIP
Adobe , StyleGAN, .
CLIP, StyleGAN. , . , ArcFace. , : , , .
ReStyle
GAN- . , . , . , .
EigenGAN
, . - , , . , , , - , .
LatentCLR
GAN, . StyleGAN2 BigGAN.
Geometry-Free View Synthesis
, . , , , . . , .
, . , «» . , . , 3D- , .
Articulated Animation
Snap , , — , , . , , . , . .
VideoGPT
. — VQ-VAE, self-attention. GPT- .
, , .
MiVOS
. . . , .
, : , , . , , Adobe Premier.
DINO
, FAIR .
. , , .
, . , . ImageNet, — , : , , . , , .
PAWS, , .
ML :
Compositional Perturbation Autoencoder (CPA)
, . , .
FAIR . , , , ..
Transferable Visual Words
, . . . « », . .
:
Das ist alles, danke für Ihre Aufmerksamkeit und bis nächsten Monat!