pony-diffusion - >nohooves

AstraliteHeart

Texto a imagen

Pony Diffusion V4 está en vivo! pony-diffusion es un modelo latente de difusión de texto a imagen que ha sido condicionado en imágenes SFW-ish de ponis de alta calidad a través de un ajuste fino. Con un agradecimiento especial a Waifu-Diffusion por proporcionar la experiencia en ajuste fino y a Novel AI por proporcionar el cómputo necesario.

Como usar

import torch
from torch import autocast
from diffusers import StableDiffusionPipeline, DDIMScheduler
model_id = "AstraliteHeart/pony-diffusion"
device = "cuda"
pipe = StableDiffusionPipeline.from_pretrained(
model_id,
torch_dtype=torch.float16,
revision="fp16",
scheduler=DDIMScheduler(
beta_start=0.00085,
beta_end=0.012,
beta_schedule="scaled_linear",
clip_sample=False,
set_alpha_to_one=False,
),
)
pipe = pipe.to(device)
prompt = "pinkie pie anthro portrait wedding dress veil intricate highly detailed digital painting artstation concept art smooth sharp focus illustration Unreal Engine 5 8K"
with autocast("cuda"):
  image = pipe(prompt, guidance_scale=7.5)["sample"][0]  

image.save("cute_poner.png")

Funcionalidades

Modelo de difusión latente de texto a imagen
Condicionado en imágenes SFW-ish de ponis de alta calidad
Afinado con una tasa de aprendizaje de 5.0e-6 durante 4 épocas
Entrenamiento en aproximadamente 80k pares de texto-imagen de ponis

Casos de uso

Propósitos de entretenimiento
Asistente de arte generativo