Transcrições
1. Trailer do Curso: Bem-vindo ao Stable
Diffusion Master Class. Este curso ensinará
tudo o que você precisa para criar arte usando inteligência
artificial. Nos vídeos a seguir, você
aprenderá os principais recursos do
AI Arts, de código aberto gratuito código aberto gratuito, tornando a ferramenta Diffusion
estável Começaremos do básico,
supondo que você não saiba nada, e colocaremos o software
em seu computador
e, em seguida, você criará
sua primeira arte usando Isso permitirá que você crie obras
de arte em qualquer estilo de arte sem precisar nenhuma habilidade prévia de desenho
ou design Você aprende a
trocar qualquer objeto em uma imagem por qualquer outro
objeto que possa imaginar e a estender fotos
existentes para adicionar conteúdo a elas e
aumentá-las Você aprenderá como aumentar
a resolução de qualquer imagem. Você aprenderá a
criar vídeos com IA, bem
como técnicas como as animações infinitas
do Zoom
e até aprenderá usar a difusão estável
em combinação com ferramentas como o Chat
GPT Ao final deste curso, você poderá criar peças de
arte prontas para
produção
e poderá fazer esse tipo de arte em um período de apenas
alguns segundos a minutos. Você aprenderá
tudo isso e muito mais na master class de
difusão estável
2. Instalando a interface de usuário de difusão estável: Neste vídeo,
trataremos da limpeza, instalação de
difusão estável, discórdia, etc. Se você nunca usou difusão
estável antes, esta é a primeira
vez que ouve falar sobre isso. Você deve acessar
este site aqui para experimentar uma
versão simplificada da efusão estável. Portanto, você pode acessar este site, stable diffusion web.com e
instable diffusion web.com. Você verá uma versão muito
simplista da efusão
estável, na qual
você pode inserir alguns textos, por exemplo, I. Digamos, uma pequena cabana em uma montanha nevada no
estilo de uma estação da Disney. E eu clico em Gerar imagem. E assim, ele criará algumas
imagens para nós. Então você pode ver que isso
é muito bonito. É exatamente o que digitamos. Se você quisesse fazer uma cabana com
neve e fosse
do estilo que você encontraria
no site da estação de arte. E se você clicar em uma imagem, poderá ver a aparência delas, clicar com o
botão direito do mouse e salvar uma imagem. Então, isso é como os ossos nus, a ponta do iceberg. Pela estabilidade que a
confusão pode causar. abordaremos muitos
recursos e ferramentas diferentes Neste curso, abordaremos
muitos
recursos e ferramentas diferentes
que você pode usar a IA para
criar arte. Mas se você nunca
jogou antes, acesse este site agora, confira e digite
coisas diferentes nas instruções. Clique em Gerar, veja que tipo
de imagens você pode criar. E então podemos começar
a comer carne e batatas. Portanto, instale de forma estável
e eficiente em seu computador. Se em algum momento durante este
curso você tiver problemas, você se deparará com problemas de bugs. Então você não sabe como
instalar corretamente. Você quer ver o que outros
estudantes, colegas de classe e outros usuários de efusão
estável ou fazendo acessam a discórdia, que está disponível
neste link aqui. Discord.GG corta a difusão
estável. Se você tiver alguma dúvida
neste curso
sobre difusão estável,
publique suas perguntas aqui
em vez de em qualquer
outro lugar ou envie e-mails ou
mensagens, coloque-as aqui. E os usuários, incluindo
os desenvolvedores, têm uma difusão simples,
poderão responder às
suas perguntas. Sem o caminho. Vamos falar sobre a obtenção de
uma nova difusão estável. E isso está disponível
no site github.com
slash automatic 11,
11 slash stable dash
diffusion dash web UI. Isso nos dará a interface de usuário da web que torna muito
mais fácil ver o que estamos fazendo com a
efusão estável e você poderá interagir com ela e criar todas essas belas
imagens e obras
de arte. Quando estiver no link
deste site, você pode rolar para baixo até
a seção de instalação. Vamos lá, instalação
e execução. E você pode seguir estas etapas
de instalação. Dependendo se
você estiver usando Linux, Apple ou Windows, você terá uma instalação um pouco
diferente. Pessoalmente, estou usando o
Windows, então, para mim, instalei o Python,
instalei o Git. E então, caso você
nunca o tenha usado antes. O que acontece é que você descobre, depois de instalar o
Git e o Python, onde você descobre um lugar no seu computador que
deseja instalar. Então, no meu caso, vou ter uma
pasta de documentos que eu crio. E digamos que eu
crie uma nova pasta e diga que é
aqui que quero colocar meu
material de difusão estável, difusão estável. E eu entro nessa
pasta e depois escrevo, clico com o botão esquerdo
na seção URL. Eu digito cmd. E isso abrirá um prompt de comando nessa
pasta que acabei de criar. Posso então colar essas informações do clone do
git, que é o que
acabei de copiar aqui. E isso clonará todo
esse código do GitHub
na pasta web. Em seguida, basta encontrar o
arquivo de execução, a interface de usuário da web dash UI dot bat do Windows e executá-lo e ele
instalará uma difusão simples. Então faça isso e então
podemos começar.
3. Instalando o modelo de base de difusão estável: Então, eu tenho
efusão estável aqui
carregada e você pode ou não ver um modelo já pré-carregado
nos pontos de verificação, ponto de verificação de difusão
capaz aqui. Se você já
tem isso, pode pular este vídeo e ir
para o próximo vídeo. Mas caso sua instalação não tenha
sido instalada automaticamente, abordaremos isso aqui. Então,
precisaremos baixar o modelo de
divisão estável para criar imagens. E podemos obter esse
modelo aqui, este é o modelo de estabilização
para 0,1
ou aqui o modelo de
efusão estável 1,5. Atualmente, acredito que maior parte deste curso está
usando o modelo 1.5, mas você também pode usar uma revisão de tabela para
modelar, o que quiser. Essencialmente, você
acessa este URL aqui que
é Hugging Face, Runway model stabled fusion, dash v1 dash five, Tree slash main
ou este aqui. Seja qual for o URL de sua preferência, você optou pela versão mais recente
ou pela versão antiga. E você grampeia os arquivos de
fusão, as inversões. E então você vai
baixar o modelo, que é o
modelo de tensor seguro aqui. Você baixa isso. Você deseja fazer o download para
um local muito específico. Você deseja baixá-lo para seus modelos de interface de usuário
web de difusão
estável, pasta de difusão estável. Então, vamos dar
uma olhada nisso. Vamos recuar um pouco. Em sua difusão estável, este
é o seu software geral. Você está procurando a pasta de
modelos e depois a
pasta de difusão estável e vai
colocá-la aqui. a
pasta de difusão estável e vai colocá-la aqui. Depois de fazer isso e
obter uma difusão estável, clique em
Atualizar e veja os modelos
que
você baixou nessa pasta que
aparecem aqui. Então, apenas uma rápida observação, ou
para garantir que todos tenham,
tem o modelo básico de posto de controle
eficiente de mesa.
4. Texto para imagem: Você instalou o stable
deficient com sucesso. Agora podemos começar a criar algumas obras de arte usando difusão
estável. Ao carregar
o aplicativo pela primeira vez, você verá algo semelhante
ao que você vê aqui. Este é o nosso painel que tem todos os controles incríveis
que nos permitirão encontrar um controle detalhado intrincado sobre tudo o que queremos
fazer com nossa geração de imagens. Porém, antes de
começarmos a
criar imagens, precisamos decidir para onde
queremos imprimir nossas imagens. Onde queremos
salvar tudo? E para fazer isso, você
vai querer ir até
a guia que diz configurações,
configurações e, em seguida,
caminhos para salvar. E aqui é onde você pode definir onde deseja
salvar suas imagens. Então, eu configurei uma
pasta no meu computador. Você vai querer
fazer a mesma coisa. Basta criar uma pasta em algum lugar
, copiar o caminho da pasta e colá-la aqui. Dessa forma, todas as
imagens que você criar serão salvas nessa pasta no seu computador e você
poderá encontrá-las facilmente. Em seguida, clique em Aplicar configurações
e recarregue sua interface de usuário. Depois de fazer isso,
podemos voltar ao
nosso texto para imagem,
texto para imagem aqui, e vamos
começar a criar algumas artes de IA. A primeira coisa que
precisamos entender é o final positivo e os
estímulos negativos. É assim que se reconta, difusão
estável,
que arte criar. Então eu apenas digito um homem
e clico em Gerar. Você tem que fazer. Boa aparência
e fazer também é usar um terno. Ele está sorrindo,
olhar para ele é ótimo. E se clicarmos nessa
pequena pasta aqui, ela abrirá a pasta em nosso computador que a
designamos. E entramos nessa pasta e vemos que há um homenzinho aqui. Vamos lá. Parabéns,
você acabou de criar sua primeira arte em efusão
estável. Vamos explorar
um pouco mais as configurações. Então, aqui, essas são
as sugestões positivas. É aqui que digitamos
as coisas que queremos
ver e queremos que sejam estáveis. Eu digo, bem, se a fusão for usada, você acessa um site
como IA cívica,
cívica , cívica e cívica. Você pode encontrar imagens que foram criadas por outras
pessoas usando IA generativa. E você pode
descobrir que tipo de instruções usamos para
criar essas imagens. Então isso é civet ai.com. E se eu clicar em
uma dessas imagens, você poderá ver as instruções positivas
e negativas. Então, por exemplo, eu posso copiar esse positivo, talvez
aqui. Copiar e colar. E eu posso copiar esse parâmetro
negativo. Lucros negativos
são coisas que não queremos ver. E cole isso aqui. E vamos dar uma olhada. Vamos examinar isso um
pouco mais adiante. Então, aqui vemos a foto de um homem de 48 anos
em roupas pretas. Ele nos diz a
resolução da foto. Oito k tem
granulação de filme de alta qualidade. Ok, então tudo isso
nos dará algum controle sobre
o tipo de imagem que queremos criar
aqui e o aviso negativo,
essas coisas que não queremos ver, onde você pode
ver todas as coisas
que queremos evitar,
como rosto clonado de baixa qualidade, perda de pernas, falta de braços
extras, etc. Se nos regenerarmos,
devemos ver algo semelhante até certo ponto
a nossa imagem de referência. Deve-se observar que isso está usando um modelo
diferente do que estamos usando. Então, aqui não vai ficar
exatamente assim. Mas se você
quiser apenas ter uma ideia de que tipo de prompts usar, que tipo de propriedades
estavam sendo usadas, que tipo de amostrador, etc. Essa é uma ótima maneira de
obter algumas referências. Ok, nós sabemos como a promessa
positiva funciona, nós sabemos o quão negativa é a de
Brown. Agora, vamos nos aprofundar em alguns
dos recursos mais detalhados aqui. Método de amostragem. O que é método de amostragem? O método de amostragem é como? Bem, que tipo de métodos de
amostragem são usados. Essas são todas as
opções diferentes que você pode escolher. Há muitos deles aqui. E, francamente, na maioria das vezes, a menos que
você esteja realmente
entrando em detalhes, provavelmente não verá uma grande diferença. se você acessar
a documentação aqui, que fique à vontade, ela está desativada effusion
dash art.com. Você pode ver a comparação entre diferentes métodos de
amostragem. E sim, há uma diferença. Mas é meio sutil na
maioria das vezes. Hum, a menos que você esteja carregando, emparelhando-os exatamente
lado
a lado, você provavelmente não verá você provavelmente não verá uma grande diferença na
maioria das vezes. Estou bem com você,
Larry, e na maioria
das vezes você obtém
bons resultados com
essas etapas de amostragem é quanto, quantas vezes você deseja
passar pelo processo. Porque ele continua produzindo todos
esses diferentes níveis de ruído e os aplicando,
passando por tudo isso. Se você colocar um número baixo aqui, verá uma imagem muito
desfocada e de baixa qualidade. E se você tirar uma foto
muito alta, você pode ir até. Vá lá, vá lá. Lá vamos nós. Você pode ir
até 150. Mas se você fizer 150
, ficará muito bom. Mas vai levar muito
tempo para chegar lá. Na maioria das vezes, você pode ficar 20 a 30 e isso deve
ser bom o suficiente. 20, 30 passos
geralmente são suficientes. Gere o rosto desse cara novamente. Vamos lá. Restaure nossos rostos. Você pode verificar isso e
ele fará o possível para corrigir qualquer rosto feio. Então, por exemplo, se os olhos
estão cruzados ou talvez ele tenha
dentes estranhos e eu não sei. Talvez como as sobrancelhas perdidas
ou algo parecido. Restore faces pode
tentar fazer o possível para corrigi-lo. Ladrilhar ladrilhos é um recurso meio
divertido. Azulejos. A
colocação de ladrilhos cria um ladrilho. Dessa forma, se você
colocasse essa imagem ao lado
dela, ela fluiria naturalmente
para a próxima imagem nela. Por exemplo, você pode ver que
essa metade inferior do homem
fluiria naturalmente para o homem superior aqui. Então, se você colocasse essa imagem
exata logo abaixo dela, ela
fluiria naturalmente como um ladrilho. Então é isso que o ladrilho faz. Às vezes, você obterá resultados muito
estranhos, mas você pode ver que
isso naturalmente fluirá para
essa pessoa aqui. Solução de alto risco: isso é para
aumentar a escala de suas imagens. Se você achar que a resolução
dessa imagem não é alta o suficiente. Você quer que seja melhor. Você pode aprimorá-lo, você pode aumentar a resolução disso. Em geral. Isso é
bom, obscuramente, aqui. R S Gan SR novamente quatro vezes além de você poder brincar com esses latentes, é um dos
primeiros que foram criados. Esses outros são variações. Este é totalmente
otimizado, você pode até mesmo instalar o seu próprio, que é o que este é.
Vamos falar sobre isso mais tarde. Então é isso que a alta resolução
corrige. Larguras e alturas. Essas são as dimensões
da imagem que está
sendo criada. Portanto, por padrão, é 5125 12º. Se você escolher uma escala
diferente, por exemplo, 90 por 540, gerada, podemos obter
dimensões diferentes para nossa imagem. Vamos lá. Temos um cara, um cara
com um braço de aparência estranha, mas mesmo assim é um cara. Assim, você pode obter dimensões
diferentes. Às vezes, você obtém saídas
estranhas com
imagens duplas, pessoas duplicadas. Se você mudar isso que eu
mencionei em uma escala quadrada. E a razão para
isso é que quando as imagens são
inseridas no modelo, elas sempre são inseridas
em formato quadrado. Mas o que você está dizendo
é que eu quero criar essa imagem
que não seja quadrada. Então, ele vai
criar um quadrado, mas ele realmente não
sabe o que fazer com essa informação
extra nas laterais dele. Então, às vezes, fica
confuso e cria duplos ou clones de
qualquer coisa que seja o cara. Isso nem sempre acontece, mas às vezes acontece. Então, vamos lá. Apesar de termos dito apenas um homem
solteiro, temos dois caras. Agora, em vez de uma, contagem de
lotes, contagem de lotes é quantas
imagens queremos
criar por padrão definidas como uma. Mas você pode dizer “
Vamos fazer para”, e o que ele vai fazer é
criar as imagens
uma após a outra de forma iterativa. Nós temos um cara. Quando lá vamos, temos nossas quatro imagens. O tamanho do lote é a quantidade de imagens
a serem criadas simultaneamente. Estava fazendo um de cada vez, mas dá para fazer
mais de um por vez. Se o seu computador pode lidar com isso, depende da velocidade do
seu computador. A escala Cfg está dizendo quanta atenção
prestamos a esse aviso, ao aviso positivo e
negativo. Se você definir como um, verá
uma imagem que realmente não se parece muito com
sua imagem de referência. É só quem sabe
o que quer que seja. E se você disser que eu quero
ir até 30, isso vai criar
algo que seja exatamente os parâmetros de seus
textos. Mas você também percebe que as
cores ficam muito saturadas. Então, você geralmente não
quer subir até o fim. talvez você queira experimentar entanto, talvez você queira experimentar
entre subir um pouco e descer
um pouco. Semente. A semente é muito importante para estabilização e para qualquer
outro modelo generativo de IA. Por padrão, a semente é menos um. E isso significa que toda
vez que você criar uma imagem, ela criará uma
foto completamente aleatória do zero. Toda vez que você clica
no botão Gerar, temos um cara diferente. Mas você não precisa fazer isso. Você pode dizer que eu quero reutilizar a semente da última geração. E se fizermos isso, obteremos
o número da semente aqui. Então, se eu clicar em Gerar novamente, vamos
criar exatamente o mesmo cara. Por. Lá vamos nós. Nós criamos outro. É praticamente idêntico. A razão é porque
usamos a mesma semente. Você clica nos extras aqui. Você pode ver que há uma
semente de variação e isso quer dizer, bem, eu tenho duas imagens. Um é uma semente e
este é algum outro C, digamos nove ou
algum outro número. E então você pode dizer:
quanta informação eu quero usar dessa semente? Compare-a com as informações que eu quero
usar desta semente. Então você pode dizer que eu quero que
seja mais influenciado por este e ligeiramente influenciado
pelo segundo e assim por diante. E então, se você disser que eu só
quero usar a semente usando
a parte da largura, você pode fazer isso aqui, e eu só quero usá-la da
parte do ódio. Eu posso fazer isso aqui. Mas isso
mudará drasticamente sua imagem. Esses,
alterando a escala. Você verá grandes
mudanças, onde essa provavelmente
é a melhor
se você
quiser ser influenciado um pouco. Depois de criar sua imagem, você notará aqui
na parte inferior, todos os detalhes necessários
para criar sua foto. Essas são nossas sugestões positivas. Esses são nossos estímulos negativos. Podemos ver as etapas. Usamos um amostrador, a escala CFG, a semente, tudo, todos esses
detalhes aqui. Bem planejado para você. E quando você clica
nessa coisa aqui, Abrir imagens e diretório
de saída, podemos ver as imagens
que criamos. Porque lembre-se de
que configuramos essa pasta no
início desta palestra. E aqui estão todas as
fotos que fizemos. Então aí está. Agora você sabe como
criar imagens, textos, imagens em difusão
estável.
5. Variações de imagens: Digamos que eu queira criar uma variação de uma imagem
que eu gerei. Não quero criar
uma imagem completamente nova. Quero apenas criar
algo semelhante
ao existente. Então, o que quero dizer com isso? Bem, por padrão, você tem uma
semente com largura negativa, o que significa criar uma semente
aleatória todas as vezes. E, como a imagem que ela gerará, você obterá uma imagem completamente
diferente. Nesse caso, temos
uma senhora com uma espada. Se eu clicar novamente, obteremos outra imagem completamente
diferente, embora estejamos usando
o mesmo aviso positivo e o mesmo aviso negativo, estamos recebendo uma pessoa muito
diferente. Então, eu quero criar algo
semelhante a esse, mas não
quero ter algo
completamente diferente. E o que você pode fazer é jogar com esse valor
chamado valor inicial. Por aqui, você pode dizer
Vc da última geração. Então, isso usará a semente
desta última imagem. Mas há outras maneiras de
descobrir a semente, por exemplo, se olharmos
aqui embaixo, você pode ver o valor da semente da
imagem que foi usada. E se você optar por conferir a imagem
que foi criada. Então, isso está no arquivo de saída
e, em seguida, clicamos nele, você
obterá sua pasta de saída. E você pode ver no nome
da imagem que foi usada, eles têm o valor da semente. Então, podemos colocar esse
valor inicial aqui. Se clicássemos em
Gerar novamente, você obterá exatamente a
mesma imagem agora, porque estamos usando
o mesmo valor inicial, você não obterá uma imagem
completamente diferente agora. Mas eu só quero
ter uma variação. Não quero usar
um assento idêntico. Então, para fazer isso, você seleciona
esse pequeno menu suspenso extra. Aqui você verá essa coisa
chamada semente de variação. E isso é útil
porque agora você pode definir um segundo valor inicial e usar a segunda busca para
influenciar a primeira. Mas ainda estamos usando apenas dois assentos em vez de criar
aleatoriamente um
novo a cada vez. O que você pode querer
fazer é dar uma olhada
nas imagens que criamos
anteriormente e dizer, bem, talvez eu também
queira usar algumas
dessas imagens influenciadas. Gosto muito do
pouco de vermelho nela e talvez eu goste desse
pouco dessa influência, mas também gosto dessa original e essa é a que eu mais quero metade, mas eu só quero um pouco de
influência dessa imagem. Então, vou pegar o valor da semente
e colocá-lo aqui. E agora podemos jogar com esse controle deslizante chamado força de
variação. E sua força de variação. Podemos então dizer: eu quero usar quanto
do primeiro assento e quanto do segundo
estágio eu quero usar. Se eu for
até a segunda semente, veremos
a primeira imagem que criamos
no começo. Ou pelo menos algo
próximo a isso, pelo menos. Então, isso está apenas usando a
influência desse segundo assento. Mas se quisermos jogar
com o primeiro, que é nosso objetivo aqui, é verificar o
controle deslizante em vez de dois até um
, basta colocá-lo porcentagem dele. Agora devemos ser capazes de ver a imagem aqui com um
pouco de influência. Vamos tentar outro também. Coloque até 0,2. E ao fazer isso, se agora compararmos as imagens
que geramos aqui, podemos ver que temos algumas
pequenas variações. E esse é o original
que tínhamos. E essas são variações
desses dois. Se você não gosta da
influência da segunda imagem, você pode simplesmente brincar com
a nova imagem aqui, também com a
variação do assento. E veremos o que
mais vamos inventar. Aí está. É assim que você pode criar variações de qualquer imagem
gerada.
6. Upscaling: Vamos falar sobre como criar imagens
de
alta definição com difusão desativada. Então,
digamos que você tenha encontrado nosso aviso,
estamos felizes com isso. Passamos por
várias iterações. Encontrei uma imagem que eu gosto. Se eu olhar para esta imagem, ela tem 512 por cinco pixels
e parece decente, mas está um pouco desfocada. Pode ser um pouco
mais de alta definição. Isso não é um garfo, uma
foto no momento. Acontece que há maneiras de
aumentar a resolução. Em primeiro lugar, você provavelmente vai
querer
ter certeza de salvar o
número da semente que deseja usar. Então você pode ir para
essa solução de alto risco. E você pode escolher essas
coisas chamadas escalares. E esses escalares ascendentes permitem que você aumente a
resolução da sua imagem. Eles funcionam
corrompendo primeiro a imagem. Em seguida, suas imagens são
reduzidas para um tamanho menor. E então eles usam essa rede
neural
treinada para recuperar imagens
danificadas e tentar consertar todos os detalhes Há vários tipos diferentes de
sofisticação. Os latentes são aqueles que foram
criados pela primeira vez quando, digamos, pesca de
poços era feita na hora. Este aqui, nosso escaneamento
quatro vezes maior, é um excelente escalar ascendente,
funciona muito bem. Queria um prêmio em 2018. S are novamente significa superresolução
aprimorada redes adversárias
generativas de superresolução
aprimorada. Se
escolhermos o mais sofisticado, vamos
aumentá-lo em duas vezes. D é a força do ruído. Você
pode definir para 0,7 ou até 0,5. Eu gosto de fazer 0,5
permitido no momento. E então clicaremos em
Gerar aqui. E vamos ver como isso fica. Você pode ver que isso mudou um pouco
a foto, mas o benefício
valerá a pena a mudança na
imagem na maioria das vezes. Então, aqui temos nosso carregamento. Vamos lá. Aqui está nosso antes,
aqui está nosso ator. Podemos ver que esta é uma foto muito maior e
muito mais nítida. Parece muito bom. Foi lançado o
escalar de outro aplicativo. Você pode instalar
seu próprio sofisticado. E, ao que parece,
você vai
ver aqui o
que eu gosto de usar, chamado
quatro
vezes ultra nítido. Esse não vem embutido
com a pequena efusão. Agora, se você quiser usar
esse escalar de aplicativo específico, vamos tentar esse e
aumentar a escala duas vezes. Você pode baixar o aplicativo
scalar neste link aqui. E você vai
baixar esse PTH de pontos ultra nítidos
quatro vezes. Se você quiser,
é um arquivo pequeno. Basta baixar isso. E então você pode colocar isso nesta pasta aqui chamada SR. Novamente, pastas sob
sua efusão estável sob a
pasta models, na pasta S. Novamente, basta
colocá-las lá. Você quer a documentação
sobre como trabalhamos de alto nível. Você pode conferir
este link aqui. Mas depois de recarregar, você é uma interface de usuário e usa uma difusão
simples. Ele pode ser carregado acessando
a recarga em Configurações. E então você verá sua nova arma mais antiga em tempo
integral aparecendo
neste menu suspenso. Então, criamos uma imagem aprimoramos com
dois aumentos de escala diferentes. Vamos compará-los agora. Então esse é o primeiro. Esse é o
pequeno. Isso é usar o SR novamente quatro vezes, e este é o ultra nítido
em tempo integral. Portanto, existem
distinções sutis, mas acho que o formato ultracurto funciona um
pouco melhor. Estes ao longo dos olhos, fizeram um bom trabalho com os olhos. Um pouco embaçados
aqui, eles têm um pouco mais de detalhes. Supondo que você
queira aprimorar ainda mais, você pode ir além disso. Você pode clicar
no botão central de extras para
qualquer imagem que você tenha. E você clica em Extras do Papai Noel
e ele abrirá a guia de imagens e enviará
sua foto para lá. Como alternativa, você pode simplesmente carregar a foto da pasta manualmente. Você pode clicar, arrastar
e soltar, etc. Mas vou
usar apenas a forma dos extras. E então você pode tentar
sua obscuridade aqui. Você verá que está subindo escalares, seu ônibus de varredura RS em tempo integral
ou, no meu caso, quatro vezes mais nítido. E então você pode escolher o
quanto deseja redimensionar. Nesse caso,
vou
acessar e clicar em gerar. Levará um momento para carregar. E então devemos
ser capazes de ver uma imagem de alta definição
muito boa. Quando o carregamento terminar, ficaremos presos em uma
pasta diferente, mas tudo bem. Então, vamos compará-los agora. Esta era esta é a nossa, esta
é a nossa foto original. Este é o nosso luxo de
usar o escaneamento. Esta é a quarta
vez ultra nítida, e a segunda vez
após a segunda ultra nítida, temos ainda mais detalhes. Então, se entrarmos aqui, fica
um pouco pixelizado. Mas se formos às quatro vezes, quem vai deixar que os detalhes
pareçam muito bons. Agora acontece que você
pode fazer isso em lote. Você nem precisa
fazer isso um por um, como estamos fazendo aqui neste processo
meio lento, você pode acessar esse
lote a partir do diretório. E podemos fazer isso: você pode selecionar um diretório de entrada e
um diretório de saída. Então, para fazer isso,
precisaremos
ter várias
fotos com as quais trabalhar. Então, vamos desativar esse
alto risco por enquanto. Vamos colocar quatro imagens
e teremos uma semente aleatória. Vamos criar imagens aqui. Vamos esclarecer isso por enquanto. Eles serviram ao seu propósito. Ele vai fazer
essas quatro imagens. Todos eles serão uma solução de
512,5 Kelvin. E se eu acessar os extras e selecionar Lote
do diretório, posso escolher o
diretório do
qual quero enviar as imagens. Então esse é meu diretório de entrada. Vou colocar isso aqui. E então eu tenho que
escolher um lugar para onde a foto deve ser enviada. Então, eu vou criar
uma nova pasta aqui. Vou chamar
isso de escalas de saída. E vou copiar o caminho
disso e colocá-lo no
diretório de saída. E então eu escolho o
obscuramente que quero usar. Eu seleciono redimensionar. E, desse jeito, agora
estamos criando imagens
de alta resolução de fotos aéreas em lote. Então, o lote é muito útil porque
digamos que você tenha um vídeo. Você pode dividir o vídeo em imagens
individuais, jpegs e PNGs. Em seguida, você pode dizer qual pasta
deseja usar como entrada. Em seguida, ele criará imagens sofisticadas para todas elas. Então, vamos lá. Você pode
ver nossas imagens aprimoradas. Isso foi feito em lote. Então aí está. Agora você sabe como
aumentar a resolução de suas imagens usando o escalar ascendente. Podemos fazer isso antes na
criação da imagem. E você também pode fazer isso no correio. Depois de criar a imagem, você também pode entrar e optar por aumentar a
resolução.
7. Instalando novos modelos: Neste vídeo,
falaremos
sobre a criação de artes usando uma variedade de modelos diferentes que terão estilos de arte
diferentes. Vamos aprender como encontrar e instalar diferentes modelos
em difusão estável. Portanto, essa imagem aqui não foi criada usando o modelo de difusão
estável original. Por padrão. Este é o modelo que veio, pelo
menos no meu caso,
para difusão de grampos. Mas esse imaturo foi criado usando uma difusão
onírica. Então, vamos
mostrar como obter um modelo diferente e então você pode criar arte
como esta. Então, antes de tudo, precisamos
encontrar um modelo diferente. Há vários sites
diferentes. Vou
encaminhá-lo para dois deles. Uma delas é a IA cívica. Então, essas são listas de sites, exemplos de diferentes obras de arte
que estão sendo criadas. Então, podemos ver todas essas
lindas imagens aqui. E se eu quiser
criar essa imagem exata, posso baixar o
modelo neste site. Você vê essa pequena coisa de
download aqui. Você pode ver que isso significa que este é um arquivo seguro para download. E as pessoas disseram
que é muito bom. Eles gostam disso. Você pode baixar isso. E depois de baixá-lo, você vai para a pasta do
software de difusão
estável. Onde quer que você o tenha instalado. Vá para sua difusão estável. Vá para seus modelos, vá para sua difusão estável. E você vai colar
esse arquivo nessa pasta. Depois de fazer
isso, você volta à sua difusão estável e só
precisa
recarregar o software. Então, nesse caso,
isso significa entrar nas configurações e clicar
na interface de recarga. E depois de fazer isso, seu modelo aparecerá nesta seção
suspensa Gordon no
canto superior esquerdo. Esse modelo em particular eu
obtive da Dreamlike Art, que é um site
chamado hugging face. Hugging Face, arte
onírica, difusão onírica
e traço 1.0. Se você acessar este site aqui, poderá
baixar esse modelo
exato também poderá
baixar esse modelo
exato e
poderá fazer isso gratuitamente. Esse modelo é muito
parecido com a jornada do MIT. Mid journey é um software gerador de
arte de IA pago muito semelhante à difusão
estável. Você pode digitar texto e isso
criará imagens
muito bonitas. Aqui você pode criar uma arte
parecida com esta. Semelhante à jornada do MIT. Na verdade, a única
diferença entre meio da jornada em efusão
estável é que você tem
muito mais características e difusão grampeada
e isso é gratuito. Então, por que não usar o gratuito
que oferece muitos recursos. Então eu digo, então aqui estamos. Este é o modelo
do Hugging Face. Se você quiser
baixá-lo e
acessar arquivos e versões, e quiser
baixar o arquivo. Diz um
traço de difusão onírico 1.0, tensores seguros. arquivo Sek PT é o modelo original e o arquivo tensor
seguro significa que eles fizeram alguma
serialização e verifica
se estão cheios de algum
tipo de vírus. Se você baixar
o arquivo CAPT, certifique-se de usar um software antivírus
antes de começar a usá-lo. De qualquer forma, depois de
fazer
o
download, coloque-o na pasta e inicia o DUI e inicia o DUI e ele aparecerá aqui
no canto superior esquerdo. Então, acho que essa é a essência
principal: você pode baixar
modelos diferentes do David AI. Ou se você puder ir ao
Hugging Face e encontrar centenas ou milhares de modelos
diferentes que as pessoas estão usando. E então você pode
inserir suas
instruções de texto e criar uma arte
no estilo de qualquer
modelo que você baixou.
8. Inpainting: Neste vídeo, vamos
falar sobre inpainting. Na pintura está a capacidade de
substituir objetos dentro de suas fotos e
imagens por outros objetos. Você pode simplesmente trocar as coisas. Então, o que você precisa
fazer no trabalho de pintura, você só precisa de uma foto,
uma ilustração. Algo pode ser uma imagem criada em efusão estável,
como a que tenho aqui. Mas você também pode simplesmente tirar uma
foto do seu computador ou um desenho ou o
que quiser. Dependerá do,
os resultados obtidos também
dependerão do modelo
que você usa. Portanto, considere qual modelo você deseja usar para sua pintura. Depois de preparar sua foto, você pode ir para imagem em
imagem e depois em tintas. E então você pode encontrar a foto e seu
computador em algum lugar. Ou, no meu caso, como
construí a imagem em difusão
estável, posso então sentir dor. Então você tem uma imagem agora,
em tinta, e você pode
escolher um pincel aqui. E isso vai nos
ajudar a decidir o que queremos substituí-lo. No meu caso, vou dar óculos para
essa senhora. Isso deu a ela alguns tons bonitos. E eu tenho que ir até o prompt na parte superior e dizer o que eu quero que
apareça na imagem. Então, digamos que dê
óculos escuros para ela. Por aqui. Você quer ter certeza de que
a máscara de pintura está selecionada pois isso significa que
vamos substituir a área que
foi desenhada. Se você quiser, você pode jogar com esses
recursos diferentes para experimentar obter resultados diferentes,
mas eu vou ter esses valores por enquanto. E então eu clico em Gerar. E vamos dar algumas
saídas diferentes com esse lote. Então, vamos dar um pouco de sorte
e óculos escuros para essa senhora. Ok, vamos lá. Está com boa aparência. Vovó ao sol. Certo? Tem alguns óculos de Elton
John, ou talvez esteja
saindo bem. Vamos ver o que mais temos. Nós temos os
tons de azul. Muito bom. Temos algumas cores verde-azulado. Parece um pouco falso para mim. Oh, destruindo esses. Vamos lá. Ok, então isso é na pintura. Você pode tirar qualquer
imagem que quiser. Você pode desenhar por toda parte e fazer
várias iterações. Talvez, digamos que eu esteja
bem com essa, mas eu quero brincar com isso e depois dar a ela. Digamos vamos dar a ela,
dar luvas. Vamos ver como isso vai acabar. Luvas e são degeneradas novamente. Veja o que temos aqui. Agora, você notará algo que os olhos dela estão
mudando novamente. A razão pela qual
eles estão mudando é
porque o Paint atualmente tem
um pequeno bug em que porque o Paint atualmente tem
um pequeno bug em , se
você não reiniciou aqui, ele ainda está usando o desenho e a
pintura anteriores que você fez da última vez. Então, se você dar uma olhada, você notará que ele tem óculos
diferentes e ela também tem luvas. Oh, isso não
pareceu muito bom. Mas você pode ver que às vezes está fazendo um bom trabalho
, mas não está. Então, para corrigir isso,
certifique-se de ir até aqui e definir o reset a cada vez. Se fizermos isso de novo, agora só trocaremos as luvas em vez dos
óculos. Tudo bem, então vamos
ver como ela está. Que tipo de luvas você
vai te dar desta vez. Lá vamos nós. São lindas luvas pretas. Neste momento. Algum tipo de luva. Suas mãos. Tenho luvas de motociclista. Você entende a essência. Conseguimos substituir objetos desse
jeito. Agora você já sabe como
fazer inpainting para substituir qualquer objeto
dentro de suas fotos.
9. Pintura fora: No último vídeo, falamos sobre pintura em pinturas, onde podemos substituir
objetos dentro de
imagens por qualquer outro objeto Nesta palestra, falaremos
sobre nossa pintura. Sobre a pintura é um método
em que você pode estender imagens. Ele se baseia na tecnologia
que usamos na pintura. Mas dessa forma, você pode aumentar
as imagens e adicionar as existentes, adicionar conteúdo adicional
às imagens existentes, torná-las mais largas ou mais altas. Adicione mais objetos, mas mesmo fora da moldura da tela
original. Então, falaremos sobre
como fazer isso. O que você precisará
fazer para isso é que provavelmente desejará
ter um modelo específico
criado para pintura de tinta Vamos querer um modelo de modelo
Inpainting subsequente. E você pode obter um modelo
Inpainting aqui na Stapled
Difusion Neste URL
aqui, Hugging face.co. Quando modelamos de forma estável, eficiente e pintada, pode
haver outras, mas você vai
querer encontrar uma que seja mencionada
especificamente
na pintura. Eles tendem a
oferecer melhores resultados. Você pode experimentá-lo com
outros, mas bem, você descobrirá se funciona
o suficiente para você fazer isso. Você acessaria o arquivo
e as versões baixaria e gostaria de colocar isso em todos os
seus outros modelos. Então, quando digo todos os
outros modelos de que estamos
falando , são suas
efusões básicas É abril, a fusão
vai para seus modelos, para sua pasta de efusão estável com todos os
outros modelos aqui Então, eu não quero
colocá-lo nesta pasta
com todos vocês. Em seguida, você volta à difusão
estável,
acessa suas configurações e
recarrega sua E, em teoria, talvez seja
necessário reiniciar o aplicativo, mas seu modelo
aparecerá aqui aqui, e você pode ver que tenho alguns modelos
diferentes de pintura Eu tenho um aqui para este, eu tenho outro aqui. Portanto, vários modelos diferentes
têm opções de pintura. Depois de fazer isso,
porém, você pode pegar uma imagem existente e importar uma imagem aqui,
por exemplo, informações da P&G E vou tirar outra
imagem que eu já criei anteriormente
em efusão estável Nesse caso, esse
é esse garotinho. Você pode usar imagens que não
foram usadas criadas
em difusão estável Mas isso significa que você
terá que
criar as instruções
do zero Já aqui no meu exemplo, desde que criei essa efusão
estável em primeiro lugar, já
tenho
o prompt
que é pré-carregado quando arrasto uma imagem
para as informações do PNG E eu posso ver meus avisos
positivos
e posso ver meus avisos
negativos E isso só me poupa da
etapa de tentar
descobrir o que está envolvido na
criação dessa imagem. Caso contrário, basta
olhar para a imagem e tentar descrevê-la da melhor forma
possível. Bem, esse é o
personagem que eu quero criar um ambiente em cores
e estilo e assim por diante. Sim, então temos essa imagem, agora
vou enviar
minha imagem para o inpaint Em outras palavras, como a seção
de imagem para imagem aqui. Como alternativa, você pode
simplesmente carregar sua pintura
imaginária aqui e
ali está essa guia aqui no modelo de toque rosa A primeira etapa que
vamos fazer é ir para
a seção de redimensionamento porque queremos estender essa
tela da imagem Então, no meu caso, vamos fazer isso, vamos fazer isso dobrar o
tamanho, mil e 24. Vamos começar
aumentando a largura. Você também notará que aqui temos um valor inicial
pré-preenchido e que mais uma vez foi
obtido pelas informações do PNG Você quer ter
certeza de que está usando a semente que foi
usada originalmente. Se você tiver a habilidade, isso lhe dará
melhores resultados. E agora vamos
querer marcar essa opção
aqui, redimensionar e preencher E isso nos permitirá
redimensionar a tela
e preenchê-la com
qualquer detalhe que a Stable Effusion
ache que funcionará, e você
verá o que quero dizer em um momento redimensionar a tela
e preenchê-la com
qualquer detalhe que a Stable Effusion ache que funcionará, e você
verá o que quero dizer em um Então, vamos clicar em Gerar aqui e ver o
resultado que obtemos. Pode demorar um pouco. Ok, a imagem está carregada aqui. E vamos ver o que é feito. Temos no lado esquerdo aqui, essa pequena imagem desfocada aqui, e no lado direito, também é uma meio desfocada E o que é feito é tirar as imagens da
periferia daqui e estendê-las para a esquerda e para
a direita Agora, isso é parcialmente
o que queremos. Temos uma imagem maior agora, agora é um tamanho de
tela diferente e isso,
isso é 512 por 512,
e isso é 1024
por e isso é 1024 Temos a
tela maior. Também podemos ver que isso não é muito semelhante à nossa imagem
original aqui. O que agora precisamos
saber é que agora precisamos
pintar sobre isso e substituir qualquer
informação por novos objetos. Então, o que vamos fazer
aqui é colocar essa imagem aqui nesta. Então, vamos fechar essa coisa
e enviá-la com tinta. Então eu enviei essa
imagem aqui. E agora temos essa coisa
aqui onde podemos estender e substituir todas essas informações aqui. Eu só vou pintar sobre isso. Estou pintando e adicionando
o que eles chamam de máscara. Uma máscara de toda a área
que queremos substituir E eu só vou fazer
um lado de cada vez. Ainda não vou fazer esse lado
direito. E a razão para
isso é que não
queremos confundir a difusão Eles querem
substituir um lado usando todo esse outro
material referenciado Não queremos que ele tente
replicar tudo
dos dois lados ao mesmo tempo Ele necessariamente saberá
qual lado usar a referência. Vamos usar esse lado
referenciado para corrigir isso. E então vamos usar
esse lado referenciado para corrigir isso. Por aqui. Agora, tudo o que eu acho que
podemos deixar é o mesmo. Não precisamos mudar
nada necessariamente aqui. Se você quiser, você pode
brincar com eles, hum, mas eu não vou
mudar nada
neste exemplo.
Vou clicar em Gerar. E vamos ver. O que obtemos. Podemos ver que agora está trabalhando paralelamente, está construindo
algo aqui. E o que sabemos que temos algo que agora temos mais detalhes não é
exatamente da mesma cor, definitivamente
há algo
diferente aqui. Agora vamos fazer a mesma
coisa que o outro lado. Vou limpar todas essas informações aqui
pressionando este reset Vou enviar para
integrar primeiro. E então eu vou
limpar toda a minha máscara. Eu não quero usar isso. E depois vamos
pintar do outro lado. E clicaremos em Gerar. Isso é muito bom,
isso não é ruim. Agora temos um monte
de informações que não existiam na imagem anterior e na imagem original nos lados
esquerdo e direito. Podemos ver que há
uma linha forte aqui, mas podemos corrigir isso. Podemos simplesmente fazer mais
uma dessas em tintas. Se você ver algum resultado que
não seja do seu agrado, basta enviá-lo para outro e pintar sobre a área que está
faltando E espero que isso resolva o problema. Mais uma vez. Para criar esse
detalhe adequado em segundo plano, ele precisa ter instruções positivas
e negativas E quando você estiver usando, ele poderá
criar um. Vamos lá. Esta é a nossa, aqui está a
nossa imagem aqui. E podemos comparar
o antes e o depois, onde essa era a imagem
original, essa coisinha quadrada. E agora temos essa imagem
muito maior. É claro que funciona muito melhor, com imagens com fundos
desfocados. Quanto mais detalhado o tabaco
, mais ele pode ter algumas discrepâncias, mas você pode obter resultados bastante
decentes Portanto, essa é uma maneira de
pintar em efusão estável. Abordaremos um tópico
posterior mais adiante no curso. Eu tive que fazer isso
no Photoshop, que na verdade é
muito mais fácil e rápido Mas se você não quiser
usar o Photoshop, você pode usar essa
técnica na difusão de grampos
para fazer pintura
10. Estudo de caso de Img2Img Yoda encontra a costura: Neste vídeo, falaremos sobre
a guia imagem para imagem e alguns
dos recursos incríveis que você pode usar com imagem para imagem. E a maneira como eu
queria mostrar isso é com um exemplo um tanto
real. Eu te dei um pequeno estudo de
caso aqui. E eu vou te mostrar
um pequeno vídeo que foi criado usando imagem para imagem. Então, aqui está um
pequeno vídeo tolo chamado Yoda Meet Stitch
e dê uma olhada e depois voltaremos depois do vídeo e explicaremos
como fizemos isso. Um. Fala mais sobre porcarias. Um experimento que você está começando. Curioso.
Supõe-se que o gatilho seja verdadeiro. Este planeta expirou para a Bosch. Muito difícil de
renderizar. Neste momento, eu aceitei um papel na Igreja
Ortodoxa para conhecer a força. Eu sei que não. Forças e
campo de energia nos unem duas coisas. Objetos controlam nossas mentes. Até mesmo veja o futuro. A garota errada costurou. Primeiro, você deve aprender
a focar sua mente. Feche sua rocha arqueada
ali. Qual é a sua mente? Para se vincular ao foco? Muito progresso. Você deve trabalhar duro para
levantá-los com a força. Deve progredir pela rocha. Abrigo. Agora.
O passo a passo deve ser movido. Suas emoções. Você deve se
relacionar com o lado sombrio. Ainda desista. Eu preciso fluir. Um chefe para o lado negro. Você viu o vídeo
de Yoda Meet Stitch. É um pouco tolo, mas
isso realmente não importa. O objetivo é apenas mostrar o quão estável a fusão pode
ser usada para criar isso. Em primeiro lugar, você
notará que
há um diálogo instável acontecendo. E esse diálogo é
criado com o chat GPT. Fui conversar com o EBT e disse, escreva-me uma conversa em que Yoda conheça Stitch e ensine a
eles sobre a força. E surgiu,
surgiu um monte de pequenos
diálogos estranhos aqui. E eu fiz isso
algumas vezes e escolhi as pequenas partes
que eu mais gostei. É daí que
vem o diálogo desse vídeo. Agora vamos falar sobre as imagens
reais de si mesmas. Então, imagens aqui, com o que
estamos lidando? Nós temos esses personagens, que é esse cara do Yoda. E você notará que ele está se aproximando mais do que a
imagem ao fundo. Então, há essa profundidade aqui. E há algumas
maneiras de fazer isso. Provavelmente existe uma maneira fazer isso se estivesse fazendo
isso para produção, algum tipo de forma profissional, que é criar as
imagens em difusão estável. E você usava algum
software fotográfico como o Photoshop e selecionava o personagem
, o
recortava e se certificava de
obter todos esses detalhes. Eu terminei, certo? Portanto, só temos essa imagem e você pode colá-la em seu software
de edição de vídeo. E você tinha isso
em primeiro plano. O primeiro pareceu
muito trabalhoso. Sabe, eu não queria fazer tudo isso porque é
muito esforço. Parece que muitas vezes eu nem sei
quais imagens quero usar. Talvez eu goste de alguém que não é. Não sei se alguns desses
outros eu não quero
perder tempo entrando no Photoshop e recortando-os, pelo
menos não para
esse tipo de coisa. Eu queria fazer
algo rapidamente e queria ver qual é
o método mais rápido para criar esse personagem de primeiro e
segundo plano. Então, a solução que eu queria fazer é usar a técnica de
tela verde. Então, tudo isso
é feito criando personagens na frente
de telas verdes. Então, temos um personagem aqui, esse cara do Yoda está
na frente de uma tela verde. Em seguida, posso usar algo
chamado chroma key, que remove a cor
de fundo. E então eu posso. Substitua-a por outra imagem. Então é isso que
você está vendo aqui. Então, vamos mostrar como você pode fazer isso em difusão estável. Então, eu tenho minha
efusão estável aqui. Primeiro de tudo, eu vou e
crio o personagem
que quero criar. Nesse caso, brinquei
com alguns modelos de que gostei. Eu brinquei com alguns
textos, solavancos que eu gostei. Eu acabei descobrindo que
esse garotinho é tipo, ei, esse cara é meio fofo. Ele parece um personagem de Yoda
que eu quero fazer. Eu gosto desse cara. Então eu estou bem, estou
feliz com isso. Eu vou enviar
a imagem para imagem. A única razão pela qual nos
preocupamos com isso é para receber as instruções de texto. Nem nos
importamos com o sanduíche. Eu posso deletar isso agora. Estamos na
guia de imagem para imagem. Temos nosso aviso. Agora, o que precisamos
fazer é ter uma foto do nosso personagem na frente
de uma tela verde. E quando digo personagem, quero dizer qualquer personagem, pode ser isso. Isso é o que eu estava usando, é um cara na frente
de uma tela verde. E
nem é uma ótima tela verde,
como você pode ver,
é meio grossa, é apenas
um objeto de cor única. Agora, há um problema
com um Yoda e você não pode usar o Yoda na
frente de uma tela verde. Podemos fazer isso um
pouco, sem problemas. Mas Yoda é um pouco complicado
porque ouro é verde. Então eu precisava usar
uma tela azul, então, ok, vamos trocar essa cor em vez de verde
por azul. Eu fiz isso em algum software de edição de
fotos. Então eu tenho meu personagem, eu o tenho na frente
de uma tela azul. No meu caso. Eu posso dar uma
olhada nas minhas configurações aqui, mas elas não são
realmente importantes. Estou usando um Eu tenho alguns que podem
contornar a escala CFG. O mesmo assento, se você
quisesse a semente do seu texto para a imagem. Mas eu estou bem com tudo isso. A única coisa que eu quero que
ele mude
é que eu queria
que a saída
estivesse é que eu queria
que a saída nas dimensões de um vídeo, ou pelo menos na mesma escala. Porque quando eu crio
um vídeo como esse
, são 1920 pixels por
540 pixels, certo? Então, eu queria ter uma imagem que estivesse nesse espectro similar. Ok, então eu tenho minhas dimensões, tenho minha foto, tenho minhas instruções. Estou pronto para ir. Eu posso
então clicar em Gerar. E a efusão estável
está fazendo sua mágica. Ele está lançando um
pequeno personagem simpático de Yoda. Lá vamos nós. Nós temos um Yoda. Ele está na frente de uma tela
azul e diz, bem, a fusão
fez isso por nós. Então você pode fazer isso
para um desconhecido. Talvez você tenha um lote de 20 avisos diferentes que
você queria criar. E talvez eu queira tê-los em perspectivas
um pouco diferentes. Eu queria ter um
close-up do rosto dele. Então, vamos tentar um em close-up. Veja como fica
com esse rosto de perto. Vamos ver como isso fica. Eu posso tentar poses diferentes. Realmente não importa
o que queremos fazer. Você pode experimentar e experimentar campos
diferentes e diferentes. Quão perto você está do objeto, talvez queira ter sugestões de
mãos diferentes, isso realmente não importa. Podemos tentar
experimentar, é claro. De qualquer forma, depois
de ter todas as suas fotos diferentes, você
terá um diretório de todos os caracteres
que deseja usar. E a partir daí, você notará que
eles estão um pouco, pouco embaçados,
um pouco, não tão detalhados. Então, vou entrar nos meus extras aqui e fazer o lote a
partir do diretório. Então, nesse caso, isso significa que
eu selecionaria a pasta de todas as imagens que
usei como entrada. E vou especificar algum lugar para que a imagem
de saída seja salva. E depois de fazer
isso, agora terei essa bela coleção
de personagens de Yoda. E quando meu caso
deixa os personagens dois na frente de
telas azuis e verdes, o ponto, claro, é azul, então eu o coloquei na frente
de uma tela verde. diodo, claro, é verde, então eu os coloquei na frente
de uma tela azul. Ok, então eu entrei no meu software de edição de
vídeo. Então, no meu caso, estou
usando o Premier aqui. E tudo o que fiz aqui foi adicionar
um efeito chamado ultra key. Esta é a foto original que tirei desta difusão de mesa. Eu coloquei isso na
minha linha do tempo aqui. Em seguida, aplico a tecla ultra, que remove tudo o
que é azul. Porque você só tem essa tecla
ultra e diz: De que cor você
quer que ela mascare? Você pode simplesmente selecionar a cor. Nesse caso. Você então tem que brincar
um pouco com essas pequenas configurações. Mas quando você descobre algo que parece essencialmente
preto, você está bem. E você pode colar
a imagem de fundo, que no meu caso é outra foto que gerei
em difusão estável. Acabei de digitar na barra pendurada, que é o planeta em que o
Yoda existe. Foi assim que consegui
criar esses personagens
em efusão estável, onde você tem um personagem em primeiro plano
na frente de uma tela verde ou azul e um
ambiente de fundo separadamente. Isso tudo é usar imagem em imagem. Então, se você quiser saber como usar imagem para imagem, é assim
que você pode fazer isso. Você pode criar todos esses personagens
diferentes. Usando suas instruções. Você pode fazer as poses com seu personagem de tela azul
e tela verde. E então você pode aprimorar
todos eles com difusão
estável.
11. Intro de zoom infinito: Aqui está uma aplicação muito legal de difusão desativada , pois ela pode ser usada para criar o que é conhecido como zoom infinito. Você tem essa imagem
que
continua aumentando o zoom para sempre ou diminuindo o zoom para sempre, dependendo
se você quer ir
para frente ou para trás. Portanto, esse é um
aplicativo que podemos usar usando difusão estável. E você aprenderá como fazer
isso na próxima palestra.
12. Zoom infinito: Para criar o zoom infinito, precisamos primeiro instalar uma extensão em difusão
simples. Então, nesta guia Extensões, na URL de instalação a partir, você vai
querer colar a URL de um repositório
git muito específico. Nesse caso, esse é esse
repositório aqui,
github.com, github.com, a interface de usuário web 1111
automática de oito HID com zoom infinito. Então, você copiará o código desse repositório
do GitHub e o
colocará lá. E então você vai clicar
em Instalar. E então levará
alguns instantes. Depois de fazer
isso, você acessará
a categoria instalada aqui. Você clicará em verificar se há atualizações e , em seguida, aplicará e reiniciará. E talvez seja necessário também
fechar a difusão estável e
reiniciá-la novamente. Portanto, esteja preparado para isso e certifique-se de esfregar
até fazer isso. Você
também precisará ter
um posto de controle aqui que
tenha uma pintura embutida . Na pintura. Basicamente construído em um modelo que pode ser
usado na pintura. E geralmente tem o
nome na pintura. Então você pode ter isso inicialmente. Você precisará
encontrar alguns modelos para fazer isso. Então, aqui estamos unvicos. A Ai pode encontrar vários modelos
diferentes e tem exemplos de como seriam as
imagens. E você pode clicar em um
desses modelos e ele
mostrará exemplos. Pois no meu caso, eu escolho
a costela animada. O principal é que
você precisa ter um modelo que não esteja no modelo
pintado. Então você precisa de algo que esteja na pintura, porque isso
será projetado para funcionar melhor com
o zoom infinito. Então você pega isso, baixa
um desses modelos e o coloca na pasta de difusão
estável. Assim como todos os nossos
outros modelos, a difusão está desativada
do que a pasta modelos
e depois a pasta de
difusão desativada. Então você faz isso. E agora temos nosso
modelo aparecendo
na pintura como um
modelo que você pode selecionar. Em seguida, podemos ir até a aba do
bebê no Zoom. A criança, a guia Zoom, aparece porque instalamos
a extensão, então eu não vou querer
estar lá antes. E agora vamos dar uma olhada em
algumas dessas opções aqui. Na guia principal, você tem o lote
como antes. Então, quantas versões desse
vídeo queremos criar? Mostra o comprimento
que queremos definir. Por quanto tempo queremos um ou dois
vídeos antes? E aqui é
muito intuitivo, na verdade. Está dizendo, ok,
neste segundo 0 s, o que
eu quero ver? Oh, a primeira coisa que
eu quero ver é essa floresta tropical. E então ele vai
entrar em uma selva exuberante. Então, está tentando criar uma selva exuberante e
depois densas florestas tropicais. E então, eventualmente, você
entra nesse dossel de carga. Então, essa é apenas a primeira
coisa que você verá. Você também pode inserir avisos e adicionar linhas, não é muito
o que você quer fazer? É bastante intuitivo. Aqui está a solicitação que
definimos para o, queremos ver Isso é comum entre
todas essas informações. Então, estamos mudando isso. Portanto, essa é a
maior prioridade, mas também tenta
ter em mente todas as sugestões
positivas aqui. E tenha em mente a
imediata remoção negativa de lixo deles. A semente, é claro,
assim como o resto, se você regenerasse essa imagem e
tivesse uma semente diferente, você obteria um vídeo
diferente. Mas se você mantiver a semente da última iteração que criou, obterá uma, bem, se tiver uma negativa, obterá um vídeo completamente
diferente a cada vez. Mas se você tiver uma constância, você vai ter o
mesmo vídeo todas as vezes. Os amostradores, você usará uma matriz ou um
dos GPM plus plus, são ótimos
amostradores para usar com isso. A largura da saída, a altura da saída. Essa é a escala do vídeo. Nesse caso, é esse quadrado mas não precisa ser uma
raiz quadrada, você pode alterá-lo. E as etapas de amostragem são quantas? Se você aumentar o
número de etapas, isso funcionará um pouco mais, mas demorará um pouco mais. É claro. A
imagem inicial do cliente é meio interessante porque você pode escolher o que eu quero que seja, a primeira imagem que vemos, e então a saída será
baseada nessa primeira imagem. Você pode fazer o upload de uma
imagem inicial para começar. Pois o vídeo mostra o
número de quadros por segundo. Normalmente, quero deixar
isso como qualquer que seja sua meta
final por segundo. E geralmente são 30 quadros por segundo ou
24 quadros por segundo. O Zoom L é
definido inicialmente por padrão, que significa que você vai para o primeiro prompt e , em seguida, diminui o zoom
para a próxima ramificação
e, em seguida, para a próxima solicitação
no próximo pai. O zoom significa que
estamos invertendo a ordem. Então, ele começa no último prompt
e, em seguida, o penúltimo prompt, o zoom do prompt, está
se movendo para trás. Muitas vezes, o zoom
oferece melhores resultados. E no seu software de edição,
você sempre pode reverter a velocidade do vídeo. E a razão é porque,
quando você está diminuindo o zoom, ele está tentando criar algo do zero que
ainda não existe. Está apenas tentando
observar o ruído e adicionar algumas informações. Ampliando. Ele já tem
informações nas quais se basear. Então, está apenas substituindo o funcionamento interno disso
com base nas coisas ao seu redor. Portanto, ele tem um pouco mais
de materiais de referência para usar. Portanto, o zoom geralmente
oferece melhores resultados. O número de quadros iniciais
é bastante intuitivo. Então, digamos que você queira fazer um pequeno buraco antes de
começar a ampliar. E a mesma coisa
para o último quadro. A velocidade do zoom é
inicialmente definida como uma, mas geralmente são duas rápidas. Normalmente, quero definir
isso para pelo menos dois ou quatro ou algo mais alto, apenas para que seja um zoom
mais lento e gradual. Embora isso
signifique que o vídeo será mais longo e mais lento. Então, em vez de serem 5 s
que definimos aqui ou aqui, na verdade vai
multiplicar isso por quatro porque estamos
ampliando mais devagar. Mas geralmente é mais elegante
e agradável de ver. A pintura com a qual o mascaramento está lidando quando
cria uma imagem. Inicialmente, se você
não desbotar a máscara, obterá alguns resultados
chocantes. Então, vamos dar uma
olhada nas saídas aqui. Observe que a pasta de saídas não
está na pasta de texto para imagens
, está na pasta Zoom. Então, será
sua própria seção. Então, se eu der uma olhada em algumas
dessas versões iniciais, podemos, já
que, ainda pior, está tudo bem. Um desses. Vamos lá, podemos ver
esse quadrado muito claro porque a máscara não
desfocou muito bem. Então, geralmente
você quer desfocar um pouco a máscara e ela
ficará muito mais suave. Como você pode ver neste
. Provavelmente é um pouco quadrado,
mas você provavelmente pode brincar com as configurações de
desfoque mas você provavelmente pode brincar com da máscara para
torná-la ainda mais suave. E no pós-processo, você pode aumentar a escala para poder escolher um escalar suficiente. Esse é um desses
geralmente recomendados
e
aumentará a resolução
do seu vídeo para
aumentá-lo com mais detalhes. Observe que isso aumentará o tempo necessário para
o processamento do vídeo. Portanto, tenha isso em mente. Se você tiver um
multiplicador de ruído de imagem para imagem, verifique se ele está definido como um. Se você o tiver definido
com outro valor, talvez não obtenha bons resultados. Talvez nem funcione. Se você tiver correções de cores, verifique se isso não está ativado. Se você não os tiver,
não se preocupe com isso. Isso é somente se você já os tiver habilitado e
eles estiverem aparecendo lá. Então, sim, essa é essencialmente
a essência disso. Depois de definir todas as
configurações, basta clicar em Gerar vídeo
e você terá um bom vídeo **** essencialmente ampliado para sempre
ou diminui o zoom para sempre.
13. Criar promessas de difusão estável com o ChatGPT: Se você é fã como
eu, eu tenho GPT. Acontece que você
pode usar o chat GBT para criar solicitações de difusão
estável. Portanto, você não precisa se
preocupar em tentar ter ideias sobre o tipo de texto
a ser usado como sua solicitação. Você pode ter uma difusão estável, crie-as para você. Então, como fazemos isso? Bem, a efusão estável está
disponível em chat.openai.com. E você pode ir até lá
e criar uma conta e então você
terá acesso a essa interface. E é essencialmente onde
você pode digitar o texto aqui. E converse com o GPT então. São
milagres e
encontrará com o GPT então. São
milagres e
encontrará respostas para tudo o que
você colocar aqui. O que eu quero perguntar
ao chat GBT é que
eu queria dar
algumas instruções para mim. Então, aqui está minha mensagem de texto que vou
colocar no chat GPT. Você vai querer ter
algo parecido com isso. Vamos passar por aqui. Mas estamos colocando
aqui exemplos de
um produto de alta qualidade
para um retrato de
um garoto jogando xadrez para a IA de texto em
imagem, geração de imagens. Então, estamos dizendo ao chat GPT
qual é o objetivo geral. Mostramos alguns exemplos
de informações imediatas Esse é o bate-papo que o GPG pode usar. E então estamos dizendo que forneça algumas variações dos objetos. Estamos criando, diferentes
estações do ano, roupas, etc. Não use isso. Evite usar isso. E aqui está a parte mais
importante começar cada prompt com
essas palavras exatas. E nesse caso, a parte mais importante
é o garoto jogando xadrez porque eu quero
um garoto jogando xadrez. Você copia isso. E você acessa sua efusão estável aqui ou no seu GPG de bate-papo
e a coloca. E vamos conversar com o GP. O Gbt gera um monte
de instruções interessantes aqui e o faz muito rapidamente. Muito mais rápido do que eu
conseguiria encontrar instruções. Isso é certo. Tem algumas coisas
bonitas lá. Estou muito feliz com isso. Vou copiar isso, ir para minha difusão estável. E vou
colocar isso no meu nó, no deles,
no meu script, aqui
vou acessar os scripts e acessar as instruções do
arquivo ou de uma caixa de texto. E então você pode colar as
informações que
acabou de receber do chat GPT em sua
lista de entradas de prompt. E depois de fazer isso, você pode escolher
seu amostrador. Quero dizer, obviamente você escolhe seu modelo e então
você pode clicar em Gerar. E você verá que o chat GPT, de difusão
estável, está surgindo com essas imagens com base
na entrada que acabamos de fornecer
e as criamos no chat GPG. Eles parecem muito bons. Faz um trabalho muito bom. Vamos dar uma olhada um pouco
nelas. Então, temos um garoto
jogando xadrez no inverno. Aí está no outono. Há o verão, e acho que
existe o outro,
seja qual for a estação. É assim que você
pode usar o chat GPT para criar solicitações para difusão
estável.
14. Instalando o Controlnet: Vamos apresentar um
tópico chamado rede de controle. A rede de controle é uma extensão para difusão
estável que permite que você posicione a arte
que você cria. Então, neste exemplo aqui, eu tenho uma imagem estática em temos esse personagem que está sendo criado com alguns prompts. E o que podemos fazer aqui é usar sua
imagem original e colocá-la em pose. Que agora estará sempre
nessa posição exata que,
neste caso, é característica. Agora, isso é legal por si só e você pode colocar sua
IA da maneira que quiser. Mas o que é realmente útil
é que você pode usá-lo quando estamos começando
a criar vídeos de inteligência artificial. Quando começamos a criar um vídeo com o movimento
do braço direito,
preciso que a IA também pose exatamente
da mesma maneira e controle essa é a
ferramenta que usamos para posar. Então é isso que estamos desenvolvendo
neste curso. Estamos criando vídeos de IA, mas um controle que tem
muitos aplicativos interessantes. E nós
os examinaremos um pouco
aqui neste curso. Mas para este vídeo, vamos
nos concentrar apenas em instalá-lo
controlado. Ok, vamos instalar a rede de controle. Então, você vai querer ir para
a guia Extensões aqui. E você vai para, você ainda não vai ver
isso aqui, e é isso que
estamos tentando conseguir. Você precisará ir
até disponível. E você vai procurar o controle web
de estabilização, net. É isso que
vamos procurar, ou pelo menos
é o nome atual. E você vai encontrá-lo em. Meu estojo não está
aparecendo porque eu
já o instalei para você. Quando você fizer isso,
você verá isso aparecer no
lado esquerdo aqui. E você descobrirá isso. E então você vai
clicar em Instalar. Depois de instalar isso. E você clica no botão
Instalar, então você vai
instalar
e verá que ele aparece aqui. E então você pode clicar em
Aplicar e reiniciar a UI. Agora, o que isso
vai fazer é criar essa nova pasta em suas efusões de venda. E
será essa rede de controle de interface de usuário web estável e
eficiente que
a pasta aparecerá agora
, não estará lá no começo, mas aparecerá lá depois. E vamos querer
criar alguns modelos aqui. Então, isso criará
esses modelos. Isso vai aparecer. Inicialmente. Precisaremos
adicionar alguns outros modelos. Então, vamos colocar o
modelo não nesta pasta,
mas na pasta estável da rede de controle Diffusion
Models. É para isso
que vamos navegar. E vamos
baixar esses modelos. E você vai
baixá-los deste site aqui. Hugging Face, LLL, ESBL, Slash net slash Modelos de
manutenção de barras em árvore. Você vai baixar
esses modelos aqui. Eles são bem grandes e
você
os colocará nesta pasta aqui. Lembre-se de que está desativada a pasta de rede de
controle de modelos de interface de usuário da web de
difusão . Observe que isso é diferente
do local em que você colocaria
todos
os outros modelos de difusão estáveis até agora. Depois de fazer isso, você
pode ir para a difusão simples. Talvez seja necessário
aplicá-lo e reiniciar a interface de usuário novamente. Talvez você precise fechá-lo
e começar de novo. Mas se você seguir essas etapas, verá esta guia aqui, rede
de controle aparecendo
abaixo do texto em imagem. E ao clicar nele, você verá todos esses modelos. E você verá os
modelos que acabamos de
baixar do Hugging Face. Faça essa configuração e
, em
seguida, você pode continuar usando
o controle no próximo vídeo.
15. Introdução ao Controlnet: Então, até agora,
criamos personagens que estão apenas olhando para a
câmera na maior parte do tempo. Eles podem ser bastante insossos
na forma como estão posicionados. Mas usando a rede de controle, que
instalamos no último vídeo, agora
podemos ter nossos
personagens em poses específicas. Então, por exemplo, temos uma pausa aqui. Somos mulheres sentadas
no chão, com as pernas cruzadas,
os braços no chão. E ela está sempre
na mesma pose, embora tenhamos trocado a
roupa e mudado a cor de fundo ou
qualquer outra coisa que queira fazer, a pose é sempre mantida. Então, vamos dar uma olhada no que
podemos fazer com a
rede de controle para isso. Bem, na rede de controle aqui,
originalmente, se
tivéssemos que carregar nosso personagem, obteríamos algo
assim , onde só
temos um personagem, é meio sem graça
e voltado para frente. Isso é bom. Mas o que queremos fazer é
acessar a rede de controle aqui. Queremos fazer uma pose para que nosso personagem seja
posicionado controlando-o. Então, o que você coloca aqui? Bem, pode ser qualquer coisa, na verdade. Você pode tirar uma foto
de si mesmo em uma pose em que tenha o braço acima da cabeça ou qualquer outra coisa. Nem
precisa ser humano. Posso dizer, desde que
tenha a forma humanóide com braços e pernas e
tenha alguma forma de cabeça. Nesse caso,
não há nem mesmo um humano. Eu posso usar isso e agora
teremos nosso personagem 0. Certifique-se de ter ativado aqui, isso precisa ser verificado e
o processador precisa ser. Neste exemplo,
vamos usar o Canny. E o modelo
precisa ser exatamente o mesmo. Então, se você tem doces aqui,
você precisa de um doce aqui. Se você tivesse um modelo
diferente aqui, você precisa ter certeza de que
exatamente o mesmo modelo é usado. Então, depois de
selecionar essas coisas, você ativou. Então você pode ir
aqui e gerar. E vamos descobrir
que nosso personagem
agora está sendo criado na pose. Agora tínhamos aquela senhora branca em uma posição com as mãos no bolso e parece que ela tentou criar
algo como uma maleta, mas um pouco instável aqui. O olho está fazendo o possível
para recriar essa parte posterior. Vamos mostrar alguns
recursos para fazer poses se, por algum motivo,
você precisar de inspiração. Um deles é o
site pose maniacs.com, onde você pode se opor,
como este aqui você
vai para Home oppose. Você pode encontrar
várias
poses diferentes para escolher. Nesse caso, essa é
a postagem do dia, essa é a que
temos atualmente. E, essencialmente,
o que é é um personagem que você pode
mover, apenas um modelo. Você pode invertê-lo. Você pode optar por
torná-lo masculino ou feminino. Você pode escolher algumas posições
predefinidas que talvez
queira experimentar. E, finalmente, você pode
até escolher a iluminação, mas não nos
importamos com
a iluminação porque a IA
substituirá a iluminação. Depois, você pode
colocá-la em tela cheia, salvar uma captura e colocá-la
na fusão desativada. Outro que temos
é o postmarked.com. E você acessa postmarked.com e obterá
algo assim. E você pode adicionar modelos e muitos modelos
se quiser usar. E você também pode adicionar avisos, embora isso não seja
útil para o nosso cenário. Você pode ter cenas pré-fabricadas
como essa aqui, por exemplo, vamos adicionar esse personagem. Portanto, este é um post muito
bonito. Estou muito feliz com isso. Isso é muito dinâmico. Eu posso sentir muito
movimento acontecendo aqui. Vamos encontrar uma pose em que eu goste
bastante da posição, acho que gostei da
aparência dessa. Você acessa as configurações
aqui. Você pode ver algumas coisas assim em que
você terá sombra e piso, mas não queremos nenhuma
dessas coisas porque isso vai confundir a IA. Não precisamos do chão, não
precisamos do chão. E a única coisa que
nos importa é supor que realmente vamos
desativar todos os outros recursos
que estão nos distraindo. E, finalmente, vamos apenas
selecionar a captura de tela. Temos nossa
captura de tela, selecione-a. Lá vamos nós. Agora podemos voltar
à difusão simples. E eu posso arrastar minha desesperança. Sempre exclua o anterior. Eu posso arrastar minha captura de tela para dentro. Aqui temos nosso
pequeno personagem. E eu vou
clicar em Gerar agora. E teremos nossa personagem, senhora de cabelos
brancos. Agora, na pose das postagens que acabamos de
criar. Então, lá vamos nós. Posso ver que a IA está fazendo seu
melhor trabalho para recriar isso. Então, como isso está
fazendo isso exatamente? Bem, está usando algo
chamado mapa de profundidade. E um mapa de profundidade é essa segunda imagem
criada aqui. Se você não estiver vendo
isso, acesse as configurações e verifique se
essa coisa na
rede de controle está desmarcada. Isso é uma coisa muito importante. Você quer que isso seja
desmarcado se quiser ver esse plano de fundo. Então, o que é isso? Bem, quando usamos o
pré-processador e o modelo
, estamos criando uma
profundidade ou um mapa aqui, que analisamos dependendo do
modelo usado. Nesse caso, estamos
usando o Cannae. Portanto, o modelo de doces é
usado para detecção de bordas. Então, ele cria linhas finas
ao redor da saída, ao redor do modelo aqui. Então, está criando pequenas linhas. Aqui está desenhando pequenas linhas. E então é usar isso para influenciar a criação da pose que nosso
personagem usa. Há alguns modelos diferentes
aqui que baixamos. Aqui temos o mapa de doces que se concentra nas linhas finas do lote de
leques, o que é bom para altos detalhes, bom para Anna.
Podemos ter um mapa de profundidade aqui que seja útil
para identificar o espaço? Vamos
fazer outro vídeo que abordará
isso com mais detalhes. Temos o H-E-A-D, que é semelhante ao mapa
do condado, mas não se
importa muito com linhas finas. Isso cria mais
linhas difusas nas bordas. O MLS D é bom
para arquitetura. Portanto, se você tiver plantas
ou algum tipo de
edifício do qual deseja
obter o posicionamento. Isso é ótimo para eles. O mapa normal é útil para software
3D, onde você precisa saber a altura das imagens e alguns tipos
de volumes diferentes. Isso vai criá-los. A pose aberta é útil apenas
para criar essencialmente
como um boneco. E as
posições dos braços dos bonecos serão
aquelas usadas para
influenciar a saída. E finalmente, o que eu tenho
aqui é rabisco. É só que, basicamente, pode pegar apenas um esboço de
um pedaço de papel e convertê-lo
em seu desenho. Portanto, esta é uma boa
introdução sobre para que a
rede de controle pode ser usada.
16. Introdução a fazer vídeo com inteligência artificial: Até agora, neste curso,
acabamos de
aprender a criar imagens,
apenas imagens estáticas
que não estão se movendo. Mas acontece que a difusão
simples pode ser
usada para criar vídeos Então, o que faremos
nas próximas palestras é aprender como criar imagens em
movimento criadas para adicionar uma difusão estável O que você está vendo aqui é filmagem de um
casal em férias E o que fizemos se a
mantivéssemos por meio de difusão
estável, difusão
simples recria
cada imagem aqui, mas o faz Então, ainda
parece que é um vídeo e está passando de um
quadro para o próximo quadro. Agora, você pode notar que esse uso específico de difusão
simples parece um
pouco aquarela, mas isso é apenas esse aviso
específico
que estávamos usando. Você pode usar isso para
criar o inimigo ou verdade, qualquer outra coisa que você queira para converter suas imagens de vídeo Você gostou desse vídeo. E então aprenderemos como
criar um vídeo usando
efusão estável para você mesmo. Ok?
17. Configuração do SD para criação de vídeo: Ok, vamos começar com a criação de vídeo
com difusão estável. Portanto, na primeira etapa, precisamos fazer um pouco de
configuração. Na barra de salvamento imagens, grades de barra
abaixo da guia Configurações. Você provavelmente vai
querer escolher JPEG como formato de arquivo
para imagens, você pode usar PNG. Normalmente, é a
configuração padrão para PNG. Só vai ser
um arquivo maior. Depende da quantidade de memória
que você tem no seu computador. Você está consciente de
salvar memória ou não. Caminhos para economizar. Certifique-se de identificar onde está a economia para que
você possa encontrá-la mais tarde. Você sempre pode adicionar em seu
próprio link a pasta em que
deseja salvar seus arquivos de vídeo
criativos, as imagens com o
local de coleta lá. Sob a difusão estável, você vai querer verificar
isso com imagem para imagem. Execute a quantidade exata de
etapas que o controle deslizante especifica. Normalmente, você faz menos
com a remoção de ruído. Então você vai
ter que verificar isso. E voltaremos a isso, o que isso faz em um momento. Para interface de usuário. Na lista rápida, você vai
querer ter certeza esse texto está sendo exibido aqui. E sob a rede de controle, lembre-se de que instalamos o controle
sobre isso em um vídeo anterior. Se você ainda não instalou o
controle, precisará voltar assistir primeiro ao vídeo instalado na rede
de controle. Aqui. Este será um pequeno botão
aqui, ele não anexará um mapa técnico à saída. Você vai
querer que isso seja
verificado quando estiver gravando um vídeo, certifique-se de que isso esteja marcado
quando você não estiver gravando um vídeo, você vai
querer desmarcar isso. Tudo bem, depois de fazer isso,
clique em aplicar configurações, recarregue a interface de usuário. E você verá
esse pequeno controle deslizante
multiplicador de ruído aparecer aqui depois de salvá-lo
e recarregá-lo. Uma coisa que você
notará aqui é que vamos
querer definir isso como zero. Mas quando você desce
até o fundo, vai para 0,5. Às vezes, isso pode ser
corrigido em futuras atualizações, então isso pode não ser um problema. Mas, enquanto isso,
o que você pode fazer é fazer Inspect. E você pode clicar nesses homenzinhos aqui
e colocar isso em zero. E então você pode clicar com o
botão direito do mouse nessa coisa aqui. Basta clicar no controle deslizante
e selecionar o botão Min. Coloque isso em zero. E agora você pode realmente
arrastá-lo até zero. E se você está se perguntando, bem, o que é isso? Bem, se você olhar essas
configurações e acessarmos as configurações
que acabamos de alterar anteriormente e desativamos a efusão. Hum, faça a quantidade exata de
passos que um escravo especifica. Então, estamos dizendo que
não queremos fazer nada diferente do
que essa configuração aqui. Queremos fazer o número
exato de etapas que o slide
está especificando. Ok, fizemos
a configuração. Agora. Podemos começar a
criar o vídeo.
18. Criando vídeo com difusão estável: Então, vamos pensar em como
podemos criar vídeos com IA. Podemos usar texto para imagem, porque textos, a imagem
terá um aviso, criará uma imagem e terá uma
média diferente a cada vez. Mesmo se usarmos a mesma semente, ela continuará assim, não
haverá nenhum fluxo entre uma
imagem e a próxima imagem. E um vídeo é apenas uma
série de imagens em sequência. É só uma sequência. Então, precisamos usar
imagem para imagem. E então precisamos
ter imagens relacionadas umas com
as outras para
que elas se movam. Eles criam uma sensação
de movimento à medida que você passa de um quadro para
o próximo quadro. Então, precisamos ter um vídeo. E então, o que a
difusão grampeada pode fazer é pegar cada quadro
do vídeo e convertê-lo em qualquer imagem
que quisermos. E podemos ter alguma
consistência entre eles usando as mesmas informações
de sementes. Portanto, precisamos de um vídeo que
possamos converter em vídeo. Então, se você não tem, se você tem seu
próprio vídeo, você pode usar o vídeo que quiser. Caso contrário, se você quiser
baixar um vídeo gratuito, acesse pexels.com escolha o vídeo que quiser. Não importa nesse caso, eu escolhi esse garotinho aqui. E precisamos dividir isso em quadros
individuais. Há algumas maneiras de fazer isso. Você pode acessar um site como
este, easy gift.com. Vá para o vídeo dois jpeg. Coloque seu vídeo aqui. E então você escolhe quantos quadros você
quer por segundo. E você pode conseguir isso e
simplesmente tirar todas as imagens. Você pode fazer isso por meio de um software de edição de
vídeo. Nesse caso, se você tiver
algo como o Adobe Premiere, basta adicionar seus vídeos, sua sequência, exportar
e escolher JPEG. Essa é outra maneira de usar o que quiser. Você
não precisa usar o Premiere. Eu estava apenas mostrando que, caso
você tenha esse software ou
não possa ter esse software, você pode usar algo
como Easy gif.com. Depois de
convertê-lo, você
terá uma sequência de imagens. Então, se eu
clicasse nesse cara, a primeira imagem aqui,
e eu simplesmente clicasse à esquerda. Podemos ver a passagem de um
quadro para o próximo quadro. Temos esse cara se movendo lentamente. Efusão tão estável. O que ele vai fazer
é pegar cada quadro, convertê-lo em qualquer criação que
escolhermos com nossas instruções de texto. Mas haverá consistência
porque está se movendo. Portanto, ela terá uma imagem
que muda a cada vez, mas ainda temos nossa imagem de referência
básica. Aqui estamos em imagem a imagem. Vou carregar a
primeira imagem em nossa sequência. Na aba imagem para imagem
aqui, imagem para imagem. Adicionamos um aviso positivo. No negativo, você pode
colocar o que quiser. Nós escolhemos todos
eles. Eu quero usar. Obviamente, você
pode usar
qualquer modelo que quiser. Eu tenho um método de amostragem. Eu escolhi um com o qual
estou feliz. Nesse caso, minha imagem
de referência é 1.920 pixels por 180 pixels. Isso não é um quadrado. Então, ajustei a largura
e a altura para corresponder ao valor ou
à escala da minha imagem. Isso é exatamente a metade
dos 1920 pixels e aproximadamente a
metade dos 1080 pixels. Você notará que, se fizer isso e depois dividir por dois, às vezes
o valor será ajustado automaticamente e
isso não é muito
importante, só precisa ser aproximado. Então, agora chegamos ao CFG
e à força de eliminação de ruídos. Isso é um pouco complicado porque a escala CFG não se esqueça do quanto
queremos uma difusão estável. Jim dispara e
cria sua própria imagem. Então, quanto mais alto subimos, mais liberdade
a difusão
simples tem, quanto mais baixo vamos,
mais
perto estamos da imagem original. Agora, se chegarmos bem
perto da imagem, isso é bom. Porque um quadro se
parecerá com o
quadro seguinte e com a sequência. Mas isso também significa que não
estamos conseguindo difusão
estável para fazer
tanto de seu trabalho, está
se tornando menos, no meu caso, pintura
em pastel caricatural. Então, queremos ter um valor
um pouco baixo, para que pareça com
a imagem anterior. Mas também queremos que seja alto. Portanto, esse
recurso estável funcionará. Então você tem que experimentar
ir para baixo e para cima. E isso é um
pouco de prática, um pouco de gosto
e preferência também. O mesmo acontece com a força
de eliminação de ruído. Quanto mais alto subimos,
mais estável a fusão tem que experimentar. Uma coisa que você quer
fazer é, depois encontrar uma imagem de que goste, certifique-se de manter
a semente consistente. E para a rede de controle, você a ativa e escolhe o mesmo pré-processador
do modelo. Então, o que quer que você escolha, você
quer que seja o mesmo. Se você escolher, por exemplo, a profundidade, certifique-se de usar também
o pré-processador de profundidade. De qualquer forma, então eu cliquei em Executar, e foi assim que obtive
essa imagem aqui. Eu tenho esse garotinho que
é essencialmente essa imagem, mas além das sugestões positivas
e negativas. A pose também está sendo levada em consideração
por causa da rede de controle. O que quero dizer quando digo que a escala CFG e a resistência ao ruído
precisam ser baixas. Ou então você
terá muita variação. Bem, deixe-me mostrar a
saída que obtive
dessa imagem aqui,
essa sequência de imagens. Essa é a saída. Você
notará que a raiz quadrada, porque eu tinha a escala
um pouco errada, mas está tudo bem para este exemplo. Você notará que ele muda bastante de um
quadro para o próximo quadro. Você pode ver a etnia. Se o cara ao menos mudar. Você provavelmente pode mudar o estímulo positivo e o negativo para tentar mantê-lo ainda mais. Mas queremos confiar
menos do que na solicitação. Porque você não pode
prever
exatamente a aparência
de cada quadro. Podemos tentar o quanto quisermos, mas isso ainda vai mudar
até certo
ponto, porque ele está recriando uma nova
imagem toda vez. Eu recomendo que você
tente experimentar com a escala CFG e a força de
eliminação de ruído, mantenha esses
valores baixos o máximo possível. Quando você estiver feliz em
se livrar disso, livre-se da sua imagem aqui. Livre-se da sua imagem aqui. Por quê? Porque isso
influenciará suas imagens anteriores e futuras em sequência.
Não queremos isso. Queremos que cada imagem seja
considerada sozinha. Então, vamos ao lote aqui. E no lote, vamos escolher
nosso diretório de entrada. Então, o que quero dizer com isso? Quero dizer, o lugar onde temos nossos arquivos originais
são os arquivos de entrada. Portanto, copie o
local da pasta em que você se destaca e escolha a pasta onde
deseja que sua saída fique. Basta verificar
aqui se você vê que isso vai ser consistente
todas as vezes. Caso contrário, você
terá problemas. E então você pode clicar em correr. E depois de fazer
isso, você vai, eventualmente,
demorar um pouco. Eventualmente, você
acabará com sua pasta de saída
cheia de imagens. Esses caras. E podemos então combinar todas essas imagens em
uma sequência de vídeo. Você pode fazer isso
usando um
software de edição de vídeo ou
usar o Easy gif.com. Você acessa este site
e o criador de GIF e faz o upload de suas fotos. Se você estiver usando um
software de vídeo como o Premiere, vá para Arquivo vá para Importar. Você seleciona a primeira
imagem da sua sequência. Observe que a nomenclatura é
importante quando a simples difusão de nomes das imagens as nomeia em uma sequência. E essa sequência é baseada
em suas imagens de entrada. Então lembre-se de que criamos
essas imagens de entrada. Você não vai
querer brincar muito com
esses nomes porque ele
procurará isso quando você
os combinar mais tarde Se você não começar
com esse 0010203, não conseguirá
combiná-los. Então, considere isso. Sim, então você tem
sua sequência de imagens, nós a colocamos aqui. Temos nosso vídeo
e o reproduzimos. E parece bom, parece que eu criei
um vídeo, o que é ótimo. É isso que queremos. Há muitos quadros por segundo. Parece muito rápido. Há algumas coisas que podemos
fazer para tentar consertá-lo. Uma das coisas que
abordaremos
no próximo vídeo, que
é D piscando. Outra coisa que você deve
considerar é que
talvez você não precise de
tantos quadros por segundo. Tudo bem, ele só pode realmente
processar uma certa quantidade de cada vez. E se cada imagem for diferente, ela está se esforçando um pouco. Assim, poderíamos, por exemplo aumentar
a duração do tempo que
vemos cada quadro. Talvez só precise ver. Eu posso triplicar as molduras. E então, quando eu
reproduzir o vídeo, ele parecerá mais
um
esboço de história em quadrinhos , até certo ponto. Um pouco menos de jargão. Os olhos. Vamos consertá-lo, como
mencionei mais tarde. Mas você pode fazer isso. Mas se você estiver fazendo essa
técnica. Talvez você não
precise de tantos quadros em seu vídeo original. Talvez você possa reduzir o número de quadros em primeiro lugar. Então, quando estávamos dividindo os quadros desse cara
em imagens individuais, você pode ir para a sequência e dizer que talvez só precise de
12 quadros por segundo. Você não precisa de 24 quadros por segundo ou 30
quadros por segundo. E então, porque a saída, e talvez você dobre e
triplique de qualquer maneira. Então,
você economizará tempo ao criar todos os seus
vídeos com uma simples difusão. Então aí está. Agora você criou um vídeo usando difusão estável usando
algumas imagens de referência.
19. Defletores de vídeo de IA: Neste vídeo, falaremos
sobre como corrigir muitas
oscilações que ocorrem como em seu vídeo,
depois de igualá-las Então este é um vídeo que eu
criei em difusão estável. E você notará que
há muita cintilação no
fundo e é muito difícil olhar para ela e é meio dolorosa
nos Porque o motivo é que
toda vez difusão
estável ocupa
um quadro de um vídeo, ela
o recria. Cada quadro é um pouco
diferente do quadro seguinte E por causa disso, há muitas pequenas
falhas e divisões, cintilações ligeiramente
diferentes
e cada E o que queremos fazer é
adicionar alguns efeitos. Eu tento suavizar isso. Eu tentei identificar quando um quadro é completamente diferente do quadro seguinte. E é como um
pontinho aqui e ali. Bem, vamos tentar
suavizá-los e remover essas pequenas
manchas e falhas Então, isso é o que
vamos fazer neste vídeo, é descobrir como remover a cintilação de seus vídeos de IA Então, vamos fazer isso. Você precisará de uma ferramenta e a
ferramenta que parece funcionar melhor
para isso é a resolução da demência O Da Vinci Resolve
é um plug-in pago. É uma suíte de edição de vídeo. Tem muitos efeitos e você pode fazer coisas profissionais nele. Sim Então, se você quiser
ver a cintilação de D, você pode usar este Aqui estamos dentro
do Da Vinci Resolve. E eu importei o
videoclipe do processamento de IA. Então esse é o pequeno
vídeo aqui. Você verá que parece que
tudo está no Fast Forward. E a razão pela qual fiz isso, em vez de reproduzir
cada quadro, o que acontece aqui é que
eu os exportei do
meu outro
software de edição de vídeo depois combinar as imagens
em uma taxa de quadros mais baixa Então eu acho que isso ocorre apenas em 12 quadros por
segundo, em vez dos habituais 24 quadros por segundo
ou 30 quadros por segundo. Agora, por que eu faria isso? Bem, o que acontece
aqui é que quando eu estava criando o vídeo
com difusão estável, em vez de fazer 24 quadros por segundo ou 30
quadros por segundo, eu queria acelerar
o processo para que a versão estável
não precisasse renderizar tantas imagens, imagens Só porque a fusão grampeada
demora um pouco para fazer isso e eu realmente não
queria esperar tanto tempo E o que você pode fazer mais
tarde é que eu posso
diminuir a velocidade do vídeo. Então, neste momento, isso é apenas um vídeo de
doze quadros por segundo, mas eu posso fazer o
tempo passar na metade da velocidade E isso vai entrar, terá alguns quadros
duplicados mais tarde Mas como é uma espécie de aquarela de desenho animado,
estamos parecendo Provavelmente não
importa muito. Se eu tiver algumas
molduras duplicadas lá porque é um
pouco difícil ver todas as imagens com
todos os detalhes que são meio caricaturais Portanto, não me importo ter imagens duplicadas
e, portanto, não me importo exportá-las em
alguns quadros duplicados Então, aqui estamos com o vídeo agora e eu coloquei o
vídeo na resolução de Jue de Agora, por que eu trouxe
o vídeo aqui? Por que eu não trouxe
a sequência de imagens? A razão para isso
é que descobri que, quando aplicamos os plug-ins de
cintilação D, funcionam
melhor, pelo menos na
minha experiência em vídeos
do que Às vezes, acho difícil lidar com sequências de
imagens com
efeitos de cintilação Eu não acho que isso
sempre será o caso. Talvez seja apenas com a
versão atual que estou usando, mas no momento em que estou usando, preciso usar vídeos ao aplicar os
plug-ins D
flickering up Então, eu adicionei qualquer
videoclipe aqui e agora
vou para a guia Fusion. É aqui que vamos
aplicar todos os efeitos. Aqui. Podemos ver a mediana dentro e
a mediana fora Meeting n é nosso vídeo de entrada. Esse é o vídeo que
teremos chegando. Se eu clicar, clicar nesta pequena nota aqui e
eu apertar uma no meu teclado, posso adicionar a
tela de vídeo a este lado. E se eu clicar com o botão esquerdo
na
saída mediante e apertar duas
no meu teclado, posso adicioná-la ao outro Portanto, este é o
vídeo de entrada antes dos efeitos e o outro lado é o vídeo de
saída do After Effects. Então, vamos começar a adicionar
alguns efeitos a isso. Vou clicar
na mediana em. E vou clicar no
espaço de controle no meu teclado, supondo que eu esteja usando o Espaço de Controle
do Windows E abriremos
essa ferramenta de seleção. E aqui eu posso digitar
os efeitos que eu quero. Eu quero a remoção automática de
sujeira. Então, vou adicionar esse
automático durante a remoção. Na verdade
, isso não funcionou. Quero, quero clicar
primeiro no nó e depois na remoção
automática de sujeira Agora ele foi adicionado
à cadeia corretamente. Portanto, isso eliminará
quaisquer pequenos respingos, um pequeno pedaço de sujeira que aparece em apenas
uma única moldura, mas não aparece na próxima
moldura ou na moldura seguinte . Isso é o que isso vai fazer. E agora vamos adicionar
um plugin cintilante. Então, vou clicar
no próximo nó e clicar
em D cintilando Aqui está o plugin D flicker. Mais uma vez, eu fiz isso errado. Clique na sujeira automática
e depois na cintilação mais pesada. E isso o adicionou
à cadeia. Aqui nas configurações de
cintilação de D. Vamos querer mudar isso de
lapso de tempo
para lâmpadas fluorescentes Então, agora temos nossos efeitos automáticos de remoção de
sujeira, efeito cintilação de
entidade Se quiser, você pode continuar adicionando mais efeitos de cintilação em D. Por exemplo, eu posso simplesmente copiar
e colar algumas vezes. Essa cintilação d não é suficiente. Eu posso continuar
copiando os efeitos. Se eu for para o próximo,
vou querer mudar
isso um pouco. Vou mudar a quantidade de detalhes que serão restaurados
após o Flickr Então, talvez eu faça assim. E no último, talvez
eu escreva isso. Algo parecido. Então, agora temos um
monte
de efeitos aqui que
ajudarão a remover a cintilação Em teoria, isso
deve remover
a maior parte da cintilação Seria difícil ver
o vídeo da IA. Então, suponho que
você tenha feito isso. Qual seria a próxima etapa? Vou remover
alguns deles para fins ilustrativos. Depois de adicionar seus efeitos
, clique em reproduzir
no DaVinci E, na verdade, eu posso ver aqui
que não está funcionando corretamente porque
essa pequena linha verde, deveria
haver uma pequena linha
verde aqui chegando. Então, vamos tentar outro. Vamos tentar isso apenas com
a remoção automática de sujeira. Não vejo uma pequena linha verde. Isso me deixa nervoso
porque não significa que esteja carregado corretamente. Vamos tentar sair
e entrar novamente. Ok, agora eu vejo essa
coisinha verde. Eu quero ver isso porque isso para mim me diz
que está carregado corretamente. Você quer percorrer
todos os efeitos. Você adicionou seus efeitos de cintilação
D e, em seguida, clicou Reproduzir e
passou por
tudo isso até o final Por que você quer fazer isso aqui? Por que eu me importo tanto com essas
pequenas linhas verdes? Quando você está processando
a cintilação D e a remoção automática de sujeira Se você renderizá-la anteriormente
nesta guia de fusão, você economizará muito tempo ao exportar a renderização. Se você tentar exportar a renderização sem
executá-la aqui, poderá levar muito,
muito tempo para aplicar
o efeito de cintilação de D. No meu caso, demorei quatro dias para renderizar
um vídeo de alguns minutos. Considerando que isso só pode
levar alguns minutos se você fizer isso aqui nesta fase. Então, adicione sujeira ao seu Mac, adicione novos efeitos de
cintilação de div Vá até a frente da linha
do tempo do vídeo, clique em Reproduzir e certifique-se de que ele seja
executado até o Você vê essa
linha verde
até o fim , então você
sabe, você está bem. Você sabe que a
cintilação pode funcionar e que já está
um pouco Tudo bem, isso economiza tempo. Para economizar tempo, vamos fazer
algumas otimizações
para o DaVinci Resolve Certifique-se de ter seu
kit inteligente para o dinheiro do aluguel. Talvez você faça isso
primeiro, na verdade. Mas sim, você quer isso de forma inteligente,
a menos que
seja mais inteligente do que qualquer outra pessoa mais inteligente e
saiba quais configurações definir
para Mas depois de fazer isso. E você examinou isso, vá para a
guia Entregar aqui embaixo. E você vai
exportar seu vídeo. Então você escolhe o nome do arquivo, escolhe qualquer local
no seu computador deseja salvá-lo para
selecionar o tipo de saída No meu caso, estou escolhendo um MP4, que é o Se você tiver uma GPU, certifique-se de usar sua GPU Caso contrário, você não está
usando tudo o que pode. E eu vou para as configurações
avançadas aqui e vou
selecionar o uso de renderizar imagens em
cache para que usaremos
qualquer pré-processamento em que da Vinci Resolve Até agora. Você fez tudo isso. Em seguida, você clica em
Adicionar à fila de renderização. Seu vídeo aparecerá no
lado direito do gráfico. E então você pode
clicar em renderizar tudo. E você terá seu vídeo
explorado com todos os cintilantes em D É isso mesmo. Isso é tudo o que você
precisa para exibir seus vídeos de IA
20. Difusão estável dentro do Photoshop: Ok, então estamos usando difusão
estável até
agora sozinho. Mas acontece que você pode usar difusão
estável
dentro do Photoshop. E este plugin é um plugin gratuito que se integra
com efusão estável. Assim, você pode usar todo
o poder da difusão
simples
dentro de um Photoshop. Então, vamos
instalar isso e então você pode dar uma olhada em como tudo
isso funciona para si mesmo. Então, a primeira coisa
que você precisa fazer é instalar esse plugin
no Photoshop. Então, você faz isso
acessando o site github.com, uma arte de pontos da tabela de
barras para desenvolvedores do KD. Você vai lá. Você encontrará
esse repositório do GitHub. Mas não vamos
sair com o repositório. Vamos apenas
baixar este arquivo aqui como instalar, em
todas essas etapas aqui, você baixa o
arquivo CSV e o executa. A Creative Cloud
fará todo o resto. Ele instalará o
plug-in para você. Agora, precisamos começar a
executar a difusão estável e habilitá-la para
que o Photoshop possa acessá-la. Então, o que precisamos fazer
é acessar a do
plug-in table effusion web QI pasta
do
plug-in table effusion web QI para acessar esse arquivo chamado arquivo em lote do
Windows. E você vai editá-lo. E você vai
adicionar esse argumento aqui, traço, traço API. Para a maioria de vocês. Isso é o que você
precisa fazer é adicionar essa API de traço, traço. Alguns de vocês podem
ter algo um pouco diferente,
mas, no final das
contas, precisam adicionar esse argumento para habilitá-lo. Depois de fazer isso, você pode reiniciar a difusão desativada. E depois de reiniciá-lo, você copiará esse
URL de host local e local. Você vai copiar isso. Em seguida, você pode
iniciar seu Photoshop. Então, o photoshop carrega. Você acessa seus plug-ins, clica em Salvar e a
difusão é arte estável. Você abre o
plug-in de arte estável, distingue e aparece. E o que você quer fazer
é inserir
a URL que foi criada no prompt de comando que você está usando
para difusão estável. Essencialmente, você copia o URL. Isso é essa coisa aqui. Copie isso. Isso também é o mesmo, a mesma coisa que
seu site normalmente. Então, quando você tem o host local, isso é o que essa coisa
é, é essa URL aqui. Então você copia isso e
coloca isso aqui. E depois de fazer isso, é aí
que você encontrará todos os
seus modelos preenchidos. Então, abrimos isso. Eu também sou povoado. Agora podemos manter um
aviso positivo e um aviso negativo. É essencialmente a
mesma interface de usuário que você espera com difusão
estável. Apenas dentro do Photoshop. Você pode ter sua semente aleatória. Você escolhe o
método de amostragem que deseja usar. Escolha o número de etapas
para concluir mais etapas, quanto mais textos mais longos, mas
quanto mais detalhes você obtiver, veja se a escala G,
quanto mais baixa mais perto está do prompt, longe,
mais criatividade a fusão
estável terá. Para o texto em imagem, você pode basicamente selecionar uma ferramenta retangular
onde quiser. Simples assim. E a fusão estável
preencherá qualquer espaço imagem
fotografada se você desenhar
sobre da imagem
fotografada se você desenhar
sobre uma imagem existente
e ela substituirá ou tentará criar
com base no prompt. E voltaremos à
pintura em um momento. As configurações avançadas
são o número de etapas que você pode escolher se
quiser aumentar ou
diminuir a escala, ou seja,
alta resolução. Então, vamos supor que queremos fazer o recurso de conversão de texto em imagem aqui. Então eu seleciono texto para imagem. Eu seleciono a área
da tela para a
qual eu quero criar uma imagem. Então, vamos tentar substituir todo
esse retângulo aqui. E eu vou clicar em gerar. deficiente menos capaz vai fazer
isso , vai carregar. Provavelmente demore um
pouco,
dependendo do tamanho da área
que você escolheu. Além disso, se você escolher a escala, levará um
pouco mais de tempo, mas
obterá resultados mais bonitos. E aí está, quase pronto. Isso carregaria a carga. Linda. Vamos lá. Temos uma
imagem bonita aqui. Parece que temos alguns artefatos
estranhos
no fundo. Lá vamos nós. Então, temos nossa imagem e ela vem com
várias sugestões. Temos esse, esse, esse,
todos parecem muito bons. A imagem para imagem é
se eu quiser substituir, use isso como minha referência. Hum, crie uma nova imagem. Portanto, isso é mais útil se você tiver uma imagem ruim em
primeiro lugar e quiser substituí-la por seu
prompt de texto. A
imagem
criará prompt de texto. A
imagem algo do zero. Na pintura, verificamos
o recurso inpainting. Então, na pintura, significa
que podemos substituir parte da imagem existente
por outra coisa. Então, por exemplo, eu poderia dizer que quero
selecionar esses olhos aqui. E vamos mudar a cor
dos olhos, olhos azuis. E eu tenho a pintura selecionada e posso
clicar em gerar. Então, aqui estão os resultados que o Photoshop gerou para nós. Temos esse globo ocular aqui. Alguns desses
não são muito bons, como se este
obviamente estivesse errado. Este também está bem. Esse também não é tão ruim. Todos esses
são bem decentes. Ampliando, provavelmente podemos encontrar alguma semelhança vezes você verá
alguns problemas aqui, mas este fez um trabalho
muito bom. Então, vai ficar manchado nesse
cantinho aqui. Mas você sempre pode corrigir
isso no Photoshop. Outra coisa é escolher
um modelo diferente, por exemplo, escolher um modelo que tenha
pintura embutida nele. Alguns desses modelos
têm na pintura, por exemplo, este aqui é
destinado à pintura. Sobre pintura, você
obterá melhores resultados. Outra coisa que você pode fazer
com a pintura embutida é usar as cores da
sua imagem existente. E você pode usar
isso para estender a imagem e usar o truque de
pintura no Photoshop. Então, por exemplo,
eu poderia dizer que vou pegar
essas cores aqui. Assim, estendido um pouco,
algo assim. E então eu posso simplesmente
selecionar a área. Nesse caso, talvez
essa coisa quadrada aqui. E gere esperança. Vamos nos certificar de que selecionamos a
pintura, mas clique gerar e a fusão estável
basicamente examinaremos em
gerar e a fusão estável
basicamente examinaremos esta
área, compararemos o prompt e tentaremos preencher
todos esses detalhes aqui, esta imagem, você
verá em um segundo, provavelmente será
outra mulher aparecendo. Com base nessa saída. Aí está.
Tentou estendê-lo. Provavelmente é necessário
preencher com o prompt e o preenchimento ao redor
das cores e talvez com o que
você está selecionando um pouco mais, mas você tem a
ideia de que também pode estender as imagens usando isso. Portanto, esse é um plug-in de ferramenta incrivelmente
poderoso com o Photoshop que é
essencialmente gratuito para o Photoshop Você nem precisa
se preocupar em tentar criar imagens do
zero no Photoshop. Você pode usar a versão estável para fazer a maior parte
do trabalho para você. Se você acessar a guia
Explorer aqui, poderá ver exemplos de imagens que outros
usuários criaram. E o mais
importante aqui é que você pode pesquisar
o que quiser ver. Se eu quiser ver um Samurai, algo assim, posso
pesquisar da mesma forma. Mas então eu posso
clicar nessa coisa aqui. E ele copiará o prompt
usado para criar essa imagem no prompt aqui. Então você pode criar
uma imagem como essa. E a última coisa que
eu quero te mostrar, se é provavelmente algo que você já sabe se
você tem o Photoshop, mas caso não tenha. O Photoshop é um
monte de filtros neurais. E seus filtros,
ou seja, filtros que usam produtos de IA para ajudá-los. Por exemplo, você
suaviza a pele dos retratos para mudar a aparência da
expressão. Você pode transferir maquiagem. Você pode aplicar estilos,
apenas esquemas de cores. Você pode colorir automaticamente suas imagens. Por exemplo, digamos,
eu tenho essa imagem, só quero mudar
todas as cores dela. É muito fácil de fazer. O super zoom é
semelhante ao aumento de escala. Não acho que seja tão bom quanto o aumento de
difusão estável. O simples aumento da escala de difusão está, na verdade, criando
novos conteúdos. O super zoom é
mais do que apenas
brincar com o ruído
para obter mais textura. desfoque de profundidade permite que você
essencialmente coloque os objetos em
primeiro plano e fique mais focado e conclua
tudo em segundo plano. E esses permitem que
você se livre
de pequenos arranhões e
manchas e assim por diante. Essas são todas as ferramentas de IA
que o Photoshop tem. Se você tem o Photoshop,
você já
os tem com sua assinatura. Então, definitivamente, confira o
plug-in de difusão estável no Photoshop. Se você é usuário do Photoshop, as possibilidades são infinitas. Você pode criar qualquer coisa
com que possa sonhar.
21. Introdução de imagem em vetor: Neste vídeo,
aprenderemos como criar SVGs ou imagens vetoriais
usando difusão estável. Então, apenas uma breve recapitulação. O que é uma
imagem vetorial comparada a uma imagem JPEG ou PNG? Bem, vamos dar uma olhada em uma imagem
JPEG aqui, imagem PNG. Se aumentarmos o zoom o suficiente, podemos ver que a
resolução fica em blocos e volumosa e você não pode
ampliar muito. E se você expandir essa quantidade enorme e
torná-la muito grande, você verá toda a resolução se
rompendo com uma imagem SVG ou vetorial. Se eu ampliar completamente, pelo
menos o máximo possível, podemos ver que ele
retém as cores e
retém a imagem
sem quebrar. Então
é isso que
vamos aprender no vídeo a seguir: no vídeo a seguir: como criar SVG em imagens vetoriais
usando difusão de grampos.
22. Criando imagens de vetor SVG: Vamos aprender como
criar imagens vetoriais. Em difusão estável. Você precisará
instalar outra extensão. Extensões que você
instalará a partir do URL. E a partir do URL,
você obterá o repositório Git
para essa extensão, que é o estúdio vetorial de interface de usuário
web de difusão básica. Você vai copiar isso, copiar o código e
colá-lo aqui e clicar em Instalar. Esse é o primeiro passo. Então você vai
instalar, verificar se há atualizações. E você tem sua coisa vetorial que eu deveria mostrar aqui. Ele será atualizado, você clicará em
Aplicá-lo e reiniciará a UI. Talvez seja necessário fechar o aplicativo
reiniciado. Essa é a primeira etapa
nesse mesmo repositório Git, que mais uma vez é acessado aqui no github.com slash store, legato stable diffusion
web UI vector studio. Você rolará para baixo
e encontrará
a instalação,
dependendo se estiver usando Linux, Mac ou Windows. E eu estou supondo que
você esteja usando o Windows aqui porque eu estou usando o Windows, mas siga
tudo o que você precisa fazer
para o seu computador. Nesse caso, o que você
precisa fazer se estiver usando um Windows é baixá-lo. E depois de baixá-lo, você encontrará o arquivo. E você vai copiar
o arquivo executável,
o arquivo de retratos. E você vai copiar isso. E você vai
colocar isso em um lugar muito específico. E esse lugar está
na efusão estável. Quais extensões BWI, stable diffusion web UI vector
studio, acabaram instaladas na pasta bin. E você vai colocar aquele arquivo de
retratos lá. Você faz tudo isso. Talvez seja necessário reiniciar a efusão
estável novamente. E depois de fazer
isso, você verá o Spectra Studio
Tap aparecer aqui. Agora, na verdade, não vamos
usar a guia do estúdio vetorial, mas vamos usar
o plug-in embutido em um método alternativo. Então, aqui estamos no toque
de texto para imagem. E o que você vai
ver agora é que, sob esses scripts, você vai ver esse
pequeno estúdio vetorial. E se eu clicar nele,
isso vai usar as informações do plugin que agora temos
nesta guia aqui. Mas é assim que vamos
criar os arquivos SVG. Você tem várias opções
diferentes. Você tem a
ilustração, o logotipo, desenho, a tatuagem artística, o
gótico, o inimigo, etc. Você pode conferir qualquer um
dos que quiser. Nesse caso, vamos tentar
criar o logotipo de um hipopótamo. Essencialmente, tudo
o que precisamos fazer é permitir isso. De agora em diante, tudo o que
for criado será um arquivo SVG. Agora você também pode escolher se
deseja criar um PNG transparente.
Isso também é uma opção. No entanto, vamos clicar em Gerar e ver que tipo de
saída obtemos aqui. Lá vamos nós. Temos um hipopótamo. Esse é o PNG,
esse é o SVG. Então, podemos ver aqui que o branco é, na verdade,
parte da imagem. Mas talvez você queira que isso
seja transparente. E se sim, você
terá que clicar em Branco é opaco e ele mudará
a semente para
manter a imagem que
tivemos da última vez. Se eu gerar isso
pela segunda vez, agora
devemos ver nosso hipopótamo com um fundo
transparente. E lá vamos nós. Esse é o nosso SVG. Então, o PNG e o SVG foram criados. Então, se você colocasse uma
cor no fundo, a cor apareceria. Agora você vai
notar que uma
coisa não é que não
há cor. Isso é interessante. Por
que não tem cor? Bem, atualmente existe
a forma como esse plug-in funciona, se você quiser colorir, bem, ainda existe uma maneira
de fazer isso. você não precisará usar todas essas coisas sofisticadas que No entanto, você não precisará usar
todas essas coisas sofisticadas que
estamos instalando
aqui, você pode desativar esses scripts de
plug-in. Tudo o que você precisa fazer é
tirar a imagem de um
hipopótamo e criar
outro hipopótamo aqui. Vamos lá. Nós temos nossa imagem. E tudo o que você precisa fazer
é acessar este site chamado express.adobe.com
slash tools slash convert to SVG. Agora, isso é uma
coisa gratuita que você pode usar. Na verdade, você não precisa pagar
por uma assinatura da Adobe. Você só precisa se
inscrever em uma conta e
inserir a imagem
que você criou. Nesse caso, vou ficar nosso hipopótamo que
acabamos de criar originalmente. E você pode baixá-lo. E aí está, você terá sua imagem SVG. Então é assim que você
pode criar SVGs. Com efusão estável. Você pode usar
o plug-in embutido e isso criará um SVG com aparência
adequada pois
você pode fazer tudo
na versão estável, mas está limitado
a preto e branco. Como alternativa, você pode simplesmente
pegar a imagem do Canadá que
desejar e colá-la
no Adobe Express.