Transcrições
1. Introdução ao curso: Muita coisa mudou
no espaço da IA
nos últimos anos. Quando foi
lançado pela primeira vez, a maioria de nós, inclusive
eu, viu
isso como uma novidade. Até
agora, os modelos de IA evoluíram
a ponto de quase replicar um
criativo humano ou, pelo menos, enganá-lo quase replicar um
criativo humano temporariamente Quase todas as grandes empresas de
tecnologia
investiram bilhões
no espaço de IA, que levou a melhores modelos, treinamento
e pesquisa de
IA. Existe esse medo de que a IA
assuma o trabalho de uma
pessoa criativa. Esse medo é muito real,
e fotógrafos, designers
gráficos
e ilustradores podem ficar um pouco
preocupados Decidi criar
um curso teórico de IA que alivie esse medo Passei centenas de horas utilizando as ferramentas e modelos de
IA mais recentes e tenho muita
esperança de que a IA seja um complemento maravilhoso
combinado
com nossos próprios conjuntos de habilidades
criativas Essa aula é um bom ponto de
partida para qualquer criativo ou designer que queira aprender
sobre noções básicas de IA, como os bastidores de como vários modelos de IA funcionam,
como ferramentas de geração de imagens e modelos de IA de bate-papo, noções básicas sobre redação
rápida e como
escrever instruções eficazes, aprendendo
termos de design diferenciados que nos fornecem
o vocabulário certo para criar imagens hiperdetalhadas o vocabulário certo para Também discutiremos as
questões legais e muito mais. Aprender a escrever
instruções é como
aprender a escrever
novamente quando criança Começamos com instruções básicas que descrevem levemente
o que queremos
e, eventualmente, por meio da prática, somos capazes de descrever
adequadamente com
imensos detalhes o que
é nossa visão usando palavras que talvez
nunca tenhamos pensado em imensos detalhes o que
é nossa visão usar Essa aula pode agradar a quase qualquer pessoa que
tenha sido intimidada ou sobrecarregada pela IA e não saiba por onde
começar a aprender o básico Esta aula foi projetada
especificamente para criativos e designers para ajudar a
orientá-lo nos fundamentos da IA, você
possa começar a
pensar em como utilizar essas ferramentas incríveis para ajudar a se alinhar às futuras evoluções
do setor Minha esperança é que essa aula
seja um trampolim para futuras aulas que abordarão projetos práticos
de design usando Mas primeiro, precisamos
entender o básico por trás como isso funciona e esta aula
tem como objetivo fazer exatamente isso Nos vemos na
primeira aula. Meu nome é Lindsey Marsh, e ensinar
teoria do design é Sou designer
gráfico há mais de 20 anos e instrutor
de design para mais 350.000 estudantes de design gráfico Estou entusiasmado por poder
trazer essa aula para você hoje.
2. Como os LLMs funcionam: Vamos gerar um
cardeal vermelho em um galho. Como esse gerador de imagens
sabia mostrar um pássaro? Como ele sabia que o pássaro era
vermelho e estava em um galho? Como ele sabia a aparência
de um galho? Esse é um sistema complexo que executa milhões e milhões de cálculos matriciais
precisos para produzir o que parece ser mágica. Para realmente ter uma boa ideia
de como isso acontece, precisamos primeiro entender como modelos de
IA entendem a linguagem
humana e, seguida, entender como ela
gerará imagens Então, o que é um LLM? Um LLM ou um
modelo de linguagem grande é um tipo de inteligência
artificial
treinada para entender e gerar linguagem
humana Ferramentas como chat GPT, Claude e Google Gemini são
exemplos de LLMs,
são grandes modelos de são Usarei o chat GPT
durante todo o curso, que também é um dos LLMs
mais populares do mercado. Eles são chamados de grandes
porque são treinados em grandes
quantidades de texto, desde
livros, artigos e sites até
conversas on-line e muito mais. O objetivo é aprender como
os humanos se comunicam, nossa estrutura de frases, gramática, tom, estilo e até mesmo intenção Assim, a IA pode responder
de uma forma que pareça natural e útil. Sue, por que os LLMs são importantes para designers como nós
e outros criativos Porque os LLMs são mais do que
apenas assistentes de redação. Aqui estão algumas maneiras de como eles podem ajudar ou
projetar fluxos de trabalho Em primeiro lugar, geração de ideias. Precisa de um conceito, um slogan
ou uma direção de campanha. Basta perguntar. Redação Os LLMs podem ajudar a redigir postagens em mídias
sociais, slogans, descrições de produtos e muito mais. Resumos criativos Você pode obter ajuda para estruturar ou editar documentos voltados para o cliente. A nomenclatura gera
nomes de marcas, nomes de produtos, títulos de
projetos, tudo
com base no tom e nas palavras-chave Mas, mais do
que isso, aprender sobre como os LLMs funcionam nos permite entender a
ferramenta mais importante para designers
na próxima década As ferramentas de
geração de imagem e vídeo usaremos
ao longo do curso. Então, no curso, vamos nos
concentrar em dois tipos de modelos de IA. O primeiro é o
que acabamos de mencionar, o modelo de linguagem grande ou LLM, que acaba sendo
alimentado em outro sistema, chamado de modelo de difusão de
imagem E o
modelo de difusão de imagens é o que
nos ajuda a gerar imagens a partir do texto Por exemplo, ele pode
reconhecer que a Apple se
relaciona com frutas sem que essa conexão seja explicitamente
ensinada Essa capacidade de
interpretar a linguagem é essencial para as ferramentas de
geração de imagens, que exploraremos
ao longo do curso. Antes que uma IA possa criar uma
imagem de um cachorro latindo, ela deve primeiro entender o que é
um cachorro e o que
significa latir Portanto, o grande modelo de linguagem aprende, compreende
e gera linguagem
humana
analisando grandes quantidades de texto e encontrando
pontos de conexão entre eles. Em seguida, são inseridas
instruções em um modelo de fusão de imagem para fusão, que gera imagens guiadas por padrões
que aprendem durante o treinamento Geralmente, depende de um LLM para primeiro entender e
interpretar o prompt de texto, convertendo-o em tokens
significativos que guiarão o processo de geração visual Agora vamos falar sobre
como os LLMs funcionam. Pense nisso como um preenchimento automático
sobrecarregado que não apenas
finaliza suas frases,
mas pode escrever ensaios, responder perguntas, criar instruções de design e até mesmo ajudar na criação de marcas e Em sua essência, os LLMs são máquinas
de probabilidade. Quando você faz uma pergunta, eles
calculam quais palavras têm maior probabilidade de vir a seguir com base em tudo o que
aprenderam. Por exemplo, é como um designer experiente
que está tão acostumado com tendências, necessidades do
cliente e layouts que quase consegue adivinhar
o que o cliente quer a seguir, mesmo antes mesmo de o cliente contar, porque já fez isso
repetidamente A próxima é gerar
tokens e contexto. Portanto, os LLMs não veem
uma frase inteira. Eles os dividem em pequenos
pedaços chamados tokens. Palavras, parte das palavras ou até mesmo pontuação Até mesmo a pureza no final
é seu símbolo individual. Eles então analisam o contexto, o texto em torno dele, para
descobrir o que provavelmente virá a seguir. E, em seguida, há
várias camadas e processos pelos quais ele é executado. Os LLMs têm milhões ou
até bilhões de neurônios, unidades
matemáticas que
processam a linguagem em camadas Cada camada refina a
compreensão do significado, assim como um processo de
revisão criativa Então, vamos analisar esse
processo com mais detalhes. Então, vamos dar um exemplo de prompt. E este exemplo é criar
uma imagem de um cachorro peludo. Portanto, é bom dividir
cada palavra em tokens. Portanto, criar seria seu
próprio símbolo
e imagem separados de um cachorro latindo Ocasionalmente, ele
divide uma palavra. Portanto, latir pode
ser latido e depois, e os períodos também contam
como símbolos Portanto, cada palavra ou símbolo
recebe um ponto vetorial. Os LLMs não entendem
as palavras da mesma forma que os humanos. Em vez disso, eles representam
palavras como vetores, que são como longas listas de números, às vezes com 12.000 Esses números capturam a
posição de uma palavra em um enorme espaço invisível
chamado espaço de incorporação ou
espaço vetorial Cada palavra se torna um ponto
no espaço onde palavras semelhantes
são colocadas próximas umas das outras. Em nosso exemplo imediato, as palavras cachorro e latido estariam próximas
neste mapa porque frequentemente
mostravam associadas dados frequentemente
mostravam associadas
juntas durante o
treinamento Este exemplo usa um espaço de dois D, mas os modelos de IA têm
50.000 palavras para mapear Portanto, não há muito espaço. Então, o que ele faz
é
mapear tudo em um espaço vetorial de três D. É por isso que cada símbolo ou palavra
recebe uma longa lista de números, pois eles indicam a localização exata em
um mapa vetorial de três D. Essas colunas de números são coordenadas que
permitem que as palavras se
encontrem e, portanto, desenvolvam associações e
linguagem humana entre si. Imagine uma nuvem gigante de três D, exceto que, na verdade, tem milhares de dimensões
neste espaço. Significados semelhantes
se igualam mais próximos. Então, King está perto da Rainha e Paris está perto da França. E designer está próximo de outras palavras como criativo,
visual e artístico. Significados diferentes
estão mais distantes. Então, King está longe da
Apple porque King e Apple não aparecem
muito juntos em
texto e linguagem humanos. O brilho da luz é
uma área
diferente do peso leve,
dependendo do contexto. Esse mapa de significado
é construído durante o treinamento, à medida que o modelo aprende
como as palavras aparecem no contexto Os LLMs não entendem
palavras isoladamente. Em vez disso, eles consideram
os símbolos ao seu redor. Por exemplo, o designer usou cores claras no layout. Aqui, a luz é interpretada como brilho devido aos
símbolos, cores e layout próximos Mas a mochila é muito
leve e fácil de transportar. Agora, leve significa
não pesado, graças
às palavras contextuais,
como mochila e transporte O modelo ajusta dinamicamente compreensão com base no contexto, e faz isso por meio de um
mecanismo chamado atenção Então, vamos falar sobre atenção. Ao contrário dos modelos mais antigos que processam
cada palavra de forma independente, a
atenção,
que faz parte de
uma camada de transformação maior , que veremos, é
outro processo executado que permite ao modelo examinar todas as outras palavras na
frase e perguntar: qual delas
devo prestar atenção em
qual delas
devo prestar atenção
para entender
o que essa palavra significa? Isso dá ao modelo
a capacidade de pesar palavras de forma diferente dependendo de sua relevância para
a palavra que está gerando
ou analisando É como um designer revisando um quadro de humor inteiro antes de tomar uma
decisão sobre
um único elemento de layout Porque o significado geralmente
depende do contexto. Por exemplo, a palavra banco pode significar coisas muito diferentes. Ela se sentou na
margem do rio. A função de atenção
destaca a palavra rio. Ele fez um depósito no banco. A atenção agora destaca
a palavra depósito. O modelo usa a
atenção para focar
nas palavras que esclarecem
qual significado está correto. E então, os dados,
depois da atenção, fluem por várias outras camadas de processamento
diferentes. E muitos desses são
cálculos de matrizes
matemáticas diferentes que você vê nos bastidores e que estão acontecendo milhões e
milhões de Então, o próximo passo é a rede neural de
feedback. Então, depois de prestar atenção, o vetor atualizado de cada
token
naquele pequeno mapa de três D que
mostrei agora é enriquecido
com mais contexto Está passando por uma
pequena rede neural chamada camada feedforward Essa rede aplica uma transformação matemática
ao vetor. Ele não mistura fichas umas
com as outras. Cada token é processado de
forma independente aqui. Pense nisso como uma
etapa de refinamento que ajuda a extrair padrões
mais significativos a partir
das informações fornecidas. Está polindo, ajustando
, ajustando e aprimorando antes de
ser transmitido Eu queria parar um
momento e fazer uma pausa. Esse é um processo
matemático muito complicado com muitas camadas que processam dados
repetidamente. Você não precisa ser matemático para
entender como Eu só queria
mostrar um guia detalhado de como eles
passam pelos processos, mas você não precisa memorizar isso ou saber
isso de frente e de trás Isso só nos ajuda mais tarde, quando escrevemos instruções para saber o que
realmente está acontecendo nos bastidores
com a forma como
estão processando nossas palavras A próxima etapa são
as conexões residuais, pule as conexões. Isso é para garantir que o modelo não esqueça as informações
originais. Ele usa conexões residuais. Eles são como pequenos
atalhos que adicionam o vetor de entrada original volta à saída
de cada camada Isso evita que o modelo
sobrescreva informações úteis com
muitas transformações Então, é como
editar um design, mas manter a versão original como uma camada de backup no Photoshop Mais uma vez, você
não precisa conhecer
a matemática por trás de tudo isso, saiba que esse é um processo muito
complexo que acontece e por que a IA às vezes
parece mágica. Muitos freios e
contrapesos acontecem para
garantir que o que está sendo
lançado seja verificado e revisado Outra camada é chamada de normalização de
camadas e essa é uma etapa de limpeza. Isso ajuda a estabilizar
o treinamento e mantém os dados consistentes
em todas as camadas Isso garante que o modelo não fique muito tendencioso com valores extremos Por exemplo, é como
ajustar os níveis em uma foto para uniformizar a iluminação antes de passar para a próxima edição Então, estamos acumulando mais e
mais camadas de processamento. E os transformadores não fazem isso de uma
só vez. Eles repetem todo esse
processo várias vezes 12, 24 ou até 96 vezes,
dependendo do tamanho do modelo. Isso vai passar
pela atenção. Ele passará pela
alimentação da rede neural, pelas conexões residuais, pela normalização
da camada e se repetirá indefinidamente Assim, cada camada cria uma compreensão mais sutil
da linguagem humana Portanto, camadas inferiores,
compreensão de estruturas como gramática e pontuação,
camadas intermediárias, reconhecimento de significado
e relacionamento
e algumas dessas camadas
superiores de
processamento que, e algumas dessas camadas
superiores de posteriormente
, ajudam a raciocinar, como gramática e pontuação,
camadas intermediárias,
reconhecimento de significado
e relacionamento
e algumas dessas camadas
superiores de
processamento que, posteriormente
, ajudam a raciocinar,
planejar e concluir tarefas. Então, por exemplo, é
como passar do esboço à ilustração
refinada e à identidade
completa da marca E temos uma saída final. Depois de passar por
todas as camadas, o vetor final
é usado para prever o próximo token para geração de
texto, token que significa palavra, classificar algo como um
sentimento ou tópico
ou orientar a geração de imagens, como em um modelo de difusão, sobre o qual
falaremos Nós apenas explicamos como
os modelos LL funcionam. Mas se você realmente
quiser se tornar muito mais técnico e
mergulhar na matemática, é
claro que não é necessário
para este curso. Você pode conferir três
azuis e um marrom no YouTube. Foi assim que aprendi pela primeira vez
os detalhes dos modelos de IA e achei ele um professor
muito, muito bom. Então, vimos essa complexa
trama de processamento. Os vetores que representam palavras passam por várias camadas
de processamento de dados Eventualmente, eles alcançam uma matriz de
probabilidade o modelo determina
qual palavra tem maior probabilidade de sair em seguida. Embora a
matemática subjacente seja complexa, o que você realmente
precisa entender é profundidade
desse processo em camadas Cada palavra é
dividida,
analisada comparada entre si por meio de vários
freios e contrapesos internos O resultado parece
quase mágico, pois a máquina realmente entende e interpreta a linguagem humana Esse mesmo tipo de
inteligência em camadas também impulsiona a geração de
imagens por meio de um processo
chamado difusão, que exploraremos
na próxima lição Certifique-se de baixar
o recurso em PDF que aborda tudo o que
falamos nesta lição.
3. Como funciona a difusão de imagens: Os geradores de imagens e vídeos com IA
impressionaram a Internet nos últimos anos
com sua capacidade de fundir objetos, assuntos e
desafiar A negatividade em torno
dessas ferramentas de IA está se dissipando lentamente à
medida que os criativos começam a perceber o quanto elas podem ser
essenciais para
acompanhar as mudanças e mudanças
do setor Hoje, aprendemos
como os geradores de imagens funcionam passo a passo, para que possamos ver a magia
por trás da cortina Então, como essas ferramentas de
geração de imagens de IA funcionam? Então, da linguagem às imagens, como entender os LLMs ajuda
você a aprender modelos de difusão Então, na última lição,
passamos bons 12 minutos aprendendo sobre LLMs e como eles
processam tokens Eles constroem contexto,
aplicam atenção e geram previsões. Então, aprendendo isso,
você já estabeleceu as bases para entender como os modelos de difusão funcionam Enquanto os LLMs geram palavras, os modelos de
difusão
geram imagens e se baseiam em muitas
das mesmas ideias centrais, como processamento em
camadas, espaços vetoriais de
alta dimensão, representações semelhantes a
tokens e saídas baseadas em probabilidade A conexão principal é a
previsão como mecanismo central. No centro dos LLMs e modelos de
difusão está uma ideia
simples, mas poderosa Aprender a prever
algo com base no contexto. Em LLMs, o modelo
prevê a próxima palavra. Em modelos de difusão, o modelo aprende a prever uma versão
mais limpa da imagem, passo
a passo,
do ruído à Ambos os sistemas refinam as suposições com base no que aprenderam com grandes conjuntos
de dados Um funciona no espaço da linguagem, o outro no espaço de pixels. Então, o primeiro passo, a fase de treinamento, ele aprende destruindo imagens. Então, vamos dar um exemplo real
da foto de um gato. Vamos adicionar ruído aleatório
a ele pouco a pouco, ao longo de centenas de etapas. Como designer, você pode achar
esse processo familiar porque são os filtros gaussianos de desfoque e granulação Eventualmente, ele se torna
estático, como a penugem da TV. O modelo aprende como cada etapa do ruído afeta a imagem São milhares
de adições
e remoções de
pequenos pixels diferentes adições
e remoções de
pequenos pixels Isso ensina ao modelo
como as imagens se desfazem. Segundo passo, ele aprende como
desfazer o ruído ou o grão. O modelo é treinado para prever a imagem limpa
de uma imagem ruidosa. Em cada etapa, ele adivinha. Se essa é a aparência da
versão ruidosa, o que poderia ter sido a
original Ele fica melhor
comparando suas suposições com imagens reais e
ajustando seus pesos Então imagine um escultor diante de um
grande bloco de pedra No início, é apenas ruído, uma massa sólida caótica
sem forma reconhecível,
um grande bloco O escultor começa a
esculpir pouco a pouco, guiado pela intuição,
treinamento e referências Cada ataque remove a incerteza. Lentamente, formas começam a surgir, uma curva aqui, uma
silhueta Com o tempo, o ruído se torna forma e forma a
aleatoriedade do bloco Uma
estátua detalhada e bonita é revelada. Isso é chamado de difusão
reversa. Você começa com o
ruído e o refina em uma imagem coerente,
passo a passo Etapa três, a geração começa. É a fase de amostragem. Agora que ele foi treinado
e realizou
esse processo de difusão milhões
e milhões de vezes, podemos começar com puro ruído, uma tela em branco de estática
e enviar uma mensagem de texto, por exemplo, um cachorrinho golden retriever usando óculos escuros Agora, passo quatro, eliminando o
ruído passo a passo. O modelo remove apenas um
pouco de ruído por vez, guiado pelo que aprendeu. Depois de cada etapa, a
imagem fica um pouco menos embaçada, um pouco
mais detalhada A etapa final, a imagem final, e é uma criação única. Isso continua por 50
a 1.000
etapas diferentes , dependendo do
ajuste do modelo Depois de etapas suficientes, a
imagem fica totalmente nítida. Agora você tem uma imagem
fotorrealista que nunca existiu antes, criada puramente a partir do ruído
e moldada pela linguagem E a grande questão
na mente de todos é quais dados os
modelos de difusão são treinados Os modelos de difusão são treinados em enormes conjuntos de dados de imagens
e, geralmente, precisam ser combinados com descrições de texto, também chamadas de pares de texto de imagem Esses conjuntos de dados ensinam ao modelo não apenas a aparência das coisas, mas também como interpretar solicitações de
texto em elementos visuais. Os dados de treinamento geralmente
incluem uma imagem, uma foto de um cachorro
usando óculos escuros, uma legenda ou descrição, como um golden retriever usando
óculos escuros Esse emparelhamento permite que o modelo aprenda quando alguém diz isso, a imagem provavelmente
fica assim O modelo então analisa pares de texto de
imagens para milhões e milhões de imagens em toda a
biblioteca de imagens que ele usa. Então, de onde ele tira esses milhões e
milhões de imagens? Essa é outra
grande questão que traz muitas questões de
direitos autorais, que abordaremos
um pouco mais tarde. Mas vamos falar sobre
alguns desses conjuntos de dados, e modelos diferentes
usam conjuntos de dados diferentes Então, há o Leon five B, e são 5 bilhões de pares de texto de
imagem
retirados da Internet Então, em qualquer lugar na Internet,
pegue tudo o que puder. Uma imagem que tem uma
descrição em texto, basta pegá-la. Open Images, são 9
milhões de imagens com rótulos, caixas
delimitadoras e Há Coco, 330.000 imagens
rotuladas com legendas
detalhadas São 100.000 milhões de
imagens cintilantes com metadados. A partir desses dados de treinamento,
o modelo de difusão aprende a aparência de diferentes
objetos e conceitos, quais estilos, é um É realista ou representado
visualmente, como a linguagem é mapeada para elementos
visuais como
peludo, brilhante, casa em arco E como alguns
desses modelos de difusão usam dados de treinamento que estão em
toda a Internet, há grandes considerações éticas e legais
a E vou ter
uma aula dedicada para detalhar todos os problemas
legais com ferramentas de geração de
imagens
e maneiras de contornar isso para garantir que o material que você está usando seja seguro. Portanto, alguns dados de treinamento podem incluir trabalhos protegidos por direitos autorais ou criados por
artistas, e muitos artistas
levantaram preocupações sobre seus estilos serem
imitados Como resultado, modelos de
origem ética, como Adobe Firefly, estão sendo desenvolvidos usando somente conteúdo licenciado
ou Discutiremos detalhadamente as questões legais com
geradores de imagens nas
próximas aulas Como cada conjunto de dados é único e cada modelo
usa um conjunto de dados diferente, existem diferentes estilos, propriedades
e personalidades que diferentes ferramentas de geração de
imagens Por exemplo, Mid Journey
era muito popular quando as ferramentas de geração de imagens foram lançadas pela primeira vez, há
alguns anos, e elas tendem a mostrar amostras trabalhos de
artistas
em toda a Internet, não apenas trabalhos gerais de imagem
do Google Então, eles estão
tirando mais proveito dos artistas e do trabalho dos artistas. Então, eles serão altamente artísticos, imaginativos,
surreais, oníricos Ele prioriza o
estilo sobre o realismo. E muitas vezes parecem pinturas
digitais, arte
conceitual e imagens estilizadas de
revistas Portanto, se você está procurando
por algo altamente técnico e científico, Md Journey pode não
ser a ferramenta para você. Mas se você está procurando um conceito de personagem
realmente básico para se personalizar, essa pode ser
a ferramenta para você Mas também tem mais problemas
legais, e foi a
que mais foi processada
e mais atacada pela comunidade de
artistas E falaremos
sobre como evitar o roubo do
trabalho original dos criadores usando essas ferramentas Há muitas
coisas diferentes que podemos fazer para adicionar nossa própria personalidade ao que
geramos para torná-la
única e nossa. E outro exemplo é o Dali, que será a ferramenta de geração de imagens Hat
GPT E vou usá-lo
ao máximo durante todo o curso, porque tive muitos resultados excelentes com ele. Além disso, é excelente para seguir com exatidão instruções de texto
complexas e produzir resultados ilustrativos, claros e
coerentes Portanto, é bom para
contar histórias, desenhos animados, estilos
editoriais, e achei
muito bom para
ideias e geração de logotipos O Eonardo é outra
ferramenta que é ótima porque tem algumas
opções gratuitas para você usar Não é tão de alta qualidade quanto a ferramenta paga de
geração de imagens GPT Open AI chat que eu uso, mas é uma ótima
alternativa gratuita, e falaremos
sobre quais opções são gratuitas e quais são
pagas um pouco Mas é forte em cinema, estilo de jogo de
fantasia ou arte
conceitual,
geralmente usado para maquetes de produtos, ativos de
RPG e elementos de design de jogos de interface do usuário É estilizado, mas de alta fidelidade. Firefly da Adobe é o mais acessível que eu
gosto de usar porque
a maioria dos estudantes de design tem uma assinatura da Adobe, então ele permite que você acesse o
Firefly dentro do Photoshop,
mas também fora do Photoshop em sua ferramenta independente de geração de imagens de IA O Firefly da Adobe é
o mais acessível que eu
gosto de usar porque
a maioria dos estudantes de design
tem uma assinatura da Adobe,
então ele permite que você acesse o
Firefly dentro do Photoshop,
mas também fora do Photoshop em sua ferramenta independente de geração de imagens de IA. Eu obtive
resultados mistos usando o Firefly. Pode ser um pouco difícil
fazer com que ele realmente entenda sua solicitação; às vezes é
ótimo e às vezes não. E vou usar o
Firefly como exemplo, mas
tem resultados mistos Acho que existem ferramentas melhores, mas essa é a mais
acessível aos designers porque vocês
já estão usando as ferramentas da Adobe. Então, espero que eles
fiquem cada vez melhores, e há uma razão pela qual dificuldades em
comparação com outros modelos Ele tem um dos
conjuntos de dados mais seguros nos quais treina. Ele usa imagens que são
todas livres de direitos autorais. Todos eles receberam permissão para serem
usados na ferramenta de IA. Assim, você pode usar qualquer
coisa gerada no Firefly para o trabalho do cliente
ou para o trabalho comercial Não posso dizer o mesmo para
alguns dos outros modelos de IA. Então é isso que o torna único, mas também limita sua biblioteca. Ele tem uma biblioteca muito menor para treinar porque só pode usar trabalhos licenciados
onde já foi concedida
permissão para usá-los. Mas com habilidades realmente boas de redação
rápida, você pode
contornar esse problema. Como você pode ver, há muitas
ferramentas de geração de imagens para você escolher. Vou me
concentrar apenas em alguns, mas minha esperança é ensinar essa
aula para que ela seja atemporal Vou te ensinar como escrever palavras-chave e escrever
rapidamente. E criaremos todo tipo de palavras criativas incríveis que realmente ajudarão a
destacar nossas sugestões e nosso
trabalho CT.
4. Escrita de propostas: A IA não é mágica. Não chega à sua mente
nem infere ideias vagas. Ele interpreta o que você diz literal e probabilisticamente É por isso que o
texto, a estrutura e os detalhes do seu prompt
fazem toda a diferença Um aviso forte pode ser
a diferença entre um resultado genérico e uma
obra-prima estilizada Saída na nuvem versus algo com emoção, textura ou história. M. versus Uau. T. A escrita rápida é direção
criativa. Pense na redação rápida
como uma orientação a um assistente altamente qualificado, mas
literal Quanto mais clara e criativamente você comunicar o assunto, a vibração, o estilo e o conteúdo,
mais próximo o resultado
estará da sua A escrita rápida não significa
hackear a IA. Trata-se de se comunicar
como um designer. engenharia rápida
é o processo de reunir instruções precisas
e detalhadas. Assim como escolher fontes ou
organizar uma composição, há nuances em
escrever instruções A ordem das
palavras pode ser importante, e sabemos disso
entendendo como LLMs funcionam para prever a próxima palavra com base
nas palavras anteriores O tom do seu fraseado
influencia o humor. Modificadores como cinematográficos ou
hiperreais ou oníricos atuam
como filtros vamos nos aprofundar em Posteriormente, vamos nos aprofundar em
algumas palavras
modificadoras muito específicas Bons escritores de prompts iteram, ajustam e aprendem a
linguagem visual do modelo, da mesma forma que designers aprendem a teoria das
cores ou os sistemas de grade O presidente da OpenAI,
Greg Brockman, compartilhou uma estrutura concisa de quatro etapas para Essa abordagem enfatiza a
clareza e
a estrutura para melhorar a qualidade das respostas geradas pela
IA Declare seu objetivo com clareza. Comece especificando exatamente o que você deseja que a IA realize Por exemplo, crie
três ideias de
conceito de logotipo distintas para uma marca de café
sustentável chamada Green Brew voltada para jovens
profissionais
ecologicamente corretos de 25 a 35 anos. Especifique o formato
de saída desejado. Defina como você deseja que as
informações sejam apresentadas. Por exemplo, apresente cada ideia de
logotipo com um nome
descritivo curto, uma breve justificativa, talvez
duas ou três frases, e sugira paletas
de
cores e estilos de tipografia adequados ideia de
logotipo com um nome
descritivo curto,
uma breve justificativa, talvez
duas ou três frases,
e sugira paletas
de
cores e estilos de tipografia adequados. Em seguida, defina restrições
e grades de proteção. Inclua quaisquer limitações ou requisitos
específicos para
orientar a resposta do EI. Por exemplo, evite designs excessivamente complexos ou
ilustrativos Use uma
estética minimalista e moderna apropriada para a primeira marca
digital garanta que as fontes sugeridas estejam
disponíveis por meio de fontes do Google ou
fontes Forneça
informações contextuais, compartilhe ou preferências
adicionais para ajudar a IA a
adaptar sua resposta Por exemplo, a marca
enfatiza o fornecimento ético, a responsabilidade
ambiental e uma personalidade sofisticada, mas
acessível O design deve ressoar com jovens profissionais que
valorizam a sustentabilidade, mas também o estilo e a conveniência Com isso, você obterá resultados
muito
mais específicos dos quais poderá
obter muitos insights. Obviamente, os detalhes são uma grande
parte da redação rápida. Aprendemos anteriormente a
importância do contexto para os LLMs. Na última parte do
nosso prompt de quatro partes, recebemos informações
contextuais Podemos nos
aprofundar muito em nossa explicação sobre o espírito
da marca, público-alvo
e a aparência desejada Ainda precisamos fazer toda a
pesquisa sobre design de marca, mas a IA nos dá um
trampolim de ideias e nos permite explorar áreas talvez não
tenhamos explorado sozinhos
. O interessante sobre a
IA é o quanto você precisa se associar
igualmente a ela para produzir algo que valha a
pena e seja único Lembre-se de que ele é
treinado em um conjunto baseado em redes de neurônios humanos
e processos de pensamento, para que possa emular a criatividade, mas não sabe como
ser criativo sozinho Ele precisa de sua orientação como especialista treinado em
design e guia seu caminho. É por isso que tenho o prazer de informar
que todos os nossos esforços, aprendendo teoria do design, cor,
layout, tipografia, fotografia,
recorte, gradação de cores,
hierarquia, histórico de design
e estilos, ainda
serão absolutamente necessários para produzir Somos os diretores de arte. Temos que pensar na IA como
uma nova ferramenta de software
para nos ajudar, mas ainda estamos
no banco do motorista. Vamos deixar de escrever
para LLMs por um momento. Podemos fazer mais criação de
ideias e brainstorming usando LLMs em um próximo projeto de design de marca Mas, por enquanto, vamos começar
a escrever instruções
eficazes para a criação de
imagens e vídeos Eu quero te mostrar a
evolução de um calçado. Então, quais são os
alicerces de um prompt forte? Então,
aqui está um exemplo. Um tênis futurista
e o estilo da casa
Bau combinam a
moda streetwear com gradientes de néon, superfícies
refletivas
e sombras dramáticas, renderizadas como uma maquete de vitrine de produtos para o Instagram. Vamos
detalhar isso. Então, qual é o assunto? É um tênis
futurista Podemos ser muito detalhados com
o tipo de tênis que é. Em segundo lugar, estabelecemos
um estilo ou influência. Que estilo de arte ou
referência você quer? Então eu falei sobre a casa de Bau e a
moda streetwear. Dois estilos diferentes
se fundem. E detalhamos
ainda mais, adicionamos detalhes. Sua aparência e
sensação incluem texturas, cores, iluminação e clima Então, para este,
fizemos gradientes de néon, superfícies
refletivas
e Não dissemos apenas sombras. Dissemos sombras dramáticas.
Não dissemos superfícies. Nós realmente nos
certificamos de que éramos detalhados. Por fim, formato médio. Que formato é esse? Um pôster, logotipo, ilustração, postagem em mídia
social O que dissemos é que
queríamos renderizar como uma
maquete de vitrine de produtos para o Instagram Fomos muito específicos
quanto ao tipo de saída e formato em que
queríamos estar. Então, começamos com um
simples toque de sapato. Eu não contei nada, apenas
gerei a imagem de um sapato. Não havia detalhes, não
havia contexto, um sapato. Então, o que ele vai fazer é
criar o que
acha que é um sapato com base em
todos os dados de treinamento. É só um sapato branco. Não há nenhuma característica nisso. Não é um
tipo específico de sapato. Então, vamos editar um pouco nosso
prompt. Vamos adicionar mais alguns detalhes. Um tênis moderno com formas inspiradas em
Bohuse. Então, agora temos um pouco de formas e cores
entrando em nosso sapato. Ok, vamos dar um
pouco mais de detalhes. Um tênis moderno com formas
inspiradas na casa Bau e bordas brilhantes em neon Coloque-o em um fundo preto. Então, agora estamos definindo o
plano de fundo e a cena. Nós não fizemos isso antes. E agora estamos sendo
muito específicos o que as linhas precisam ser, que brilharão em néon e ainda
manterão a forma da Bauhaus Vamos nos aprofundar. Vamos fazer um tênis moderno
com formas inspiradas em Buhuse, bordas brilhantes
em neon, colocá-lo em um fundo preto,
o tênis repousa sobre uma água brilhante
renderizada em três D com formas
adicionais inspiradas em Bohuse no fundo. Então, estou contando mais
detalhes sobre o plano de fundo e também sobre onde
o tênis está apoiado. Vai descansar
em um pouco de água. Então, vamos levar
isso ainda mais longe. Estou dizendo que quero um ângulo fotográfico
específico. Em vez de apenas um sapato onde
você vê o lado inteiro, eu quero um ângulo de três quartos, então vou adicionar
isso ao prompt. Quero acrescentar mais detalhes. Quero que chova e que gotículas de chuva atinjam
a água em que ela está apoiada e
o sapato
e façam
com que ele sapato
e façam
com Estou te dizendo, não
só faça chover, mas quero que as gotículas
de chuva caiam e reajam Vamos colocar mais e
mais detalhes com isso. Quero que um pouco da água
suba acima da sola
do sapato e espirre contra
ela como uma onda em uma tempestade Quero que os
efeitos de iluminação sejam
retroiluminados com propriedades holográficas Então, vamos adicionar mais duas revisões. Então, fiz a mesma
solicitação de antes, mas estou adicionando manter
tudo igual, mas troque os cadarços dos sapatos por
fios dourados Faça o ouro brilhar e brilhar. Mas também faça com que tenha uma perspectiva
ligeiramente distorcida. Torne os
cadarços dourados mais refletivos, adicione mais respingos de água e um
raio atrás deles Estou basicamente dizendo
mais dramático. Por fim, quero mais água saindo
da Eu quero que a água
tenha mais reflexo do néon do sapato Eu quero que haja um
raio no fundo. Eu quero que esse sapato ainda
tenha o formato de bohus. Eu quero o brilho de néon. Eu quero que o sapato seja mais decente
. Eu, mais, mais. Estou adicionando mais detalhes,
camadas e camadas, e estou tornando esse caminho mais exclusivo do que era no início A melhor maneira de escrever
instruções detalhadas e aprender como
fazer isso é estudando
outros exemplos Existem tantos exemplos
fantásticos de
redação rápida que você
pode encontrar on-line. No momento, há
valor criativo para aqueles que conseguem escrever instruções eficazes e
muito detalhadas para imagens visuais e vídeos, tanto que
as pessoas podem cobrar por solicitações
específicas para produzir imagens
muito Agora é visto mais
como uma arte em si, tão criativo quanto esboçar
uma imagem ou criar um logotipo Por quê? Porque é preciso um esforço enorme para
escrever instruções eficazes As palavras usadas, a forma como
enquadramos
o plano de fundo, o cenário é como falar
um novo idioma criativo, e aqueles que sabem
falar o idioma prosperarão É por isso que reuni alguns recursos
muito legais para você. Antes de entrarmos
nesse recurso, vou mostrar alguns exemplos
reais de redação rápida. Vamos dividi-los.
5. Exemplos com propostas do mundo real: Encontrei esse no Instagram. Então isso tem uma
aparência muito elegante de fibra, bordado e fio E eles pegaram logotipos
e conseguiram aplicar esse aviso específico
a muitos outros diferentes. Então, vamos dar uma
olhada em um prompt. E você notará que as
instruções que são muito, muito boas são esses parágrafos grandes, longos e detalhados.
Então, vamos detalhar. Crie um logotipo texturizado altamente
detalhado para a marca, feito de fios
grossos ou lã. Então você está estabelecendo
o
assunto e descrevendo-o. Cada seção do
logotipo deve ter uma cor vibrante diferente corresponda à
imagem de referência fornecida, e as imagens de referência também são
muito importantes. Podemos fazer
projetos práticos usando esses. O fio deve ter uma textura
tricotada com fibras
claramente visíveis, dando
uma aparência suave e dinâmica de
três D. E claro que o logotipo tem um efeito
tridimensional com sombreamento que faz com que
pareça um pedaço de tecido tricotado Então, estamos falando especificamente
sobre o tipo de fio, cor e a aparência E agora vamos definir a cena e
o plano de fundo. Portanto, o fundo deve ser
neutro ou de cor clara, permitindo que a textura vibrante do
fio se
destaque e mostre a identidade única da
marca Então, quando
detalhamos esse prompt, ele tem essas
quatro camadas
distintas sobre
as
quais falamos anteriormente, nas quais
você estabelece o assunto ,
fornece contexto , fornece informações
básicas e
as fornece no formato em que
deseja. Este próximo eu realmente
poderia ter usado na minha
master class intermediária de design gráfico, onde
ensinei vocês a
criar um pôster de fast food, e tive que acessar pexels.com
para encontrar Mas era muito limitado. Acabei encontrando
algo que funciona. Mas e se eu puder
criar algo que corresponda
perfeitamente à minha
visão criativa para o pôster E isso seria
muito bom
para qualquer tipo de pôster de fast food item relacionado a alimentos
ou qualquer pôster que você
queira gerar Agora você pode criar o que
quiser em termos de uso
dessa fotografia. Então você também pode fazer tacos, diferentes tipos de objetos alimentares O prompt não é tão longo, mas
acho que ainda é eficaz. Diz, renderize uma
imagem dramática hiper-realista de, você sabe, qualquer alimento suspenso
no ar com migalhas,
respingos, partículas congeladas respingos Use iluminação de borda ousada, foco
macro e um
fundo brilhante de qualquer cor para adicionar
energia e contraste. Então, você percebe
que algumas
dessas palavras-chave criativas , quando são descartadas, realmente dão à IA um senso de estilo que deve ser procurado
em suas referências. Então, neste caso,
iluminação do aro, foco macro. E suspenso no ar
e hiperrealista. Talvez você não conheça
muitas dessas palavras, mas vamos analisar
algumas palavras realmente diferenciadas para nos ajudar a
inventar
aquelas
palavras realmente estranhas que talvez não saibamos
o que é iluminação de borda Mas vamos explorar
tudo isso aqui em breve. E eu adoro ver essas texturas
hiper-realistas sendo usadas, especialmente esse tipo de objeto inflável
explodido aqui
que você pode fazer Então, vamos dar uma
olhada nesse prompt. Podemos ver isso em ação.
É muito consistente. Depois de desenvolver esse prompt, você pode simplesmente mudar
o assunto, e ele manterá o mesmo
estilo bastante consistente. Então, como vamos
criar isso? Foi assim que eles
fizeram. Então, vamos dar uma olhada no prompt
final. Uau. Não vou ler tudo
isso, mas queria mostrar este exemplo de como
isso é escrito de
forma elaborada e como provavelmente demorou algumas horas para escrever a solicitação e
ver os resultados Não é o que você queria.
Você tem que ajustá-lo, mudar o prompt,
assim como fizemos com o exemplo do sapato Tivemos que voltar,
adicionar coisas , adicionar coisas,
adicionar detalhes. São horas, e é por
isso que escrever instruções é uma
arte criativa por si só. Então, vamos destacar talvez algumas
das palavras-chave específicas realmente diferenciadas aqui que
eles estão usando Então, eles usam objetos
transparentes infláveis. Flutuar suavemente na água, para que não fique em águas agitadas, então está meio que definindo
o plano de fundo. Portanto, tem superfícies
lisas e salientes, espessas, visíveis e seladas a
quente Então, deixe-me dizer
o quão específico isso é. Então, você quase
precisa pesquisar como os objetos
de plástico são feitos
e termos sobre plástico. Então, às vezes você precisa
ir ao HachPT, pesquisar sobre plástico inflável, aprender sobre o processo e até mesmo
saber como escrever um aviso
sobre como Então é assim que
essas coisas ficam detalhadas. Então você tem turbulência, bolhas de
ar, ondulações
fracas, cáusticos naturais Então, aprenderemos
um pouco sobre cáusticos , mas isso é
tudo sobre iluminação Eu não sabia disso
até começar a me aprofundar nas palavras-chave
para escrever instruções. Aqui está outro bom
exemplo de redação rápida. Isso está em um saco lacrado
embalado a vácuo. Então, vamos ver
como fazer esse efeito. Então, crie uma imagem
hiperrealista de alta resolução, e você verá
essas mesmas palavras-chave, hiperrealistas, de
alta resolução, porque essas
são essas pequenas
palavras-chave que, de
repente , clicam no cérebro do
modelo de IA e dizem:
Ok, esse é o tipo de
foto que eu preciso procurar Mas eu queria
entrar nessa pequena área, incluir condensação
ou pequenos vincos ao redor dos
pontos de pressão para aumentar o Quão bem escrito é isso? Então, no final, você pode ver esses detalhes visuais
com dois pontos Então, ele listará muitos detalhes
visuais, mais do
que o que já foi feito. Portanto, plástico a vácuo triturado, transparente ou
metálico, silhueta de
objeto, detalhes visíveis
e extremos, iluminação
severa para
enfatizar textura e forma, sobreposições tipográficas, códigos
distorcidos e humor da marca, estilo de exibição do produto e clima de silhueta de
objeto, detalhes visíveis
e extremos, iluminação
severa para
enfatizar textura
e forma, sobreposições tipográficas, códigos
distorcidos e humor da marca, estilo de exibição do produto e clima de fundo. Portanto, ele define o
clima de fundo, uma iluminação natural
brilhante pós-consumo experimental, ousada e
colecionável, aprimora as cores
vivas
e
oferece uma aparência limpa, cinematográfica e oferece uma aparência limpa, cinematográfica Lindamente escrito
e o aviso, claro, parece fantástico Eu tive que experimentar esse prompt. Isso é o que eu tenho. Então, esse exemplo de
teclado foi muito legal porque achei
que eles realmente descreveram o que queriam
com essas palavras-chave extras Então, neste caso, eles disseram que querem uma grade
estreita de dois por dois. Eles simplesmente não disseram,
mostre-me um teclado. Eles disseram, eu quero
uma grade de dois por dois. Então, duas teclas na parte superior,
duas teclas na parte inferior. E outra coisa é que eles falaram sobre ângulo isométrico Então essa é a
visão e o foco da câmera. Tem esse ângulo isométrico. Então, se vocês estudaram, eu já lhes ensinei design
isométrico antes Então, isso é muito
popular em termos de visão. Então, enviar
imagens de referência é muito legal. Então, eles enviaram
uma imagem
de referência de uma foto que tiraram
de uma lata de Coca Cola e adicionaram no prompt uma imagem
de alta resolução desse objeto flutuando dentro de algumas nuvens brancas projetando sombras em
um céu azul brilhante A
iluminação energética
brilhante cromada levemente
arranhada, amassada, mas altamente refletiva, com uma atmosfera surreal e onírica mas altamente refletiva, com uma atmosfera surreal E você pode ver como criar muitos modelos realmente legais com seus próprios produtos ou design de
marca em que
está trabalhando Neste último exemplo, isso realmente me inspirou a fazer algumas pesquisas por palavras-chave para iluminação,
texturas e termos
semelhantes Então isso tem uma
aparência iridescente, um efeito muito,
muito legal em
que você tem quase esse prisma de arco-íris, E se você não
sabe se sua solicitação é boa
o suficiente, é boa
o suficiente, você precisa adicionar um pouco mais de
impulso à sua solicitação, basta perguntar ao Chat ChPT É ótimo para refinar um pouco
mais
suas solicitações, pois conhece os tipos de solicitações necessárias para gerar o tipo de
conteúdo que você está procurando Descrições obscuras revelam exclusividade e camadas de estilo. A maioria de nós, designers
, usa as mesmas dez ou 15 palavras-chave
visuais, talvez ousadas, grossas, brilhantes, geométricas, redondas, para citar algumas Mas e se
houvesse um mundo totalmente novo de milhares de palavras
criativas descritivas
diferentes que nunca
exploramos antes Tudo começou quando vi aquele aviso iridescente
que mostrei anteriormente e achei o efeito muito
legal Eu já vi isso antes. Eu simplesmente não
sabia como
colocar isso em palavras. Eu vou ser
honesto. sabia a diferença
entre idescente,
luminância, bioluminescência e todas essas outras Eu não
sabia a diferença
entre idescente,
luminância, bioluminescência
e todas essas outras
antes de pesquisar essa classe. O incrível é que eu
posso digitar no chat GPT ou um AILLM similar e pedir
palavras semelhantes para Surgiu com uma
variedade maior de palavras semelhantes. Consegui pedir que ele
criasse exemplos visuais dessa iluminação específica
no mesmo objeto, para que eu pudesse ter uma ideia das diferenças diferenciadas entre
os diferentes efeitos de iluminação Uau. Eu nunca teria mergulhado tão fundo em palavras tão
específicas antes, e agora me sinto
uma designer melhor Agora posso descrever profundamente várias situações de
iluminação diferentes ao escrever minhas instruções. E também pergunte a Cha GPT um estilo de arte,
texturas e estados de espírito muito
específicos, para que eu
possa expandir o vocabulário do meu
designer Consegui pegar essa
lista e
pesquisar intensamente tantas novas variedades de texturas e estilos de arte Eu me sinto como um novo designer que tem o mundo inteiro
ao nosso alcance De tudo que usei para IA, esse é o que me
manteve acordado à noite. Mas, no bom sentido, quero que
você mergulhe pessoalmente do coelho explorando termos de design de
nuances dos quais talvez nunca
tenha ouvido falar antes Dessa forma, ao escrever instruções, você pode ser incrivelmente específico Examinaremos muitos exemplos
de termos de design de nuances
na próxima lição Então, prepare-se.
6. Termos de design sutil: Uma escultura biométrica
e uma textura adivinhada
sob uma luz brilhante com as sensibilidades Wabi sabi sob uma luz brilhante Como diabos podemos
aprender o que é tudo isso? Eu nem conheço
metade desses termos até agora, até começarmos
a explorar algumas dessas palavras-chave
diferenciadas que podem tornar nossas solicitações
realmente profissionais Então, eu tenho esse recurso
para download. É isso que
vou ver com vocês juntos
nesta aula. Portanto, ao escrever instruções ou
desenvolver resumos criativos, essas palavras refletem nossos
estilos, texturas
e estéticas menos conhecidos que podem elevar sua linguagem conhecidos que Então, vamos trabalhar para expandir
nossa linguagem de design. Então, esses são alguns
e, claro, chat GPT e eu
realmente trabalhamos juntos para ajustar alguns desses estilos
muito diferentes Então, eu quero falar
sobre o primeiro. Esses são alguns estilos e movimentos
estéticos diferentes. Então, algumas delas eu quero mostrar
a vocês: a biomórfica, que é o exemplo no
início da aula, é uma
espécie de
bolha orgânica, semelhante a um fluido, que se forma E eu pude
mergulhar profundamente, pesquisei no Google, pesquisei, e agora eu conheço design
biomórfico, ou seja
, eu posso desenvolver cerca de três elementos
biomórficos D para colocar em um projeto de design de marca e
ajustá-los porque eu realmente
gosto de como isso parece agora, pesquisei, e agora eu conheço design
biomórfico, ou seja
,
eu posso desenvolver cerca de três elementos
biomórficos D para colocar em
um projeto de design de marca e
ajustá-los porque eu realmente
gosto de como isso parece agora,
especialmente em um modelo em três D. E há o núcleo do y2k. Então eu vivi até
o início dos anos 2000, então eu sabia muito
sobre o y2k É uma
forma de futurismo retrô do início dos anos 2000, gradientes
cromados Então, pense em dois pontos com esse tipo
de aparência brilhante corticista. É abstração dinâmica angular, modernidade
industrial. Então, esse era um estilo de pintura meio
popular, e eu ia dar uma
olhada em muitas coisas na Wikipedia
sobre esse estilo. Muito legal. Não
sabia que isso existia. Dinamismo O dinamismo demorei um pouco para descobrir
como dizer essa palavra São composições de alta energia. Então, vamos passar para
diferentes texturas e descritores de materiais Então aqui está aquela iridescente. É uma superfície cintilante de
arco-íris, uma mudança de cor com Achei que era muito
melhor do que apenas dizer neon. Eu senti que a única maneira descrever uma
luz brilhante era neon Mas agora eu tenho descendência. Então você oxidou, que é quando você
tem ferro que enferruja Portanto, é uma
pátina química enferrujada com metais desgastados. Então, isso pode lhe dar aquela aparência
metálica desgastada que talvez
você estivesse procurando Também há manchas,
que são
partículas dispersas ou textura brilhante E depois há a colagem. Portanto, a colagem em D são as camadas
rasgadas revelam E eu já vi isso em muitos
designs em que você tem aquela aparência rasgada
e vê as camadas, e realmente adorei a
aparência Eu simplesmente não sabia que
tinha uma colagem com o nome D. Portanto, a menos que você tenha muitas
aulas de história da arte na faculdade, talvez não conheça
algumas delas, mas pode pedir ajuda ao Chat
GPT agora Depois, há o
assustador, grotesco,
intencionalmente estranho, distorcido intencionalmente estranho, distorcido Esse foi meio
assustador, mas ei, todos
nós temos
coisas diferentes que estamos criando para nossas peças de design Então, um dos meus favoritos é
iluminação e termos de humor. Cáustica é, na verdade,
um termo muito popular em renderização de vídeo e três modelos
D, falando sobre como a luz
interage E às vezes vidro também. Portanto, são padrões de
luz refratada, geralmente debaixo d'água Eu sempre adoro esse efeito. Eu pintava um pouco
disso à mão quando costumava fazer pintura digital
e pintava água. Eu pintaria esse tipo de treliça refletida
e
instável, que Esse é o estudo da luz e refração no vidro e na água Então, preciso descobrir isso e ser capaz de
dar um nome a isso. Vamos passar para termos de estilo cultural
e de nicho. Futurismo retrô, que é
um visual vintage de ficção científica, imaginando Existe o Wabi Sabi, que é um conceito japonês de
imperfeição e transitórios É por isso que às vezes você
vê o ouro rachado
reparado e as placas, porque eles querem honrar
a imperfeição, e é uma coisa muito cultural
de se E eu realmente
vi esse Wabi Sabi em muitas instruções ultimamente,
então deve ser um estilo muito Portanto, também há composições estéticas
e visuais. Portanto, o orpismo é uma abstração
vibrante usa cores para expressar Então, o rainismo é a interseção de raios de luz, futurismo
semiabstrato
e até fractalismo, que você já ouviu falar
de fractais matemáticos, que continuam até o infinito, são
geometrias recursivas, formas e complexidade semelhantes raios de luz, futurismo
semiabstrato
e até fractalismo,
que você já ouviu falar
de fractais matemáticos, que continuam até o infinito, são
geometrias recursivas, formas e complexidade semelhantes. raios de luz, futurismo
semiabstrato
e até fractalismo,
que você já ouviu falar
de fractais matemáticos, que continuam até o infinito, são
geometrias recursivas, formas e complexidade semelhantes. Então, um dos meus
favoritos são superfícies, padrões e técnicas de mídia. Aqui está um vertigris
que é cobre oxidado e meio que nos dá uma pátina verde
muito legal E depois há o comportamento
e os efeitos das cores , cores prismáticas É como quando
você tem o prisma, que é basicamente todo
o arco-íris de luz sendo refratado
em uma área apertada Então você tem uma refração do arco-íris
com uma transição nítida. Portanto, eles não têm essas
transições soltas , como gradientes
soltos Eles são muito apertados e você vê uma
transição de cores muito rápida. Com essa iluminação frenética, e espero estar pronunciando
tudo isso corretamente, sempre
consigo bater um Mas a iluminação frenal é gradiente refletivo
de alta energia Então, tem esse
gradiente frio nas bordas, com todo o
resto meio escuro e irrefletivo E então temos a cultura do sabão
e a influência global. Então você tem o modernismo do deserto, que é uma
arquitetura de meados do século adaptada para climas áridos Então, se você já fez uma
solicitação para qualquer tipo de edifício ou prédio
em uma cena de fundo, você precisa falar com eles para falar com o chat GPT, ou qualquer
gerador de imagem que você esteja usando Certifique-se de colocar em que tipo de prédio tudo
está em segundo plano. Seja muito específico sobre o
estilo de construção. E então outra palavra-chave
super comum que estou vendo
em todos os lugares é Neo Tokyo. E Neo Tokyo é essa expansão urbana corajosa, colorida e
influenciada pelo anime E eu vejo muito isso quando você tem robôs futuristas Eles tendem a
querer apenas colocar isso em um cenário de Neo Tokyo.
Então você me conhece. Gosto de ir cada vez
mais longe na do coelho porque tenho uma curiosidade intelectual
por todas as coisas Então eu perguntei ao ChahPT Quais
são os termos ainda mais sutis e raramente conhecidos
em design Então, se você encontrar um estilo
que você goste, What diabos is that, você pode enviar uma foto de
referência para um LLM e pedir que ele descreva esse estilo
com palavras rápidas, e é bom
ajudá-lo a descobrir Então, alguns dos meus termos
raros favoritos eram veludo flocado. Eu sinto que posso
estender a mão e tocar isso. Plástico Leucite, que é um plástico retrô, um
tipo de plástico grosso robusto que
era muito popular
antes de começarem a
receber os plásticos muito finos finos Mas eu posso ver muito isso
em, tipo, produtos retrô. Textura de plástico-bolha. Adoro a aparência disso nas coisas. brilho do subsolo, que
você pode imaginar, como um bloco de magma e apenas um pouco do magma
de dentro está saindo, mas não é muito brilhante É muito subterrâneo. E o brilho do fluido de ferro. Então você já viu
óleo derramando em uma estrada e viu esse tipo
de arco-íris refletido Isso é exatamente o que isso é. É esse reflexo
que o óleo emite
, que reflete
um pouco
do espectro de cores em você, mas ainda tem aquela
aparência escura e líquida. Vamos até loucamente. Então, esses são provavelmente aqueles dos quais
você nunca ouviu falar. E se você já ouviu falar deles, parabéns, porque
eu nunca ouvi falar deles. Então, essas são as palavras mais
obscuras que pude encontrar na Internet,
e a quantidade que
encontrei foi Esta é apenas uma seleção muito
pequena que eu pessoalmente gostei e achei que
você acharia útil, mas há milhares
que eu não usei. Portanto, há a
refração do brilho da lua, uma luz suave e
prateada curvada pela névoa.
Muito, muito específico. Há uma floração caleidoscópica. Então, se você já olhou
através de um caleidoscópio, é uma dispersão caótica de luz fraturada, sangramento
fotônico, que é a sobreposição de fontes de
luz sangramento
fotônico é uma dispersão caótica de luz fraturada, sangramento
fotônico, que é a sobreposição de fontes de
luz com uma sobreposição ruidosa. Há pedra polida de magma, que é lustrosa e queimada, lava
resfriada encontra obsidiana resfriada Latido vítreo. Acho que estou dizendo isso. Acho que é de vitae, que significa vida. vitrio é uma casca de árvore
com
brilho vítreo semitransparente E também
podemos falar sobre esses temas
conceituais ultramodernos ,
Archetypical Glitch Core, Archetypical Glitch Core, que Fragmentos de utopia esquecidos, pedaços
quebrados de sociedades perfeitas
fracassadas Quero dizer, quão diferenciado você pode ter? E então ruínas do punk solar, o que é uma utopia de eco que Então, se você está tentando pintar
um quadro de humor distópico, essas são definitivamente algumas palavras que você
pode querer usar Como desafio para
estudantes do ensino médio, quero que você encontre os estilos de arte
mais diferenciados Escolha quatro estilos,
texturas ou descrições de arte com
nuances diferentes , e eu quero que você
explore isso intensamente Então, se é iudescência, procure iridescência,
descubra o que é isso, aprenda sobre isso E eu quero que você faça isso
com quatro diferentes. E se você quiser
fazer duas por dia durante todo o tempo em
que estiver aprendendo
IA ou fazendo esta aula, seria ótimo porque você
pode realmente começar a expandir seu vocabulário e
conhecimento de design dessa forma Então, agora entendemos a estrutura básica do que é necessário para criar um prompt sólido. E também descubra algumas
dessas palavras-chave diferenciadas. Sim, resta apenas
mais uma coisa para discutir as
questões legais com o uso da IA. Isso tem que ser discutido
antes de seguir em frente.
7. Direitos autorais e questões legais: Então, de onde a IA obtém suas fotos para criar
essas obras-primas É difícil não falar sobre
o elefante na sala. Como discutimos anteriormente, Mid Journey Dali e outras ferramentas de
fotogeração de IA tiraram uma grande quantidade de fotos de toda
a Internet para treinar seus bots
de IA Isso significa que
fotos, ilustrações
e gráficos protegidos por direitos autorais foram
compilados para ensinar ao bot o que o usuário talvez queira Há um
artigo interessante que afirma
que um dos fundadores
da MD Journey sabia esse era o caso e admitiu não saber o
que fazer para dar devida
propriedade dos direitos autorais aos artistas
das imagens que esse AiBT usa Ao criar arte de IA, você também pode adicionar imagens de
referência para ajudar o bot a detalhar ainda mais
o que você está procurando. E não há como
impedir que os usuários enviem trabalhos protegidos por direitos autorais da Pesquisa
Google para Isso significa que, se você estiver usando
imagens que não têm uma licença Creative Commons zero
ou uma licença de domínio público, você pode estar se expondo a ser
processado por extrair obras de arte de imagens protegidas por direitos autorais Então, isso significa que as ferramentas de IA violaram os direitos dos
criadores Isso viria
à tona em algum momento. Vários artistas se
uniram para processar o Mid Journey em outros
sites de portfólio de arte, como Deviant Art, por
permitir que trabalhos de IA
derivados de direitos autorais sejam publicados sem dar os devidos
créditos E vai ser um processo judicial
muito complicado. Por um lado, as ferramentas de IA
foram treinadas absorvendo dados da
maior parte da Internet, que é uma
fonte gigantesca de Pode ser difícil provar a individual de direitos
autorais a partir de imagens derivadas de um conjunto de
dados tão grande Por outro lado,
houve
casos em que
artistas individuais podem digitar o nome de um
prompt de IA e
ver claramente como sua arte foi usada
para formular os resultados Embora nem
sempre seja uma cópia exata, você pode ver a inspiração Quem é o dono do trabalho criado
pelos geradores de imagens de IA? Se eu inserir um prompt em um gerador de texto ou imagem de
IA, eu possuo o prompt para criar a imagem ou a própria imagem? É uma questão jurídica complexa, mas sempre vale a pena
ler mais sobre isso. Um elemento
humano deve estar presente para que qualquer
reivindicação de direitos autorais ocorra. Isso significa que a AI Tech não pode
reivindicar a propriedade das imagens. A arte de IA realmente não tem um proprietário com base nas leis de direitos autorais
atuais,
mas, de acordo com os termos de uso de alguns dos programas, ela atribui a
propriedade de uma imagem ao criador ou redator imediato Mas você pode considerar que reivindicação
de
direitos autorais no tribunal seria
a próxima pergunta, pois nada pode impedir que empresas
terceirizadas levem você a tribunal por usar a imagem de
sua marca em sua foto gerada por IA. Estamos realmente vivendo em um
novo Velho Oeste digital. Então, o que você faz
se quiser seguir o
caminho seguro e seguro, proteger trabalho de
um verdadeiro artista e garantir que ele receba
os créditos adequados? Bem, antes de tudo, eu
evitaria colocar nomes
de artistas específicos nas instruções de IA Não há problema em usar
nomes históricos como Leonardo Da Vinci. Ele está morto há muitos anos, mas eu não colocaria novos
artistas que ainda estejam vivos e tenham
um legado a construir. Outra coisa que você pode fazer
é usar ferramentas geradoras de imagens de
IA de empresas oficiais que garantem que a biblioteca de fotos que eles usam para
treinar seus bots e gerar imagens receba
permissão das
pessoas que as possuem. Além de usar ferramentas de IA
como o Adobe Firefly, aqui estão algumas melhores
práticas pessoais para mitigar essas complexidades e
garantir que Em primeiro lugar, cada ferramenta de IA tem termos de licenciamento
diferentes, por isso é bom analisar cada uma delas Faça um LLM,
divida-o para que você possa digerir e
comparar os diferentes Documente suas contribuições criativas
e etapas iterativas com clareza. Digamos que você esteja fazendo
um design de personagem. Talvez você mantenha uma cópia do esboço original que
você enviou para um modelo de IA Acompanhe as
diferentes instruções que você usa para editar e
alterar seu personagem Tenha cuidado ao solicitar à IA personagens protegidos por direitos autorais, marcas
famosas ou É aqui que você pode ter mais problemas e ter a maior chance
de ser processado. Evite usar nomes de empresas
ao digitar seus prompts. Evite usar o logotipo da Nike para
gerar ideias para um logotipo. Evite dizer o estilo de animação
da Pixar ou da Disney
ao criar imagens Um exemplo proeminente disso é quando alguém
começou a copiar o famoso estilo Ghibli do
famoso animador Hao Miyazaki Seu estilo leva
centenas de horas apenas para alguns
segundos de animação, e as pessoas estavam
inserindo seu nome e estilo nas instruções para
emular essa Em uma entrevista, Miyazaki chamou a IA de um insulto
à própria vida e acredita que a
animação deve estar enraizada nas emoções e experiências
humanas e não nos algoritmos Portanto, ao escrever suas instruções, pense em criar
sua própria mistura de estilos que
seja exclusiva para você Você pode se inspirar em
outros trabalhos criativos. Fazemos isso o
tempo todo como criativos. Navegamos no Instagram ou no
Behance em busca de inspiração. Em seguida,
criamos algo e nos vemos
imitando alguns desses estilos subconscientemente O mesmo problema
existe com o uso da IA. Encontrar originalidade
pode ser difícil, mas esse sempre foi
o caso de nós designers É por isso que estudamos centenas
de estilos para que possamos misturar, combinar e criar nosso próprio sabor e fator
exclusivos. forma de estabelecer
seu próprio estilo é fazer o upload de um esboço básico de sua ideia, logotipo
ou personagem Escrevendo instruções muito elaboradas que só poderiam ser
escritas por você Mantenha um estilo específico
no que você gera, o que permite que você se
aproprie desse estilo. Pegando ideias geradas pela IA
e modificando-as fortemente fora dos programas de IA e programas de
design, como o
Photoshop e design, como o
Photoshop e Eu recomendo uma
troca de criatividade em seu fluxo de Isso significa que você pode enviar
um esboço para a IA. Isso ajuda você a refinar sua imagem. Você traz isso de
volta para o Adobe Illustrator ou outro programa vetorial
e o vetoriza Depois, você pode ajustá-lo ainda mais. Você o traz de volta à IA para
adicionar mais detalhes
ou refinar as ideias Você pode até mesmo pedir
conselhos à IA sobre a orientação do
seu logotipo posteriormente. Isso levanta a
questão de ser processado. Qual a probabilidade de
sermos processados por usar imagens geradas por
IA em nossas campanhas de marketing,
por exemplo É possível, mas
não muito provável. A pessoa ou empresa que está processando
precisa provar, sem dúvida, que as imagens que você
usa copiam exatamente o estilo delas Como os geradores de IA
são treinados em milhões e milhões
de pares de imagens de texto, isso significa
que é impossível para um fotógrafo ou designer reivindicar
a propriedade se sua
solicitação for exclusiva o suficiente Mas pode-se escrever um
aviso que descreva estilo de
um fotógrafo famoso um T e fazer com que ele seja em
um T e fazer com que ele seja
tão próximo a esse estilo
que infrinja dessa pessoa.
Isso é muito complicado Sempre
permanecerá uma área cinza , como acontece
com o design do logotipo. Uma coisa que você pode
fazer é
verificar regularmente os ativos gerados por IA usando a pesquisa
reversa de imagens para detectar possíveis problemas de similaridade ou
violação Você pode modificar
significativamente a saída
gerada pela IA em vez de
usá-la diretamente. Então, se você pedir uma ideia de
logotipo, modifique esse aviso um
pouquinho para torná-lo seu. Após o processamento, você pode editar imagens geradas por
IA extensivamente usando ferramentas como o
Photoshop ou No final das contas, a grande conclusão é quanto mais interação
guiada humana houver entre o conteúdo gerado pela
IA, melhor você poderá se
proteger, e a curta propriedade clara
depende significativamente da quantidade de contribuição humana
criativa original que você adiciona às imagens
geradas pela IA Sempre aprimore e adapte imagens forma criativa para
estabelecer claramente seus direitos autorais Garanta que seus
designs finais contenham modificações
humanas criativas
significativas e estejam livres de
problemas de violação.
8. Projeto do estudante: Então, eu tenho seu primeiro projeto
estudantil, que é fazer engenharia reversa de
uma foto usando instruções. Então, quero que você recrie as fotos de referência com a
maior precisão
possível e possa
baixá-las como
parte dos recursos usando apenas
ferramentas de geração de imagens de IA e instruções escritas Não é permitida a edição manual de imagens. Isso permitirá que você
pratique o uso de instruções para criar
objetos e detalhes muito específicos Então, aqui está a primeira,
que tem três formas em D. Eu quero que você recrie
isso o mais próximo possível. Não será exato, mas você
poderá editar
continuamente os prompts para obter lentamente os resultados de que precisa E o segundo é
um café da manhã americano. Então você pode
começar com dois ovos e descrever tudo
no fundo, descrever que há uma janela, descrever que é
fotorrealista Comece a usar algumas
dessas palavras-chave que
aprendemos para poder descrever essa
imagem e imitá-la Portanto, escolha qualquer
gerador de IA de sua escolha. Pode ser Adobe Firefly,
Dolly, Leonardo, ou Use somente instruções de texto e
tente replicar a imagem, que você não possa fazer nenhuma
referência E eu quero que você se
aproxime da composição, da iluminação, do assunto, da paleta de cores, da
textura e do estilo E você pode repetir quantas
vezes precisar e acompanhar suas melhores
versões de prompt à medida que for multado
9. Bônus!Nano Banana Pro — dá para adivinhar o real ou a IA?: O Google Nano Banana
Pro acabou de ser lançado e os resultados são insanos As formas pelas quais a IA
deixa evidências de que é IA
estão lentamente se tornando mais difíceis de detectar. Isso torna muito mais fácil trapacear,
mudar o passado, enganar e
enganar Obviamente, ele tem seus benefícios para quem sabe
usá-lo corretamente. Para o Photoshop 2026, Adobe anunciou
uma parceria com o Google para adicionar o Nano Banana como uma opção de terceiros em
sua Agora, uma nova opção está disponível
em seu Nano Banana Pro. Essa é uma
opção paga se você
a usasse no Google Gemini,
mas a Adobe a disponibilizou para usar o Adobe
Photoshop agora Nunca vi resultados tão
incríveis com essa opção muito melhores do que até mesmo a já muito
boa Nano Banana de primeira geração Por ser uma
opção premium fora da Adobe, Adobe penaliza você um pouco por usar este
Dano Banana Pro Custa dez créditos
por geração para resolução de
uma a 2000 e 16 créditos para resolução de 4.000 A Creative Cloud Pro oferece
4.000 gerações por mês. Adobe Creative Pro custa
$70 por mês na minha área, então você definitivamente está
pagando por isso Portanto, você também pode usar alguns
desses créditos e
experimentar essa ferramenta. Então, eu quero jogar um
pequeno jogo com você. Eu gerei a maioria dessas imagens usando o Google Nano Banana Pro com exceção
de uma ou duas Quero ver se você pode
me dizer qual é gerada com IA e qual
é uma fotografia real. Eu fiz isso com meu marido, e ele falhou miseravelmente.
Vamos ver como você se sai. Por favor, escreva nos comentários
quantos você acertou. vou deixar você saber Depois de cada um, vou deixar você saber
a diferença entre
real e IA. Agora, vamos começar com uma das mais fáceis. Essa é uma das
únicas que meu marido acertou. Desculpe, querida. Então
, qual deles você acha que é real e
qual você acha que é IA? Apenas espere alguns
segundos para pensar sobre isso. E tudo se resume a ampliar. Então, se você não
consegue ampliar, é muito difícil
dizer se é IA ou não. À primeira vista,
acho que talvez
o da direita Parece quase bom demais, mas a iluminação
é muito boa. E eu não sou astronauta, então não sei se o
equipamento dela está correto ou Parece meio
complicado na frente. Mas, novamente, o
da esquerda parece muito convincente. Mas vamos ampliar e
descobrir qual é real
e qual não é. Então, se ampliarmos
aquela que parece ter sido tirada dos anos 80, é muito crível, porque havia mulheres no início
dos anos 80 que estavam começando
a treinar no programa de astronautas a treinar no Mas dê uma olhada nesse distintivo. Tipografia no Texas, onde a
IA ainda tem dificuldades, mesmo com o Nano A única coisa que
consigo entender com 100% de precisão é quando se
trata de tipografia Não é absolutamente
nítido e claro. Você pode ver com um distintivo da NASA. Além disso, aqui em cima,
dá para perceber que há pequenos orifícios, quase
como se estivessem
desgastados, mas percebo que apenas problemas com a tipografia, e esse não é o Além disso, se você
olhar para o rosto desse cara, eles devem ser gêmeos
porque é exatamente o mesmo cara Então, se você tem exatamente o
mesmo cara, quais são as chances de ter
gêmeos no programa espacial Provavelmente muito mínimo.
Mas é muito impressionante. Olhe para o teto. Veja
os painéis de madeira Os detalhes são muito bons. E, à primeira vista,
acho que essa é uma foto real documentada A da direita
é uma foto real e a da esquerda é
IA. Você ficou surpreso? Vamos para a
próxima. Vamos ser um pouco mais difíceis
com este. Então, aqui você tem dois sets de filmagem
padrão, um com Tom Cruise à esquerda e outro
com Pedro Pascal e alguns outros atores famosos Qual set de filmagem é real
e qual é falso? E isso pode ser
uma pegadinha. Então eu quero que você
dê uma olhada, e eles parecem muito convincentes. Então, vamos dar uma olhada. A única maneira de
realmente saber é ampliar e
observar as texturas Então, esse é super convincente. Veja esta câmera funcionando, olhe para a
tela verde, olhe para o céu. Você realmente não pode dizer. Olha esse prédio. Não está distorcido Não está distorcido. Isso
parece surpreendentemente bom. Dê uma olhada neste piso. Não há erros
no piso. Se você olhar para os sapatos, não conseguirá ver
muitos erros até o fim. Olha essa borda aqui. Essa é uma imagem total
gerada pela IA. Além disso, quanto mais você aumenta o zoom, você pode ver essa textura
repetida, quase como uma
textura computacional aqui Quando você amplia todo o ladrilho. Isso não
é natural. Essa não é uma textura natural. Então, de repente,
quando você aumenta o zoom, você começa a ver todos
os pequenos erros. Talvez ele tenha perdido um dedo, mas você poderia simplesmente dizer:
Bem, está se curvando para um lado Então, quando você diminui o zoom, você não pode realmente dizer, mas quando
você aumenta o zoom, você pode. Na verdade, também
foi uma foto postada no Red it, como um formulário real ou vermelho AI. E muitos
profissionais de câmera apontaram muitos
problemas com essa câmera. Então, quando você está no
ramo de fazer filmes, você pode ver muitos erros. Além disso, alguém apontou que essa tela verde não tem exatamente o mesmo ângulo que aparece aqui que ela
realmente está mostrando. E a maior oferta para mim, ou o que a maioria das pessoas
conseguiria ver está aqui
no andaime Há uma fiação
e flexão muito
estranhas dos Então essa foi uma revelação absoluta. Mas quando você diminui o zoom,
isso é muito convincente. Mas quando você aumenta o zoom,
sempre dá para perceber. E o da esquerda? Essa é bem convincente. Quero dizer, ele
parece ter mais ou menos a idade dele. Talvez seja uma foto de
7 anos ou
uma foto de 10 anos dele filmando algo para Bem, uau. Isso
parece muito bom. Os pequenos detalhes restantes. Veja esse homem segurando a foto. Ainda temos os fios, muitos detalhes
naturais semelhantes aos humanos. Você pode até vê-los
comendo biscoitos
e café no set e até mesmo ter
esse pequeno logotipo em sua jaqueta e até mesmo Tudo parece muito convincente até você perceber que
isso também é IA Mais uma vez, a câmera aquela câmera, não
existe na vida real. Você pode fazer uma busca
reversa de imagens, tentar encontrar esta câmera e não conseguirá encontrá-la porque ela
não existe. Mas essa provavelmente foi
uma das mais difíceis. Não existe essa forma
óbvia do Omega de ser IA,
mas, como você pode ver
, avó do Google,
banana realmente arrasou de uma
forma quase Então, sim, ambos são IA. Mas o da esquerda é, na verdade, muito mais convincente
quando você aumenta o zoom Muito assustador. Tudo bem, todos vocês, pessoas
criativas. Vamos fazer uma que
se aplique a você. Um deles é um esboço real
e o outro é a IA Qual é qual? Vou te dar um momento
para pensar sobre isso. Veja todos os detalhes e vou ampliar alguns
deles para que eles possam ver. Bem, ambos
parecem esboços. Vamos dar uma olhada
neste à esquerda. Pode ser IA, mas
é difícil dizer. Isso parece muito genuíno. Se fosse IA, eu
ficaria muito assustado. Há muitas linhas principais. Há muita
experimentação humana em tentar
descobrir as formas
da tipografia Eu não sei. Está bem
perto. Que tal o outro? Isso parece muito
convincente com aquele lápis mastigado e
desgastado. Mas está muito mastigado? Quero dizer, quem realmente tem
um lápis tão ruim? Que tal
uma borracha de formato
muito, muito, muito
estranho Mas os esboços em si
são um pouco nítidos demais. Eu vejo essas linhas principais, o que me faz
pensar: Bem, talvez isso seja real, porque essas linhas principais,
como uma IA pode fazer isso? Você sabe, isso é apenas
algo que um desenhista
faz para tentar
descobrir a simetria Ou é um desenhista muito
talentoso ou é muito simétrico. Até mesmo a pequena poeira deixada pela pequena poeira do lápis ou da borracha é realmente
convincente deixada pela pequena poeira do lápis
ou da borracha é realmente
convincente. Então
, qual é qual? Ok, então a da esquerda
é na verdade uma aluna minha, Amber Axelton, ela fez isso como parte de um
projeto de marca Então, o da esquerda é real e o da
direita é absolutamente IA. Tem um tom meio
escuro nos esboços. Então, geralmente o lápis não
tem essa cor escura, e somente
alguém que desenhou muito na vida
será capaz de identificar isso E esse será
o problema com a IA.
Somente especialistas do setor no que
você está procurando
podem resolver. Sabe de uma coisa Somente especialistas do setor no que ? Eu acho que isso é falso. Parece um pouco polido
demais para mim. Quem não gosta de uma
boa partida de xadrez? Um deles é real
e o outro é gerado pelo Google Nano Banana
Pro. Qual deles? Vou te dar alguns
segundos para descobrir. Sim. Ok, então, à primeira vista, este à direita
parece muito gerado por IA É super polido e
tem essa hiperreflexão, quase como se tivesse sido
gerado com um
programa tridimensional muito bom, como o Blender E quando eu amplio o zoom, posso ver alguns detalhes do cavalo
que parecem muito estranhos, e isso me lembra da IA E vamos dar uma
olhada no outro. O outro parece
meio natural. Estou vendo
algumas peças de madeira que estão meio lascadas. Ele simplesmente tem
muita textura natural. E se você ver como a luz está atingindo e refletindo, parece muito, muito,
muito natural E as peças parecem ter textura natural orgânica. Há até um plano de fundo que parece convincente
com algumas montanhas-russas, alguns livros empilhados
e uma xícara Então, qual é real
e qual é ahi? Este enganou
todo mundo que eu tentei. Então, o da
esquerda é, na verdade IA gerado pelo Google
Nano Banana Pro, e o da
direita é uma fotografia Ela foi um
pouco iluminada no Photoshop, mas é principalmente uma imagem original
intacta Isso te surpreende?
Isso te choca de alguma forma? Você foi enganado?
Então, aqui temos duas
fotos aparentemente normais de frutas, mas uma delas é uma IA falsa e a outra é
uma fotografia real Agora, qual
você acha que é IA e qual você acha que
é uma fotografia real? Eu prometo, ambos não são IA. Ambos se parecem com IA. Mas vamos dar uma olhada
neste à direita. Parece super brilhante, quase um pouco brilhante demais. Quase parece que está
brilhante sem motivo. Ele só tem aquele brilho extra que parece um
pouco artificial. A mesa em si e a textura
parecem bastante convincentes. A tigela, nada mais
está realmente deformado. Isso pode ser uma fruta de verdade. A IA tem dificuldade em lidar com caules e descobrir onde
essas coisas dão frutos. É meio convincente, mas esse brilho está
me confundindo Ok, e
esse da esquerda? Quero dizer, acho que do jeito que
foi tirada talvez nos anos 80 ou
no final dos
anos 90 ou Tem uma geladeira muito
convincente. Tem um pouco de remédio
na bancada. Muitas coisas que você veria
em uma cozinha aleatória. Até os ímãs estão intactos. Tem um pedaço de
papel lá. Tudo parece convincente. A sombra está correta
porque a luz vem de
cima e brilha para baixo. E ainda tem isso nos
dias 14 e 96 de agosto. Realmente combinaria com
um tipo de cozinha em 96. Então, deixe-me ampliar e ver se consigo ver se
isso é IA ou real. Oh, acho que o encontrei. Olha, vê esse pequeno adesivo? Se não fosse por esse adesivo, eu teria
dificuldade em
descobrir se isso era IA ou Mas, mais uma vez,
adesivos, logotipo, emblemas e tipografia são muito
difíceis de serem gerados pela IA Então isso não parece natural. Mas todo o resto funciona, e isso é muito complicado Então, a da direita
é uma fotografia real, que encontrei na Wikipedia, e a da
esquerda foi gerada
com o Google Nano Banana Então, qual dessas fotos
é real e qual é IA? Ambas parecem ter sido
tiradas nos anos 50 ou 60. Eles estão em um carro. A da esquerda parece super saturada para uma foto, mas poderia ter
sido corrigida O da direita
parece bastante convincente. Mas qual é IA
e qual é real? Ok, o da direita é gerado com o
Google Nano Banana Portanto, é IA, e
a da esquerda é a foto real.
Você está surpreso? coisa sobre
as características
dos rostos fez você
pensar que era IA? Então, esse é um
pouco diferente. Esta é uma
foto real de aniversário de um bolo que eu tirei, e é do aniversário do meu filho e da
minha sobrinha Eles fizeram nove e sete anos, ou fizeram oito e seis anos? Essa seria a grande questão. Uma delas é modificada
usando o Google na banana, onde apenas um
elemento foi alterado, que seriam as velas de
aniversário Agora, qual deles é
mais convincente? Acho que a
parte complicada disso é ampliar
essa à esquerda Então você tem esse tipo de coisa
estranha com
o nove acontecendo, quase como se estivesse quebrado e não
parecesse sobrenatural Então, meu primeiro instinto
seria dizer:
Ok, esta é a imagem gerada pela
IA E vamos
para o outro. Então, isso começa a parecer
quase polido demais. Se você olhar para isso,
quase não há erros. Nem mesmo um pouco da textura da cera da vela Isso me faz pensar que essa é definitivamente a foto
gerada pela IA. E se esse é o que você
adivinhou, eles estavam fazendo
nove e sete anos, você está correto.
Essa é a foto real. E o falso e o modificado são
o oito e o seis. É assustador como podemos mudar fotos do passado e dar pessoas uma narrativa totalmente
diferente do que aconteceu. Isso pode
ser muito assustador. Podemos dizer que namoramos
pessoas que nunca namoramos, ou temos um recibo de um
produto que nunca compramos. Essa é a parte assustadora da IA. Mais uma
rodada de bônus só para se divertir. É uma foto real ou é uma IA gerada
pelo Nano Banana À primeira vista, reflexão muito
convincente. Veja como tudo
é refletido. Isso parece muito
autêntico e real. Veja como está
chovendo lá fora e você pode ver a
chuva nas ruas Os carros parecem
bem normais,
mas é o mesmo carro
atrás com o outro? Eu não sei. Estou começando a duvidar de mim mesma
se é real ou não. Seu cabelo parece convincente. A iluminação, tudo
parece muito natural. Veja também os detalhes
do kit. Não consigo encontrar um erro
no tricô. Mas, como sempre, vamos encontrar qualquer tipo de tipografia,
fonte ou texto que pudermos O que é repreender a erva doce? Não sei o que
é isso, mas essa tipografia não parece natural Todo o resto é pequeno
demais para eu ler, mas esse é o sorteio Honestamente, essa é a única
oferta em toda a foto. Você pode ampliar e
olhar em volta, mas é difícil
encontrar outro motivo. Então, se ela não estivesse segurando um livro, se estivesse segurando
algo sem texto, seria muito difícil
descobrir se é real ou IA. Mas sim, isso é IA. Espero que você tenha gostado desse
pequeno mergulho na tentativa de descobrir o que
é real e o que é falso. Então, está ficando cada vez mais
difícil e o Google Nano Banana, o material que eu gerei
a partir daí com instruções
muito simples de uma frase foi incrível
e bastante convincente E pude ver que em
mais um ou dois anos, vamos apagar todos
esses pequenos artefatos de IA, e vai
ser muito difícil sem ter um olho
super treinado Portanto, continue treinando esse olho, amplie 800% e observe esses detalhes,
texturas, padrões Definitivamente tipografia. Por favor, deixe um
comentário abaixo se você gostou disso e
quantos acertou? Ou se você errou, está surpreso
com algum deles? Nos vemos no próximo vídeo.