IA para designers: como funciona, inspiração para escrita e design

Lindsay Marsh, Over 600,000 Design Students & Counting!

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

- 1.
  
  Introdução ao curso
  
  2:48
- 2.
  
  Como os LLMs funcionam
  
  13:18
- 3.
  
  Como funciona a difusão de imagens
  
  11:10
- 4.
  
  Escrita de propostas
  
  9:55
- 5.
  
  Exemplos com propostas do mundo real
  
  10:04
- 6.
  
  Termos de design sutil
  
  10:57
- 7.
  
  Direitos autorais e questões legais
  
  8:54
- 8.
  
  Projeto do estudante
  
  1:28
- 9.
  
  Bônus!Nano Banana Pro — dá para adivinhar o real ou a IA?
  
  14:53

Nível iniciante

Nível intermediário

Nível avançado

Todos os níveis

4.036

Estudantes

211

Projetos

Sobre este curso

Muito mudou no espaço de IA nos últimos anos. Quando surgiu, muitos de nós, incluindo eu, vimos como uma novidade, algo experimental, mas ainda não essencial.

Avançando rápido até agora, os modelos de IA avançaram a um ponto em que quase podem replicar a criatividade humana ou, pelo menos, imitá-la de forma convincente. Quase todas as grandes empresas de tecnologia investiram bilhões no desenvolvimento de IA, o que acelerou melhorias em treinamento, pesquisa e acessibilidade.

Não é de se admirar que muitos profissionais da criação, como fotógrafos, designers e ilustradores, estejam se sentindo desconfortáveis. O medo de ser substituído pela IA é real e faz sentido.

Foi para isso que criei este curso.

Depois de passar centenas de horas explorando as ferramentas e modelos de IA mais recentes, eu saí com uma sensação renovada de esperança. Acredito que a IA não esteja aqui para nos substituir. Ele está aqui para trabalhar conosco. Quando usada com sabedoria, ela pode amplificar nossas ideias, desbloquear novos fluxos de trabalho criativos e nos ajudar a permanecer relevantes em um setor em constante mudança.

Este curso é sua entrada no mundo da IA, projetado especificamente para pessoas criativas. Abordaremos:

Os conceitos principais por trás de como diferentes modelos de IA funcionam, desde geradores de imagens a ferramentas baseadas em bate-papo como o ChatGPT
Os conceitos básicos de propostas de escrita e como melhorá-los através da prática
Vocabulário de design diferenciado que vai ajudar você a gerar imagens mais precisas e expressivas
Considerações legais e éticas ao usar IA em trabalhos criativos
E muito mais

Pense em aprender a escrever propostas como aprender a desenhar ou falar um novo idioma. No início, parece estranho. Mas à medida que você desenvolve seu vocabulário e prática, você vai conseguir descrever claramente sua visão e trazê-la à vida usando essas ferramentas.

Este curso é para qualquer pessoa que se sinta intimidada, sobrecarregada ou insegura sobre por onde começar com a IA. Ele foi adaptado para criativos e designers, dando a confiança para começar a usar essas ferramentas sem perder sua identidade artística.

Espero que este curso seja a base para uma série maior, onde vamos passar para projetos de design práticos que usam IA de maneiras significativas e empolgantes. Mas primeiro, precisamos entender as noções básicas de como tudo funciona, e é exatamente isso que este curso vai ajudar você a fazer.

Então, vamos começar.
Vejo você na próxima aula.

Conheça seu professor

Lindsay Marsh

Over 600,000 Design Students & Counting!

Top Teacher

I have had many self-made titles over the years: Brand Manager, Digital Architect, Interactive Designer, Graphic Designer, Web Developer and Social Media Expert, to name a few. My name is Lindsay Marsh and I have been creating brand experiences for my clients for over 12 years. I have worked on a wide variety of projects both digital and print. During those 12 years, I have been a full-time freelancer who made many mistakes along the way, but also realized that there is nothing in the world like being your own boss.

I have had the wonderful opportunity to be able to take classes at some of the top design schools in the world, Parsons at The New School, The Pratt Institute and NYU. I am currently transitioning to coaching and teaching.

Visualizar o perfil completo

Habilidades relacionadas

ChatGPT Midjourney Canva Design para redes sociais Carreira e indústria de design gráfico IA para criatividade e inspiração Design

Level: Beginner

Projeto prático de curso

Não se esqueça de baixar todos os arquivos disponíveis na guia Recursos do curso, incluindo vários documentos úteis que servem como notas do curso. Também fique à vontade para conferir minha newsletter de design gratuita para saber as últimas novidades sobre desenvolvimentos de IA no mundo do design (e outras notícias!)

Há dois projetos principais de estudantes que foram discutidos neste curso.

1.) Depois de assistir ao vídeo Termos de design matizado, escolha quatro termos diferentes de design matizado e mergulhe profundamente em cada um. Você também pode optar por fazer 2 por dia por uma semana se quiser um desafio maior. Use o ChatGPT ou outra ferramenta de IA para ajudar a definir e explorar esses termos. Você também pode pedir para a IA mostrar exemplos visuais ou ajudar você a encontrar exemplos incríveis de cada estilo online.

Depois de ter completado um mergulho profundo em quatro (ou mais, para o desafio maior) termos de design com nuances, crie e publique (na área de projeto do estudante) imagens geradas por IA que reflitam cada um desses estilos. Se quiser, também pode compartilhar suas anotações em cada termo ou refletir sobre como aprender esse novo vocabulário de design pode ajudá-lo em seu trabalho criativo futuro.

Nota lateral: meu livro em PDF guia prático de teoria do design está disponível agora no Skillshare! É um livro de teoria de design de 200 páginas que aborda tudo sobre a teoria do design! Além disso, não deixe de conferir minha newsletter de design gratuita.

Você pode usar qualquer gerador de imagens de IA de sua escolha. Minhas recomendações são as seguintes:
Observação: os cursos futuros vão analisar algumas dessas ferramentas em detalhes com projetos práticos.

Adobe Firefly

Conhecido por: integração perfeita do Photoshop/Illustrator, licenciamento para uso comercial
Plataforma: baseada na web e integrada no Adobe Creative Cloud
Ideal para: designers gráficos, marketing, uso editorial

DALL·E 3 (OpenAI, ChatGpt)

Conhecido por: seguimento preciso de prompts, forte consistência de texto para imagem
Plataforma: disponível via ChatGPT Pro, Microsoft Copilot (Bing, Designer)
Ideal para: ensinar estrutura de proposta, storytelling visual, realismo

Leonardo.Ai

Conhecido por: versatilidade, treinamento de modelos personalizados, interface fácil de usar
Plataforma: baseada na web
Ideal para: iniciantes a profissionais, arte para jogos, conjuntos de dados personalizados

Canva AI (Magic Media)

Conhecido por: acessibilidade, facilidade de uso, geração rápida de conteúdo nas redes sociais
Plataforma: baseada na Web, integrada no Canva
Ideal para: design de mídia social, apresentações e educação

Nano Banana do Google

Conhecido por: manter a foto original intacta ao solicitar alterações. Você pode ver como ele se opõe ao ChatGPT no meu artigo do Substack aqui
Plataforma: criada na plataforma de IA Gemini do Google

SEGUNDO PROJETO DO ESTUDANTE

2) O segundo projeto é apresentado na última aula. Você pode optar por fazer apenas um ou ambos os projetos de estudante. Baixe as duas imagens de referência da seção Recursos do curso. Sua tarefa é recriar essas imagens usando apenas prompts de texto e um gerador de imagens de IA. Aplique o que você aprendeu sobre engenharia de propostas para corresponder as fotos originais o mais possível — focando no arranjo, iluminação, clima e tom. Incentivamos você a iterar e refinar sua proposta várias vezes para obter o melhor resultado.

ATUALIZAÇÃO: alguns estudantes concluíram projetos sem incluírem todas as propostas. Se você incluir sua ideia (e melhor ainda, qual plataforma de IA você usou para gerar sua foto) eu posso ajudar você a avaliar melhor seu projeto!

Using AI in Design - Rare Design Terms You Want To Use!

Lindsay Marsh 30 curtidas

2 comentários

Nomin 19 curtidas

2 comentários

Kerry Owston 14 curtidas

2 comentários

Olena Savchuk 13 curtidas

Nota do curso

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Introdução ao curso: Muita coisa mudou no espaço da IA nos últimos anos. Quando foi lançado pela primeira vez, a maioria de nós, inclusive eu, viu isso como uma novidade. Até agora, os modelos de IA evoluíram a ponto de quase replicar um criativo humano ou, pelo menos, enganá-lo quase replicar um criativo humano temporariamente Quase todas as grandes empresas de tecnologia investiram bilhões no espaço de IA, que levou a melhores modelos, treinamento e pesquisa de IA. Existe esse medo de que a IA assuma o trabalho de uma pessoa criativa. Esse medo é muito real, e fotógrafos, designers gráficos e ilustradores podem ficar um pouco preocupados Decidi criar um curso teórico de IA que alivie esse medo Passei centenas de horas utilizando as ferramentas e modelos de IA mais recentes e tenho muita esperança de que a IA seja um complemento maravilhoso combinado com nossos próprios conjuntos de habilidades criativas Essa aula é um bom ponto de partida para qualquer criativo ou designer que queira aprender sobre noções básicas de IA, como os bastidores de como vários modelos de IA funcionam, como ferramentas de geração de imagens e modelos de IA de bate-papo, noções básicas sobre redação rápida e como escrever instruções eficazes, aprendendo termos de design diferenciados que nos fornecem o vocabulário certo para criar imagens hiperdetalhadas o vocabulário certo para Também discutiremos as questões legais e muito mais. Aprender a escrever instruções é como aprender a escrever novamente quando criança Começamos com instruções básicas que descrevem levemente o que queremos e, eventualmente, por meio da prática, somos capazes de descrever adequadamente com imensos detalhes o que é nossa visão usando palavras que talvez nunca tenhamos pensado em imensos detalhes o que é nossa visão usar Essa aula pode agradar a quase qualquer pessoa que tenha sido intimidada ou sobrecarregada pela IA e não saiba por onde começar a aprender o básico Esta aula foi projetada especificamente para criativos e designers para ajudar a orientá-lo nos fundamentos da IA, você possa começar a pensar em como utilizar essas ferramentas incríveis para ajudar a se alinhar às futuras evoluções do setor Minha esperança é que essa aula seja um trampolim para futuras aulas que abordarão projetos práticos de design usando Mas primeiro, precisamos entender o básico por trás como isso funciona e esta aula tem como objetivo fazer exatamente isso Nos vemos na primeira aula. Meu nome é Lindsey Marsh, e ensinar teoria do design é Sou designer gráfico há mais de 20 anos e instrutor de design para mais 350.000 estudantes de design gráfico Estou entusiasmado por poder trazer essa aula para você hoje. 2. Como os LLMs funcionam: Vamos gerar um cardeal vermelho em um galho. Como esse gerador de imagens sabia mostrar um pássaro? Como ele sabia que o pássaro era vermelho e estava em um galho? Como ele sabia a aparência de um galho? Esse é um sistema complexo que executa milhões e milhões de cálculos matriciais precisos para produzir o que parece ser mágica. Para realmente ter uma boa ideia de como isso acontece, precisamos primeiro entender como modelos de IA entendem a linguagem humana e, seguida, entender como ela gerará imagens Então, o que é um LLM? Um LLM ou um modelo de linguagem grande é um tipo de inteligência artificial treinada para entender e gerar linguagem humana Ferramentas como chat GPT, Claude e Google Gemini são exemplos de LLMs, são grandes modelos de são Usarei o chat GPT durante todo o curso, que também é um dos LLMs mais populares do mercado. Eles são chamados de grandes porque são treinados em grandes quantidades de texto, desde livros, artigos e sites até conversas on-line e muito mais. O objetivo é aprender como os humanos se comunicam, nossa estrutura de frases, gramática, tom, estilo e até mesmo intenção Assim, a IA pode responder de uma forma que pareça natural e útil. Sue, por que os LLMs são importantes para designers como nós e outros criativos Porque os LLMs são mais do que apenas assistentes de redação. Aqui estão algumas maneiras de como eles podem ajudar ou projetar fluxos de trabalho Em primeiro lugar, geração de ideias. Precisa de um conceito, um slogan ou uma direção de campanha. Basta perguntar. Redação Os LLMs podem ajudar a redigir postagens em mídias sociais, slogans, descrições de produtos e muito mais. Resumos criativos Você pode obter ajuda para estruturar ou editar documentos voltados para o cliente. A nomenclatura gera nomes de marcas, nomes de produtos, títulos de projetos, tudo com base no tom e nas palavras-chave Mas, mais do que isso, aprender sobre como os LLMs funcionam nos permite entender a ferramenta mais importante para designers na próxima década As ferramentas de geração de imagem e vídeo usaremos ao longo do curso. Então, no curso, vamos nos concentrar em dois tipos de modelos de IA. O primeiro é o que acabamos de mencionar, o modelo de linguagem grande ou LLM, que acaba sendo alimentado em outro sistema, chamado de modelo de difusão de imagem E o modelo de difusão de imagens é o que nos ajuda a gerar imagens a partir do texto Por exemplo, ele pode reconhecer que a Apple se relaciona com frutas sem que essa conexão seja explicitamente ensinada Essa capacidade de interpretar a linguagem é essencial para as ferramentas de geração de imagens, que exploraremos ao longo do curso. Antes que uma IA possa criar uma imagem de um cachorro latindo, ela deve primeiro entender o que é um cachorro e o que significa latir Portanto, o grande modelo de linguagem aprende, compreende e gera linguagem humana analisando grandes quantidades de texto e encontrando pontos de conexão entre eles. Em seguida, são inseridas instruções em um modelo de fusão de imagem para fusão, que gera imagens guiadas por padrões que aprendem durante o treinamento Geralmente, depende de um LLM para primeiro entender e interpretar o prompt de texto, convertendo-o em tokens significativos que guiarão o processo de geração visual Agora vamos falar sobre como os LLMs funcionam. Pense nisso como um preenchimento automático sobrecarregado que não apenas finaliza suas frases, mas pode escrever ensaios, responder perguntas, criar instruções de design e até mesmo ajudar na criação de marcas e Em sua essência, os LLMs são máquinas de probabilidade. Quando você faz uma pergunta, eles calculam quais palavras têm maior probabilidade de vir a seguir com base em tudo o que aprenderam. Por exemplo, é como um designer experiente que está tão acostumado com tendências, necessidades do cliente e layouts que quase consegue adivinhar o que o cliente quer a seguir, mesmo antes mesmo de o cliente contar, porque já fez isso repetidamente A próxima é gerar tokens e contexto. Portanto, os LLMs não veem uma frase inteira. Eles os dividem em pequenos pedaços chamados tokens. Palavras, parte das palavras ou até mesmo pontuação Até mesmo a pureza no final é seu símbolo individual. Eles então analisam o contexto, o texto em torno dele, para descobrir o que provavelmente virá a seguir. E, em seguida, há várias camadas e processos pelos quais ele é executado. Os LLMs têm milhões ou até bilhões de neurônios, unidades matemáticas que processam a linguagem em camadas Cada camada refina a compreensão do significado, assim como um processo de revisão criativa Então, vamos analisar esse processo com mais detalhes. Então, vamos dar um exemplo de prompt. E este exemplo é criar uma imagem de um cachorro peludo. Portanto, é bom dividir cada palavra em tokens. Portanto, criar seria seu próprio símbolo e imagem separados de um cachorro latindo Ocasionalmente, ele divide uma palavra. Portanto, latir pode ser latido e depois, e os períodos também contam como símbolos Portanto, cada palavra ou símbolo recebe um ponto vetorial. Os LLMs não entendem as palavras da mesma forma que os humanos. Em vez disso, eles representam palavras como vetores, que são como longas listas de números, às vezes com 12.000 Esses números capturam a posição de uma palavra em um enorme espaço invisível chamado espaço de incorporação ou espaço vetorial Cada palavra se torna um ponto no espaço onde palavras semelhantes são colocadas próximas umas das outras. Em nosso exemplo imediato, as palavras cachorro e latido estariam próximas neste mapa porque frequentemente mostravam associadas dados frequentemente mostravam associadas juntas durante o treinamento Este exemplo usa um espaço de dois D, mas os modelos de IA têm 50.000 palavras para mapear Portanto, não há muito espaço. Então, o que ele faz é mapear tudo em um espaço vetorial de três D. É por isso que cada símbolo ou palavra recebe uma longa lista de números, pois eles indicam a localização exata em um mapa vetorial de três D. Essas colunas de números são coordenadas que permitem que as palavras se encontrem e, portanto, desenvolvam associações e linguagem humana entre si. Imagine uma nuvem gigante de três D, exceto que, na verdade, tem milhares de dimensões neste espaço. Significados semelhantes se igualam mais próximos. Então, King está perto da Rainha e Paris está perto da França. E designer está próximo de outras palavras como criativo, visual e artístico. Significados diferentes estão mais distantes. Então, King está longe da Apple porque King e Apple não aparecem muito juntos em texto e linguagem humanos. O brilho da luz é uma área diferente do peso leve, dependendo do contexto. Esse mapa de significado é construído durante o treinamento, à medida que o modelo aprende como as palavras aparecem no contexto Os LLMs não entendem palavras isoladamente. Em vez disso, eles consideram os símbolos ao seu redor. Por exemplo, o designer usou cores claras no layout. Aqui, a luz é interpretada como brilho devido aos símbolos, cores e layout próximos Mas a mochila é muito leve e fácil de transportar. Agora, leve significa não pesado, graças às palavras contextuais, como mochila e transporte O modelo ajusta dinamicamente compreensão com base no contexto, e faz isso por meio de um mecanismo chamado atenção Então, vamos falar sobre atenção. Ao contrário dos modelos mais antigos que processam cada palavra de forma independente, a atenção, que faz parte de uma camada de transformação maior , que veremos, é outro processo executado que permite ao modelo examinar todas as outras palavras na frase e perguntar: qual delas devo prestar atenção em qual delas devo prestar atenção para entender o que essa palavra significa? Isso dá ao modelo a capacidade de pesar palavras de forma diferente dependendo de sua relevância para a palavra que está gerando ou analisando É como um designer revisando um quadro de humor inteiro antes de tomar uma decisão sobre um único elemento de layout Porque o significado geralmente depende do contexto. Por exemplo, a palavra banco pode significar coisas muito diferentes. Ela se sentou na margem do rio. A função de atenção destaca a palavra rio. Ele fez um depósito no banco. A atenção agora destaca a palavra depósito. O modelo usa a atenção para focar nas palavras que esclarecem qual significado está correto. E então, os dados, depois da atenção, fluem por várias outras camadas de processamento diferentes. E muitos desses são cálculos de matrizes matemáticas diferentes que você vê nos bastidores e que estão acontecendo milhões e milhões de Então, o próximo passo é a rede neural de feedback. Então, depois de prestar atenção, o vetor atualizado de cada token naquele pequeno mapa de três D que mostrei agora é enriquecido com mais contexto Está passando por uma pequena rede neural chamada camada feedforward Essa rede aplica uma transformação matemática ao vetor. Ele não mistura fichas umas com as outras. Cada token é processado de forma independente aqui. Pense nisso como uma etapa de refinamento que ajuda a extrair padrões mais significativos a partir das informações fornecidas. Está polindo, ajustando , ajustando e aprimorando antes de ser transmitido Eu queria parar um momento e fazer uma pausa. Esse é um processo matemático muito complicado com muitas camadas que processam dados repetidamente. Você não precisa ser matemático para entender como Eu só queria mostrar um guia detalhado de como eles passam pelos processos, mas você não precisa memorizar isso ou saber isso de frente e de trás Isso só nos ajuda mais tarde, quando escrevemos instruções para saber o que realmente está acontecendo nos bastidores com a forma como estão processando nossas palavras A próxima etapa são as conexões residuais, pule as conexões. Isso é para garantir que o modelo não esqueça as informações originais. Ele usa conexões residuais. Eles são como pequenos atalhos que adicionam o vetor de entrada original volta à saída de cada camada Isso evita que o modelo sobrescreva informações úteis com muitas transformações Então, é como editar um design, mas manter a versão original como uma camada de backup no Photoshop Mais uma vez, você não precisa conhecer a matemática por trás de tudo isso, saiba que esse é um processo muito complexo que acontece e por que a IA às vezes parece mágica. Muitos freios e contrapesos acontecem para garantir que o que está sendo lançado seja verificado e revisado Outra camada é chamada de normalização de camadas e essa é uma etapa de limpeza. Isso ajuda a estabilizar o treinamento e mantém os dados consistentes em todas as camadas Isso garante que o modelo não fique muito tendencioso com valores extremos Por exemplo, é como ajustar os níveis em uma foto para uniformizar a iluminação antes de passar para a próxima edição Então, estamos acumulando mais e mais camadas de processamento. E os transformadores não fazem isso de uma só vez. Eles repetem todo esse processo várias vezes 12, 24 ou até 96 vezes, dependendo do tamanho do modelo. Isso vai passar pela atenção. Ele passará pela alimentação da rede neural, pelas conexões residuais, pela normalização da camada e se repetirá indefinidamente Assim, cada camada cria uma compreensão mais sutil da linguagem humana Portanto, camadas inferiores, compreensão de estruturas como gramática e pontuação, camadas intermediárias, reconhecimento de significado e relacionamento e algumas dessas camadas superiores de processamento que, e algumas dessas camadas superiores de posteriormente , ajudam a raciocinar, como gramática e pontuação, camadas intermediárias, reconhecimento de significado e relacionamento e algumas dessas camadas superiores de processamento que, posteriormente , ajudam a raciocinar, planejar e concluir tarefas. Então, por exemplo, é como passar do esboço à ilustração refinada e à identidade completa da marca E temos uma saída final. Depois de passar por todas as camadas, o vetor final é usado para prever o próximo token para geração de texto, token que significa palavra, classificar algo como um sentimento ou tópico ou orientar a geração de imagens, como em um modelo de difusão, sobre o qual falaremos Nós apenas explicamos como os modelos LL funcionam. Mas se você realmente quiser se tornar muito mais técnico e mergulhar na matemática, é claro que não é necessário para este curso. Você pode conferir três azuis e um marrom no YouTube. Foi assim que aprendi pela primeira vez os detalhes dos modelos de IA e achei ele um professor muito, muito bom. Então, vimos essa complexa trama de processamento. Os vetores que representam palavras passam por várias camadas de processamento de dados Eventualmente, eles alcançam uma matriz de probabilidade o modelo determina qual palavra tem maior probabilidade de sair em seguida. Embora a matemática subjacente seja complexa, o que você realmente precisa entender é profundidade desse processo em camadas Cada palavra é dividida, analisada comparada entre si por meio de vários freios e contrapesos internos O resultado parece quase mágico, pois a máquina realmente entende e interpreta a linguagem humana Esse mesmo tipo de inteligência em camadas também impulsiona a geração de imagens por meio de um processo chamado difusão, que exploraremos na próxima lição Certifique-se de baixar o recurso em PDF que aborda tudo o que falamos nesta lição. 3. Como funciona a difusão de imagens: Os geradores de imagens e vídeos com IA impressionaram a Internet nos últimos anos com sua capacidade de fundir objetos, assuntos e desafiar A negatividade em torno dessas ferramentas de IA está se dissipando lentamente à medida que os criativos começam a perceber o quanto elas podem ser essenciais para acompanhar as mudanças e mudanças do setor Hoje, aprendemos como os geradores de imagens funcionam passo a passo, para que possamos ver a magia por trás da cortina Então, como essas ferramentas de geração de imagens de IA funcionam? Então, da linguagem às imagens, como entender os LLMs ajuda você a aprender modelos de difusão Então, na última lição, passamos bons 12 minutos aprendendo sobre LLMs e como eles processam tokens Eles constroem contexto, aplicam atenção e geram previsões. Então, aprendendo isso, você já estabeleceu as bases para entender como os modelos de difusão funcionam Enquanto os LLMs geram palavras, os modelos de difusão geram imagens e se baseiam em muitas das mesmas ideias centrais, como processamento em camadas, espaços vetoriais de alta dimensão, representações semelhantes a tokens e saídas baseadas em probabilidade A conexão principal é a previsão como mecanismo central. No centro dos LLMs e modelos de difusão está uma ideia simples, mas poderosa Aprender a prever algo com base no contexto. Em LLMs, o modelo prevê a próxima palavra. Em modelos de difusão, o modelo aprende a prever uma versão mais limpa da imagem, passo a passo, do ruído à Ambos os sistemas refinam as suposições com base no que aprenderam com grandes conjuntos de dados Um funciona no espaço da linguagem, o outro no espaço de pixels. Então, o primeiro passo, a fase de treinamento, ele aprende destruindo imagens. Então, vamos dar um exemplo real da foto de um gato. Vamos adicionar ruído aleatório a ele pouco a pouco, ao longo de centenas de etapas. Como designer, você pode achar esse processo familiar porque são os filtros gaussianos de desfoque e granulação Eventualmente, ele se torna estático, como a penugem da TV. O modelo aprende como cada etapa do ruído afeta a imagem São milhares de adições e remoções de pequenos pixels diferentes adições e remoções de pequenos pixels Isso ensina ao modelo como as imagens se desfazem. Segundo passo, ele aprende como desfazer o ruído ou o grão. O modelo é treinado para prever a imagem limpa de uma imagem ruidosa. Em cada etapa, ele adivinha. Se essa é a aparência da versão ruidosa, o que poderia ter sido a original Ele fica melhor comparando suas suposições com imagens reais e ajustando seus pesos Então imagine um escultor diante de um grande bloco de pedra No início, é apenas ruído, uma massa sólida caótica sem forma reconhecível, um grande bloco O escultor começa a esculpir pouco a pouco, guiado pela intuição, treinamento e referências Cada ataque remove a incerteza. Lentamente, formas começam a surgir, uma curva aqui, uma silhueta Com o tempo, o ruído se torna forma e forma a aleatoriedade do bloco Uma estátua detalhada e bonita é revelada. Isso é chamado de difusão reversa. Você começa com o ruído e o refina em uma imagem coerente, passo a passo Etapa três, a geração começa. É a fase de amostragem. Agora que ele foi treinado e realizou esse processo de difusão milhões e milhões de vezes, podemos começar com puro ruído, uma tela em branco de estática e enviar uma mensagem de texto, por exemplo, um cachorrinho golden retriever usando óculos escuros Agora, passo quatro, eliminando o ruído passo a passo. O modelo remove apenas um pouco de ruído por vez, guiado pelo que aprendeu. Depois de cada etapa, a imagem fica um pouco menos embaçada, um pouco mais detalhada A etapa final, a imagem final, e é uma criação única. Isso continua por 50 a 1.000 etapas diferentes , dependendo do ajuste do modelo Depois de etapas suficientes, a imagem fica totalmente nítida. Agora você tem uma imagem fotorrealista que nunca existiu antes, criada puramente a partir do ruído e moldada pela linguagem E a grande questão na mente de todos é quais dados os modelos de difusão são treinados Os modelos de difusão são treinados em enormes conjuntos de dados de imagens e, geralmente, precisam ser combinados com descrições de texto, também chamadas de pares de texto de imagem Esses conjuntos de dados ensinam ao modelo não apenas a aparência das coisas, mas também como interpretar solicitações de texto em elementos visuais. Os dados de treinamento geralmente incluem uma imagem, uma foto de um cachorro usando óculos escuros, uma legenda ou descrição, como um golden retriever usando óculos escuros Esse emparelhamento permite que o modelo aprenda quando alguém diz isso, a imagem provavelmente fica assim O modelo então analisa pares de texto de imagens para milhões e milhões de imagens em toda a biblioteca de imagens que ele usa. Então, de onde ele tira esses milhões e milhões de imagens? Essa é outra grande questão que traz muitas questões de direitos autorais, que abordaremos um pouco mais tarde. Mas vamos falar sobre alguns desses conjuntos de dados, e modelos diferentes usam conjuntos de dados diferentes Então, há o Leon five B, e são 5 bilhões de pares de texto de imagem retirados da Internet Então, em qualquer lugar na Internet, pegue tudo o que puder. Uma imagem que tem uma descrição em texto, basta pegá-la. Open Images, são 9 milhões de imagens com rótulos, caixas delimitadoras e Há Coco, 330.000 imagens rotuladas com legendas detalhadas São 100.000 milhões de imagens cintilantes com metadados. A partir desses dados de treinamento, o modelo de difusão aprende a aparência de diferentes objetos e conceitos, quais estilos, é um É realista ou representado visualmente, como a linguagem é mapeada para elementos visuais como peludo, brilhante, casa em arco E como alguns desses modelos de difusão usam dados de treinamento que estão em toda a Internet, há grandes considerações éticas e legais a E vou ter uma aula dedicada para detalhar todos os problemas legais com ferramentas de geração de imagens e maneiras de contornar isso para garantir que o material que você está usando seja seguro. Portanto, alguns dados de treinamento podem incluir trabalhos protegidos por direitos autorais ou criados por artistas, e muitos artistas levantaram preocupações sobre seus estilos serem imitados Como resultado, modelos de origem ética, como Adobe Firefly, estão sendo desenvolvidos usando somente conteúdo licenciado ou Discutiremos detalhadamente as questões legais com geradores de imagens nas próximas aulas Como cada conjunto de dados é único e cada modelo usa um conjunto de dados diferente, existem diferentes estilos, propriedades e personalidades que diferentes ferramentas de geração de imagens Por exemplo, Mid Journey era muito popular quando as ferramentas de geração de imagens foram lançadas pela primeira vez, há alguns anos, e elas tendem a mostrar amostras trabalhos de artistas em toda a Internet, não apenas trabalhos gerais de imagem do Google Então, eles estão tirando mais proveito dos artistas e do trabalho dos artistas. Então, eles serão altamente artísticos, imaginativos, surreais, oníricos Ele prioriza o estilo sobre o realismo. E muitas vezes parecem pinturas digitais, arte conceitual e imagens estilizadas de revistas Portanto, se você está procurando por algo altamente técnico e científico, Md Journey pode não ser a ferramenta para você. Mas se você está procurando um conceito de personagem realmente básico para se personalizar, essa pode ser a ferramenta para você Mas também tem mais problemas legais, e foi a que mais foi processada e mais atacada pela comunidade de artistas E falaremos sobre como evitar o roubo do trabalho original dos criadores usando essas ferramentas Há muitas coisas diferentes que podemos fazer para adicionar nossa própria personalidade ao que geramos para torná-la única e nossa. E outro exemplo é o Dali, que será a ferramenta de geração de imagens Hat GPT E vou usá-lo ao máximo durante todo o curso, porque tive muitos resultados excelentes com ele. Além disso, é excelente para seguir com exatidão instruções de texto complexas e produzir resultados ilustrativos, claros e coerentes Portanto, é bom para contar histórias, desenhos animados, estilos editoriais, e achei muito bom para ideias e geração de logotipos O Eonardo é outra ferramenta que é ótima porque tem algumas opções gratuitas para você usar Não é tão de alta qualidade quanto a ferramenta paga de geração de imagens GPT Open AI chat que eu uso, mas é uma ótima alternativa gratuita, e falaremos sobre quais opções são gratuitas e quais são pagas um pouco Mas é forte em cinema, estilo de jogo de fantasia ou arte conceitual, geralmente usado para maquetes de produtos, ativos de RPG e elementos de design de jogos de interface do usuário É estilizado, mas de alta fidelidade. Firefly da Adobe é o mais acessível que eu gosto de usar porque a maioria dos estudantes de design tem uma assinatura da Adobe, então ele permite que você acesse o Firefly dentro do Photoshop, mas também fora do Photoshop em sua ferramenta independente de geração de imagens de IA O Firefly da Adobe é o mais acessível que eu gosto de usar porque a maioria dos estudantes de design tem uma assinatura da Adobe, então ele permite que você acesse o Firefly dentro do Photoshop, mas também fora do Photoshop em sua ferramenta independente de geração de imagens de IA. Eu obtive resultados mistos usando o Firefly. Pode ser um pouco difícil fazer com que ele realmente entenda sua solicitação; às vezes é ótimo e às vezes não. E vou usar o Firefly como exemplo, mas tem resultados mistos Acho que existem ferramentas melhores, mas essa é a mais acessível aos designers porque vocês já estão usando as ferramentas da Adobe. Então, espero que eles fiquem cada vez melhores, e há uma razão pela qual dificuldades em comparação com outros modelos Ele tem um dos conjuntos de dados mais seguros nos quais treina. Ele usa imagens que são todas livres de direitos autorais. Todos eles receberam permissão para serem usados na ferramenta de IA. Assim, você pode usar qualquer coisa gerada no Firefly para o trabalho do cliente ou para o trabalho comercial Não posso dizer o mesmo para alguns dos outros modelos de IA. Então é isso que o torna único, mas também limita sua biblioteca. Ele tem uma biblioteca muito menor para treinar porque só pode usar trabalhos licenciados onde já foi concedida permissão para usá-los. Mas com habilidades realmente boas de redação rápida, você pode contornar esse problema. Como você pode ver, há muitas ferramentas de geração de imagens para você escolher. Vou me concentrar apenas em alguns, mas minha esperança é ensinar essa aula para que ela seja atemporal Vou te ensinar como escrever palavras-chave e escrever rapidamente. E criaremos todo tipo de palavras criativas incríveis que realmente ajudarão a destacar nossas sugestões e nosso trabalho CT. 4. Escrita de propostas: A IA não é mágica. Não chega à sua mente nem infere ideias vagas. Ele interpreta o que você diz literal e probabilisticamente É por isso que o texto, a estrutura e os detalhes do seu prompt fazem toda a diferença Um aviso forte pode ser a diferença entre um resultado genérico e uma obra-prima estilizada Saída na nuvem versus algo com emoção, textura ou história. M. versus Uau. T. A escrita rápida é direção criativa. Pense na redação rápida como uma orientação a um assistente altamente qualificado, mas literal Quanto mais clara e criativamente você comunicar o assunto, a vibração, o estilo e o conteúdo, mais próximo o resultado estará da sua A escrita rápida não significa hackear a IA. Trata-se de se comunicar como um designer. engenharia rápida é o processo de reunir instruções precisas e detalhadas. Assim como escolher fontes ou organizar uma composição, há nuances em escrever instruções A ordem das palavras pode ser importante, e sabemos disso entendendo como LLMs funcionam para prever a próxima palavra com base nas palavras anteriores O tom do seu fraseado influencia o humor. Modificadores como cinematográficos ou hiperreais ou oníricos atuam como filtros vamos nos aprofundar em Posteriormente, vamos nos aprofundar em algumas palavras modificadoras muito específicas Bons escritores de prompts iteram, ajustam e aprendem a linguagem visual do modelo, da mesma forma que designers aprendem a teoria das cores ou os sistemas de grade O presidente da OpenAI, Greg Brockman, compartilhou uma estrutura concisa de quatro etapas para Essa abordagem enfatiza a clareza e a estrutura para melhorar a qualidade das respostas geradas pela IA Declare seu objetivo com clareza. Comece especificando exatamente o que você deseja que a IA realize Por exemplo, crie três ideias de conceito de logotipo distintas para uma marca de café sustentável chamada Green Brew voltada para jovens profissionais ecologicamente corretos de 25 a 35 anos. Especifique o formato de saída desejado. Defina como você deseja que as informações sejam apresentadas. Por exemplo, apresente cada ideia de logotipo com um nome descritivo curto, uma breve justificativa, talvez duas ou três frases, e sugira paletas de cores e estilos de tipografia adequados ideia de logotipo com um nome descritivo curto, uma breve justificativa, talvez duas ou três frases, e sugira paletas de cores e estilos de tipografia adequados. Em seguida, defina restrições e grades de proteção. Inclua quaisquer limitações ou requisitos específicos para orientar a resposta do EI. Por exemplo, evite designs excessivamente complexos ou ilustrativos Use uma estética minimalista e moderna apropriada para a primeira marca digital garanta que as fontes sugeridas estejam disponíveis por meio de fontes do Google ou fontes Forneça informações contextuais, compartilhe ou preferências adicionais para ajudar a IA a adaptar sua resposta Por exemplo, a marca enfatiza o fornecimento ético, a responsabilidade ambiental e uma personalidade sofisticada, mas acessível O design deve ressoar com jovens profissionais que valorizam a sustentabilidade, mas também o estilo e a conveniência Com isso, você obterá resultados muito mais específicos dos quais poderá obter muitos insights. Obviamente, os detalhes são uma grande parte da redação rápida. Aprendemos anteriormente a importância do contexto para os LLMs. Na última parte do nosso prompt de quatro partes, recebemos informações contextuais Podemos nos aprofundar muito em nossa explicação sobre o espírito da marca, público-alvo e a aparência desejada Ainda precisamos fazer toda a pesquisa sobre design de marca, mas a IA nos dá um trampolim de ideias e nos permite explorar áreas talvez não tenhamos explorado sozinhos . O interessante sobre a IA é o quanto você precisa se associar igualmente a ela para produzir algo que valha a pena e seja único Lembre-se de que ele é treinado em um conjunto baseado em redes de neurônios humanos e processos de pensamento, para que possa emular a criatividade, mas não sabe como ser criativo sozinho Ele precisa de sua orientação como especialista treinado em design e guia seu caminho. É por isso que tenho o prazer de informar que todos os nossos esforços, aprendendo teoria do design, cor, layout, tipografia, fotografia, recorte, gradação de cores, hierarquia, histórico de design e estilos, ainda serão absolutamente necessários para produzir Somos os diretores de arte. Temos que pensar na IA como uma nova ferramenta de software para nos ajudar, mas ainda estamos no banco do motorista. Vamos deixar de escrever para LLMs por um momento. Podemos fazer mais criação de ideias e brainstorming usando LLMs em um próximo projeto de design de marca Mas, por enquanto, vamos começar a escrever instruções eficazes para a criação de imagens e vídeos Eu quero te mostrar a evolução de um calçado. Então, quais são os alicerces de um prompt forte? Então, aqui está um exemplo. Um tênis futurista e o estilo da casa Bau combinam a moda streetwear com gradientes de néon, superfícies refletivas e sombras dramáticas, renderizadas como uma maquete de vitrine de produtos para o Instagram. Vamos detalhar isso. Então, qual é o assunto? É um tênis futurista Podemos ser muito detalhados com o tipo de tênis que é. Em segundo lugar, estabelecemos um estilo ou influência. Que estilo de arte ou referência você quer? Então eu falei sobre a casa de Bau e a moda streetwear. Dois estilos diferentes se fundem. E detalhamos ainda mais, adicionamos detalhes. Sua aparência e sensação incluem texturas, cores, iluminação e clima Então, para este, fizemos gradientes de néon, superfícies refletivas e Não dissemos apenas sombras. Dissemos sombras dramáticas. Não dissemos superfícies. Nós realmente nos certificamos de que éramos detalhados. Por fim, formato médio. Que formato é esse? Um pôster, logotipo, ilustração, postagem em mídia social O que dissemos é que queríamos renderizar como uma maquete de vitrine de produtos para o Instagram Fomos muito específicos quanto ao tipo de saída e formato em que queríamos estar. Então, começamos com um simples toque de sapato. Eu não contei nada, apenas gerei a imagem de um sapato. Não havia detalhes, não havia contexto, um sapato. Então, o que ele vai fazer é criar o que acha que é um sapato com base em todos os dados de treinamento. É só um sapato branco. Não há nenhuma característica nisso. Não é um tipo específico de sapato. Então, vamos editar um pouco nosso prompt. Vamos adicionar mais alguns detalhes. Um tênis moderno com formas inspiradas em Bohuse. Então, agora temos um pouco de formas e cores entrando em nosso sapato. Ok, vamos dar um pouco mais de detalhes. Um tênis moderno com formas inspiradas na casa Bau e bordas brilhantes em neon Coloque-o em um fundo preto. Então, agora estamos definindo o plano de fundo e a cena. Nós não fizemos isso antes. E agora estamos sendo muito específicos o que as linhas precisam ser, que brilharão em néon e ainda manterão a forma da Bauhaus Vamos nos aprofundar. Vamos fazer um tênis moderno com formas inspiradas em Buhuse, bordas brilhantes em neon, colocá-lo em um fundo preto, o tênis repousa sobre uma água brilhante renderizada em três D com formas adicionais inspiradas em Bohuse no fundo. Então, estou contando mais detalhes sobre o plano de fundo e também sobre onde o tênis está apoiado. Vai descansar em um pouco de água. Então, vamos levar isso ainda mais longe. Estou dizendo que quero um ângulo fotográfico específico. Em vez de apenas um sapato onde você vê o lado inteiro, eu quero um ângulo de três quartos, então vou adicionar isso ao prompt. Quero acrescentar mais detalhes. Quero que chova e que gotículas de chuva atinjam a água em que ela está apoiada e o sapato e façam com que ele sapato e façam com Estou te dizendo, não só faça chover, mas quero que as gotículas de chuva caiam e reajam Vamos colocar mais e mais detalhes com isso. Quero que um pouco da água suba acima da sola do sapato e espirre contra ela como uma onda em uma tempestade Quero que os efeitos de iluminação sejam retroiluminados com propriedades holográficas Então, vamos adicionar mais duas revisões. Então, fiz a mesma solicitação de antes, mas estou adicionando manter tudo igual, mas troque os cadarços dos sapatos por fios dourados Faça o ouro brilhar e brilhar. Mas também faça com que tenha uma perspectiva ligeiramente distorcida. Torne os cadarços dourados mais refletivos, adicione mais respingos de água e um raio atrás deles Estou basicamente dizendo mais dramático. Por fim, quero mais água saindo da Eu quero que a água tenha mais reflexo do néon do sapato Eu quero que haja um raio no fundo. Eu quero que esse sapato ainda tenha o formato de bohus. Eu quero o brilho de néon. Eu quero que o sapato seja mais decente . Eu, mais, mais. Estou adicionando mais detalhes, camadas e camadas, e estou tornando esse caminho mais exclusivo do que era no início A melhor maneira de escrever instruções detalhadas e aprender como fazer isso é estudando outros exemplos Existem tantos exemplos fantásticos de redação rápida que você pode encontrar on-line. No momento, há valor criativo para aqueles que conseguem escrever instruções eficazes e muito detalhadas para imagens visuais e vídeos, tanto que as pessoas podem cobrar por solicitações específicas para produzir imagens muito Agora é visto mais como uma arte em si, tão criativo quanto esboçar uma imagem ou criar um logotipo Por quê? Porque é preciso um esforço enorme para escrever instruções eficazes As palavras usadas, a forma como enquadramos o plano de fundo, o cenário é como falar um novo idioma criativo, e aqueles que sabem falar o idioma prosperarão É por isso que reuni alguns recursos muito legais para você. Antes de entrarmos nesse recurso, vou mostrar alguns exemplos reais de redação rápida. Vamos dividi-los. 5. Exemplos com propostas do mundo real: Encontrei esse no Instagram. Então isso tem uma aparência muito elegante de fibra, bordado e fio E eles pegaram logotipos e conseguiram aplicar esse aviso específico a muitos outros diferentes. Então, vamos dar uma olhada em um prompt. E você notará que as instruções que são muito, muito boas são esses parágrafos grandes, longos e detalhados. Então, vamos detalhar. Crie um logotipo texturizado altamente detalhado para a marca, feito de fios grossos ou lã. Então você está estabelecendo o assunto e descrevendo-o. Cada seção do logotipo deve ter uma cor vibrante diferente corresponda à imagem de referência fornecida, e as imagens de referência também são muito importantes. Podemos fazer projetos práticos usando esses. O fio deve ter uma textura tricotada com fibras claramente visíveis, dando uma aparência suave e dinâmica de três D. E claro que o logotipo tem um efeito tridimensional com sombreamento que faz com que pareça um pedaço de tecido tricotado Então, estamos falando especificamente sobre o tipo de fio, cor e a aparência E agora vamos definir a cena e o plano de fundo. Portanto, o fundo deve ser neutro ou de cor clara, permitindo que a textura vibrante do fio se destaque e mostre a identidade única da marca Então, quando detalhamos esse prompt, ele tem essas quatro camadas distintas sobre as quais falamos anteriormente, nas quais você estabelece o assunto , fornece contexto , fornece informações básicas e as fornece no formato em que deseja. Este próximo eu realmente poderia ter usado na minha master class intermediária de design gráfico, onde ensinei vocês a criar um pôster de fast food, e tive que acessar pexels.com para encontrar Mas era muito limitado. Acabei encontrando algo que funciona. Mas e se eu puder criar algo que corresponda perfeitamente à minha visão criativa para o pôster E isso seria muito bom para qualquer tipo de pôster de fast food item relacionado a alimentos ou qualquer pôster que você queira gerar Agora você pode criar o que quiser em termos de uso dessa fotografia. Então você também pode fazer tacos, diferentes tipos de objetos alimentares O prompt não é tão longo, mas acho que ainda é eficaz. Diz, renderize uma imagem dramática hiper-realista de, você sabe, qualquer alimento suspenso no ar com migalhas, respingos, partículas congeladas respingos Use iluminação de borda ousada, foco macro e um fundo brilhante de qualquer cor para adicionar energia e contraste. Então, você percebe que algumas dessas palavras-chave criativas , quando são descartadas, realmente dão à IA um senso de estilo que deve ser procurado em suas referências. Então, neste caso, iluminação do aro, foco macro. E suspenso no ar e hiperrealista. Talvez você não conheça muitas dessas palavras, mas vamos analisar algumas palavras realmente diferenciadas para nos ajudar a inventar aquelas palavras realmente estranhas que talvez não saibamos o que é iluminação de borda Mas vamos explorar tudo isso aqui em breve. E eu adoro ver essas texturas hiper-realistas sendo usadas, especialmente esse tipo de objeto inflável explodido aqui que você pode fazer Então, vamos dar uma olhada nesse prompt. Podemos ver isso em ação. É muito consistente. Depois de desenvolver esse prompt, você pode simplesmente mudar o assunto, e ele manterá o mesmo estilo bastante consistente. Então, como vamos criar isso? Foi assim que eles fizeram. Então, vamos dar uma olhada no prompt final. Uau. Não vou ler tudo isso, mas queria mostrar este exemplo de como isso é escrito de forma elaborada e como provavelmente demorou algumas horas para escrever a solicitação e ver os resultados Não é o que você queria. Você tem que ajustá-lo, mudar o prompt, assim como fizemos com o exemplo do sapato Tivemos que voltar, adicionar coisas , adicionar coisas, adicionar detalhes. São horas, e é por isso que escrever instruções é uma arte criativa por si só. Então, vamos destacar talvez algumas das palavras-chave específicas realmente diferenciadas aqui que eles estão usando Então, eles usam objetos transparentes infláveis. Flutuar suavemente na água, para que não fique em águas agitadas, então está meio que definindo o plano de fundo. Portanto, tem superfícies lisas e salientes, espessas, visíveis e seladas a quente Então, deixe-me dizer o quão específico isso é. Então, você quase precisa pesquisar como os objetos de plástico são feitos e termos sobre plástico. Então, às vezes você precisa ir ao HachPT, pesquisar sobre plástico inflável, aprender sobre o processo e até mesmo saber como escrever um aviso sobre como Então é assim que essas coisas ficam detalhadas. Então você tem turbulência, bolhas de ar, ondulações fracas, cáusticos naturais Então, aprenderemos um pouco sobre cáusticos , mas isso é tudo sobre iluminação Eu não sabia disso até começar a me aprofundar nas palavras-chave para escrever instruções. Aqui está outro bom exemplo de redação rápida. Isso está em um saco lacrado embalado a vácuo. Então, vamos ver como fazer esse efeito. Então, crie uma imagem hiperrealista de alta resolução, e você verá essas mesmas palavras-chave, hiperrealistas, de alta resolução, porque essas são essas pequenas palavras-chave que, de repente , clicam no cérebro do modelo de IA e dizem: Ok, esse é o tipo de foto que eu preciso procurar Mas eu queria entrar nessa pequena área, incluir condensação ou pequenos vincos ao redor dos pontos de pressão para aumentar o Quão bem escrito é isso? Então, no final, você pode ver esses detalhes visuais com dois pontos Então, ele listará muitos detalhes visuais, mais do que o que já foi feito. Portanto, plástico a vácuo triturado, transparente ou metálico, silhueta de objeto, detalhes visíveis e extremos, iluminação severa para enfatizar textura e forma, sobreposições tipográficas, códigos distorcidos e humor da marca, estilo de exibição do produto e clima de silhueta de objeto, detalhes visíveis e extremos, iluminação severa para enfatizar textura e forma, sobreposições tipográficas, códigos distorcidos e humor da marca, estilo de exibição do produto e clima de fundo. Portanto, ele define o clima de fundo, uma iluminação natural brilhante pós-consumo experimental, ousada e colecionável, aprimora as cores vivas e oferece uma aparência limpa, cinematográfica e oferece uma aparência limpa, cinematográfica Lindamente escrito e o aviso, claro, parece fantástico Eu tive que experimentar esse prompt. Isso é o que eu tenho. Então, esse exemplo de teclado foi muito legal porque achei que eles realmente descreveram o que queriam com essas palavras-chave extras Então, neste caso, eles disseram que querem uma grade estreita de dois por dois. Eles simplesmente não disseram, mostre-me um teclado. Eles disseram, eu quero uma grade de dois por dois. Então, duas teclas na parte superior, duas teclas na parte inferior. E outra coisa é que eles falaram sobre ângulo isométrico Então essa é a visão e o foco da câmera. Tem esse ângulo isométrico. Então, se vocês estudaram, eu já lhes ensinei design isométrico antes Então, isso é muito popular em termos de visão. Então, enviar imagens de referência é muito legal. Então, eles enviaram uma imagem de referência de uma foto que tiraram de uma lata de Coca Cola e adicionaram no prompt uma imagem de alta resolução desse objeto flutuando dentro de algumas nuvens brancas projetando sombras em um céu azul brilhante A iluminação energética brilhante cromada levemente arranhada, amassada, mas altamente refletiva, com uma atmosfera surreal e onírica mas altamente refletiva, com uma atmosfera surreal E você pode ver como criar muitos modelos realmente legais com seus próprios produtos ou design de marca em que está trabalhando Neste último exemplo, isso realmente me inspirou a fazer algumas pesquisas por palavras-chave para iluminação, texturas e termos semelhantes Então isso tem uma aparência iridescente, um efeito muito, muito legal em que você tem quase esse prisma de arco-íris, E se você não sabe se sua solicitação é boa o suficiente, é boa o suficiente, você precisa adicionar um pouco mais de impulso à sua solicitação, basta perguntar ao Chat ChPT É ótimo para refinar um pouco mais suas solicitações, pois conhece os tipos de solicitações necessárias para gerar o tipo de conteúdo que você está procurando Descrições obscuras revelam exclusividade e camadas de estilo. A maioria de nós, designers , usa as mesmas dez ou 15 palavras-chave visuais, talvez ousadas, grossas, brilhantes, geométricas, redondas, para citar algumas Mas e se houvesse um mundo totalmente novo de milhares de palavras criativas descritivas diferentes que nunca exploramos antes Tudo começou quando vi aquele aviso iridescente que mostrei anteriormente e achei o efeito muito legal Eu já vi isso antes. Eu simplesmente não sabia como colocar isso em palavras. Eu vou ser honesto. sabia a diferença entre idescente, luminância, bioluminescência e todas essas outras Eu não sabia a diferença entre idescente, luminância, bioluminescência e todas essas outras antes de pesquisar essa classe. O incrível é que eu posso digitar no chat GPT ou um AILLM similar e pedir palavras semelhantes para Surgiu com uma variedade maior de palavras semelhantes. Consegui pedir que ele criasse exemplos visuais dessa iluminação específica no mesmo objeto, para que eu pudesse ter uma ideia das diferenças diferenciadas entre os diferentes efeitos de iluminação Uau. Eu nunca teria mergulhado tão fundo em palavras tão específicas antes, e agora me sinto uma designer melhor Agora posso descrever profundamente várias situações de iluminação diferentes ao escrever minhas instruções. E também pergunte a Cha GPT um estilo de arte, texturas e estados de espírito muito específicos, para que eu possa expandir o vocabulário do meu designer Consegui pegar essa lista e pesquisar intensamente tantas novas variedades de texturas e estilos de arte Eu me sinto como um novo designer que tem o mundo inteiro ao nosso alcance De tudo que usei para IA, esse é o que me manteve acordado à noite. Mas, no bom sentido, quero que você mergulhe pessoalmente do coelho explorando termos de design de nuances dos quais talvez nunca tenha ouvido falar antes Dessa forma, ao escrever instruções, você pode ser incrivelmente específico Examinaremos muitos exemplos de termos de design de nuances na próxima lição Então, prepare-se. 6. Termos de design sutil: Uma escultura biométrica e uma textura adivinhada sob uma luz brilhante com as sensibilidades Wabi sabi sob uma luz brilhante Como diabos podemos aprender o que é tudo isso? Eu nem conheço metade desses termos até agora, até começarmos a explorar algumas dessas palavras-chave diferenciadas que podem tornar nossas solicitações realmente profissionais Então, eu tenho esse recurso para download. É isso que vou ver com vocês juntos nesta aula. Portanto, ao escrever instruções ou desenvolver resumos criativos, essas palavras refletem nossos estilos, texturas e estéticas menos conhecidos que podem elevar sua linguagem conhecidos que Então, vamos trabalhar para expandir nossa linguagem de design. Então, esses são alguns e, claro, chat GPT e eu realmente trabalhamos juntos para ajustar alguns desses estilos muito diferentes Então, eu quero falar sobre o primeiro. Esses são alguns estilos e movimentos estéticos diferentes. Então, algumas delas eu quero mostrar a vocês: a biomórfica, que é o exemplo no início da aula, é uma espécie de bolha orgânica, semelhante a um fluido, que se forma E eu pude mergulhar profundamente, pesquisei no Google, pesquisei, e agora eu conheço design biomórfico, ou seja , eu posso desenvolver cerca de três elementos biomórficos D para colocar em um projeto de design de marca e ajustá-los porque eu realmente gosto de como isso parece agora, pesquisei, e agora eu conheço design biomórfico, ou seja , eu posso desenvolver cerca de três elementos biomórficos D para colocar em um projeto de design de marca e ajustá-los porque eu realmente gosto de como isso parece agora, especialmente em um modelo em três D. E há o núcleo do y2k. Então eu vivi até o início dos anos 2000, então eu sabia muito sobre o y2k É uma forma de futurismo retrô do início dos anos 2000, gradientes cromados Então, pense em dois pontos com esse tipo de aparência brilhante corticista. É abstração dinâmica angular, modernidade industrial. Então, esse era um estilo de pintura meio popular, e eu ia dar uma olhada em muitas coisas na Wikipedia sobre esse estilo. Muito legal. Não sabia que isso existia. Dinamismo O dinamismo demorei um pouco para descobrir como dizer essa palavra São composições de alta energia. Então, vamos passar para diferentes texturas e descritores de materiais Então aqui está aquela iridescente. É uma superfície cintilante de arco-íris, uma mudança de cor com Achei que era muito melhor do que apenas dizer neon. Eu senti que a única maneira descrever uma luz brilhante era neon Mas agora eu tenho descendência. Então você oxidou, que é quando você tem ferro que enferruja Portanto, é uma pátina química enferrujada com metais desgastados. Então, isso pode lhe dar aquela aparência metálica desgastada que talvez você estivesse procurando Também há manchas, que são partículas dispersas ou textura brilhante E depois há a colagem. Portanto, a colagem em D são as camadas rasgadas revelam E eu já vi isso em muitos designs em que você tem aquela aparência rasgada e vê as camadas, e realmente adorei a aparência Eu simplesmente não sabia que tinha uma colagem com o nome D. Portanto, a menos que você tenha muitas aulas de história da arte na faculdade, talvez não conheça algumas delas, mas pode pedir ajuda ao Chat GPT agora Depois, há o assustador, grotesco, intencionalmente estranho, distorcido intencionalmente estranho, distorcido Esse foi meio assustador, mas ei, todos nós temos coisas diferentes que estamos criando para nossas peças de design Então, um dos meus favoritos é iluminação e termos de humor. Cáustica é, na verdade, um termo muito popular em renderização de vídeo e três modelos D, falando sobre como a luz interage E às vezes vidro também. Portanto, são padrões de luz refratada, geralmente debaixo d'água Eu sempre adoro esse efeito. Eu pintava um pouco disso à mão quando costumava fazer pintura digital e pintava água. Eu pintaria esse tipo de treliça refletida e instável, que Esse é o estudo da luz e refração no vidro e na água Então, preciso descobrir isso e ser capaz de dar um nome a isso. Vamos passar para termos de estilo cultural e de nicho. Futurismo retrô, que é um visual vintage de ficção científica, imaginando Existe o Wabi Sabi, que é um conceito japonês de imperfeição e transitórios É por isso que às vezes você vê o ouro rachado reparado e as placas, porque eles querem honrar a imperfeição, e é uma coisa muito cultural de se E eu realmente vi esse Wabi Sabi em muitas instruções ultimamente, então deve ser um estilo muito Portanto, também há composições estéticas e visuais. Portanto, o orpismo é uma abstração vibrante usa cores para expressar Então, o rainismo é a interseção de raios de luz, futurismo semiabstrato e até fractalismo, que você já ouviu falar de fractais matemáticos, que continuam até o infinito, são geometrias recursivas, formas e complexidade semelhantes raios de luz, futurismo semiabstrato e até fractalismo, que você já ouviu falar de fractais matemáticos, que continuam até o infinito, são geometrias recursivas, formas e complexidade semelhantes. raios de luz, futurismo semiabstrato e até fractalismo, que você já ouviu falar de fractais matemáticos, que continuam até o infinito, são geometrias recursivas, formas e complexidade semelhantes. Então, um dos meus favoritos são superfícies, padrões e técnicas de mídia. Aqui está um vertigris que é cobre oxidado e meio que nos dá uma pátina verde muito legal E depois há o comportamento e os efeitos das cores , cores prismáticas É como quando você tem o prisma, que é basicamente todo o arco-íris de luz sendo refratado em uma área apertada Então você tem uma refração do arco-íris com uma transição nítida. Portanto, eles não têm essas transições soltas , como gradientes soltos Eles são muito apertados e você vê uma transição de cores muito rápida. Com essa iluminação frenética, e espero estar pronunciando tudo isso corretamente, sempre consigo bater um Mas a iluminação frenal é gradiente refletivo de alta energia Então, tem esse gradiente frio nas bordas, com todo o resto meio escuro e irrefletivo E então temos a cultura do sabão e a influência global. Então você tem o modernismo do deserto, que é uma arquitetura de meados do século adaptada para climas áridos Então, se você já fez uma solicitação para qualquer tipo de edifício ou prédio em uma cena de fundo, você precisa falar com eles para falar com o chat GPT, ou qualquer gerador de imagem que você esteja usando Certifique-se de colocar em que tipo de prédio tudo está em segundo plano. Seja muito específico sobre o estilo de construção. E então outra palavra-chave super comum que estou vendo em todos os lugares é Neo Tokyo. E Neo Tokyo é essa expansão urbana corajosa, colorida e influenciada pelo anime E eu vejo muito isso quando você tem robôs futuristas Eles tendem a querer apenas colocar isso em um cenário de Neo Tokyo. Então você me conhece. Gosto de ir cada vez mais longe na do coelho porque tenho uma curiosidade intelectual por todas as coisas Então eu perguntei ao ChahPT Quais são os termos ainda mais sutis e raramente conhecidos em design Então, se você encontrar um estilo que você goste, What diabos is that, você pode enviar uma foto de referência para um LLM e pedir que ele descreva esse estilo com palavras rápidas, e é bom ajudá-lo a descobrir Então, alguns dos meus termos raros favoritos eram veludo flocado. Eu sinto que posso estender a mão e tocar isso. Plástico Leucite, que é um plástico retrô, um tipo de plástico grosso robusto que era muito popular antes de começarem a receber os plásticos muito finos finos Mas eu posso ver muito isso em, tipo, produtos retrô. Textura de plástico-bolha. Adoro a aparência disso nas coisas. brilho do subsolo, que você pode imaginar, como um bloco de magma e apenas um pouco do magma de dentro está saindo, mas não é muito brilhante É muito subterrâneo. E o brilho do fluido de ferro. Então você já viu óleo derramando em uma estrada e viu esse tipo de arco-íris refletido Isso é exatamente o que isso é. É esse reflexo que o óleo emite , que reflete um pouco do espectro de cores em você, mas ainda tem aquela aparência escura e líquida. Vamos até loucamente. Então, esses são provavelmente aqueles dos quais você nunca ouviu falar. E se você já ouviu falar deles, parabéns, porque eu nunca ouvi falar deles. Então, essas são as palavras mais obscuras que pude encontrar na Internet, e a quantidade que encontrei foi Esta é apenas uma seleção muito pequena que eu pessoalmente gostei e achei que você acharia útil, mas há milhares que eu não usei. Portanto, há a refração do brilho da lua, uma luz suave e prateada curvada pela névoa. Muito, muito específico. Há uma floração caleidoscópica. Então, se você já olhou através de um caleidoscópio, é uma dispersão caótica de luz fraturada, sangramento fotônico, que é a sobreposição de fontes de luz sangramento fotônico é uma dispersão caótica de luz fraturada, sangramento fotônico, que é a sobreposição de fontes de luz com uma sobreposição ruidosa. Há pedra polida de magma, que é lustrosa e queimada, lava resfriada encontra obsidiana resfriada Latido vítreo. Acho que estou dizendo isso. Acho que é de vitae, que significa vida. vitrio é uma casca de árvore com brilho vítreo semitransparente E também podemos falar sobre esses temas conceituais ultramodernos , Archetypical Glitch Core, Archetypical Glitch Core, que Fragmentos de utopia esquecidos, pedaços quebrados de sociedades perfeitas fracassadas Quero dizer, quão diferenciado você pode ter? E então ruínas do punk solar, o que é uma utopia de eco que Então, se você está tentando pintar um quadro de humor distópico, essas são definitivamente algumas palavras que você pode querer usar Como desafio para estudantes do ensino médio, quero que você encontre os estilos de arte mais diferenciados Escolha quatro estilos, texturas ou descrições de arte com nuances diferentes , e eu quero que você explore isso intensamente Então, se é iudescência, procure iridescência, descubra o que é isso, aprenda sobre isso E eu quero que você faça isso com quatro diferentes. E se você quiser fazer duas por dia durante todo o tempo em que estiver aprendendo IA ou fazendo esta aula, seria ótimo porque você pode realmente começar a expandir seu vocabulário e conhecimento de design dessa forma Então, agora entendemos a estrutura básica do que é necessário para criar um prompt sólido. E também descubra algumas dessas palavras-chave diferenciadas. Sim, resta apenas mais uma coisa para discutir as questões legais com o uso da IA. Isso tem que ser discutido antes de seguir em frente. 7. Direitos autorais e questões legais: Então, de onde a IA obtém suas fotos para criar essas obras-primas É difícil não falar sobre o elefante na sala. Como discutimos anteriormente, Mid Journey Dali e outras ferramentas de fotogeração de IA tiraram uma grande quantidade de fotos de toda a Internet para treinar seus bots de IA Isso significa que fotos, ilustrações e gráficos protegidos por direitos autorais foram compilados para ensinar ao bot o que o usuário talvez queira Há um artigo interessante que afirma que um dos fundadores da MD Journey sabia esse era o caso e admitiu não saber o que fazer para dar devida propriedade dos direitos autorais aos artistas das imagens que esse AiBT usa Ao criar arte de IA, você também pode adicionar imagens de referência para ajudar o bot a detalhar ainda mais o que você está procurando. E não há como impedir que os usuários enviem trabalhos protegidos por direitos autorais da Pesquisa Google para Isso significa que, se você estiver usando imagens que não têm uma licença Creative Commons zero ou uma licença de domínio público, você pode estar se expondo a ser processado por extrair obras de arte de imagens protegidas por direitos autorais Então, isso significa que as ferramentas de IA violaram os direitos dos criadores Isso viria à tona em algum momento. Vários artistas se uniram para processar o Mid Journey em outros sites de portfólio de arte, como Deviant Art, por permitir que trabalhos de IA derivados de direitos autorais sejam publicados sem dar os devidos créditos E vai ser um processo judicial muito complicado. Por um lado, as ferramentas de IA foram treinadas absorvendo dados da maior parte da Internet, que é uma fonte gigantesca de Pode ser difícil provar a individual de direitos autorais a partir de imagens derivadas de um conjunto de dados tão grande Por outro lado, houve casos em que artistas individuais podem digitar o nome de um prompt de IA e ver claramente como sua arte foi usada para formular os resultados Embora nem sempre seja uma cópia exata, você pode ver a inspiração Quem é o dono do trabalho criado pelos geradores de imagens de IA? Se eu inserir um prompt em um gerador de texto ou imagem de IA, eu possuo o prompt para criar a imagem ou a própria imagem? É uma questão jurídica complexa, mas sempre vale a pena ler mais sobre isso. Um elemento humano deve estar presente para que qualquer reivindicação de direitos autorais ocorra. Isso significa que a AI Tech não pode reivindicar a propriedade das imagens. A arte de IA realmente não tem um proprietário com base nas leis de direitos autorais atuais, mas, de acordo com os termos de uso de alguns dos programas, ela atribui a propriedade de uma imagem ao criador ou redator imediato Mas você pode considerar que reivindicação de direitos autorais no tribunal seria a próxima pergunta, pois nada pode impedir que empresas terceirizadas levem você a tribunal por usar a imagem de sua marca em sua foto gerada por IA. Estamos realmente vivendo em um novo Velho Oeste digital. Então, o que você faz se quiser seguir o caminho seguro e seguro, proteger trabalho de um verdadeiro artista e garantir que ele receba os créditos adequados? Bem, antes de tudo, eu evitaria colocar nomes de artistas específicos nas instruções de IA Não há problema em usar nomes históricos como Leonardo Da Vinci. Ele está morto há muitos anos, mas eu não colocaria novos artistas que ainda estejam vivos e tenham um legado a construir. Outra coisa que você pode fazer é usar ferramentas geradoras de imagens de IA de empresas oficiais que garantem que a biblioteca de fotos que eles usam para treinar seus bots e gerar imagens receba permissão das pessoas que as possuem. Além de usar ferramentas de IA como o Adobe Firefly, aqui estão algumas melhores práticas pessoais para mitigar essas complexidades e garantir que Em primeiro lugar, cada ferramenta de IA tem termos de licenciamento diferentes, por isso é bom analisar cada uma delas Faça um LLM, divida-o para que você possa digerir e comparar os diferentes Documente suas contribuições criativas e etapas iterativas com clareza. Digamos que você esteja fazendo um design de personagem. Talvez você mantenha uma cópia do esboço original que você enviou para um modelo de IA Acompanhe as diferentes instruções que você usa para editar e alterar seu personagem Tenha cuidado ao solicitar à IA personagens protegidos por direitos autorais, marcas famosas ou É aqui que você pode ter mais problemas e ter a maior chance de ser processado. Evite usar nomes de empresas ao digitar seus prompts. Evite usar o logotipo da Nike para gerar ideias para um logotipo. Evite dizer o estilo de animação da Pixar ou da Disney ao criar imagens Um exemplo proeminente disso é quando alguém começou a copiar o famoso estilo Ghibli do famoso animador Hao Miyazaki Seu estilo leva centenas de horas apenas para alguns segundos de animação, e as pessoas estavam inserindo seu nome e estilo nas instruções para emular essa Em uma entrevista, Miyazaki chamou a IA de um insulto à própria vida e acredita que a animação deve estar enraizada nas emoções e experiências humanas e não nos algoritmos Portanto, ao escrever suas instruções, pense em criar sua própria mistura de estilos que seja exclusiva para você Você pode se inspirar em outros trabalhos criativos. Fazemos isso o tempo todo como criativos. Navegamos no Instagram ou no Behance em busca de inspiração. Em seguida, criamos algo e nos vemos imitando alguns desses estilos subconscientemente O mesmo problema existe com o uso da IA. Encontrar originalidade pode ser difícil, mas esse sempre foi o caso de nós designers É por isso que estudamos centenas de estilos para que possamos misturar, combinar e criar nosso próprio sabor e fator exclusivos. forma de estabelecer seu próprio estilo é fazer o upload de um esboço básico de sua ideia, logotipo ou personagem Escrevendo instruções muito elaboradas que só poderiam ser escritas por você Mantenha um estilo específico no que você gera, o que permite que você se aproprie desse estilo. Pegando ideias geradas pela IA e modificando-as fortemente fora dos programas de IA e programas de design, como o Photoshop e design, como o Photoshop e Eu recomendo uma troca de criatividade em seu fluxo de Isso significa que você pode enviar um esboço para a IA. Isso ajuda você a refinar sua imagem. Você traz isso de volta para o Adobe Illustrator ou outro programa vetorial e o vetoriza Depois, você pode ajustá-lo ainda mais. Você o traz de volta à IA para adicionar mais detalhes ou refinar as ideias Você pode até mesmo pedir conselhos à IA sobre a orientação do seu logotipo posteriormente. Isso levanta a questão de ser processado. Qual a probabilidade de sermos processados por usar imagens geradas por IA em nossas campanhas de marketing, por exemplo É possível, mas não muito provável. A pessoa ou empresa que está processando precisa provar, sem dúvida, que as imagens que você usa copiam exatamente o estilo delas Como os geradores de IA são treinados em milhões e milhões de pares de imagens de texto, isso significa que é impossível para um fotógrafo ou designer reivindicar a propriedade se sua solicitação for exclusiva o suficiente Mas pode-se escrever um aviso que descreva estilo de um fotógrafo famoso um T e fazer com que ele seja em um T e fazer com que ele seja tão próximo a esse estilo que infrinja dessa pessoa. Isso é muito complicado Sempre permanecerá uma área cinza , como acontece com o design do logotipo. Uma coisa que você pode fazer é verificar regularmente os ativos gerados por IA usando a pesquisa reversa de imagens para detectar possíveis problemas de similaridade ou violação Você pode modificar significativamente a saída gerada pela IA em vez de usá-la diretamente. Então, se você pedir uma ideia de logotipo, modifique esse aviso um pouquinho para torná-lo seu. Após o processamento, você pode editar imagens geradas por IA extensivamente usando ferramentas como o Photoshop ou No final das contas, a grande conclusão é quanto mais interação guiada humana houver entre o conteúdo gerado pela IA, melhor você poderá se proteger, e a curta propriedade clara depende significativamente da quantidade de contribuição humana criativa original que você adiciona às imagens geradas pela IA Sempre aprimore e adapte imagens forma criativa para estabelecer claramente seus direitos autorais Garanta que seus designs finais contenham modificações humanas criativas significativas e estejam livres de problemas de violação. 8. Projeto do estudante: Então, eu tenho seu primeiro projeto estudantil, que é fazer engenharia reversa de uma foto usando instruções. Então, quero que você recrie as fotos de referência com a maior precisão possível e possa baixá-las como parte dos recursos usando apenas ferramentas de geração de imagens de IA e instruções escritas Não é permitida a edição manual de imagens. Isso permitirá que você pratique o uso de instruções para criar objetos e detalhes muito específicos Então, aqui está a primeira, que tem três formas em D. Eu quero que você recrie isso o mais próximo possível. Não será exato, mas você poderá editar continuamente os prompts para obter lentamente os resultados de que precisa E o segundo é um café da manhã americano. Então você pode começar com dois ovos e descrever tudo no fundo, descrever que há uma janela, descrever que é fotorrealista Comece a usar algumas dessas palavras-chave que aprendemos para poder descrever essa imagem e imitá-la Portanto, escolha qualquer gerador de IA de sua escolha. Pode ser Adobe Firefly, Dolly, Leonardo, ou Use somente instruções de texto e tente replicar a imagem, que você não possa fazer nenhuma referência E eu quero que você se aproxime da composição, da iluminação, do assunto, da paleta de cores, da textura e do estilo E você pode repetir quantas vezes precisar e acompanhar suas melhores versões de prompt à medida que for multado 9. Bônus!Nano Banana Pro — dá para adivinhar o real ou a IA?: O Google Nano Banana Pro acabou de ser lançado e os resultados são insanos As formas pelas quais a IA deixa evidências de que é IA estão lentamente se tornando mais difíceis de detectar. Isso torna muito mais fácil trapacear, mudar o passado, enganar e enganar Obviamente, ele tem seus benefícios para quem sabe usá-lo corretamente. Para o Photoshop 2026, Adobe anunciou uma parceria com o Google para adicionar o Nano Banana como uma opção de terceiros em sua Agora, uma nova opção está disponível em seu Nano Banana Pro. Essa é uma opção paga se você a usasse no Google Gemini, mas a Adobe a disponibilizou para usar o Adobe Photoshop agora Nunca vi resultados tão incríveis com essa opção muito melhores do que até mesmo a já muito boa Nano Banana de primeira geração Por ser uma opção premium fora da Adobe, Adobe penaliza você um pouco por usar este Dano Banana Pro Custa dez créditos por geração para resolução de uma a 2000 e 16 créditos para resolução de 4.000 A Creative Cloud Pro oferece 4.000 gerações por mês. Adobe Creative Pro custa $70 por mês na minha área, então você definitivamente está pagando por isso Portanto, você também pode usar alguns desses créditos e experimentar essa ferramenta. Então, eu quero jogar um pequeno jogo com você. Eu gerei a maioria dessas imagens usando o Google Nano Banana Pro com exceção de uma ou duas Quero ver se você pode me dizer qual é gerada com IA e qual é uma fotografia real. Eu fiz isso com meu marido, e ele falhou miseravelmente. Vamos ver como você se sai. Por favor, escreva nos comentários quantos você acertou. vou deixar você saber Depois de cada um, vou deixar você saber a diferença entre real e IA. Agora, vamos começar com uma das mais fáceis. Essa é uma das únicas que meu marido acertou. Desculpe, querida. Então , qual deles você acha que é real e qual você acha que é IA? Apenas espere alguns segundos para pensar sobre isso. E tudo se resume a ampliar. Então, se você não consegue ampliar, é muito difícil dizer se é IA ou não. À primeira vista, acho que talvez o da direita Parece quase bom demais, mas a iluminação é muito boa. E eu não sou astronauta, então não sei se o equipamento dela está correto ou Parece meio complicado na frente. Mas, novamente, o da esquerda parece muito convincente. Mas vamos ampliar e descobrir qual é real e qual não é. Então, se ampliarmos aquela que parece ter sido tirada dos anos 80, é muito crível, porque havia mulheres no início dos anos 80 que estavam começando a treinar no programa de astronautas a treinar no Mas dê uma olhada nesse distintivo. Tipografia no Texas, onde a IA ainda tem dificuldades, mesmo com o Nano A única coisa que consigo entender com 100% de precisão é quando se trata de tipografia Não é absolutamente nítido e claro. Você pode ver com um distintivo da NASA. Além disso, aqui em cima, dá para perceber que há pequenos orifícios, quase como se estivessem desgastados, mas percebo que apenas problemas com a tipografia, e esse não é o Além disso, se você olhar para o rosto desse cara, eles devem ser gêmeos porque é exatamente o mesmo cara Então, se você tem exatamente o mesmo cara, quais são as chances de ter gêmeos no programa espacial Provavelmente muito mínimo. Mas é muito impressionante. Olhe para o teto. Veja os painéis de madeira Os detalhes são muito bons. E, à primeira vista, acho que essa é uma foto real documentada A da direita é uma foto real e a da esquerda é IA. Você ficou surpreso? Vamos para a próxima. Vamos ser um pouco mais difíceis com este. Então, aqui você tem dois sets de filmagem padrão, um com Tom Cruise à esquerda e outro com Pedro Pascal e alguns outros atores famosos Qual set de filmagem é real e qual é falso? E isso pode ser uma pegadinha. Então eu quero que você dê uma olhada, e eles parecem muito convincentes. Então, vamos dar uma olhada. A única maneira de realmente saber é ampliar e observar as texturas Então, esse é super convincente. Veja esta câmera funcionando, olhe para a tela verde, olhe para o céu. Você realmente não pode dizer. Olha esse prédio. Não está distorcido Não está distorcido. Isso parece surpreendentemente bom. Dê uma olhada neste piso. Não há erros no piso. Se você olhar para os sapatos, não conseguirá ver muitos erros até o fim. Olha essa borda aqui. Essa é uma imagem total gerada pela IA. Além disso, quanto mais você aumenta o zoom, você pode ver essa textura repetida, quase como uma textura computacional aqui Quando você amplia todo o ladrilho. Isso não é natural. Essa não é uma textura natural. Então, de repente, quando você aumenta o zoom, você começa a ver todos os pequenos erros. Talvez ele tenha perdido um dedo, mas você poderia simplesmente dizer: Bem, está se curvando para um lado Então, quando você diminui o zoom, você não pode realmente dizer, mas quando você aumenta o zoom, você pode. Na verdade, também foi uma foto postada no Red it, como um formulário real ou vermelho AI. E muitos profissionais de câmera apontaram muitos problemas com essa câmera. Então, quando você está no ramo de fazer filmes, você pode ver muitos erros. Além disso, alguém apontou que essa tela verde não tem exatamente o mesmo ângulo que aparece aqui que ela realmente está mostrando. E a maior oferta para mim, ou o que a maioria das pessoas conseguiria ver está aqui no andaime Há uma fiação e flexão muito estranhas dos Então essa foi uma revelação absoluta. Mas quando você diminui o zoom, isso é muito convincente. Mas quando você aumenta o zoom, sempre dá para perceber. E o da esquerda? Essa é bem convincente. Quero dizer, ele parece ter mais ou menos a idade dele. Talvez seja uma foto de 7 anos ou uma foto de 10 anos dele filmando algo para Bem, uau. Isso parece muito bom. Os pequenos detalhes restantes. Veja esse homem segurando a foto. Ainda temos os fios, muitos detalhes naturais semelhantes aos humanos. Você pode até vê-los comendo biscoitos e café no set e até mesmo ter esse pequeno logotipo em sua jaqueta e até mesmo Tudo parece muito convincente até você perceber que isso também é IA Mais uma vez, a câmera aquela câmera, não existe na vida real. Você pode fazer uma busca reversa de imagens, tentar encontrar esta câmera e não conseguirá encontrá-la porque ela não existe. Mas essa provavelmente foi uma das mais difíceis. Não existe essa forma óbvia do Omega de ser IA, mas, como você pode ver , avó do Google, banana realmente arrasou de uma forma quase Então, sim, ambos são IA. Mas o da esquerda é, na verdade, muito mais convincente quando você aumenta o zoom Muito assustador. Tudo bem, todos vocês, pessoas criativas. Vamos fazer uma que se aplique a você. Um deles é um esboço real e o outro é a IA Qual é qual? Vou te dar um momento para pensar sobre isso. Veja todos os detalhes e vou ampliar alguns deles para que eles possam ver. Bem, ambos parecem esboços. Vamos dar uma olhada neste à esquerda. Pode ser IA, mas é difícil dizer. Isso parece muito genuíno. Se fosse IA, eu ficaria muito assustado. Há muitas linhas principais. Há muita experimentação humana em tentar descobrir as formas da tipografia Eu não sei. Está bem perto. Que tal o outro? Isso parece muito convincente com aquele lápis mastigado e desgastado. Mas está muito mastigado? Quero dizer, quem realmente tem um lápis tão ruim? Que tal uma borracha de formato muito, muito, muito estranho Mas os esboços em si são um pouco nítidos demais. Eu vejo essas linhas principais, o que me faz pensar: Bem, talvez isso seja real, porque essas linhas principais, como uma IA pode fazer isso? Você sabe, isso é apenas algo que um desenhista faz para tentar descobrir a simetria Ou é um desenhista muito talentoso ou é muito simétrico. Até mesmo a pequena poeira deixada pela pequena poeira do lápis ou da borracha é realmente convincente deixada pela pequena poeira do lápis ou da borracha é realmente convincente. Então , qual é qual? Ok, então a da esquerda é na verdade uma aluna minha, Amber Axelton, ela fez isso como parte de um projeto de marca Então, o da esquerda é real e o da direita é absolutamente IA. Tem um tom meio escuro nos esboços. Então, geralmente o lápis não tem essa cor escura, e somente alguém que desenhou muito na vida será capaz de identificar isso E esse será o problema com a IA. Somente especialistas do setor no que você está procurando podem resolver. Sabe de uma coisa Somente especialistas do setor no que ? Eu acho que isso é falso. Parece um pouco polido demais para mim. Quem não gosta de uma boa partida de xadrez? Um deles é real e o outro é gerado pelo Google Nano Banana Pro. Qual deles? Vou te dar alguns segundos para descobrir. Sim. Ok, então, à primeira vista, este à direita parece muito gerado por IA É super polido e tem essa hiperreflexão, quase como se tivesse sido gerado com um programa tridimensional muito bom, como o Blender E quando eu amplio o zoom, posso ver alguns detalhes do cavalo que parecem muito estranhos, e isso me lembra da IA E vamos dar uma olhada no outro. O outro parece meio natural. Estou vendo algumas peças de madeira que estão meio lascadas. Ele simplesmente tem muita textura natural. E se você ver como a luz está atingindo e refletindo, parece muito, muito, muito natural E as peças parecem ter textura natural orgânica. Há até um plano de fundo que parece convincente com algumas montanhas-russas, alguns livros empilhados e uma xícara Então, qual é real e qual é ahi? Este enganou todo mundo que eu tentei. Então, o da esquerda é, na verdade IA gerado pelo Google Nano Banana Pro, e o da direita é uma fotografia Ela foi um pouco iluminada no Photoshop, mas é principalmente uma imagem original intacta Isso te surpreende? Isso te choca de alguma forma? Você foi enganado? Então, aqui temos duas fotos aparentemente normais de frutas, mas uma delas é uma IA falsa e a outra é uma fotografia real Agora, qual você acha que é IA e qual você acha que é uma fotografia real? Eu prometo, ambos não são IA. Ambos se parecem com IA. Mas vamos dar uma olhada neste à direita. Parece super brilhante, quase um pouco brilhante demais. Quase parece que está brilhante sem motivo. Ele só tem aquele brilho extra que parece um pouco artificial. A mesa em si e a textura parecem bastante convincentes. A tigela, nada mais está realmente deformado. Isso pode ser uma fruta de verdade. A IA tem dificuldade em lidar com caules e descobrir onde essas coisas dão frutos. É meio convincente, mas esse brilho está me confundindo Ok, e esse da esquerda? Quero dizer, acho que do jeito que foi tirada talvez nos anos 80 ou no final dos anos 90 ou Tem uma geladeira muito convincente. Tem um pouco de remédio na bancada. Muitas coisas que você veria em uma cozinha aleatória. Até os ímãs estão intactos. Tem um pedaço de papel lá. Tudo parece convincente. A sombra está correta porque a luz vem de cima e brilha para baixo. E ainda tem isso nos dias 14 e 96 de agosto. Realmente combinaria com um tipo de cozinha em 96. Então, deixe-me ampliar e ver se consigo ver se isso é IA ou real. Oh, acho que o encontrei. Olha, vê esse pequeno adesivo? Se não fosse por esse adesivo, eu teria dificuldade em descobrir se isso era IA ou Mas, mais uma vez, adesivos, logotipo, emblemas e tipografia são muito difíceis de serem gerados pela IA Então isso não parece natural. Mas todo o resto funciona, e isso é muito complicado Então, a da direita é uma fotografia real, que encontrei na Wikipedia, e a da esquerda foi gerada com o Google Nano Banana Então, qual dessas fotos é real e qual é IA? Ambas parecem ter sido tiradas nos anos 50 ou 60. Eles estão em um carro. A da esquerda parece super saturada para uma foto, mas poderia ter sido corrigida O da direita parece bastante convincente. Mas qual é IA e qual é real? Ok, o da direita é gerado com o Google Nano Banana Portanto, é IA, e a da esquerda é a foto real. Você está surpreso? coisa sobre as características dos rostos fez você pensar que era IA? Então, esse é um pouco diferente. Esta é uma foto real de aniversário de um bolo que eu tirei, e é do aniversário do meu filho e da minha sobrinha Eles fizeram nove e sete anos, ou fizeram oito e seis anos? Essa seria a grande questão. Uma delas é modificada usando o Google na banana, onde apenas um elemento foi alterado, que seriam as velas de aniversário Agora, qual deles é mais convincente? Acho que a parte complicada disso é ampliar essa à esquerda Então você tem esse tipo de coisa estranha com o nove acontecendo, quase como se estivesse quebrado e não parecesse sobrenatural Então, meu primeiro instinto seria dizer: Ok, esta é a imagem gerada pela IA E vamos para o outro. Então, isso começa a parecer quase polido demais. Se você olhar para isso, quase não há erros. Nem mesmo um pouco da textura da cera da vela Isso me faz pensar que essa é definitivamente a foto gerada pela IA. E se esse é o que você adivinhou, eles estavam fazendo nove e sete anos, você está correto. Essa é a foto real. E o falso e o modificado são o oito e o seis. É assustador como podemos mudar fotos do passado e dar pessoas uma narrativa totalmente diferente do que aconteceu. Isso pode ser muito assustador. Podemos dizer que namoramos pessoas que nunca namoramos, ou temos um recibo de um produto que nunca compramos. Essa é a parte assustadora da IA. Mais uma rodada de bônus só para se divertir. É uma foto real ou é uma IA gerada pelo Nano Banana À primeira vista, reflexão muito convincente. Veja como tudo é refletido. Isso parece muito autêntico e real. Veja como está chovendo lá fora e você pode ver a chuva nas ruas Os carros parecem bem normais, mas é o mesmo carro atrás com o outro? Eu não sei. Estou começando a duvidar de mim mesma se é real ou não. Seu cabelo parece convincente. A iluminação, tudo parece muito natural. Veja também os detalhes do kit. Não consigo encontrar um erro no tricô. Mas, como sempre, vamos encontrar qualquer tipo de tipografia, fonte ou texto que pudermos O que é repreender a erva doce? Não sei o que é isso, mas essa tipografia não parece natural Todo o resto é pequeno demais para eu ler, mas esse é o sorteio Honestamente, essa é a única oferta em toda a foto. Você pode ampliar e olhar em volta, mas é difícil encontrar outro motivo. Então, se ela não estivesse segurando um livro, se estivesse segurando algo sem texto, seria muito difícil descobrir se é real ou IA. Mas sim, isso é IA. Espero que você tenha gostado desse pequeno mergulho na tentativa de descobrir o que é real e o que é falso. Então, está ficando cada vez mais difícil e o Google Nano Banana, o material que eu gerei a partir daí com instruções muito simples de uma frase foi incrível e bastante convincente E pude ver que em mais um ou dois anos, vamos apagar todos esses pequenos artefatos de IA, e vai ser muito difícil sem ter um olho super treinado Portanto, continue treinando esse olho, amplie 800% e observe esses detalhes, texturas, padrões Definitivamente tipografia. Por favor, deixe um comentário abaixo se você gostou disso e quantos acertou? Ou se você errou, está surpreso com algum deles? Nos vemos no próximo vídeo.

IA para designers: como funciona, inspiração para escrita e design

Lindsay Marsh, Over 600,000 Design Students & Counting!

Assista a este curso e milhares de outros

Assista a este curso e milhares de outros

Aulas neste curso

1.

Introdução ao curso

2:48

2.

Como os LLMs funcionam

13:18

3.

Como funciona a difusão de imagens

11:10

4.

Escrita de propostas

9:55

5.

Exemplos com propostas do mundo real

10:04

6.

Termos de design sutil

10:57

7.

Direitos autorais e questões legais

8:54

8.

Projeto do estudante

1:28

9.

Bônus!Nano Banana Pro — dá para adivinhar o real ou a IA?

14:53

Sobre este curso

Conheça seu professor

Lindsay Marsh

Habilidades relacionadas

Projeto prático de curso

Nota do curso

Por que fazer parte da Skillshare?

Aprenda em qualquer lugar

Cursos relacionados

Transcrições