Crie avatares de IA: da imagem ao vídeo. Guia passo a passo

Bros Academy, null

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

- 1.
  
  Introdução aos avatares de IA
  
  1:16
- 2.
  
  Módulo 1: avatares de IA — tipos, casos de uso e escolha de sua direção
  
  3:05
- 3.
  
  Módulo 2: fundamento visual — como criar seu avatar na prática
  
  8:28
- 4.
  
  Módulo 2.1: criando ângulos e estilos múltiplos para seu avatar de IA
  
  5:00
- 5.
  
  Módulo 3: script e história — escrevendo um cenário de vídeo curto
  
  3:13
- 6.
  
  Módulo 4: Transformando scripts em fala - Transformando scripts em fala
  
  7:42
- 7.
  
  Módulo 5: Comparando ferramentas de IA
  
  13:22
- 8.
  
  Módulo 6: criando som de fundo
  
  6:48
- 9.
  
  Módulo 7: montagem final na prática — como editar o vídeo no CapCut
  
  7:32

Nível iniciante

Nível intermediário

Nível avançado

Todos os níveis

Estudantes

Sobre este curso

Os avatares de IA estão se tornando uma parte natural dos conteúdos de vídeo modernos. Mas criar um bom é mais que simplesmente escolher a ferramenta certa.

Neste curso, você vai aprender um fluxo de trabalho prático passo a passo para criar avatares de IA, começando com uma única imagem e terminando com um vídeo de apresentação finalizado.

Vamos nos concentrar nos blocos de construção principais do processo:

criar visuais consistentes para seu avatar
escrever roteiros curtos que funcionem bem com voz e sincronização labial de IA
gerando uma voz natural
como aplicar sincronização labial e movimento sutil
como montar tudo em um vídeo completo

Este curso é baseado na experiência real de produção e se concentra na compreensão do processo, não na busca de resultados perfeitos.

Você vai ver como decisões diferentes afetam o resultado final e por que um fluxo de trabalho claro é mais importante do que qualquer ferramenta específica.

Ao final do curso, você terá seu próprio vídeo de avatar de IA e a confiança para continuar experimentando e criando novos projetos usando a mesma abordagem.

Divulgação de IA:

Este curso inclui exemplos de conteúdo criado com inteligência artificial.

Ferramentas de inteligência artificial são usadas para demonstrar como as narrações geradas por IA são criadas para vídeos curtos como parte do material de aprendizagem.

O curso é narrado por um instrutor humano. A voz gerada por IA é usada apenas como exemplo nos projetos mostrados no curso.

Conheça seu professor

Bros Academy

null

Professor

We are Bros Academy, a creative duo combining the worlds of cryptocurrency and AI content creation.

With over 6-8 years of experience in the dynamic world of crypto, we've invested in digital assets, explored Web3 games, and been active members of global crypto communities. Our passion for blockchain technology and decentralized finance (DeFi) has led us to create practical, beginner-friendly courses for those entering the space.

In addition to our crypto background, we are also AI content creators. We craft engaging AI-generated ads, animated shorts, and visual stories using the latest generative tools. From storytelling to marketing, we love experimenting with how artificial intelligence can be used creatively and commercially.

Through our courses, we share hands-... Visualizar o perfil completo

Habilidades relacionadas

ChatGPT IA para filmes e vídeos IA e inovação IA para marketing e negócios

Level: Beginner

Projeto prático de curso

Projeto: crie seu primeiro vídeo de avatar de IA

Neste curso, seu projeto é criar um pequeno vídeo de avatar de IA usando o fluxo de trabalho mostrado ao longo das aulas.

Você não precisa ter como objetivo um resultado perfeito ou refinado.
O objetivo deste projeto é entender o processo e concluir todas as etapas principais do início ao fim.

O que você vai criar

Você vai criar:

um avatar de IA consistente (realista ou estilizado)
um roteiro curto (cerca de 20–30 segundos)
uma narração gerada por IA
um clipe de avatar sincronizado com os lábios
um vídeo final curto onde tudo se junta

Passos do projeto

Você pode seguir esses passos no seu próprio ritmo:

Escolha a direção do seu avatar
Decida se você quer um personagem realista ou estilizado.
Crie a imagem do seu avatar
Gere uma imagem base e verifique a consistência visual.
Escreva um roteiro curto
Mantenha ele simples e adequado para sincronização de voz e labial com IA.
Gere a narração
Crie um áudio limpo usando uma ferramenta de voz de IA.
Aplique a sincronização labial
Teste uma ou mais ferramentas e escolha o resultado que você gosta mais.
Monte o vídeo final
Combine recursos visuais, voz e movimento em um vídeo curto.

O que compartilhar na Galeria de projetos

Você pode compartilhar:

uma captura de tela da imagem do seu avatar
um vídeo curto ou exportação final
ou até mesmo apenas notas sobre o que funcionou e o que não funcionou

Compartilhar é opcional, mas é altamente recomendável — ver abordagens diferentes pode ser muito útil para outros alunos.

Dicas para este projeto

Não se preocupe com a perfeição
Foque na compreensão do fluxo de trabalho cri
Pequenos experimentos são mais valiosos do que resultados perfeitos
Não tem problema se o seu primeiro resultado parecer complicado — isso faz parte do processo

Nota final

Este projeto destina-se a ajudar você a se sentir mais confiante ao experimentar avatares de IA.

Não existe um único resultado “certo” — apenas progresso e aprendizado com a prática.

Nota do curso

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Introdução aos avatares de IA: Você está curioso sobre avatares de IA, mas se sente sobrecarregado com ferramentas, demonstrações e resultados mistos. Você está no lugar certo Este curso foi criado pela Bros Academy com base na experiência real de produção do Bros AI Studio. Em nosso estúdio, não fazemos apenas experiências com IA. Nós o usamos para criar avatares AA, personagens animados, desenhos animados completos baseados em IA, videoclipes e vídeos de publicidade comercial para Os avatares de AA não caem por causa de ferramentas ruins. Eles caem devido a um fluxo de trabalho pouco claro. Este curso não é uma coleção de recursos ou demonstrações aleatórias. É um processo prático de ponta a ponta. Na verdade, nós o usamos em nossos próprios projetos desde a escolha de um personagem até a criação de um vídeo de avatar de AA falante e em movimento. Você verá como criamos personagens consistentes, escrevemos curtas e roteiros que funcionam para AA, geramos vozes naturais, aplicamos sincronização labial, sem exageros, sem mágica de cliques, exatamente o que funciona e por quê Este curso não promete resultados perfeitos, vídeos virais ou renda instantânea. O que isso lhe dará é uma estrutura clara, ponto de partida realista e a confiança para experimentar sem adivinhar No final, você não terá apenas um vídeo de avatar de IA finalizado. Você entenderá como e por que foi feito. Se você quiser uma introdução prática fundamentada aos avatares de IA usados em projetos reais, este curso é para você. Vamos começar. 2. Módulo 1: avatares de IA — tipos, casos de uso e escolha de sua direção: Módulo um, tipos de avatares AA, casos de uso e escolha de sua direção Antes de começarmos a trabalhar com ferramentas e recursos visuais, vamos dar um passo atrás e falar sobre os avatares A Neste módulo, veremos o que são os avatares A, onde eles são usados e como escolher a direção certa sem pensar demais Quando falamos sobre avatares de IA, queremos dizer personagens digitais criados com a ajuda de ferramentas de IA Esses avatares podem representar pessoas reais ou podem ser personagens completamente fictícios O objetivo principal é a comunicação para explicar algo, contar uma história ou transmitir uma mensagem. Os avatares AA já são usados em muitas áreas diferentes. Você os verá frequentemente em conteúdo de mídia social, vídeos educacionais, marketing e publicidade e até mesmo em projetos de apresentação ou contação de histórias Elas são ferramentas flexíveis e sua função depende de como você deseja usá-las. Existem vários tipos principais de avatares AA. Alguns são realistas e baseados em fotos reais, outros são estilizados, parecidos com desenhos animados ou semirrealistas e alguns são Para ser honesto, não existe um único tipo correto. Cada abordagem tem seus próprios pontos fortes. Os avatares realistas geralmente são criados a partir de fotos reais. Eles podem se sentir muito pessoais e envolventes, especialmente quando representam uma pessoa real. Ao mesmo tempo, eles apresentam maiores expectativas de realismo e exigem mais controle e consistência Avatares fictícios ou estilizados não são Eles oferecem mais liberdade criativa e geralmente são mais fáceis de manter visualmente. Eles também são mais tolerantes quando se trata de movimento, sincronização labial e pequenas imperfeições Antes de escolher um avatar, é importante fazer algumas perguntas simples. Por que você precisa desse avatar? Onde será usado? Você quer que represente você ou um personagem, e quão realista isso realmente precisa ser? Uma coisa importante a lembrar é que você não está preso a uma única opção. Você sempre pode alterar seu avatar mais tarde ou criar mais de um. O que mais importa não é tomar uma decisão perfeita, mas ganhar experiência tentando de fato. Neste curso, mostraremos as duas abordagens na prática. Criaremos um avatar realista baseado em fotos reais e também geraremos um avatar fictício do zero Dessa forma, você entende como cada abordagem funciona e qual delas se adapta melhor aos seus objetivos. Tudo bem, esse é o fim deste módulo. Vamos resumir rapidamente o que aprendemos. Neste módulo, aprendemos quais avatares A, onde são usados e os principais tipos que você encontrará Você também viu como pensar em usar uma direção de avatar sem pressão ou medo de fazer a escolha errada. No próximo módulo, começaremos a criar a base visual para seu avatar e passaremos à prática prática. No próximo módulo, passaremos dos conceitos à prática. Você verá como os avatares de IA são realmente criados usando diferentes ferramentas e abordagens Trabalharemos com fotos reais, geraremos personagens fictícios e nos concentraremos na construção de uma base visual consistente Você pode reutilizar posteriormente para vídeo e animação. 3. Módulo 2: fundamento visual — como criar seu avatar na prática: Módulo dois, Visual Foundation, criando seu Avator na prática Bem-vindo ao Módulo dois. Neste módulo, finalmente passamos da teoria para a prática. Vou explicar como criamos avatares passo a passo usando diferentes ferramentas e configurações Não estamos buscando a perfeição aqui. O objetivo é entender o processo e aprender a criar avatares consistentes e utilizáveis em Veremos algumas abordagens comuns desde avatares realistas baseados em fotos reais até personagens de desenhos animados mais estilizados Usaremos ferramentas diferentes ao longo do caminho, mas não conseguiremos nos conectar a nenhuma específica. As ferramentas são apenas exemplos, os fluxos de trabalho que realmente importam Enquanto assiste, tente observar algumas pequenas decisões, iluminação, ângulos e detalhes do baile Essas pequenas coisas geralmente fazem uma diferença maior do que você esperaria. Também passará algum tempo analisando ângulos e consistência, criando várias visualizações do mesmo personagem e preparando imagens para vídeo ou animação. E não se preocupe em se lembrar de tudo. Concentre-se em entender por que as coisas são feitas de uma determinada maneira. Você sempre pode voltar mais tarde quando começar a criar seu próprio avatar. Tudo bem, vamos começar com uma ferramenta muito poderosa que eu uso muito. Hicks sentiu a IA Hicksfld é uma plataforma generativa de IA que reúne várias imagens e modelos de vídeo O Hicksfld é uma plataforma generativa de IA que reúne várias imagens e modelos de vídeo em uma única interface. Em vez de se limitar a um único modelo, ele permite que você experimente diferentes modelos, ferramentas cinematográficas e modos de geração dependendo do que você está tentando criar Você pode gerar imagens e vídeos, experimentar cenas cinematográficas, controlar ângulos de câmera, criar variações de cena e explorar diferentes estilos visuais É por isso que é uma ótima ferramenta para produção criativa, marketing e narrativa visual Comece a criar nosso avatar. A primeira coisa que precisamos é de um bom aviso. Para isso, eu costumo ir direto para o ChatGPT. Você pode usar outros modelos, bem como Gemini ASCI, para ajudar a gerar o prompt Neste exemplo, quero criar um avatar super realista de mim mesmo usando minhas próprias fotos como referência. Quero que o avatar seja reconhecível, então vou manter alguns detalhes visuais claros como usar um capuz azul Eu também quero um microfone de estúdio na minha frente e algumas plantas verdes, talvez em um fundo. Eu costumo usar fotos como essa, e você deve se lembrar que sua imagem de referência deve ser igual à sua em uma moldura, preferência um retrato ou um close up, e também de boa qualidade e, o mais importante, seu rosto deve estar olhando diretamente para a câmera. Depois de editar sua imagem de referência, deixe a IA fazer sua mágica e aguarde a solicitação. Tudo bem, vamos verificar o que o ChatGPT nos deu. Vamos dar uma olhada rápida no prompt. Se tudo estiver bem, basta copiá-lo e vamos voltar para Hicksvild A primeira maneira de criar seu avatar é treiná-lo usando suas próprias fotos com a sola Hicksvild Na verdade, essa é a opção favorita da minha esposa no momento. Para começar, clique em Imagem no canto superior esquerdo e selecione o modelo Hicks feltro Sol Minha esposa e eu já treinamos nossos avatares do Sol, então não vou passar por todo o processo do zero aqui Mas o que você precisa é clicar em Gerar novo e fazer upload de cerca de 15 ou 20 fotos suas. Lembre-se de que é melhor incluir uma mistura de fotos de perto e fotos de corpo inteiro. Isso ajuda a modelo a aprender seu rosto e corpo em diferentes posições e ângulos. Para meu treinamento de avatar, uso as mesmas fotos que mostrei anteriormente. Tente usar imagens semelhantes de si mesmo, boa iluminação, rosto claro e nenhuma outra pessoa na moldura. O processo de treinamento leva um pouco de tempo. Pelo que me lembro, geralmente leva cerca de dez ou 20 minutos, então seja paciente aqui. Quando seu avatar estiver pronto, selecione-o e cole o prompt, o que obtivemos do ChatGPT Desde este curso, estamos criando curtas para o YouTube, vídeos no estilo TikTok Vamos escolher a proporção de 916. Para resolução, geralmente escolho a opção mais alta disponível. No momento, são dois K. Apenas uma nota rápida sobre os créditos Gerar quatro imagens custa dois créditos e, honestamente, isso não é muito, especialmente em comparação com outras ferramentas E lembre-se de quando eu disse que Hicksfeld é um agregador de modelos de IA Essa é uma das maiores vantagens. Você pode alternar entre modelos diferentes enquanto paga por uma assinatura, em vez de usar cinco ferramentas separadas, o que seria muito mais próximo é meu favorito pessoal no momento, nana Banana Pro Aqui, usaremos o mesmo prompt e a mesma imagem de referência e geraremos o avatar novamente. Vou gerar duas imagens usando nana banana. No momento, uma imagem em resolução de dois K custa dois créditos, então tenha isso em mente quando estiver testando coisas. Depois disso, vamos mudar para o CDRm 4.5. A mesma configuração novamente, o mesmo prompt e a mesma imagem de referência. Acho que agora você está começando a ver o que estamos fazendo aqui. A ideia é mostrar vários modelos diferentes de geração de imagens usando exatamente a mesma entrada. Isso oferece mais opções de escolha e facilita a comparação dos resultados. Talvez goste mais da aparência de um modelo do que de outro, e está tudo bem. O objetivo é entender como testar, comparar e escolher o modelo que funciona melhor para você. Em seguida, quero mostrar a você o link AI. Na verdade, você também pode usar modelos de links em Hicksville. Mas quando estou trabalhando especificamente com links, geralmente vou direto para o site do link e gero imagens lá. Vou explicar por que prefiro isso um pouco mais tarde. Isso fará sentido quando você ver o fluxo de trabalho. Por enquanto, vamos gerar nosso avatar usando o modelo 01 ou qualquer que seja a versão mais recente disponível em seu site. No lado esquerdo da tela, clique no botão 01 agora mude para geração de imagem Cole o aviso e faça o upload da sua foto de referência. Se você tiver uma assinatura clink, poderá gerar imagens gratuitamente Eu tenho uma assinatura, então vou selecionar a opção de geração gratuita clicando neste botão. Vou definir quatro saídas, mas você pode escolher até nove se quiser mais variações E para resolver, vamos usar dois K. Veja, com assinatura, mostra zero créditos Se você não tiver uma assinatura, gerar uma imagem geralmente custa cerca de um crédito. Tudo bem, se tudo estiver bem, vamos clicar em gerar. Enquanto as imagens estão sendo geradas, quero explicar por que costumo usar o link AI diretamente. Em vez de passar pelo Hicks Field, mesmo por meio do Is, ter uma assinatura pode ser mais barato O motivo é bem simples. Na Bros Academy, somos criadores ativos e geramos muitas imagens e vídeos para nós mesmos e para os clientes. Isso significa que precisamos de muitos créditos. Link AI tem um sistema muito bom que permite que você ganhe créditos gratuitamente. Deixe-me mostrar nosso perfil no link. Publicamos nosso trabalho aqui regularmente e às vezes participamos de concursos diferentes Apenas publicar seus criativos não rende créditos por si só, mas você ganha créditos quando alguém recria suas imagens ou vídeos usando seus. Além disso, você recebe uma pequena comissão por cada As pessoas também podem gostar do seu trabalho e segui-lo se gostarem do seu estilo. Então, se você quiser, você também pode criar um público dentro do escritório. Por exemplo, ontem, ganhei 160 créditos grátis. Não foi meu melhor resultado, mas tudo bem. Alguns dias são melhores do que outros. Nos últimos meses, ganhei mais de 32.000 créditos gratuitos dessa forma Se eu fosse comprar esses créditos, custaria cerca de 400 dólares Além disso, eu ganho mais de 50.000 créditos gratuitos de outras atividades oferecidas no passado Link também tem um programa de referência. No momento, estou gravando isso. Se você usar meu link de indicação, nós dois receberemos 500 créditos gratuitos para suas primeiras gerações. É uma vitória para nós dois. Vou vincular o link na descrição. Tudo bem, vamos dar uma olhada nos resultados que o link gerou. Na verdade, eu realmente gostei do resultado. Antes de baixar a imagem, recomendo aumentá-la para obter a melhor qualidade possível É um pequeno passo, mas faz uma diferença notável. Agora vamos voltar à Hicksfeld AI e verificar quais são os diferentes modelos Pessoalmente, meu resultado favorito aqui é do C dream 4.5. Mas, no seu caso, o melhor resultado pode vir de um modelo diferente, e tudo bem. O objetivo aqui não é escolher um modelo correto. Meu objetivo é simplesmente mostrar as opções para que você possa escolher o que funciona melhor para você. Vá em frente e baixe a imagem que você mais gosta. E é isso por enquanto. Acabamos de criar nosso primeiro avatar realista com base em uma referência fotográfica. Testamos vários modelos e escolhemos o que mais gostamos. No próximo módulo, levaremos esse avatar mais longe. Vamos gerar mais imagens do mesmo personagem, mas com ângulos diferentes. Portanto, nosso vídeo parece mais dinâmico e natural. E se você quiser mais um avatar no estilo cartoon, não se preocupe Também mostrarei como transformar seu avatar realista em um personagem de permanência de pixels com apenas alguns cliques. Nos vemos no próximo módulo. 4. Módulo 2.1: criando ângulos e estilos múltiplos para seu avatar de IA: Módulo 2.1, criando vários ângulos e estilos para seu avatar AA. Neste módulo, levaremos seu avatar um passo adiante. Vamos nos concentrar em criar vários ângulos do mesmo personagem, para que seu vídeo pareça mais natural e dinâmico. Você verá como transformar seu avatar realista em uma versão mais estilizada no estilo pixel, se essa for a direção que você deseja explorar Tudo bem, vamos voltar para Hicksfeld e escolher o modelo nana Banana Pro Já escolhi as imagens que mais gosto e baixei. Agora, quero gerar ângulos de câmera diferentes para essa imagem mantendo o mesmo caráter e o mesmo ambiente da referência. Vamos selecionar nossa imagem e atualizar o prompt. Certifique-se de que a relação de especificação 916 esteja selecionada . Em seguida, clique em Gerar. Vou gerar quatro variações, mas fique à vontade para experimentar com menos ou mais resultados e ver o que funciona melhor para você Tudo bem, como você pode ver, temos algumas opções diferentes aqui. Eles não são perfeitos, mas isso mesmo. Em alguns casos, é útil ser mais específico no prompt e descrever claramente o ângulo da câmera desejado. Mas, por enquanto, estou mostrando principalmente o fluxo de trabalho e as opções disponíveis. seguir, quero mostrar outra ferramenta dentro da Hicksville AI baseada no modelo Nana Banana Pro É chamado de Shots. Vamos para o topo da tela, clique em Aplicativos e encontre o aplicativo Shots. Este aplicativo gera nove ângulos de câmera diferentes a partir de uma única imagem enviada. Nós o usamos com bastante frequência. Então, deixe-me mostrar rapidamente alguns exemplos do trabalho que foi gerado com ele. É uma ótima ferramenta para contar sua história de uma forma mais cinematográfica Muitas pessoas usam avatares com apenas uma imagem ou um ângulo de câmera Se você quiser se destacar, ajuda fazer algo um pouco mais interessante ou pelo menos, entender como isso é feito. Tudo bem, vamos fazer o upload da nossa imagem. Espere um pouco e, em seguida, verifique a proporção. No nosso caso, o 916 funciona perfeitamente. A geração custou quatro créditos. Vamos clicar em Gerar e esperar cerca de um, 2 minutos pelos resultados. Tudo bem, temos nove tiros aqui. Eu gosto de alguns deles, então vou pegar quatro e aprimorá-los Cada imagem aprimorada custa dois créditos. Você também pode baixar as imagens sem aumentar a escala, se não precisar ou aumentá-las em até quatro X, o que custa mais créditos, que custa mais créditos, Tudo bem, vamos começar a aumentar a escala. Geralmente, leva cerca de dois ou 3 minutos, então vamos ser pacientes e esperar. Ok, agora podemos ver todas as imagens que temos. Vamos baixá-los e salvar tudo em uma pasta separada. E mais tarde, talvez nos próximos módulos, eu gere mais alguns ângulos em que o avatar esteja olhando diretamente para a câmera, sem essas fotos Agora lembre-se de que eu disse que mostrarei como transformar seu avatar em um personagem de desenho animado caso você queira esse visual Você pode gerar um avatar de desenho animado do zero usando bailes de formatura do ChatGPT, é claro, mas hoje vamos simplificar Usaremos o nana Banana Pro em Hicksville com um Vou usar a mesma imagem de referência e pedir uma versão em estilo pixel mantendo as características e o ambiente do personagem o mais próximo possível do original. Vamos gerá-lo e, em seguida, entraremos em Clean Gale para comparar os resultados Dessa forma, você verá como ferramentas diferentes lidam exatamente com a mesma tarefa e poderá escolher o que mais gosta. Tudo bem, em um clique, selecione 01 modelo e mude para geração de imagem Faça o upload da imagem de referência, cole o mesmo prompt que usamos no campo Hicks e defina quatro saídas E agora vamos clicar em gerar. Agora vamos voltar ao campo AA de Hicks e dar uma olhada no que temos Então, o que vocês acham, pessoal? Pessoalmente, acho que isso parece muito bom. Nesse estágio, você pode experimentar facilmente alterando coisas como roupas, penteados ou pequenos detalhes apenas ajustando o prompt e usando a imagem como referência É uma configuração muito flexível. Agora vamos verificar o que obtivemos do Klink AA. Hm. Na minha opinião, os resultados aqui parecem melhores com o modelo banana banana Pro. A versão do link parece um pouco simples e caricatural demais para o meu gosto. Dito isso, você pode se sentir diferente, e tudo bem. Não há um único melhor resultado aqui. Meu objetivo é simplesmente mostrar opções diferentes para que você mesmo possa testá-las e decidir o que funciona melhor para seu estilo e seus projetos. Tudo bem, isso é tudo para este módulo. Vamos resumir rapidamente o que aprendemos aqui. Você aprende a expandir imagens de um único avatar em várias visualizações e estilos. Exploramos como gerar ângulos de câmera diferentes, mantendo o mesmo caráter e ambiente, e por que isso é importante para criar vídeos mais dinâmicos e com aparência natural. Você também viu como diferentes modelos de IA podem produzir resultados muito diferentes, mesmo usando o mesmo prompt e imagem de referência, e por que não há uma única escolha certa. Por fim, veremos como um avatar realista pode ser transformado em uma versão mais em estilo cartoon e como comparar os resultados em diferentes ferramentas A principal conclusão aqui é um fluxo de trabalho, opções de teste, comparação de resultados e escolha que se adequa ao seu projeto e ao seu gosto No próximo módulo, vamos nos concentrar na história e na estrutura. Usaremos o ChatGPT para criar um script simples e transformar nossa ideia em um pequeno cenário de vídeo Você verá como passar de um conceito aproximado para um script claro e utilizável, o que funciona bem para um vídeo curto Veja no próximo módulo. 5. Módulo 3: script e história — escrevendo um cenário de vídeo curto: Módulo gratuito, roteiro e cenário de vídeo curto para redação de histórias. Olá, pessoal, e bem-vindos ao Módulo Gratuito. Neste módulo, começaremos a brincar com ideias para nosso vídeo usando o avatar que já criamos. Falaremos sobre AA, mas não se preocupe, não de uma forma chata ou super técnica O objetivo é criar ideias que sejam interessantes, mesmo para pessoas que não gostam muito de AA. Usaremos o ChatGPT para nos ajudar a fazer um brainstorming. Diremos que queremos criar um pequeno vídeo curto no YouTube e pedir dez ideias divertidas e envolventes sobre AA. Vamos ver o que acontece e escolher algo de que gostamos. Tudo bem, vamos dar uma olhada no que o ChatGPT inventou Eu li todas as ideias e lembre-se de que você não precisa se limitar à IA como Você pode pegar qualquer assunto que quiser e usar a mesma abordagem para criar vídeos. O principal é o fluxo de trabalho. Depois de concluir este curso, você terá uma maneira clara de passar de uma ideia a um pequeno vídeo finalizado. Depois disso, todo o resto depende da sua imaginação. Uh hein. Uma ideia realmente me surpreendeu. IA não substituirá você, alguém que usa IA W. Parece um pouco provocativo, é exatamente o que precisamos Vamos ajustá-lo um pouco e adicionar 2026 à ideia. Agora vou pedir ao ChatGPT que escreva um script 20 32º, que é um forte gancho nos primeiros 3 segundos, para que as pessoas não simplesmente percam o vídeo. Vamos ver o que o ChatGPT nos deu a seguir. Tudo bem, vamos ler o que temos. Na verdade, o ChatGPT gera um script dividido segundo a segundo, o que é muito útil, especialmente para vídeos curtos Se essa versão já é boa para você, tudo bem. Você pode parar aqui e seguir em frente. Mas aqui está um pequeno truque ao trabalhar com o ChatGPT. Normalmente, você obtém melhores resultados se tentar. No nosso caso, quero que o ChatGPT imagine que é um YouTuber com dez anos de experiência e um Em seguida, pedirei para reescrever o roteiro usando essa perspectiva Agora vamos ver que tipo de resultados obtemos e compará-los com a versão anterior. Tudo bem, vamos ler o resultado. Pessoalmente, gosto mais dessa versão. Gosto muito de como o roteiro começa com. Em 2026, a IA não substituirá você. Nesse momento, o espectador pode relaxar um pouco porque muitas pessoas realmente temem que IA as substitua no futuro E então, apenas alguns segundos depois, diz o avatar, alguém usando IA o fará. É aí que a sensação muda. O espectador pode pensar, espere, o quê? O que você quer dizer? E essa curiosidade faz com que eles queiram continuar assistindo. O vídeo também termina com uma pergunta provocativa, o que é ótimo Isso pode motivar as pessoas a deixar um comentário ou reagir ao vídeo, e isso naturalmente ajuda no engajamento e no algoritmo Vamos copiar o script e colá-lo em um arquivo separado do Google Docs para manter tudo organizado Voltaremos a este documento no próximo módulo. E isso é tudo para esse modelo. Faça uma pequena pausa, tome um café ou faça algumas flexões, reinicie um pouco e prepare-se para o próximo módulo, prepare-se para o próximo módulo onde transformaremos o roteiro em uma narração Mostrarei como fazer isso em 11 laboratórios de uma forma em que maioria das pessoas nem perceberá que é uma voz gerada por IA. Veja no próximo módulo. 6. Módulo 4: Transformando scripts em fala - Transformando scripts em fala: Módulo quatro, geração de voz, transformando scripts em fala. Olá, pessoal, e bem-vindos ao Módulo 4. No módulo anterior, focamos em escrever um script que funcione bem para avatares de IA Agora é hora de dar voz ao roteiro. Neste módulo, veremos como transformar seu texto em fala com som natural usando a geração de voz por IA Essa é uma etapa muito importante porque a voz desempenha um papel importante na sensação de credibilidade e conforto de seu avatar Usaremos 11 laboratórios para essa parte do fluxo de trabalho. 11 Labs é uma plataforma de voz de IA que permite gerar fala realista a partir de texto, trabalhar com diferentes estilos de voz e controlar como a voz soa e entrega seu roteiro. Ele suporta coisas como geração de texto para fala, bibliotecas de voz com diferentes tons e personalidades, design de voz e ferramentas de voz para conteúdos mais longos, como audiolivros ou vídeos Você não precisa usar todos os recursos. Vamos nos concentrar no que é realmente útil para avatares de AA e dublagens em vídeo Você pode se inscrever gratuitamente em 11 laboratórios usando sua conta do Google. Todo mês você recebe 10.000 créditos gratuitos para geração de voz. Para a maioria dos iniciantes, isso é mais do que suficiente para começar. Na prática, essa quantidade de créditos geralmente é suficiente para criar cerca de cinco ou seis vídeos, semelhantes ao que estamos criando neste curso, então você não precisa se preocupar pagar por nada imediatamente. E acompanhe, teste o fluxo de trabalho e veja como tudo funciona usando o plano gratuito. Em nossos projetos anteriores, usamos 11 laboratórios em muitos contextos diferentes Nós o usamos para gravar dublagens para cursos on-line, criar dialetos e narrações para desenhos animados de IA, dar voz a vídeos do YouTube e conteúdos curtos e produzir áudio limpo e consistente para diferentes tipos cursos on-line, criar dialetos e narrações para desenhos animados de IA, dar voz a vídeos do YouTube e conteúdos curtos e produzir áudio limpo e consistente para diferentes tipos de vídeos. Não vamos abordar todos esses casos de uso em detalhes aqui, mencionei para contextualizar e mostrar o quão flexível essa ferramenta pode ser em projetos reais. Este módulo se concentrará apenas no que você precisa agora , usando 11 voltas para transformar seu roteiro em uma fala clara e natural que funciona bem com sincronização labial Você também encontrará um link para 11 voltas no documento de recursos do curso com links úteis anexados a este curso Como sempre, não se preocupe em memorizar cada configuração. Concentre-se em entender o processo, como escolher uma voz ou como pequenas mudanças no texto ou na entrega afetam o resultado final. Ao final deste módulo, você poderá transformar com confiança seu script em áudio falado, pronto para ser usado com seu avatar de IA Antes de começarmos a gerar a narração, vamos dar uma olhada rápida na biblioteca de voz em 11 No lado esquerdo da tela, clique em Vozes. Aqui você pode explorar uma grande variedade de vozes que já estão disponíveis. 11 laboratórios também oferecem a opção de clonar sua própria voz. Você pode carregar uma amostra de áudio com sua voz e gerar narração sem precisar gravar todas as Você notará que as vozes são organizadas de maneiras diferentes. Você pode navegar por idioma, estilos ou casos de uso, por exemplo, narração, mídia social ou publicidade Você também pode filtrar vozes por sexo, idade e outras características. Para o nosso caso, estamos procurando algo mais próximo uma voz de mídia social ou de estilo publicitário Eu já escolhi uma voz para o meu avatar, mas não acho que você precise usar a mesma. Reserve um momento para explorar os filtros, ouvir algumas opções e escolher a voz que você mais gosta. No final das contas, essa parte é muito subjetiva. É principalmente uma questão de gosto. Agora vamos seguir em frente e começar a gerar nossa narração. No lado esquerdo da tela, clique em conversão de texto em fala. Como eu disse, eu já escolhi uma voz para este projeto. É Alex, uma jovem voz masculina americana. Aqui você também pode escolher o modelo de geração de voz. Todos os modelos disponíveis são bons e cada um foi projetado para finalidades ligeiramente diferentes. Para o meu avatar, vou usar o modelo gratuito V. No momento em que estou gravando isso, é o modelo mais recente disponível. Se você estiver fazendo este curso mais tarde e verá modelos mais novos adicionados, uma boa regra geral é experimentar o mais recente primeiro Na maioria dos casos, os modelos mais novos oferecem melhor qualidade, entrega mais natural ou melhor comportamento de sincronização labial Agora vamos voltar ao Google Docs onde salvamos nosso script de vídeo A partir daqui, podemos simplesmente copiar o texto e colá-lo em 11 voltas para gerar a narração No meu caso, esse script tem apenas menos de 900 caracteres e 11 voltas permitem gerar até cinco K caracteres de uma vez Tecnicamente, poderíamos gerar a narração inteira em um único arquivo de áudio No entanto, há uma coisa importante a se ter em mente. Posteriormente, usaremos esse áudio para sincronização labial e não queremos que nosso avatar fale durante toda a duração do vídeo. Aplicaremos a sincronização labial somente em partes específicas do vídeo usando diferentes ângulos de câmera que preparamos anteriormente. Em algumas seções, também abordaremos o avatar com imagens de estoque ou imagens adicionais Outro motivo para essa abordagem é o custo. Gerar vídeos longos com sincronização labial pode consumir muitos créditos. Se você estiver fazendo apenas um vídeo, isso pode ser totalmente bom. Mas se você planeja criar muitos vídeos, dividir sua narração em partes menores pode ajudar a economizar uma quantidade significativa Então, por enquanto, vamos gerar a primeira parte da narração e ouvir o resultado Em 2026, a IA não substituirá você. Essa frase se repete muito. Mas aqui está a parte que as pessoas pulam. Em 2026, a IA não substituirá você. Essa frase se repete muito. Mas aqui está a parte que as pessoas pulam. Com o modelo gratuito, 11 voltas geralmente oferecem duas variações diferentes para você escolher Não se preocupe com a qualidade do som agora. Estou gravando minha tela, então o áudio que você ouve é comprimido. Depois de baixar o arquivo, você ouvirá o quão boa é realmente a qualidade final. Ouça as duas opções, escolha a que você mais gosta e faça o download. Agora vamos pegar a próxima parte do nosso roteiro, colá-la em 11 voltas e clicar em gerar O processo de geração é muito rápido, como você pode ver. Alguém usando IA terá o mesmo trabalho, mesmo título. Resultados muito diferentes. Alguém usando IA W. Mesmo emprego, mesmo título, resultados muito diferentes. Depois de escolher as opções que você mais gosta, baixe o arquivo de áudio e vá para a próxima parte do script. Você simplesmente repetirá o mesmo processo até que todas as partes do seu script sejam geradas. Não vou gravar todas as repetições aqui. O objetivo deste módulo é mostrar o fluxo de trabalho e ajudá-lo a entender como abordar a geração de voz, sem perder tempo assistindo às mesmas etapas repetidamente. Vou terminar de gerar as partes restantes em segundo plano e, em seguida, avançaremos para a próxima. Agora , todas as partes do nosso roteiro foram transformadas em dublagens Eu baixei todos os arquivos em uma pasta separada apenas para manter tudo organizado e fácil de trabalhar com eles posteriormente. Uma coisa importante a ser observada aqui que eu baixei todos os arquivos no formato wave. O motivo é simples. Wave oferece a melhor qualidade de áudio possível, o que é especialmente importante quando você usa esse áudio para lipsagem e animação Começar com áudio de alta qualidade ajuda a evitar problemas posteriores e proporciona melhores resultados finais. Tudo bem, neste momento, transformamos seu roteiro em uma voz. Você viu como escolher uma voz, como trabalhar com modelos de geração e como preparar arquivos de áudio limpos que estão prontos para a próxima etapa. Você também aprende por que geralmente faz sentido dividir um script em partes menores e como essa abordagem pode economizar tempo, créditos e oferecer mais flexibilidade posteriormente. Mais importante ainda, agora você tem arquivos de voz de alta qualidade que funcionam bem para animação e sincronização labial. No próximo módulo, pegaremos esses arquivos de voz e passaremos para a sincronização labial. Você verá como aplicar a sincronização labial na prática usando diferentes ferramentas de IA e como o mesmo áudio pode produzir resultados diferentes dependendo do fluxo de trabalho. Vamos comparar as ferramentas lado a lado e falar honestamente sobre o que funciona bem e o que não funciona e no que prestar atenção ao escolher uma solução de sincronização labial Quando estiver pronto, vamos para o próximo módulo. 7. Módulo 5: Comparando ferramentas de IA: Módulo cinco, sincronização labial na prática. Olá, pessoal, e bem-vindos ao Módulo 5. Neste módulo, faremos as dublagens do módulo anterior e faremos vídeos com sincronização labial Aplicaremos o mesmo áudio ao mesmo personagem usando duas ferramentas de IA, Cling Avatar e Hagen, para que possamos comparar claramente como cada uma lida com a sincronização labial e o movimento. O objetivo aqui não é encontrar uma ferramenta perfeita, mas entender a diferença e escolher o resultado da sincronização labial que funciona melhor para o nosso vídeo. Ao final deste módulo, selecionaremos a versão final e a usaremos na última etapa da edição. Vamos voltar ao Google Docs, onde salvamos nosso script No módulo anterior, geramos a narração em 11 voltas trabalhando com o roteiro em Para cada peça de áudio, anotei qual foto de avatar ou filmagem de arquivo a acompanhará Então, basicamente acabamos com um storyboard escrito simples Planejei a ordem das fotos do avatar para manter as coisas movimento e evitar ficar em um ângulo por muito tempo. Eu também gero alguns ângulos extras e escolho os que eu mais gosto. Para este vídeo, usarei três ângulos principais, uma vista frontal, um pequeno ângulo lateral e uma foto ligeiramente de cima para baixo, e alternaremos entre eles para manter o vídeo dinâmico e envolvente. Agora vamos passar para o site de links de IA. No canto superior esquerdo, clique em Ferramentas de IA. Como mencionei anteriormente, clink oferece uma ampla variedade de ferramentas e modelos Mas para esta lição, estamos interessados apenas em Avatar two point oh, ou simplesmente no modelo de Avatar mais recente disponível se você assistir a este curso mais tarde. A equipe do link Luis atualiza com bastante frequência, então usar a versão mais recente geralmente é uma escolha segura. Você também vê que esse link oferece um conjunto de avatares pré-fabricados. Eles podem ser úteis para testes rápidos ou tarefas de curto prazo. Mas para este projeto, estamos adotando uma abordagem mais profissional e usando nosso próprio Avatar personalizado. Clique em Carregar imagem à esquerda e faça o upload da imagem do seu avatar Depois que a imagem for carregada, faça o upload da sua primeira narração clicando em Carregar áudio Antes de gerar o vídeo, você pode escolher a resolução de saída HD ou full HD. Eu geralmente escolho a opção mais alta disponível. Custa mais créditos, é claro, mas oferece a melhor qualidade possível, o que é especialmente importante para avatares que falam de perto Uma geração de sincronização labial em full HD custa 48 créditos, o que não é barato, mas a sincronização labial em geral um pouco mais cara do que a geração normal de vídeo. Abaixo, você verá uma opção para adicionar um prompt se quiser descrever o comportamento dos avatares com mais detalhes Em muitos casos, o clink sugere automaticamente um prompt e, pela minha experiência, ele realmente funciona muito bem Para manter as coisas simples, usaremos o prompt sugerido e veremos se os resultados estão corretos Vamos seguir em frente e verificar qual ângulo do Avator vem a seguir em nosso storyboard Agora vamos voltar a clicar, fazer o upload da próxima parte do nosso áudio, clicar em Carregar imagem, selecionar o ângulo do avatar e fazer o upload Em seguida, repetimos o mesmo processo para as partes de áudio restantes. Tudo bem, está tudo pronto. Todas as peças do nosso quebra-cabeça estão agora em geração. Tudo o que resta a fazer é pesar o resultado e ver como tudo acabou. Tudo bem, nossos vídeos são gerados. Então, vamos dar uma olhada no que temos. Em 2026, a IA não substituirá você. Essa frase se repete muito, mas aqui está a parte que as pessoas pulam Então, o que você acha? Em comparação com a versão anterior, link claramente melhorou o realismo da emoção do Avatar Já está muito melhor e acho que só vai continuar melhorando a partir daqui. Pessoalmente, gosto do resultado. Os dialetos parecem vivos, não chá ou plástico Vamos seguir em frente e verificar a próxima geração. Alguém usando IA W. Mesmo trabalho. Mesmo título. Resultados muito diferentes. Alguém usando IA W. Mesmo emprego, mesmo título. Resultados muito diferentes. Alguém usando este também parece muito bom. Não vejo nenhum defeito ou artefato perceptível aqui, então acho que podemos guardá-lo com segurança Vamos continuar e ver o que temos a seguir. Um desenvolvedor sem IA escreve tudo do zero. Um desenvolvedor com IA entrega mais rápido, corrige bugs mais cedo e se concentra em problemas reais. Hm. Esse eu gosto um pouco menos. Durante o giro da cabeça, parece que a cabeça fica um pouco menor. Não é um problema crítico. Então, por enquanto, vou mantê-lo, mas é algo que você deve conhecer. Vamos seguir em frente. Então, em 2026, a questão não é se a IA aceitará meu emprego. Então, em 2026, a questão não é se a IA aceitará meu emprego. Essa geração parece ótima. Definitivamente vou manter este e seguir em frente. A questão é: Tudo bem, e aqui temos uma foto rápida que funciona bem como uma transição. Isso se encaixa perfeitamente no nosso vídeo. Será você quem o usará ou competirá contra ele? De que lado você está? Tudo bem. Agora, digamos que todos os clipes estejam em uma pasta Como você pode ver, aplicar a sincronização labial ao nosso avatar é um processo bastante simples Em seguida, faremos a mesma coisa em outro aplicativo, Hagen, que atualmente é um dos líderes em sincronização labial. Vamos comparar os resultados e depois escolher as melhores fotos para o nosso vídeo final. Hagen é uma plataforma de IA focada na criação de avatares falantes e vídeos com sincronização labial É amplamente usado para conteúdo educacional, marketing, vídeos e mídias sociais, e é conhecido por resultados estáveis de sincronização labial e fluxo de trabalho fácil de usar. A última vez que usamos o Hagen foi há cerca de quatro meses. Naquela época, nós o usávamos para criar vídeos curtos para o YouTube e o TikTok, bem como filmes curtos Desde então, a Hagen lançou um novo modelo, e é exatamente isso que vamos testar hoje. Hagen tem limites de quantos avatares você pode criar, dependendo da sua assinatura, e Avatares adicionais exigem pagamento extra Eu já atingi o limite da minha conta, então minha esposa registrou uma conta separada. Dessa forma, podemos mostrar adequadamente o processo completo de criação do Avatar em Hagen e percorrê-lo passo a passo. Hagen oferece vários planos de assinatura , incluindo um gratuito. Com o plano gratuito, você pode criar algumas gerações e ter uma ideia de como o serviço funciona antes de se comprometer com qualquer coisa Para esta lição, estamos usando o plano de 25 euros, principalmente para testar adequadamente o novo modelo e mostrar o processo. Também porque três vídeos gratuitos não seriam suficientes para o exemplo de hoje. Também queremos obter a melhor qualidade possível. Esse conjunto, sua configuração pode ser diferente. Em alguns casos, uma assinatura do Clink por si só pode já ser suficiente Isso realmente depende das suas necessidades e do seu fluxo de trabalho. Tudo bem, agora vamos continuar criando nosso avatar. No lado esquerdo da tela, clique em Avatares. Aqui, você verá que Hagen oferece duas opções principais para você escolher. Você pode clonar uma pessoa real, por exemplo, você mesmo, ou criar um personagem virtual a partir da imagem No nosso caso, optaremos pela segunda opção. Crie um personagem virtual a partir da imagem, pois isso se adapta melhor ao nosso fluxo de trabalho. Em seguida, carregamos nossa imagem de avatar. Como você pode ver, os agentes mostram exemplos de quais imagens funcionam melhor, mas nossos avatares são perfeitamente adequados para lipsing, então não há nada com que se preocupar Clique em Carregar e vá para a próxima etapa. Aqui, inserimos as informações básicas do nosso Avatar. Não há nada de especial aqui, então você não precisa gastar muito tempo nessa parte. Nosso Avatar agora está criado. Para adicionar voz, clique no Avatar e, em seguida, clique em ZEN Video. Você verá muitas opções diferentes aqui. Você pode usar vozes da Biblioteca de Hagen Pelo que me lembro, eles recentemente fizeram uma parceria com 11 Labs, que usamos para nossa narração Mas como nosso áudio já está pronto, faremos o upload do nosso próprio arquivo. Clique em Carregar áudio no canto superior esquerdo. Faça o upload do primeiro arquivo de áudio e veja como ele soa. Em 2026, a IA não substituirá você. Essa frase se repete muito, mas aqui está a parte que as pessoas pulam Se tudo parecer bom, clique em Out Audio. Depois que o áudio for adicionado, vá para o canto superior direito, clique em Gerar vídeo, verifique se todas as configurações estão definidas para a qualidade máxima e se não há marca d'água e clique em Enviar Tudo bem, enquanto o vídeo está sendo gerado, podemos seguir em frente e criar a próxima sincronização labial. Aqui eu seleciono os seis arquivos de áudio, que eu marco no Google Docs como aquele que deve ser usado com esse avatar Assim como antes, clicamos em Gerar, verificamos se todas as configurações estão definidas com a mais alta qualidade disponível e, em seguida, clicamos em Enviar. Enquanto aguardamos a próxima geração, vamos dar uma olhada no resultado da primeira. Em 2026, a IA não substituirá você. Essa frase se repete muito, mas aqui está a parte que as pessoas pulam Para mim, parece muito realista. Tenho certeza de que a maioria das pessoas, se vissem esse avatar em seus pés, nem perceberiam que é IA. Agora, vamos compará-lo com o mesmo vídeo criado no Clink Em 2026, a IA não substituirá você. Muitas vezes essa linha. Um substituto. Essa frase se repete muito. Mas aqui está a parte que as pessoas pulam. Na versão Klink, o rosto parece um pouco mais plástico e as emoções parecem um pouco mais expressivas em comparação com o resultado de higiene O que você acha? Agora, vamos dar uma olhada na segunda geração. Então, em 2026, a questão não é se a IA aceitará meu emprego. Bom. Eu realmente gosto desse de novo. E vamos também compará-la com a versão criada no link. Então, em 2026, a questão não é se a IA aceitará meu emprego. Então, em 2026, a pergunta é se a IA não aceitará meu emprego? Na versão clink, os ladrões de Avatar não são visíveis e a qualidade geral parece um pouco menos detalhada em comparação com Hagen não esconde o ladrão e, por causa disso, o resultado parece mais natural para mim. No geral, acho que prefiro a versão Hagen aqui. Tudo bem, criamos dois vídeos de sincronização labial. Agora precisamos criar o próximo usando uma imagem de avatar diferente. Para isso, voltamos à seção Avatar para criar um novo Avatar, clicamos em Nova Aparência, carregamos a próxima imagem do avatar e clicamos em Criar Aparência. Usando o mesmo processo, vamos também criar nosso terceiro e último Avatar fazendo o upload da próxima imagem e clicando em Criar Look Agora pegamos nosso segundo Avatar e passamos a criar a sincronização labial. Vamos verificar o Google Docs para ver quais arquivos de áudio devem ser usados para esse Avatar Ok, aqui temos duas faixas de áudio que precisam ser aplicadas. Antes de aplicá-las, vamos verificar rapidamente. IA não substitui Um desenvolvedor sem IA escreve tudo do zero. Um desenvolvedor com IA entrega mais rápido, corrige bugs mais cedo e se concentra em problemas reais. Sim, é exatamente disso que precisamos. Nós carregamos o áudio e o adicionamos. Em seguida, seguimos o mesmo processo familiar. Clique em Gerar, adicione a descrição, se necessário, e verifique se todas as configurações estão definidas com a qualidade máxima. Dessa vez, a geração custou créditos gratuitos, já que o arquivo de áudio é um pouco maior que o anterior. Tudo bem. No meu caso, tenho créditos suficientes. Em seguida, clicamos em Gerar. Tudo bem, quase tudo é gerado. Vamos dar uma olhada no que temos. Um desenvolvedor sem IA escreve tudo do zero. Um desenvolvedor com IA entrega mais rápido, corrige bugs mais cedo e se concentra em problemas reais. Eu, isso parece muito bom. Não há deformação da cabeça, como vimos no Klink. Vamos comparar as duas versões. Um desenvolvedor sem IA escreve tudo do zero. Um desenvolvedor com IA entrega mais rápido, corrige bugs mais cedo e se concentra em problemas reais. Honestamente, ambas as opções poderiam ser usadas com um pouco de trabalho de pós-produção, mas, mais uma vez, Hagen é minha favorita aqui. Vamos seguir em frente. A questão é, a questão é, aqui, tudo parece bem. Este clipe é muito curto para realmente comparar, então vamos seguir em frente. Alguém usando AI W, mesmo trabalho, mesmo título. Resultados muito diferentes. Este também ficou ótimo. Sem falhas estranhas ou gestos estranhos do avatar . Vamos comparar essa versão com a gerada no clink Alguém usando AI Will, mesmo trabalho, mesmo título, resultados muito diferentes. Alguém usando AI Will, mesmo trabalho, mesmo título. Resultados muito diferentes. A versão clink é um pouco mais expressiva. Em alguns casos, isso pode funcionar bem, mas por causa dessa expressividade, fica um pouco mais perceptível que é IA Agora vamos dar uma olhada na geração final. Será você quem o usará ou competirá contra ele? De que lado você está? Será você quem o usará ou competirá contra ele? De que lado você está? Essa acabou sendo uma ótima cena de encerramento para este vídeo com uma pergunta que funciona como um apelo à ação, incentivando os espectadores a deixarem um comentário. Na minha opinião, Hagen lida com isso muito bem. E mesmo assim, sou um grande fã do Klink, que eu pessoalmente uso para cerca de 80% das minhas tarefas Quando se trata de avatares realistas, Hagen atualmente se sente mais forte para mim Dito isso, se você estiver criando um avatar em estilo de desenho animado ou se tiver apenas uma assinatura de link, ou precisar aplicar sincronização labial a uma foto em um projeto animado, o link faz um ótimo trabalho Eu o usei muitas vezes nesses casos e definitivamente posso recomendar para esse tipo de trabalho. Agora vamos baixar todos os arquivos em uma pasta separada. Você viu o processo completo e os resultados e, a partir daqui, pode decidir o que funciona melhor para sua própria situação. Meu objetivo era mostrar as opções disponíveis. Tudo bem, vamos encerrar este módulo. Já terminamos de falar sobre avatar. Restam apenas algumas peças, criando música de fundo para nosso vídeo usando AA e, em seguida, reunindo tudo na pós-produção. Estamos quase na linha de chegada. Se você chegou até aqui, não há razão para avançar agora, S no próximo módulo. 8. Módulo 6: criando som de fundo: Módulo seis, AI Music na prática. Olá e bem-vindo ao próximo módulo. Neste módulo, vamos nos concentrar em gerar música de fundo para nosso vídeo usando AA. Mostrarei com que rapidez crie músicas que se adaptem ao clima e ao ritmo do nosso vídeo de avatar sem passar horas pesquisando nosso vídeo de avatar sem em bibliotecas de música padrão Usaremos duas ferramentas de IA com as quais eu trabalho pessoalmente e também usaremos o ChatGPT para nos ajudar a escrever um aviso claro para o tipo de música de que precisamos O objetivo aqui não é criar uma trilha sonora perfeita, mas gerar uma música de fundo limpa e utilizável que suporte o vídeo e funcione bem na edição final Tudo bem, para entender que tipo de música funciona melhor para esse tipo de vídeo, vamos perguntar ao JAGPT Quando você está criando esse tipo de conteúdo pela primeira vez, é totalmente normal não saber qual música é realmente popular ou funciona bem nesse formato. Então, em vez de adivinhar, usaremos o JAGPT para nos ajudar a descobrir e nos dar algumas boas instruções Ok, vamos dar uma olhada nas opções que o JAGPT criou. De todas as opções, eu gosto mais do segundo sutil sutil sublinhado cinematográfico Ja GPT mencionou que esse estilo funciona muito bem para falar em público, e eu concordo que ele suporta a voz sem distraí-la Então, vamos dar o próximo passo. Vou pedir ao JAGPT que escreva um prompt para gerar música exatamente nesse estilo Ok, aqui está nosso aviso. Vamos copiá-lo e usá-lo em duas ferramentas de IA diferentes para gerar música de fundo. O primeiro aplicativo que vamos usar é o Sona. Sona é uma ferramenta de IA usada principalmente para gerar música a partir de texto Prompt Você pode criar música de fundo, música completa, instrumentais ou faixas atmosféricas simples, ou faixas atmosféricas simples, tudo isso apenas descrevendo o clima e o estilo É especialmente popular para música de fundo para vídeos, conteúdo de mídia social, demonstrações e experimentos, ideias musicais fracas sem a necessidade de habilidades de produção musical Uma coisa que eu realmente gosto Sona é que ele é muito fácil de usar Você não precisa entender a teoria musical ou mexer com configurações complexas Você apenas descreve o que deseja e isso lhe dá um resultado. No nosso caso, usaremos o Sona para gerar uma música de fundo cinematográfica sutil que suporte a voz e não distraia a Usaremos o mesmo prompt que preparamos anteriormente, geraremos a música e depois a compararemos com outra ferramenta de IA para ver qual resultado se encaixa melhor em nosso vídeo. Vamos falar rapidamente sobre as assinaturas do SNA, incluindo uma opção gratuita e paga com mais créditos Nosso objetivo neste curso, gerar uma música de fundo curta para vídeo, o plano gratuito é totalmente suficiente. Você já pode criar músicas, testar instruções e ter uma ideia de como tudo funciona Se mais tarde você decidir gerar muitas músicas e precisar de direitos comerciais, você sempre poderá atualizar. Mas para seguir este curso, você não precisa pagar nada. Vou vincular o link à Sun e ao produtor AA, nos recursos do curso e arquivo Pin, para que você possa encontrá-lo facilmente mais tarde. Segundo aplicativo, como você já tem, é o produtor AA. Não é tão popular quanto o SNA, mas eu o uso há muito tempo Ele tem todos os recursos que eu pessoalmente preciso para meu fluxo de trabalho. Quando se trata de assinatura, produtor AA é um pouco mais barato que o Suna, a diferença não é grande Também existe um plano gratuito, que é mais do que suficiente se você estiver gerando músicas apenas para uso pessoal ou aprendizado. Atualmente, estou no plano Startup por oito dólares porque uso a música para projetos comerciais Mas esse é um tópico separado. Para este curso, a versão gratuita é totalmente adequada. O ponto principal aqui é comparar o resultado e ver qual ferramenta se adapta melhor ao seu estilo e fluxo de trabalho. Você pode ver, eu gerei uma lista bastante longa de faixas aqui. Na verdade, existem muitos deles. A última vez que gerei música no Producer AI foi há algumas semanas, mas tudo ainda está seguro e fácil de acessar. Com o tempo, isso se torna muito útil. Você cria sua própria pequena biblioteca de faixas que pode ser reutilizada, comparada ou inspirada posteriormente Tudo bem, vamos começar a gerar. Primeiro, na IA do produtor, clique em Nova sessão. Na janela de bate-papo exibida, passe a solicitação que recebemos anteriormente do ChatGPT e clique em Enviar Enquanto a música está sendo gerada lá, vamos mudar para o Sona No Sona, vá para o canto esquerdo e clique em Criar. Só precisamos de música de fundo sem vocais, então certifique-se de selecionar instrumental Agora cole o mesmo prompt e clique em Criar. Dessa forma, você está gerando vídeos em duas ferramentas diferentes ao mesmo tempo usando exatamente o mesmo prompt, que tornou a comparação muito mais clara Ok, vamos ouvir o que o produtor Rey nos deu. Hmm. Não é ruim, mas parece um pouco chato demais, talvez até um pouco chato. Vamos tentar torná-lo mais interessante e adicionar mais bits. Enquanto esperamos pela nova geração, vamos ouvir o que a Sona criou para nós R : Na verdade, gosto muito da última parte da faixa. Acho que se encaixa muito bem no nosso vídeo. Então, vamos fazer o download. Como você pode ver, com o plano gratuito, você pode baixar a faixa somente no formato gratuito MP. Mas, para o nosso vídeo, isso é mais do que suficiente. Não precisamos de nada mais complexo aqui. Tudo bem, vamos finalizar esse módulo. Neste módulo, criamos um script para nosso vídeo, descobrimos que tipo de música de fundo funciona melhor para nosso formato e geramos música usando diferentes ferramentas de IA. Comparamos os resultados, escolhemos o que gostamos e agora temos todas as peças principais prontas. Só resta um quebra-cabeça , juntando tudo. No próximo módulo, passaremos para a pós-produção e montaremos o vídeo final no Capcat É aí que tudo se junta. Veja no próximo módulo. 9. Módulo 7: montagem final na prática — como editar o vídeo no CapCut: Módulo sete, editando o vídeo no CapCut. Bem-vindo ao módulo final. Neste módulo, analisarei meu próprio projeto de vídeo e mostrarei como tudo se encaixa no CapCut Analisaremos passo a passo os principais recursos que usei, desde a colocação do visual e a narração até a adição de música e pequenos retoques finais adição de música e pequenos Não pretendo mostrar uma edição perfeita aqui. O objetivo é compartilhar um fluxo de trabalho claro e prático para que você possa entender a lógica e depois experimentar por conta própria. Tudo bem, vamos para o CapCut. Primeiro, vou mostrar o resultado final que obtive. Depois disso, examinaremos tudo passo a passo e detalharemos tudo juntos. Em 2026, a IA não substituirá você. Alguém usando IA terá o mesmo trabalho, mesmo título, resultados muito diferentes. Um designer sem IA passa o dia todo em um conceito. Um designer com inteligência artificial explora dez direções antes do almoço e refina a melhor Um desenvolvedor sem IA escreve tudo do zero. Um desenvolvedor com IA entrega mais rápido, corrige bugs mais cedo e se concentra em problemas reais. A IA não substitui as profissões. Ela substitui a hesitação. Ele substitui a resistência. Ele substitui as pessoas que esperam. Então, em 2026, a questão não é se a IA aceitará meu emprego? A questão é: será você quem o usará ou competirá contra ele? De que lado você está? Tudo bem, foi assim que minha versão final ficou. Não sei se você percebeu, mas durante a edição, achei que o roteiro original era um pouco longo demais e um pouco chato no início Então eu cortei a abertura e cortei uma pequena parte do roteiro e, honestamente, está muito melhor Nem todo mundo assistirá a um vídeo de 1 minuto até lá, e nosso objetivo é transmitir a ideia principal com clareza, não prolongá-la. Então, aqui está o que eu fiz a seguir. Importei uma pasta com todos os arquivos que eu precisava para este projeto. Também baixei alguns videoclipes de estoque. Também poderíamos ter gerado aqueles com IA, mas, nesse caso, baixar imagens de estoque foi simplesmente mais rápido Estou usando esses clipes para preencher a parte do script em que o avatar do token não está visível Eu dividi a tela em duas partes. No topo, coloco um clipe de estoque e, abaixo dele, o avatar. A ideia aqui é evitar a primeira reação de Isso parece chato. Ignorar. Em vez disso, o espectador tem algo para ver imediatamente, o que ajuda a manter sua atenção. Também adicionei um pouco de movimento à primeira foto com o avatar simbólico, um efeito de zoom sutil Para fazer isso no CapCut, vá até o primeiro quadro do clipe e adicione um quadro-chave Em seguida, vá até o final do clipe, aumente levemente a escala até o nível desejado e adicione outro quadro-chave Isso cria um zoom suave que adiciona um pouco de vida e energia à foto. Em seguida, mudo para outra foto do avatar, mas de um ângulo diferente. Logo depois disso, adiciono um atalho a um clipe de estoque em tela cheia e, em seguida, trago o layout de volta para a tela dividida. Todas essas pequenas transições e mudanças ajudam a manter a atenção dos espectadores, e essa é realmente a parte mais importante Se você não chamar a atenção de alguém nos primeiros ou nos 2 segundos, provavelmente essa pessoa não ficará por aqui para ver do que trata o vídeo ou o que vem a seguir. Portanto, o objetivo aqui não é ser sofisticado. É para manter o vídeo visualmente vivo e dar aos espectadores um motivo para continuar assistindo. Depois disso, mudo para um lábio padrão que apóia visualmente a parte sobre designers. Isso ajuda a reforçar a mensagem e torna a ideia mais clara sem explicar demais Foi também aqui que recebi a primeira dica sutil para me inscrever, um pequeno adesivo colocado em um local visível A chave aqui é mantê-lo leve e mais intrusivo. Você não quer se esforçar demais pois isso pode facilmente afastar as pessoas. Pense nisso mais como um lembrete gentil, não como um apelo à ação gritado para o espectador Depois disso, eu não compliquei demais. Eu mantenho o layout simples, uma tela dividida com uma borda padrão na parte superior, legendas e o avatar falante mostrado de outro ângulo Então, decidi dar ao espectador uma pequena pausa para não ver o rosto do meu avatar. Nessa parte, achei que as palavras em si eram fortes o suficiente, então usei uma abordagem visual mínima, com um texto grande aparecendo em um fundo preto. Selecionei o texto, fui para a animação e escolhi uma animação de zoom com a maior duração possível Repeti a mesma configuração para todas as três palavras. Isso cria uma pausa nítida no visual, permite que a mensagem chegue e ajuda a redefinir a atenção do espectador antes de prosseguir Em seguida, passamos para a parte final do vídeo. Aqui, o avatar aparece em tela cheia com diferentes ângulos de câmera alternando pela cena Também alterno essas fotos com efeito de zoom sutil em quadros mais estáticos usando uma visão mais próxima da câmera. Isso ajuda a manter o final visualmente interessante e evita que pareça plano ou repetitivo Outro elemento importante aqui é a música de fundo. A faixa que escolhemos tem um tom bastante dramático, então baixei um pouco o volume O objetivo é que a música fique em segundo plano, apoiando o clima sem se distrair da voz Honestamente, essa parte nem é obrigatória. Você sempre pode adicionar músicas mais tarde, diretamente no TikTok ou Eu quero mostrar principalmente o processo de geração de música como parte do fluxo de trabalho. Quer você o use em seu próprio projeto ou não , depende totalmente de você. O próximo detalhe muito importante são as legendas. Para criá-los no CapCut, acesse o texto na parte superior da tela Escolha legendas automáticas, selecione inglês como idioma e clique em Gerar CapCut tem uma biblioteca muito grande de estilos de legendas, fontes, animações e layouts diferentes para todos os Se você estiver editando no CapCut, eu recomendo passar algum tempo explorando-os e escolhendo o que parece certo para o seu estilo Outro elemento importante são as transições entre clipes. Assim como as legendas, o CapCut oferece uma grande variedade de transições Você pode encontrá-los clicando nas transições na parte superior da tela. Não os use demais. Algumas transições simples geralmente funcionam melhor. E às vezes também é útil lembrar gentilmente o espectador de curtir ou se inscrever. Para isso, podemos usar adesivos. Você pode encontrar adesivos ao lado da seção de transição Existem muitos deles, e novos são adicionados o tempo todo, setas, destaques, contornos, chamadas e Eles podem ser muito úteis quando você quer apontar para algo específico na tela ou guiar a atenção do espectador. Reserve um tempo para explorar a seção. É mais poderoso do que parece à primeira vista. E a última etapa final é a mixagem de áudio. dublagens de IA já são muito boas, mas ainda não são perfeitas Às vezes, você ouvirá pausas mais longas entre as fases, então é uma boa ideia cortar a parte do áudio para torná-la mais natural No ponto em que dois clipes de áudio se encontram, geralmente adiciono uma saída curta de fade no final do primeiro clipe e fading suave no início do próximo Em alguns casos, eu até sobreponho um pouco o eclipse de áudio. Isso ajuda a evitar pausas incômodas e mantém o fluxo em andamento. Como estamos trabalhando com vídeos curtos, ritmo e a rima realmente importam, e essas são basicamente todas as técnicas que usei para criar esse vídeo Então, sim, parabéns. Você chegou ao final do curso. E isso é um embrulho. Neste curso, você aprende como passar de uma ideia a um pequeno vídeo finalizado usando AA, criando um avatar, gerando imagens, escrevendo um roteiro, adicionando voz e música e, finalmente, juntando tudo na pós-produção Obrigado por escolher nosso curso. Nós realmente tentamos compartilhar nossa experiência real, não a teoria, mas um fluxo de trabalho prático que você pode realmente usar. Este curso lhe deu novas habilidades úteis Agradeceríamos muito se você deixasse uma avaliação positiva. Isso nos ajuda a crescer e continuar criando conteúdo prático e honesto como esse. E se você gosta de continuar aprendendo, fique à vontade para conferir nossos outros guias e continuar desenvolvendo suas habilidades nesse sentido. Obrigado novamente por estar aqui, sua Bros Academy.

Crie avatares de IA: da imagem ao vídeo. Guia passo a passo

Bros Academy, null

Assista a este curso e milhares de outros

Assista a este curso e milhares de outros

Aulas neste curso

1.

Introdução aos avatares de IA

1:16

2.

Módulo 1: avatares de IA — tipos, casos de uso e escolha de sua direção

3:05

3.

Módulo 2: fundamento visual — como criar seu avatar na prática

8:28

4.

Módulo 2.1: criando ângulos e estilos múltiplos para seu avatar de IA

5:00

5.

Módulo 3: script e história — escrevendo um cenário de vídeo curto

3:13

6.

Módulo 4: Transformando scripts em fala - Transformando scripts em fala

7:42

7.

Módulo 5: Comparando ferramentas de IA

13:22

8.

Módulo 6: criando som de fundo

6:48

9.

Módulo 7: montagem final na prática — como editar o vídeo no CapCut

7:32