Transcrições
1. Introdução aos avatares de IA: Você está curioso
sobre avatares de IA, mas se sente sobrecarregado com ferramentas, demonstrações e resultados mistos.
Você está no lugar certo Este curso foi criado
pela Bros Academy com base na experiência
real de produção
do Bros AI Studio. Em nosso estúdio, não fazemos
apenas experiências com IA. Nós o usamos para criar
avatares AA, personagens animados, desenhos animados completos baseados em IA,
videoclipes e
vídeos de publicidade comercial para Os avatares de AA não caem
por causa de ferramentas ruins. Eles caem devido a um fluxo de trabalho
pouco claro. Este curso não é uma coleção de recursos ou demonstrações aleatórias. É um processo prático de
ponta a ponta. Na verdade, nós o usamos
em nossos próprios projetos desde a escolha de um personagem
até a criação de um vídeo de avatar de AA falante e em
movimento. Você verá como criamos personagens
consistentes, escrevemos curtas e roteiros
que funcionam para AA,
geramos
vozes naturais, aplicamos sincronização labial, sem exageros, sem mágica de cliques, exatamente o que funciona e por quê Este curso não
promete resultados perfeitos, vídeos
virais ou renda instantânea. O que isso lhe dará
é uma estrutura clara, ponto de partida
realista e a confiança para experimentar
sem adivinhar No final, você não terá apenas um vídeo de avatar de IA finalizado. Você entenderá como
e por que foi feito. Se você quiser uma introdução
prática fundamentada aos avatares de IA usados
em projetos reais, este curso é para você.
Vamos começar.
2. Módulo 1: avatares de IA — tipos, casos de uso e escolha de sua direção: Módulo um, tipos de avatares AA, casos de
uso e escolha de
sua direção Antes de começarmos a trabalhar
com ferramentas e recursos visuais, vamos dar um passo atrás e falar sobre os avatares A Neste módulo, veremos
o que são os avatares A,
onde eles são usados
e como escolher
a direção certa
sem pensar demais Quando falamos sobre avatares de IA, queremos dizer personagens digitais criados com a
ajuda de ferramentas de IA Esses avatares podem
representar pessoas reais ou podem ser personagens completamente
fictícios O objetivo principal é
a comunicação para explicar algo, contar uma história ou
transmitir uma mensagem. Os avatares AA já são usados
em muitas áreas diferentes. Você os verá frequentemente em conteúdo de mídia
social, vídeos
educacionais, marketing e publicidade e até mesmo em projetos de apresentação ou
contação de histórias Elas são ferramentas flexíveis e sua função depende de
como você deseja usá-las. Existem vários
tipos principais de avatares AA. Alguns são realistas e baseados em fotos
reais, outros
são estilizados, parecidos com
desenhos animados ou
semirrealistas e alguns são Para ser honesto,
não existe um único tipo correto. Cada abordagem tem
seus próprios pontos fortes. Os avatares realistas geralmente são
criados a partir de fotos reais. Eles podem se sentir muito
pessoais e envolventes, especialmente quando
representam uma pessoa real. Ao mesmo tempo, eles
apresentam maiores expectativas de realismo e exigem mais
controle e consistência Avatares fictícios ou estilizados não
são Eles oferecem mais liberdade
criativa e geralmente
são mais fáceis de
manter visualmente. Eles também são mais tolerantes
quando se trata de movimento, sincronização
labial e pequenas
imperfeições Antes de escolher um avatar, é importante fazer
algumas perguntas simples. Por que você precisa desse avatar?
Onde será usado? Você quer que represente
você ou um personagem, e quão realista
isso realmente precisa ser? Uma coisa importante
a lembrar é que você não está preso
a uma única opção. Você sempre pode
alterar seu avatar mais tarde ou criar mais de um. O que mais importa não é
tomar uma decisão perfeita, mas ganhar experiência tentando
de fato. Neste curso,
mostraremos as duas abordagens na prática. Criaremos um
avatar realista baseado em fotos reais e também geraremos um avatar fictício do zero Dessa forma, você entende
como cada abordagem funciona e qual delas
se adapta melhor aos seus objetivos. Tudo bem, esse é o
fim deste módulo. Vamos resumir rapidamente
o que aprendemos. Neste módulo,
aprendemos quais avatares A, onde
são usados e os principais tipos
que você encontrará Você também viu como
pensar em usar uma direção de avatar sem pressão ou medo de
fazer a escolha errada. No próximo módulo,
começaremos a criar a base visual para seu avatar e passaremos
à prática prática. No próximo módulo,
passaremos dos conceitos à prática. Você verá como os
avatares de IA são realmente criados usando diferentes
ferramentas e abordagens Trabalharemos com fotos reais, geraremos
personagens fictícios e nos concentraremos na construção de uma base visual
consistente Você pode reutilizar posteriormente para
vídeo e animação.
3. Módulo 2: fundamento visual — como criar seu avatar na prática: Módulo dois, Visual Foundation, criando seu
Avator na prática Bem-vindo ao Módulo
dois. Neste módulo, finalmente
passamos da
teoria para a prática. Vou explicar como
criamos avatares passo a passo usando
diferentes ferramentas e configurações Não estamos buscando a
perfeição aqui. O objetivo é entender o processo e
aprender a criar avatares consistentes
e utilizáveis em Veremos algumas abordagens comuns desde avatares realistas
baseados em fotos reais até personagens de
desenhos animados mais estilizados Usaremos
ferramentas diferentes ao longo do caminho, mas não conseguiremos nos
conectar a nenhuma específica. As ferramentas são apenas exemplos, os fluxos de trabalho que
realmente importam Enquanto assiste, tente observar
algumas pequenas decisões,
iluminação, ângulos e detalhes do baile Essas pequenas coisas geralmente fazem uma diferença maior
do que você esperaria. Também passará algum tempo
analisando ângulos e consistência, criando várias visualizações
do mesmo personagem e preparando imagens para vídeo ou animação. E não se preocupe em
se lembrar de tudo. Concentre-se em entender por que
as coisas são feitas de uma determinada maneira. Você sempre pode
voltar mais tarde quando começar a criar
seu próprio avatar. Tudo bem, vamos começar com uma ferramenta muito poderosa que eu
uso muito. Hicks sentiu a IA Hicksfld é uma plataforma generativa de
IA que reúne várias imagens e modelos
de vídeo O Hicksfld é uma plataforma generativa de
IA que reúne
várias imagens e modelos
de vídeo em uma única interface. Em vez de se limitar
a um único modelo, ele permite que você experimente
diferentes modelos, ferramentas
cinematográficas e modos de
geração dependendo do que você
está tentando criar Você pode gerar
imagens e vídeos, experimentar cenas cinematográficas, controlar ângulos de câmera,
criar variações de cena e explorar diferentes estilos
visuais É por isso que é uma ótima ferramenta
para produção criativa, marketing e narrativa
visual Comece a criar nosso avatar. A primeira coisa que
precisamos é de um bom aviso. Para isso, eu costumo ir
direto para o ChatGPT. Você pode usar outros
modelos, bem como Gemini ASCI, para ajudar a
gerar o prompt Neste exemplo,
quero criar um avatar super realista de mim mesmo usando minhas próprias
fotos como referência. Quero que o avatar
seja reconhecível, então vou manter alguns detalhes visuais
claros como usar um capuz azul Eu também quero um
microfone de estúdio na
minha frente e algumas plantas verdes,
talvez em um fundo. Eu costumo usar fotos como essa, e você deve se lembrar que sua imagem de referência deve
ser igual à sua em uma moldura, preferência um retrato
ou um close up, e também de boa qualidade
e, o mais importante, seu rosto deve estar olhando
diretamente para a câmera. Depois de editar sua imagem de
referência, deixe a IA fazer sua mágica e aguarde a solicitação. Tudo bem, vamos verificar o
que o ChatGPT nos deu. Vamos dar uma
olhada rápida no prompt. Se tudo estiver bem, basta copiá-lo e vamos
voltar para Hicksvild A primeira maneira de criar
seu avatar é treiná-lo usando suas próprias
fotos com a sola Hicksvild Na verdade, essa é a opção
favorita da minha esposa no momento. Para começar, clique em Imagem
no canto superior esquerdo e selecione
o modelo Hicks feltro Sol Minha esposa e eu já
treinamos nossos avatares do Sol, então não vou passar por todo o processo do zero aqui Mas o que você precisa é
clicar em Gerar novo e fazer upload de cerca de 15 ou
20 fotos suas. Lembre-se de que é
melhor incluir uma mistura de fotos de perto
e fotos de corpo inteiro. Isso ajuda a modelo a
aprender seu rosto e corpo em diferentes
posições e ângulos. Para meu treinamento de avatar, uso as mesmas fotos
que mostrei anteriormente. Tente usar
imagens semelhantes de si mesmo, boa iluminação, rosto claro e nenhuma outra pessoa
na moldura. O processo de treinamento
leva um pouco de tempo. Pelo que me lembro,
geralmente leva cerca de
dez ou 20 minutos, então seja paciente aqui. Quando seu avatar estiver pronto, selecione-o e cole o prompt, o que obtivemos do ChatGPT Desde este curso,
estamos criando curtas para o
YouTube, vídeos no estilo
TikTok Vamos escolher a proporção de
916. Para resolução, geralmente
escolho a opção mais alta
disponível. No momento, são dois K. Apenas uma nota rápida
sobre os créditos Gerar quatro imagens
custa dois créditos
e, honestamente, isso não é muito, especialmente em
comparação com outras ferramentas E lembre-se de quando
eu disse que Hicksfeld é um agregador de modelos de IA Essa é uma das
maiores vantagens. Você pode alternar entre
modelos diferentes enquanto paga por uma assinatura, em vez
de usar cinco ferramentas separadas, o que seria muito
mais próximo é meu favorito pessoal no momento, nana Banana Pro Aqui, usaremos
o mesmo prompt e a mesma imagem de referência e
geraremos o avatar novamente. Vou gerar duas
imagens usando nana banana. No momento, uma imagem em resolução de
dois K
custa dois créditos, então tenha isso em mente quando
estiver testando coisas. Depois disso, vamos
mudar para o CDRm 4.5. A mesma configuração novamente, o mesmo prompt
e a mesma imagem de referência. Acho que agora você está começando a ver o que
estamos fazendo aqui. A ideia é mostrar vários modelos diferentes de
geração de imagens usando exatamente a mesma entrada. Isso oferece mais
opções de escolha e facilita
a comparação dos resultados. Talvez goste mais da aparência de um
modelo do que de outro, e está tudo bem. O objetivo é
entender como testar, comparar e escolher o modelo
que funciona melhor para você. Em seguida, quero
mostrar a você o link AI. Na verdade, você também pode usar
modelos de links em Hicksville. Mas quando estou
trabalhando especificamente com links, geralmente
vou direto
para o site do link e gero imagens lá. Vou explicar por que
prefiro isso um pouco mais tarde. Isso fará sentido quando
você ver o fluxo de trabalho. Por enquanto, vamos gerar
nosso avatar usando o modelo
01 ou qualquer que seja a versão mais recente
disponível em seu site. No lado esquerdo da tela, clique no botão 01 agora mude
para geração de imagem Cole o aviso e faça o upload da
sua foto de referência. Se você tiver uma
assinatura clink, poderá gerar
imagens gratuitamente Eu tenho uma assinatura,
então vou selecionar
a opção de geração gratuita
clicando neste botão. Vou definir quatro saídas, mas você pode escolher até nove se quiser mais variações E para resolver,
vamos usar dois K. Veja, com assinatura,
mostra zero créditos Se você não tiver
uma assinatura, gerar uma imagem geralmente
custa cerca de um crédito. Tudo bem, se tudo estiver
bem, vamos clicar em gerar. Enquanto as imagens estão sendo geradas, quero explicar por que
costumo usar o link AI diretamente. Em vez de
passar pelo Hicks Field, mesmo por meio do Is,
ter uma assinatura
pode ser mais barato O motivo é bem simples. Na Bros Academy, somos
criadores ativos e geramos muitas imagens e vídeos para nós mesmos
e para os clientes. Isso significa que precisamos
de muitos créditos. Link AI tem um sistema muito bom que permite que você ganhe
créditos gratuitamente. Deixe-me mostrar nosso
perfil no link. Publicamos nosso trabalho
aqui regularmente e às vezes
participamos de concursos diferentes Apenas publicar seus criativos não rende
créditos por si só, mas você ganha créditos
quando alguém recria suas imagens ou vídeos
usando seus. Além disso, você recebe uma pequena comissão
por cada As pessoas também podem gostar do seu trabalho e segui-lo se
gostarem do seu estilo. Então, se você quiser,
você também pode criar um público dentro
do escritório. Por exemplo, ontem,
ganhei 160 créditos grátis. Não foi meu melhor resultado, mas
tudo bem. Alguns dias são
melhores do que outros. Nos últimos meses, ganhei mais de
32.000 créditos gratuitos dessa forma Se eu fosse comprar esses créditos, custaria cerca de 400 dólares Além disso, eu ganho
mais de 50.000 créditos
gratuitos de outras
atividades oferecidas no passado Link também tem um programa
de referência. No momento, estou
gravando isso. Se você usar meu link de indicação, nós dois receberemos 500 créditos gratuitos
para suas primeiras gerações. É uma vitória para nós dois. Vou vincular o link
na descrição. Tudo bem, vamos dar uma olhada nos resultados que
o link gerou. Na verdade, eu
realmente gostei do resultado. Antes de baixar a imagem, recomendo aumentá-la para obter a melhor qualidade
possível É um pequeno passo, mas
faz uma diferença notável. Agora vamos voltar
à Hicksfeld AI e verificar quais são os diferentes
modelos Pessoalmente, meu resultado favorito
aqui é do C dream 4.5. Mas, no seu caso,
o melhor resultado pode vir de um modelo diferente, e tudo bem. O objetivo aqui não é
escolher um modelo correto. Meu objetivo é simplesmente mostrar as opções para que você possa escolher
o que funciona melhor para você. Vá em frente e baixe a
imagem que você mais gosta. E é isso por enquanto. Acabamos de criar nosso
primeiro avatar realista com base em uma referência fotográfica. Testamos vários modelos e
escolhemos o que mais gostamos. No próximo módulo,
levaremos esse avatar mais longe. Vamos gerar mais imagens
do mesmo personagem, mas com ângulos diferentes. Portanto, nosso vídeo parece mais
dinâmico e natural. E se você quiser mais um avatar
no estilo cartoon, não se preocupe Também mostrarei como transformar seu avatar realista em um personagem
de permanência de pixels com apenas alguns cliques. Nos vemos no próximo módulo.
4. Módulo 2.1: criando ângulos e estilos múltiplos para seu avatar de IA: Módulo 2.1, criando
vários ângulos e estilos para seu avatar AA. Neste módulo, levaremos
seu avatar um passo adiante. Vamos nos concentrar em criar vários ângulos
do mesmo personagem, para que seu vídeo pareça mais
natural e dinâmico. Você verá como transformar
seu avatar realista em uma versão mais estilizada no estilo
pixel, se essa for a direção que
você deseja explorar Tudo bem, vamos
voltar para Hicksfeld e escolher o modelo
nana Banana Pro Já escolhi as imagens que mais gosto
e baixei. Agora, quero gerar ângulos de câmera
diferentes para essa imagem mantendo o
mesmo caráter e o
mesmo ambiente da referência. Vamos selecionar nossa imagem
e atualizar o prompt. Certifique-se de que a relação de especificação 916
esteja selecionada . Em seguida,
clique em Gerar. Vou gerar quatro variações, mas fique à vontade para experimentar com menos ou mais resultados e
ver o que funciona melhor para você Tudo bem, como você pode ver,
temos algumas
opções diferentes aqui. Eles não são perfeitos,
mas isso mesmo. Em alguns casos, é útil
ser mais específico
no prompt e
descrever claramente o
ângulo da câmera desejado. Mas, por enquanto, estou mostrando
principalmente
o fluxo de trabalho e as
opções disponíveis. seguir, quero
mostrar outra ferramenta dentro da Hicksville AI baseada
no modelo Nana Banana Pro É chamado de Shots. Vamos
para o topo da tela, clique em Aplicativos e encontre o aplicativo Shots. Este aplicativo gera nove ângulos de câmera
diferentes a partir de uma única imagem enviada.
Nós o usamos com bastante frequência. Então, deixe-me mostrar rapidamente alguns exemplos do trabalho
que foi gerado com ele. É uma ótima ferramenta para contar sua história de uma forma
mais cinematográfica Muitas pessoas usam avatares com apenas uma imagem ou
um ângulo de câmera Se você quiser se destacar,
ajuda fazer algo um pouco mais interessante ou pelo
menos, entender
como isso é feito. Tudo bem, vamos
fazer o upload da nossa imagem. Espere um pouco e, em seguida,
verifique a proporção. No nosso caso, o 916
funciona perfeitamente. A geração
custou quatro créditos. Vamos clicar em Gerar
e esperar cerca de um, 2 minutos pelos resultados. Tudo bem,
temos nove tiros aqui. Eu gosto de alguns deles, então
vou pegar quatro
e aprimorá-los Cada imagem aprimorada
custa dois créditos. Você também pode baixar
as imagens sem aumentar a escala, se não precisar ou aumentá-las em até quatro X, o
que custa mais
créditos, que custa mais
créditos, Tudo bem, vamos
começar a aumentar a escala. Geralmente, leva cerca de
dois ou 3 minutos, então vamos ser pacientes e esperar. Ok, agora podemos ver
todas as imagens que temos. Vamos baixá-los e salvar tudo em uma pasta
separada. E mais tarde, talvez
nos próximos módulos, eu gere
mais alguns ângulos em que o avatar esteja
olhando diretamente para a câmera,
sem essas fotos Agora lembre-se de que eu disse que
mostrarei como transformar seu avatar em um personagem
de
desenho animado caso você queira esse visual Você pode gerar
um avatar
de desenho animado do zero usando
bailes de formatura do ChatGPT, é
claro, mas hoje
vamos simplificar Usaremos o nana Banana Pro em Hicksville com
um Vou usar a
mesma imagem de referência e pedir uma versão em
estilo pixel mantendo as características e o
ambiente do
personagem o mais próximo
possível do original. Vamos gerá-lo
e, em seguida,
entraremos em Clean Gale para
comparar os resultados Dessa forma, você verá
como ferramentas diferentes lidam exatamente com a mesma tarefa e poderá escolher
o que mais gosta. Tudo bem, em um clique, selecione 01 modelo e mude
para geração de imagem Faça o upload da imagem de referência, cole o mesmo prompt que usamos no campo
Hicks e
defina quatro saídas E agora vamos clicar em gerar. Agora vamos voltar
ao campo AA de Hicks e dar uma olhada no que temos Então, o que vocês acham, pessoal? Pessoalmente, acho que
isso parece muito bom. Nesse estágio, você pode
experimentar facilmente alterando
coisas como roupas, penteados ou pequenos
detalhes apenas
ajustando o prompt e usando
a imagem como referência É uma configuração muito flexível. Agora vamos verificar o que
obtivemos do Klink AA. Hm. Na minha opinião, os resultados aqui parecem melhores com o modelo
banana banana Pro. A versão do link parece um pouco
simples e caricatural demais para o meu gosto. Dito isso, você pode
se sentir diferente, e tudo bem. Não há um único
melhor resultado aqui. Meu objetivo é simplesmente mostrar opções
diferentes para que
você
mesmo possa testá-las e decidir o que funciona melhor para seu estilo
e seus projetos. Tudo bem, isso é
tudo para este módulo. Vamos resumir rapidamente
o que aprendemos aqui. Você aprende a expandir imagens de
um único avatar em
várias visualizações e estilos. Exploramos como gerar ângulos de câmera
diferentes,
mantendo o mesmo caráter e ambiente, e
por que isso é importante para criar vídeos mais dinâmicos e com aparência
natural. Você também viu como
diferentes modelos de IA podem produzir resultados muito
diferentes, mesmo usando o mesmo
prompt e imagem de referência, e por que não há
uma única escolha certa. Por fim, veremos
como um avatar realista pode ser transformado em uma
versão mais em estilo cartoon e como comparar os resultados
em diferentes ferramentas A principal conclusão aqui é um
fluxo de trabalho, opções de teste, comparação de resultados e escolha que se adequa ao seu projeto
e ao seu gosto No próximo módulo, vamos nos
concentrar na história e na estrutura. Usaremos o ChatGPT
para criar um script simples e transformar nossa ideia em um pequeno cenário de
vídeo Você verá como passar de
um conceito aproximado para um script claro e
utilizável, o que funciona
bem para um vídeo curto Veja no próximo módulo.
5. Módulo 3: script e história — escrevendo um cenário de vídeo curto: Módulo gratuito, roteiro e cenário de
vídeo curto para redação de
histórias. Olá, pessoal, e
bem-vindos ao Módulo Gratuito. Neste módulo,
começaremos a brincar com ideias para nosso vídeo usando o avatar que já
criamos. Falaremos sobre AA, mas não se preocupe, não de uma forma
chata ou super técnica O objetivo é criar ideias que sejam interessantes, mesmo para pessoas que
não gostam muito de AA. Usaremos o ChatGPT para nos
ajudar a fazer um brainstorming. Diremos que
queremos criar um pequeno vídeo curto
no YouTube e
pedir dez
ideias divertidas e envolventes sobre AA. Vamos ver o que acontece e escolher algo de que gostamos. Tudo bem, vamos dar uma
olhada no que o ChatGPT inventou Eu li
todas as ideias e
lembre-se de que você não precisa se limitar
à IA como Você pode pegar qualquer
assunto que quiser e usar a mesma abordagem
para criar vídeos. O principal é o fluxo de trabalho. Depois de concluir este curso, você terá uma maneira clara
de passar de uma ideia a um pequeno vídeo
finalizado. Depois disso, todo o resto
depende da sua imaginação. Uh hein. Uma ideia
realmente me surpreendeu. IA não substituirá você, alguém que usa IA W.
Parece um pouco provocativo, é exatamente o que precisamos Vamos ajustá-lo um pouco e
adicionar 2026 à ideia. Agora vou pedir ao ChatGPT que
escreva um script 20 32º, que é um forte gancho
nos primeiros 3 segundos, para que as pessoas não simplesmente
percam o vídeo. Vamos ver o que o
ChatGPT nos deu a seguir. Tudo bem, vamos
ler o que temos. Na verdade, o ChatGPT
gera um script dividido segundo a segundo, o que é muito útil, especialmente para vídeos curtos Se essa versão
já é boa para você,
tudo bem. Você pode parar aqui
e seguir em frente. Mas aqui está um pequeno truque
ao trabalhar com o ChatGPT. Normalmente, você obtém melhores resultados
se tentar. No nosso caso, quero que o ChatGPT
imagine que é um YouTuber com dez anos de experiência e um Em seguida, pedirei para reescrever o roteiro usando
essa perspectiva Agora vamos ver que
tipo de resultados
obtemos e compará-los com
a versão anterior. Tudo bem, vamos ler o resultado. Pessoalmente, gosto mais
dessa versão. Gosto muito de como o
roteiro começa com. Em 2026, a IA não substituirá você. Nesse momento, o espectador pode relaxar um pouco porque muitas pessoas realmente temem que IA
as substitua no futuro E então, apenas
alguns segundos depois, diz
o avatar,
alguém usando IA o fará. É aí que a sensação muda. O espectador pode pensar, espere, o quê? O que você quer dizer? E essa curiosidade faz com que
eles queiram continuar assistindo. O vídeo também termina com uma pergunta provocativa,
o que é ótimo Isso pode motivar as pessoas a deixar um comentário ou reagir ao vídeo, e isso naturalmente
ajuda no engajamento
e no algoritmo Vamos copiar o script
e colá-lo em um arquivo separado do Google Docs
para manter tudo organizado Voltaremos a este
documento no próximo módulo. E isso é tudo para esse modelo. Faça uma pequena pausa,
tome um café ou faça algumas
flexões, reinicie um pouco e
prepare-se para
o próximo módulo, prepare-se para
o próximo módulo onde transformaremos o
roteiro em uma narração Mostrarei como fazer isso
em 11 laboratórios de uma forma em que maioria das pessoas nem perceberá que
é uma voz gerada por IA. Veja no próximo módulo.
6. Módulo 4: Transformando scripts em fala - Transformando scripts em fala: Módulo quatro, geração de voz, transformando scripts em fala. Olá, pessoal, e
bem-vindos ao Módulo 4. No módulo anterior,
focamos em escrever um script que funcione
bem para avatares de IA Agora é hora de dar voz
ao roteiro. Neste módulo, veremos como transformar seu texto
em fala com som natural
usando a geração de voz por IA Essa é uma
etapa muito importante porque a voz desempenha um papel importante na sensação de credibilidade e conforto de
seu avatar Usaremos 11 laboratórios
para essa parte do fluxo de trabalho. 11 Labs é uma
plataforma de voz de IA que permite gerar fala
realista a partir de texto, trabalhar com diferentes estilos de
voz e controlar como a voz soa
e entrega seu roteiro. Ele suporta coisas como geração de
texto para fala, bibliotecas de
voz com diferentes
tons e personalidades, design de
voz e ferramentas de voz para conteúdos mais longos, como
audiolivros ou vídeos Você não precisa
usar todos os recursos. Vamos nos concentrar no
que é realmente útil para avatares de AA e dublagens em
vídeo Você pode se inscrever
gratuitamente em 11 laboratórios usando sua conta
do Google. Todo mês você recebe 10.000 créditos
gratuitos para geração de
voz. Para a maioria dos iniciantes, isso é mais do que suficiente
para começar. Na prática, essa
quantidade de créditos
geralmente é suficiente para criar
cerca de cinco ou seis vídeos, semelhantes ao que estamos
criando neste curso, então você não precisa se preocupar pagar por nada imediatamente. E acompanhe,
teste o fluxo de trabalho e veja como tudo funciona
usando o plano gratuito. Em nossos projetos anteriores, usamos 11 laboratórios em
muitos contextos diferentes Nós o usamos para
gravar dublagens para cursos
on-line, criar dialetos e narrações
para desenhos animados de IA, dar voz a vídeos do YouTube e conteúdos curtos
e produzir áudio limpo
e consistente
para diferentes tipos cursos
on-line, criar
dialetos e narrações
para desenhos animados de IA,
dar voz a vídeos do YouTube e conteúdos curtos
e produzir áudio limpo
e consistente
para diferentes tipos de vídeos. Não vamos abordar todos
esses casos de uso em detalhes
aqui, mencionei para contextualizar e mostrar o quão flexível essa ferramenta
pode ser em projetos reais. Este módulo se concentrará apenas
no que você precisa
agora , usando 11 voltas para transformar
seu roteiro em uma fala clara e
natural que funciona bem com
sincronização labial Você também encontrará um
link para 11 voltas no documento de recursos
do curso com links úteis
anexados a este curso Como sempre, não se preocupe em
memorizar cada configuração. Concentre-se em entender
o processo, como escolher uma voz
ou como pequenas mudanças no texto ou na entrega
afetam o resultado final. Ao final deste módulo, você poderá
transformar com confiança seu script em áudio
falado, pronto para
ser usado com seu avatar de IA Antes de começarmos a
gerar a narração, vamos dar uma olhada
rápida na biblioteca de voz em 11 No lado esquerdo da
tela, clique em Vozes. Aqui você pode explorar
uma grande variedade de vozes que
já estão disponíveis. 11 laboratórios também oferecem a
opção de clonar sua própria voz. Você pode carregar uma
amostra de áudio com sua voz e gerar narração
sem precisar gravar todas as Você notará que as vozes são organizadas de maneiras diferentes. Você pode navegar por idioma, estilos ou casos de uso, por exemplo, narração, mídia
social ou publicidade Você também pode filtrar
vozes por sexo, idade e outras características. Para o nosso caso, estamos
procurando algo mais próximo uma voz de mídia social ou de estilo
publicitário Eu já escolhi
uma voz para o meu avatar, mas não acho que você
precise usar a mesma. Reserve um momento para
explorar os filtros, ouvir algumas opções e escolher a voz
que você mais gosta. No final das contas, essa
parte é muito subjetiva. É principalmente uma questão de gosto. Agora vamos seguir em frente e começar a
gerar nossa narração. No lado esquerdo da tela, clique em conversão de texto em fala. Como eu disse, eu já escolhi uma voz para este projeto. É Alex, uma jovem voz masculina
americana. Aqui você também pode escolher
o modelo de geração de voz. Todos os
modelos disponíveis são bons e cada um foi projetado para finalidades
ligeiramente diferentes. Para o meu avatar, vou
usar o modelo gratuito V. No momento em que estou gravando
isso, é o modelo mais recente disponível. Se você estiver fazendo
este curso mais tarde e verá modelos
mais novos adicionados, uma boa regra geral é
experimentar o mais recente primeiro Na maioria dos casos, os modelos mais novos
oferecem melhor qualidade, entrega
mais natural ou
melhor comportamento de sincronização labial Agora vamos voltar
ao Google Docs onde salvamos nosso script de vídeo A partir daqui, podemos simplesmente
copiar o texto e colá-lo em 11 voltas para
gerar a narração No meu caso, esse script tem apenas menos de 900 caracteres e 11 voltas permitem
gerar até cinco K
caracteres de uma vez Tecnicamente, poderíamos gerar a narração inteira em um único arquivo de
áudio No entanto, há uma
coisa importante a se ter em mente. Posteriormente, usaremos esse áudio
para sincronização labial e não
queremos que nosso avatar fale
durante toda a duração do vídeo. Aplicaremos a sincronização labial
somente em partes específicas
do vídeo usando
diferentes ângulos de câmera que preparamos anteriormente. Em algumas seções, também abordaremos o avatar com imagens de estoque
ou imagens adicionais Outro motivo para
essa abordagem é o custo. Gerar vídeos longos com sincronização labial pode consumir muitos
créditos. Se você estiver fazendo
apenas um vídeo, isso pode ser totalmente bom. Mas se você planeja
criar muitos vídeos, dividir sua narração
em partes menores pode ajudar a economizar uma quantidade
significativa Então, por enquanto, vamos gerar a primeira parte da narração
e ouvir o resultado Em 2026, a IA não substituirá você. Essa frase se repete muito. Mas aqui está a parte que as pessoas pulam. Em 2026, a IA não substituirá você. Essa frase se repete muito. Mas aqui está a parte que as pessoas pulam. Com o modelo gratuito, 11 voltas geralmente oferecem duas
variações diferentes para
você escolher Não se preocupe com a qualidade do
som agora. Estou gravando minha tela, então o áudio que você
ouve é comprimido. Depois de baixar o arquivo, você ouvirá o quão boa é realmente a qualidade
final. Ouça as duas opções, escolha a que você
mais gosta e faça o download. Agora vamos pegar a próxima
parte do nosso roteiro, colá-la em 11 voltas
e clicar em gerar O processo de geração
é muito rápido, como você pode ver. Alguém usando IA terá o mesmo trabalho, mesmo título. Resultados muito diferentes. Alguém usando IA W. Mesmo emprego, mesmo título, resultados muito
diferentes. Depois de escolher as
opções que você mais gosta, baixe o arquivo de áudio e vá para a próxima
parte do script. Você simplesmente repetirá
o mesmo processo até que todas as partes do seu
script sejam geradas. Não vou gravar
todas as repetições aqui. O objetivo deste módulo é
mostrar o fluxo de trabalho e ajudá-lo a entender como abordar a geração de voz, sem perder tempo assistindo
às mesmas etapas
repetidamente. Vou terminar de gerar as partes restantes
em segundo plano
e, em seguida, avançaremos
para a próxima.
Agora , todas as partes do nosso roteiro foram
transformadas em dublagens Eu baixei
todos os arquivos em uma pasta separada apenas para manter tudo organizado e
fácil de trabalhar com eles posteriormente. Uma coisa importante
a ser observada aqui que eu baixei todos os arquivos no formato
wave. O
motivo é simples. Wave oferece a melhor qualidade de áudio
possível, o que é especialmente
importante quando você usa esse áudio para
lipsagem e animação Começar com áudio
de alta qualidade ajuda a evitar problemas posteriores e proporciona
melhores resultados finais. Tudo bem, neste momento, transformamos seu
roteiro em uma voz. Você viu como
escolher uma voz, como trabalhar com modelos de
geração e como preparar arquivos de áudio
limpos que estão prontos para
a próxima etapa. Você também aprende por que
geralmente faz sentido dividir um script em partes menores e como essa abordagem
pode economizar tempo, créditos e oferecer
mais flexibilidade posteriormente. Mais importante ainda, agora você tem arquivos de voz de
alta qualidade que funcionam bem para
animação e sincronização labial. No próximo módulo, pegaremos esses arquivos de voz e
passaremos para a sincronização labial. Você verá como
aplicar a sincronização labial na prática usando
diferentes ferramentas de IA e como o mesmo
áudio pode produzir resultados
diferentes
dependendo do fluxo de trabalho. Vamos comparar as ferramentas lado a
lado e falar honestamente
sobre o que funciona bem e o que não funciona
e no que prestar atenção ao escolher
uma solução de sincronização labial Quando estiver pronto,
vamos para o próximo módulo.
7. Módulo 5: Comparando ferramentas de IA: Módulo cinco,
sincronização labial na prática. Olá, pessoal, e
bem-vindos ao Módulo 5. Neste módulo, faremos
as dublagens do módulo anterior e faremos vídeos com sincronização
labial Aplicaremos o mesmo áudio
ao mesmo personagem
usando duas ferramentas de IA, Cling Avatar e Hagen, para que possamos comparar claramente como cada uma lida com a sincronização
labial e o movimento. O objetivo aqui não é
encontrar uma ferramenta perfeita, mas entender a
diferença e escolher o resultado
da sincronização labial que
funciona melhor para o nosso vídeo. Ao final deste módulo, selecionaremos a versão final e a usaremos na última
etapa da edição. Vamos voltar ao Google Docs, onde salvamos nosso script No módulo anterior, geramos a narração em 11 voltas trabalhando com o
roteiro em Para cada peça de áudio, anotei qual foto de avatar ou filmagem de arquivo a
acompanhará Então, basicamente acabamos com um storyboard
escrito simples Planejei a ordem das fotos do
avatar para manter as coisas movimento e evitar ficar
em um ângulo por muito tempo. Eu também gero
alguns ângulos extras e escolho os
que eu mais gosto. Para este vídeo,
usarei três ângulos principais, uma vista frontal, um
pequeno ângulo lateral e uma foto ligeiramente de cima para baixo, e alternaremos
entre eles para manter o vídeo
dinâmico e envolvente. Agora vamos passar
para o site de links de IA. No canto superior esquerdo,
clique em Ferramentas de IA. Como mencionei anteriormente, clink oferece uma ampla variedade
de ferramentas e modelos Mas para esta lição, estamos interessados apenas em
Avatar two point oh, ou simplesmente no modelo de Avatar
mais recente disponível se você
assistir a este curso mais tarde. A equipe do link Luis
atualiza com bastante frequência, então usar a versão mais recente geralmente
é uma escolha segura. Você também vê que esse link oferece
um conjunto de avatares pré-fabricados. Eles podem ser úteis para
testes rápidos ou tarefas de curto prazo. Mas para este projeto,
estamos adotando uma abordagem mais profissional e usando nosso próprio Avatar personalizado. Clique em Carregar imagem à esquerda
e faça o upload da imagem do seu avatar Depois que a imagem for carregada, faça o upload da sua primeira narração
clicando em Carregar áudio Antes de gerar o vídeo, você pode escolher a
resolução de saída HD ou full HD. Eu geralmente escolho a opção
mais alta disponível. Custa mais
créditos, é claro, mas oferece a
melhor qualidade possível, o que é especialmente importante para avatares que falam de perto Uma
geração de sincronização labial em full HD custa 48 créditos, o que não é barato, mas a sincronização
labial em geral um pouco mais cara do que a geração
normal de vídeo. Abaixo, você verá uma opção
para adicionar um prompt se
quiser descrever o
comportamento dos avatares com mais detalhes Em muitos casos, o clink sugere
automaticamente um prompt
e, pela minha experiência, ele realmente funciona muito bem Para manter as coisas simples, usaremos o prompt
sugerido e veremos se os resultados estão corretos Vamos seguir em frente e verificar qual ângulo do
Avator vem a seguir
em nosso storyboard Agora vamos voltar a clicar, fazer o upload da próxima
parte do nosso áudio, clicar em Carregar imagem, selecionar o
ângulo do avatar e fazer o upload Em seguida, repetimos o mesmo processo para as partes de áudio restantes. Tudo bem, está tudo pronto. Todas as peças do nosso quebra-cabeça
estão agora em geração. Tudo o que resta a fazer é pesar o resultado e ver
como tudo acabou. Tudo bem, nossos vídeos
são gerados. Então, vamos dar uma
olhada no que temos. Em 2026, a IA não substituirá você. Essa frase se repete muito, mas aqui está a parte que as pessoas pulam Então, o que você acha?
Em comparação com a versão anterior, link claramente melhorou o realismo da emoção do
Avatar Já está muito melhor e acho que só vai
continuar melhorando a partir daqui. Pessoalmente, gosto do resultado. Os dialetos parecem vivos, não chá ou plástico Vamos seguir em frente e verificar
a próxima geração. Alguém usando IA W.
Mesmo trabalho. Mesmo título. Resultados muito diferentes. Alguém usando IA W. Mesmo emprego, mesmo título. Resultados muito
diferentes. Alguém usando este
também parece muito bom. Não vejo nenhum
defeito ou artefato perceptível aqui, então acho que podemos guardá-lo
com segurança Vamos continuar e
ver o que temos a seguir. Um desenvolvedor sem IA escreve
tudo do zero. Um desenvolvedor com
IA entrega mais rápido, corrige bugs mais cedo e
se concentra em problemas reais. Hm. Esse eu gosto um pouco menos. Durante o giro da cabeça,
parece que a cabeça fica
um pouco menor. Não é um problema crítico. Então, por enquanto, vou mantê-lo, mas é algo que você deve
conhecer. Vamos seguir em frente. Então, em 2026, a questão
não é se a IA aceitará meu emprego. Então, em 2026, a questão
não é se a IA aceitará meu emprego. Essa geração parece ótima. Definitivamente vou manter
este e seguir em frente. A questão é:
Tudo bem, e aqui
temos uma foto rápida que funciona bem como uma transição. Isso se encaixa perfeitamente no nosso vídeo. Será você quem o
usará ou
competirá contra ele? De que lado você está? Tudo bem. Agora, digamos que todos
os clipes estejam em uma pasta Como você pode ver,
aplicar a sincronização labial ao nosso avatar é um processo bastante
simples Em seguida, faremos a mesma
coisa em outro aplicativo, Hagen, que atualmente é um
dos líderes em sincronização labial. Vamos comparar os
resultados e depois escolher as melhores fotos
para o nosso vídeo final. Hagen é uma
plataforma de IA focada na criação de avatares falantes
e vídeos com sincronização labial É amplamente usado para conteúdo
educacional,
marketing, vídeos e mídias sociais, e é conhecido por resultados
estáveis de sincronização labial
e fluxo de trabalho fácil de usar. A última vez que usamos o Hagen
foi há cerca de quatro meses. Naquela época, nós o usávamos para criar vídeos
curtos para o
YouTube e o TikTok, bem
como filmes curtos Desde então, a Hagen
lançou um novo modelo, e é exatamente isso que
vamos testar hoje. Hagen tem limites de
quantos avatares você pode criar,
dependendo da sua assinatura, e Avatares adicionais
exigem pagamento extra Eu já atingi
o limite da minha conta, então minha esposa registrou
uma conta separada. Dessa forma, podemos mostrar
adequadamente o processo completo de criação do Avatar em Hagen e
percorrê-lo passo a passo. Hagen oferece vários
planos de
assinatura , incluindo um gratuito. Com o plano gratuito, você pode
criar algumas gerações e ter
uma ideia de como o serviço funciona antes de se
comprometer com qualquer coisa Para esta lição, estamos
usando o plano de 25 euros, principalmente para testar adequadamente o novo modelo e
mostrar o processo. Também porque três vídeos gratuitos não
seriam suficientes
para o exemplo de hoje. Também queremos obter a
melhor qualidade possível. Esse conjunto, sua configuração
pode ser diferente. Em alguns casos, uma assinatura do
Clink por si só pode já ser suficiente Isso realmente depende das
suas necessidades e do seu fluxo de trabalho. Tudo bem, agora vamos
continuar criando nosso avatar. No lado esquerdo da
tela, clique em Avatares. Aqui, você verá que Hagen oferece duas
opções principais para você escolher. Você pode clonar uma pessoa
real, por exemplo,
você mesmo, ou criar um
personagem virtual a partir da imagem No nosso caso,
optaremos pela segunda opção. Crie um
personagem virtual a partir da imagem, pois isso se adapta melhor ao
nosso fluxo de trabalho. Em seguida, carregamos
nossa imagem de avatar. Como você pode ver, os agentes mostram exemplos de quais
imagens funcionam melhor, mas nossos avatares são perfeitamente
adequados para lipsing, então não há nada com que
se preocupar Clique em Carregar e vá
para a próxima etapa. Aqui, inserimos as
informações básicas do nosso Avatar. Não há nada de especial aqui, então você não precisa gastar
muito tempo nessa parte. Nosso Avatar agora está criado. Para adicionar voz, clique
no Avatar
e, em seguida, clique em ZEN Video. Você verá muitas opções
diferentes aqui. Você pode usar vozes
da Biblioteca de Hagen Pelo que me lembro, eles recentemente fizeram uma parceria
com 11 Labs, que usamos para nossa narração Mas como nosso áudio já
está pronto, faremos o upload do nosso próprio arquivo. Clique em Carregar áudio
no canto superior esquerdo. Faça o upload do primeiro arquivo de áudio
e veja como ele soa. Em 2026, a IA não substituirá você. Essa frase se repete muito, mas aqui está a parte que as pessoas pulam Se tudo parecer
bom, clique em Out Audio. Depois que o áudio for adicionado, vá para o canto superior direito,
clique em Gerar vídeo, verifique se todas as
configurações estão definidas para a qualidade
máxima e se não
há marca d'água e clique em Enviar Tudo bem, enquanto o
vídeo está sendo gerado, podemos seguir em frente e criar
a próxima sincronização labial. Aqui eu seleciono os
seis arquivos de áudio, que eu marco no Google Docs como aquele que deve ser
usado com esse avatar Assim como antes,
clicamos em Gerar, verificamos se todas as configurações estão definidas com a mais alta qualidade
disponível
e, em seguida, clicamos em Enviar. Enquanto aguardamos
a próxima geração, vamos dar uma olhada no
resultado da primeira. Em 2026, a IA não substituirá você. Essa frase se repete muito, mas aqui está a parte que as pessoas pulam Para mim, parece muito realista. Tenho certeza de
que a maioria das pessoas, se vissem esse
avatar em seus pés, nem perceberiam
que é IA. Agora, vamos compará-lo com o mesmo vídeo criado no Clink Em 2026, a IA não substituirá você. Muitas vezes essa linha. Um substituto. Essa frase se repete muito. Mas aqui está a parte que as pessoas pulam. Na versão Klink, o rosto
parece um pouco mais plástico e as emoções
parecem um pouco mais expressivas em comparação com o resultado
de higiene O que você acha? Agora, vamos dar uma olhada na
segunda geração. Então, em 2026, a questão
não é se a IA aceitará meu emprego. Bom. Eu realmente gosto
desse de novo. E vamos também compará-la com a versão
criada no link. Então, em 2026, a questão
não é se a IA aceitará meu emprego. Então, em 2026, a pergunta
é se a IA não aceitará meu emprego? Na versão clink,
os ladrões de Avatar não são visíveis e a qualidade geral parece um pouco menos detalhada
em comparação com Hagen não esconde o ladrão
e, por causa disso, o resultado
parece mais natural para mim. No geral, acho que prefiro
a versão Hagen aqui. Tudo bem, criamos
dois vídeos de sincronização labial. Agora precisamos criar o próximo usando
uma imagem de
avatar diferente. Para isso, voltamos à seção
Avatar para
criar um novo Avatar, clicamos em Nova Aparência, carregamos
a próxima imagem do avatar e clicamos em Criar Aparência. Usando o mesmo processo,
vamos também criar nosso terceiro e último
Avatar fazendo
o upload da próxima imagem e
clicando em Criar Look Agora pegamos nosso segundo Avatar e passamos a
criar a sincronização labial. Vamos verificar o Google
Docs para ver quais arquivos
de áudio devem ser
usados para esse Avatar Ok, aqui temos duas faixas de áudio que
precisam ser aplicadas. Antes de aplicá-las, vamos verificar
rapidamente. IA não substitui Um desenvolvedor sem IA escreve
tudo do zero. Um desenvolvedor com
IA entrega mais rápido, corrige bugs mais cedo e
se concentra em problemas reais. Sim, é exatamente disso
que precisamos. Nós carregamos o áudio e o adicionamos. Em seguida, seguimos o
mesmo processo familiar. Clique em Gerar, adicione a
descrição, se necessário, e verifique se todas as configurações estão definidas com a qualidade máxima. Dessa vez, a geração
custou créditos gratuitos, já que o arquivo de áudio é um pouco maior que o
anterior. Tudo bem. No meu caso, tenho créditos
suficientes. Em seguida, clicamos em Gerar. Tudo bem, quase
tudo é gerado. Vamos dar uma
olhada no que temos. Um desenvolvedor sem IA escreve
tudo do zero. Um desenvolvedor com
IA entrega mais rápido, corrige bugs mais cedo e
se concentra em problemas reais. Eu, isso parece muito bom. Não há deformação da cabeça,
como vimos no Klink. Vamos comparar as duas versões. Um desenvolvedor sem IA escreve
tudo do zero. Um desenvolvedor com
IA entrega mais rápido, corrige bugs mais cedo e
se concentra em problemas reais. Honestamente, ambas as opções poderiam ser usadas com um pouco de trabalho de
pós-produção,
mas, mais uma vez, Hagen é minha
favorita aqui. Vamos seguir em frente. A questão é,
a questão é, aqui, tudo parece bem. Este clipe é muito curto para realmente comparar,
então vamos seguir em frente. Alguém usando AI W, mesmo trabalho, mesmo título. Resultados muito diferentes. Este também ficou ótimo. Sem falhas estranhas ou gestos estranhos do avatar
. Vamos comparar essa versão com a gerada no clink Alguém usando AI Will, mesmo trabalho, mesmo título, resultados
muito diferentes. Alguém usando AI Will, mesmo trabalho, mesmo título. Resultados muito diferentes. A versão clink é um
pouco mais expressiva. Em alguns casos, isso
pode funcionar bem, mas por causa dessa
expressividade, fica um pouco mais
perceptível que é IA Agora vamos dar uma
olhada na geração final. Será você quem o
usará ou
competirá contra ele? De que lado você está? Será você quem o usará ou competirá contra ele? De que lado você está? Essa acabou sendo
uma ótima cena de encerramento para este vídeo com uma pergunta que funciona como um apelo à ação, incentivando os espectadores
a deixarem um comentário. Na minha opinião, Hagen
lida com isso muito bem. E mesmo assim, sou um
grande fã do Klink, que eu pessoalmente uso para
cerca de 80% das minhas tarefas Quando se trata de avatares
realistas, Hagen atualmente se sente
mais forte para mim Dito isso, se você estiver criando um avatar em estilo de desenho animado ou se tiver apenas uma assinatura de
link, ou precisar aplicar sincronização labial a uma foto em um projeto animado, o
link faz um ótimo trabalho Eu o usei muitas
vezes nesses casos e definitivamente posso recomendar
para esse tipo de trabalho. Agora vamos baixar todos os
arquivos em uma pasta separada. Você viu o
processo completo e os resultados
e, a partir daqui, pode decidir o que funciona melhor para
sua própria situação. Meu objetivo era mostrar
as opções disponíveis. Tudo bem, vamos
encerrar este módulo. Já terminamos de
falar sobre avatar. Restam apenas
algumas peças, criando música de fundo
para nosso vídeo usando AA
e, em seguida, reunindo tudo
na pós-produção. Estamos quase
na linha de chegada. Se você chegou até aqui, não
há razão para avançar agora, S no próximo módulo.
8. Módulo 6: criando som de fundo: Módulo seis, AI
Music na prática. Olá e bem-vindo
ao próximo módulo. Neste módulo, vamos nos
concentrar em gerar música de
fundo para
nosso vídeo usando AA. Mostrarei com que
rapidez crie músicas que se adaptem ao
clima e ao ritmo do
nosso vídeo de avatar sem
passar horas
pesquisando nosso vídeo de avatar sem em bibliotecas de música padrão Usaremos duas ferramentas de IA com
as quais eu trabalho pessoalmente e também
usaremos o ChatGPT para
nos ajudar a escrever um aviso claro para
o tipo de música de que precisamos O objetivo aqui não é
criar uma trilha sonora perfeita, mas gerar uma
música de fundo limpa e
utilizável que suporte o vídeo e funcione
bem na edição final Tudo bem, para entender
que tipo de música funciona melhor para esse tipo de
vídeo, vamos perguntar ao JAGPT Quando você está criando esse tipo de conteúdo pela primeira vez, é totalmente normal
não saber qual música é realmente popular ou
funciona bem nesse formato. Então, em vez de adivinhar,
usaremos o JAGPT para nos ajudar a descobrir e nos dar algumas boas instruções Ok, vamos dar uma
olhada nas opções que o
JAGPT criou. De todas as opções, eu gosto mais do segundo sutil sutil sublinhado
cinematográfico Ja GPT mencionou que
esse estilo funciona muito bem para
falar em público,
e eu concordo que ele suporta a voz sem
distraí-la Então, vamos dar o próximo passo. Vou pedir ao JAGPT
que escreva um prompt para gerar música exatamente
nesse estilo Ok, aqui está nosso aviso. Vamos copiá-lo e usá-lo em duas ferramentas de IA diferentes para
gerar música de fundo. O primeiro aplicativo que
vamos usar é o Sona. Sona é uma ferramenta de IA
usada principalmente para gerar
música a partir de texto Prompt Você pode criar música de fundo, música completa, instrumentais
ou faixas atmosféricas simples, ou faixas atmosféricas simples, tudo isso apenas descrevendo o clima e
o estilo É especialmente popular para música de
fundo para vídeos, conteúdo de mídia
social,
demonstrações e experimentos, ideias musicais
fracas sem a necessidade de habilidades de produção
musical Uma coisa que eu realmente gosto Sona é que ele é
muito fácil de usar Você não precisa entender a teoria
musical ou mexer
com configurações complexas Você apenas descreve o que
deseja e isso lhe dá um resultado. No nosso caso,
usaremos o Sona para gerar uma música de
fundo cinematográfica
sutil que suporte a voz e não
distraia a Usaremos o mesmo prompt que
preparamos anteriormente,
geraremos a música e depois a compararemos com outra ferramenta de IA para ver qual resultado se encaixa melhor em
nosso vídeo. Vamos falar rapidamente sobre as assinaturas do
SNA, incluindo uma
opção gratuita e paga com mais
créditos Nosso objetivo neste curso, gerar uma
música de fundo curta para vídeo, o plano gratuito é totalmente suficiente. Você já pode criar músicas, testar instruções e ter uma ideia
de como tudo funciona Se mais tarde você decidir gerar muitas músicas e precisar de direitos
comerciais, você sempre poderá atualizar. Mas para seguir
este curso, você não precisa pagar nada. Vou vincular o link à
Sun e ao produtor AA, nos recursos do curso e arquivo
Pin, para que você possa encontrá-lo
facilmente mais tarde. Segundo aplicativo, como você já
tem, é o produtor AA. Não é tão popular quanto o SNA, mas eu o uso
há muito tempo Ele tem todos os recursos que eu pessoalmente preciso para meu fluxo de trabalho. Quando se trata de assinatura, produtor AA é um pouco
mais barato que o Suna, a
diferença não é grande Também existe um plano gratuito, que é mais do que
suficiente se você estiver gerando músicas apenas para uso
pessoal ou aprendizado. Atualmente, estou no plano
Startup por oito dólares porque uso a música para projetos
comerciais Mas esse é um tópico separado. Para este curso, a
versão gratuita é totalmente adequada. O ponto principal aqui é
comparar o resultado e ver qual ferramenta se adapta melhor ao seu
estilo e fluxo de trabalho. Você pode ver, eu gerei uma lista
bastante longa
de faixas aqui. Na verdade,
existem muitos deles. A última vez que
gerei música no Producer AI foi há algumas semanas, mas tudo ainda está
seguro e fácil de acessar. Com o tempo, isso
se torna muito útil. Você cria sua própria pequena biblioteca de faixas que pode ser reutilizada, comparada ou
inspirada posteriormente Tudo bem, vamos
começar a gerar. Primeiro, na IA do produtor,
clique em Nova sessão. Na janela de bate-papo exibida,
passe a solicitação que recebemos anteriormente do ChatGPT e clique em
Enviar Enquanto a música está sendo gerada lá, vamos mudar para o Sona No Sona, vá para o
canto esquerdo e clique em Criar. Só precisamos de
música de fundo sem vocais, então certifique-se de
selecionar instrumental Agora cole o mesmo
prompt e clique em Criar. Dessa forma, você está
gerando vídeos em duas ferramentas diferentes
ao mesmo tempo usando exatamente
o mesmo prompt, que tornou a
comparação muito mais clara Ok, vamos ouvir o que o
produtor Rey nos deu. Hmm. Não é ruim, mas parece um pouco chato demais, talvez até um pouco chato. Vamos tentar torná-lo mais
interessante e adicionar mais bits. Enquanto esperamos
pela nova geração, vamos ouvir o que a
Sona criou para nós R : Na verdade,
gosto muito da última parte da faixa. Acho que se encaixa muito bem no nosso
vídeo. Então, vamos fazer
o download. Como você pode ver,
com o plano gratuito, você pode baixar a faixa
somente no formato gratuito MP. Mas, para o nosso vídeo, isso é
mais do que suficiente. Não precisamos de nada
mais complexo aqui. Tudo bem, vamos
finalizar esse módulo. Neste módulo, criamos
um script para nosso vídeo, descobrimos que tipo de música de
fundo funciona melhor para nosso formato e geramos música
usando diferentes ferramentas de IA. Comparamos os resultados, escolhemos o que gostamos e agora
temos todas as peças principais prontas. Só
resta um quebra-cabeça , juntando
tudo. No próximo módulo,
passaremos para a
pós-produção e montaremos
o vídeo final no Capcat É aí que tudo
se junta. Veja no próximo módulo.
9. Módulo 7: montagem final na prática — como editar o vídeo no CapCut: Módulo sete, editando
o vídeo no CapCut. Bem-vindo ao módulo final. Neste módulo,
analisarei
meu próprio projeto de vídeo
e mostrarei como tudo se
encaixa no CapCut Analisaremos passo a passo os principais recursos que
usei, desde a colocação do visual e
a narração até a
adição de música e pequenos
retoques finais adição de música e pequenos Não pretendo mostrar
uma edição perfeita aqui. O objetivo é compartilhar um fluxo de trabalho
claro e prático para que você possa entender a lógica e depois experimentar por conta própria. Tudo bem,
vamos para o CapCut. Primeiro, vou mostrar o resultado
final que obtive. Depois disso,
examinaremos tudo
passo a passo e detalharemos
tudo juntos. Em 2026, a IA não substituirá você. Alguém usando IA terá o mesmo trabalho, mesmo título, resultados muito
diferentes. Um designer sem IA passa o dia
todo em um conceito. Um designer com inteligência artificial explora dez direções antes do almoço
e refina a melhor Um desenvolvedor sem IA escreve
tudo do zero. Um desenvolvedor com
IA entrega mais rápido, corrige bugs mais cedo e
se concentra em problemas reais. A IA não substitui as profissões. Ela substitui a hesitação. Ele substitui a resistência. Ele substitui as pessoas que esperam. Então, em 2026, a questão
não é se a IA aceitará meu emprego? A questão é:
será você quem o usará ou
competirá contra ele? De que lado você está? Tudo bem, foi assim que minha versão
final ficou. Não sei se você
percebeu, mas durante a edição, achei que o roteiro
original era um pouco longo demais e um pouco
chato no início Então eu cortei a abertura e cortei uma pequena
parte do roteiro
e, honestamente, está
muito melhor Nem todo mundo assistirá a um vídeo de 1
minuto até lá, e nosso objetivo é transmitir a ideia principal com clareza,
não prolongá-la. Então, aqui está o que eu fiz a seguir. Importei uma pasta com todos os arquivos que eu precisava
para este projeto. Também baixei alguns
videoclipes de estoque. Também poderíamos ter gerado
aqueles com IA,
mas, nesse caso, baixar imagens de
estoque foi simplesmente mais rápido Estou usando esses clipes
para preencher a parte do script em
que o
avatar do token não está visível Eu dividi a tela
em duas partes. No topo, coloco um clipe de estoque
e, abaixo dele, o avatar. A ideia aqui é evitar
a primeira reação
de Isso parece chato. Ignorar. Em vez disso, o espectador tem algo para
ver imediatamente, o que ajuda a manter
sua atenção. Também adicionei um pouco de movimento à primeira foto com
o avatar simbólico, um efeito de zoom sutil Para fazer isso no CapCut, vá até o primeiro quadro do clipe e adicione um quadro-chave Em seguida, vá até o
final do clipe, aumente
levemente a escala até o nível desejado e adicione
outro quadro-chave Isso cria um
zoom suave que adiciona um pouco de vida e
energia à foto. Em seguida, mudo para outra
foto do avatar, mas de um ângulo diferente. Logo depois disso,
adiciono um atalho a
um clipe de estoque em tela cheia e, em seguida, trago o layout de volta para
a tela dividida. Todas essas pequenas
transições e mudanças ajudam a manter a atenção dos
espectadores, e essa é realmente a parte
mais importante Se você não chamar a atenção de
alguém nos primeiros ou nos 2 segundos, provavelmente essa pessoa não
ficará por aqui para ver
do que trata o vídeo
ou o que vem a seguir. Portanto, o objetivo aqui
não é ser sofisticado. É para manter o
vídeo visualmente vivo e dar aos espectadores um
motivo para continuar assistindo. Depois disso, mudo
para um lábio padrão que apóia
visualmente a
parte sobre designers. Isso ajuda a reforçar
a mensagem e torna a ideia mais clara sem explicar
demais Foi também aqui que
recebi a primeira dica
sutil para me inscrever, um pequeno adesivo colocado
em um local visível A chave aqui é mantê-lo
leve e mais intrusivo. Você não quer se esforçar demais pois isso pode facilmente
afastar as pessoas. Pense nisso mais como
um lembrete gentil, não como um apelo à ação
gritado para o espectador Depois disso, eu não
compliquei demais. Eu mantenho o layout simples, uma tela dividida com
uma borda padrão na parte superior, legendas e o avatar falante
mostrado de outro ângulo Então, decidi
dar ao espectador uma pequena pausa para não
ver o rosto do meu avatar. Nessa parte, achei que as palavras em si
eram fortes o suficiente, então usei uma abordagem visual
mínima, com um texto
grande aparecendo
em um fundo preto. Selecionei o texto,
fui para a animação e escolhi uma animação de zoom com a maior duração
possível Repeti a mesma configuração
para todas as três palavras. Isso cria uma
pausa nítida no visual,
permite que a mensagem chegue e ajuda a
redefinir a atenção do espectador
antes de prosseguir Em seguida, passamos para a parte
final do vídeo. Aqui, o avatar
aparece em tela cheia com diferentes ângulos de câmera
alternando pela cena Também alterno
essas fotos com efeito de zoom
sutil em quadros
mais estáticos usando
uma visão mais próxima da câmera. Isso ajuda a manter o
final visualmente interessante e evita que
pareça plano ou repetitivo Outro elemento importante
aqui é a música de fundo. A faixa que escolhemos
tem um tom bastante dramático, então baixei um pouco o
volume O objetivo é que a música
fique em segundo plano, apoiando o clima sem
se distrair da voz Honestamente, essa parte
nem é obrigatória. Você sempre pode
adicionar músicas mais tarde, diretamente no TikTok ou Eu quero mostrar principalmente o processo de geração de música
como parte do fluxo de trabalho. Quer você o use em
seu próprio projeto ou não
, depende totalmente de você. O próximo
detalhe muito importante são as legendas. Para criá-los no CapCut, acesse o texto na
parte superior da tela Escolha legendas automáticas, selecione inglês como idioma
e clique em Gerar CapCut tem uma
biblioteca muito grande de estilos de legendas, fontes, animações e
layouts
diferentes para todos os Se você estiver editando no CapCut, eu recomendo
passar algum tempo explorando-os e escolhendo o que parece certo para o seu estilo Outro elemento importante são
as transições entre clipes. Assim como as legendas, o CapCut oferece uma grande variedade
de transições Você pode encontrá-los
clicando nas transições na parte superior da tela.
Não os use demais. Algumas transições simples
geralmente funcionam melhor. E às vezes
também é útil lembrar gentilmente o espectador de
curtir ou se inscrever. Para isso, podemos usar adesivos. Você pode encontrar adesivos
ao lado da seção de transição Existem muitos deles, e novos são
adicionados o tempo todo,
setas, destaques, contornos,
chamadas e Eles podem ser muito úteis
quando você quer apontar para algo específico na tela ou guiar a atenção do espectador. Reserve um tempo para
explorar a seção. É mais poderoso do que
parece à primeira vista. E a última
etapa final é a mixagem de áudio. dublagens de IA
já são muito boas, mas ainda não são perfeitas Às vezes, você ouvirá pausas
mais longas entre as fases, então é uma boa ideia cortar
a parte do áudio para
torná-la mais natural No ponto em que
dois clipes de áudio se encontram, geralmente
adiciono uma saída
curta de fade no final
do primeiro clipe e fading
suave no
início do próximo Em alguns casos, eu até
sobreponho um pouco o eclipse de áudio. Isso ajuda a evitar pausas incômodas
e mantém o fluxo em andamento. Como estamos trabalhando
com vídeos curtos, ritmo e a rima realmente importam, e essas são basicamente
todas as técnicas que usei para criar esse vídeo Então, sim, parabéns. Você chegou ao final do
curso. E isso é um embrulho. Neste curso, você aprende
como passar de uma ideia a um pequeno vídeo finalizado usando
AA, criando um avatar, gerando imagens,
escrevendo um roteiro, adicionando voz e música
e, finalmente,
juntando tudo na pós-produção Obrigado por escolher nosso curso. Nós realmente tentamos compartilhar
nossa experiência real, não a teoria, mas um fluxo de trabalho
prático
que você pode realmente usar. Este curso lhe
deu novas habilidades úteis Agradeceríamos muito se você deixasse uma avaliação positiva. Isso nos ajuda a crescer e continuar criando
conteúdo prático e honesto como esse. E se você gosta de
continuar aprendendo, fique à vontade para conferir
nossos outros guias e continuar desenvolvendo suas
habilidades nesse sentido. Obrigado novamente por estar
aqui, sua Bros Academy.