Transcrições
1. Introdução: Olá a todos. Bem-vindo ao
curso de clonagem de voz feito por mim, Ahad Dragon, também conhecido
como Ahad De qualquer forma, vou te ensinar esse incrível
software RVC que
existe e é o software de clonagem de voz mais
realista que existe no momento É melhor até do que 11 laboratórios e outras coisas que você já deve
ter ouvido falar do RVC Significa conversão de voz
baseada em recuperação e eu vou
te ensinar como você
vai utilizá-la e usá-la
da melhor maneira possível. Então, qual é a estrutura central que vou te ensinar? Bem, bem, essa é a estrutura
principal. Em primeiro lugar, vou
te ensinar como instalar o RVC localmente no seu PC Vamos explicar passo a
passo como você pode instalá-lo
com sucesso e ele também funciona para Mac e
Windows. Em segundo lugar,
vou te ensinar e explicar toda a interface de
usuário ou interface de usuário do RVC E você
precisará
entendê-los antes de fazer
qualquer tipo de coisa,
caso contrário, não conseguirá nem mesmo
clonar sua voz Em seguida,
extrairemos a quantidade necessária dados
de voz limpos sem
nenhum ruído de fundo. E então, no final, vamos treinar
o modelo de voz. E vou explicar
cada seção para que
você evite os erros,
os erros comuns
que todo mundo comete, inclusive eu quando
comecei toda essa jornada, depois de clonarmos
o modelo de voz No final do software, mostrarei as aplicações para usar esse próprio modelo
de voz, incluindo as músicas cover de IA mais
populares. Aposto que todos vocês querem
fazer alguns covers de IA, especialmente com sua própria
voz cantando em espanhol ou japonês ou qualquer outro tipo
de idioma que você possa imaginar. Isso não seria possível se eu não te ensinasse como
fazer com que soasse perfeito. Porque mesmo que você
faça sua capa, se soar estranho,
então qual é o objetivo Precisa soar
exatamente como sua voz. Porque há muitos detalhes
que você precisa aprender
ao fazer seus
covers de I ou qualquer
outra coisa, como convertê-los de mulheres
para homens ou vice-versa. No final de todo
esse curso, vou te ensinar
como usar essa voz,
o
modelo de voz clonada, em tempo real Essa é a parte mais
intrigante para mim. Sim,
haverá um projeto de classe no qual você terá que
clonar sua voz E depois de
clonar sua voz, você precisa usá-la de forma perfeita e adequada para fazer
uma música cover de I. E sim, então é isso e vamos direto ao curso.
2. Instalando o RVC: Gente, bem-vindos à primeira parte dessa aula
de clonagem de voz A primeira coisa que
vamos fazer é instalar o software RVC. Vamos
direto ao assunto. Você precisa
primeiro ir ao Google e digitar get RVC. Sim. Em seguida, você rola para
baixo até ver sua conversão de
voz baseada em Cheval, que significa RVC Então você tem que
descer até ver a coisa verde que diz Últimas aqui e
atualizada. Clique nele. Então você tem duas versões, para usuários do Vida GP
ou usuários do AMD Oriental GPA Placa gráfica Nvidia. Faça o download do arquivo acima. Caso contrário, se você
tiver o AMD Oriental baixe o que está na parte inferior. Como eu tenho o Vida,
vou baixar este e depois vou
esperar que ele seja instalado. Eu já o instalei. Eu vou pular essa parte. Mas, basicamente, o que
você vai
fazer é, depois de instalado, extraí-lo. E então você terá uma
pasta que diz RVC beta 0717 ou qualquer versão que você tenha baixado
ou algo parecido Você clica duas vezes nele. Você precisa rolar para baixo até
encontrar a coisa que diz Go Web Bat e escrever, clicar nela, mostrar
mais opções se estiver usando o Windows 11
e enviar para a área de trabalho. motivo pelo qual temos que fazer isso é
porque não queremos
acessar a pasta toda
vez que queremos iniciar o RVC Você escreve, clica nele
se quiser e pode alterá-lo para RVC. Eu
já fiz isso. Como você pode ver aqui, eu
já tenho meu RVC instalado. Então você tem que fazer isso e então você
instalou o RVC com sucesso Continue na próxima
parte do vídeo.
3. Como clonar sua voz: Tudo bem então. Agora que
você instalou o RVC, é hora de
clonar sua voz Bem, antes de começarmos a usar o RVC, você precisa realmente ter
os dados da sua voz Ou você grava sua voz ou se você tem alguma outra antiga, como notas de voz que você tinha. Você pode simplesmente
misturá-los em um software de edição e
depois cloná-lo Mas ele precisa estar limpo e alta qualidade, sem
nenhum ruído de fundo. Se você não tem
isso, vá em frente e pegue o melhor microfone
que você tem em casa. Seja o seu telefone
ou como este microfone aqui. Sim, vá em frente e grave. Você pode gravar sua
voz talvez como um gravador de voz em seu
telefone ou em qualquer outro lugar. Como você pode ver
agora, eu já
gravei minha voz anteriormente, então já me preparei
para que ela seja clonada Então, aqui você pode ir
em frente e
ouvir como eu estou falando. Meu nome é Ah
Dragon. Olá pessoal. Portanto, este é um bom exemplo de como os dados de voz devem soar sem nenhum
ruído de fundo e em alta qualidade. Tudo bem, então vamos
começar o RVC. Então você clica duas vezes nele e
então você verá um comando, um CMD, abrir e você
apenas espera por ele aqui Você tem que ter um pouco de paciência. Pode levar um
ou dois minutos para funcionar. Então, como você pode ver agora, ele abrirá no
seu navegador padrão. No meu caso, ele abriu no Google Chrome. E aqui estamos. Então, quando o RVC for iniciado, você ficará surpreso quantas configurações e
opções você tem Mas não se preocupe,
explicarei tudo em breve. Tudo é fácil. Você só precisa
entendê-los. Eles são todos um monte de
textos e muitas coisas, mas você não
precisa necessariamente ajustar tudo aqui. Você tem inferência de modelo aqui. Você poderá usar seu modelo depois de treiná-lo. Aqui, usaremos
isso para remover os vocais das músicas e também remover os instrumentos
das músicas para que você possa criar uma
capa de IA da sua voz E aqui no Train Tab você poderá
clonar sua voz É aqui que vamos começar. E aqui é como uma coisa
experimental em que você pode pegar dois modelos de voz,
misturá-los e obter um modelo de voz
único, como em fantasias ou animes
como Dragon Ball Se você assiste Dragon Ball
ou gosta de Goku e Vigita, eles se fundem e então eles têm uma voz única
ou algo parecido Sim, e aqui na exportação, não
tenho certeza do que é isso, mas acho que o ON X é
algum tipo de software. Então, aqui você pode exportar
seu modelo de voz para o ONNX. E aqui você tem algumas perguntas
frequentes, mas na minha experiência, elas não são realmente úteis. Se você tiver alguma dúvida, terei respostas melhores
para elas do que aqui. Aqui, acho que é
apenas um conhecimento geral caso você tenha algum problema. Mas nem todo erro
está listado aqui. De qualquer forma, é aqui que
começaremos na guia trem. Então, vamos para
a aba do trem. Como você pode ver,
haverá muitas coisas. Vamos começar
do topo até o fundo,
onde, na verdade, vamos começar a
treinar a voz. Primeiro de tudo, primeiro passo, precisamos nomear nosso modelo de voz. Aqui você precisa se
certificar de não usar caracteres
especiais além sublinhado ou talvez
um sinal de menos Se você usar qualquer
caractere especial diferente desses, porque está usando Python
como linguagem de programação, haverá erros, então você tem que nomeá-lo de
algo como, no meu caso, vou
nomeá-lo algo como, à frente Vali First, vamos pular esses dois e
precisamos escolher a
versão dois porque queremos
a versão dois porque queremos melhor qualidade
possível Queremos usar o RVC V two,
que é o mais recente, melhores recursos Então, como você pode ver
aqui, agora temos três opções para as quais você
pode escolher isso, acho
que é um modelo de voz de tamanho
menor Mas como queremos o melhor, precisamos escolher
as melhores opções. Então 48 K, e aqui está escrito Orientação de
tom para o modelo
, necessária para cantar. Opcional para fala. Diz opcional, mas eu
meio que discordo disso. Porque sem isso, você não terá emoções em
seu modelo de voz. E seu modelo de voz
não terá vários tons. Ele terá apenas um tom e soará monótono É mais ou menos
assim, Dom Faso, se você definir como falso, é
assim que vai soar Então você tem que definir isso como verdadeiro. Então ele pode dizer domas, então ele pode ter tons
diferentes Em seguida, ele diz o
número de processos CP usados para processamento de
dados de extração de pitch. Se você quiser que seja preciso, configure-o para o máximo. E a segunda etapa, aqui
vamos implementar os dados de voz a
partir dos quais
você preparou antes que eles precisem do
caminho do treinamento. Você
precisará ir para a pasta de
treinamento, por exemplo, eu tenho os meus em arquivos
e depois em vozes. E agora eu tenho
minha voz aqui. O que temos que fazer é voltar. Precisamos clicar com o botão direito do mouse
na pasta em que nossos dados de voz estão localizados
e copiar como caminho. Em seguida, voltamos ao navegador. E destaque tudo isso
e controle V e cole. Então, a ideia
do alto-falante cantor, que
é o seu modelo de voz. Basta definir qualquer número e
deixá-lo em zero. Eu prefiro deixá-lo como padrão para que não tenhamos problemas. Em seguida, clicamos em Dados do processo e depois esperamos. Essa caixa será
destacada em laranja, o que significa que está em execução, então só precisamos
esperar que ela termine. Quando terminar, ele parará. Sim. É assim que
ficará quando terminar Também dirá pré-processo
e dirá Sucesso. Etapa dois, aqui ele
mostrará sua GPU. Se você tiver mais de uma bolsa, ela mostrará 01 a, e aqui você poderá
selecionar sua GPU No momento, se você tiver
apenas uma GPU, deixe-a em zero
e você também deve selecionar a melhor
GPU que você tem No meu caso, essa é a melhor GPU e a única GPU que
eu tenho que é zero E isso é RTX 30 80. Na verdade, isso funciona com todo
e qualquer laptop ou
PC disponível. Porém, quanto melhor seu laptop, mais rápidos serão
os resultados. Não demorará muito para
treinar o modelo de voz. Se você tem um PC melhor, precisa selecionar
o algoritmo para
extração de palhetas para obter a melhor
qualidade. Selecione Colheita. Há PM e há O, mas são relativamente piores. Selecione Colheita e clique
em Extração de recursos. Então agora você só
precisa esperar por isso. Você pode rolar se quiser. Você pode dar uma
olhada nas coisas que
estão acontecendo e esperar por elas. Você também pode ver as mudanças em tempo
real aqui
no comando. E também mais uma
coisa, não feche. Quer dizer, você pode minimizar o prompt de
comando ou o CMD, mas não clique em X. Caso contrário, todo o
programa não funcionará Como na verdade está
sendo executado nele, o navegador é como uma interface de
usuário para que
possamos acessá-lo. Então, agora está pronto, está
tudo pronto,
pronto e parou de brilhar Descemos na etapa três. E aqui vamos definir as configurações para treinar
nosso modelo de voz. Primeiro, você tem que selecionar
a época antes de
entrarmos na frequência segura, temos que entrar na época, você entende o que é Épocas. O que são épocas épocas são basicamente
como quantas vezes sua IA treinará sua voz se você
configurá-la para uma vez Você vai
treinar uma vez, 20 vezes, 200 vezes, e quanto mais, melhor. Mas, como regra geral, é
assim que deve ser Vou abrir
minha nota para te mostrar. Se seu modelo de voz
for inferior a 10 minutos, a
época deverá estar
entre 100, 200 épocas Se seu modelo de voz, quero dizer, se seu áudio de voz for igual ou
superior a 10 minutos, você pode ir 200 a 300. Qualquer coisa acima de 300 realmente
não faz
muita diferença Se você já teve problemas
ao configurar essas épocas, tente diminuí-las e depois clique em Treinar
novamente Porque às vezes, talvez
seu laptop seja multitarefa ou talvez se
sua GPU não seja tão forte,
acho que pode
haver alguns erros Portanto, você deve retreinar seu modelo de voz
usando épocas mais baixas Então, por uma questão de tempo, vídeo, vou definir
as épocas para 20. A frequência de salvamento é
como quantas épocas até que seu software salve
o modelo de treinamento Normalmente deixo às cinco
para não perder. Mas se você contratar
cerca de 2.200 ou 300, você pode definir como 25 ou
50, o que você quiser Depende da rapidez com que seu PC treina o modelo de
voz e depende de quantas
épocas você o configurou para deixar esse tamanho de lote
por GPU como padrão,
até mesmo salvar
apenas o
arquivo de ponto de verificação mais recente para economizar espaço em até mesmo salvar disco, basta deixá-lo como padrão, o
que, como você sabe,
se você clicar em sim, diz que grandes conjuntos de dados
consumirão muita memória da GPU, talvez
não seu PC treina o modelo de
voz e
depende de quantas
épocas você o configurou para
deixar esse tamanho de lote
por GPU como padrão,
até mesmo salvar
apenas o
arquivo de ponto de verificação mais recente para economizar espaço em disco,
basta deixá-lo como padrão, o
que, como você sabe,
se você clicar em sim, diz que grandes conjuntos de dados
consumirão muita memória da GPU, talvez
não
fornecem muitas melhorias
de velocidade. Deixe como você sabe aqui. Clique em Sim, só
por segurança , pois quando ele for salvo, você
poderá usar esse modelo. Então você tem aqueles modelos
pré-treinados baseados, caminho
G e caminho D. Essas coisas são como
quando você treina seu modelo de voz e, como
está apenas começando, não
precisa pensar
muito sobre isso Mas se você quiser treinar novamente seus modelos depois
de treiná-los, acesse a pasta
RVCs e
encontre o caminho e o
caminho D do modelo de voz E depois passe
pelos caminhos
aqui para que você possa
melhorar esse modelo de voz. Em seguida, insira a GPU que
você está usando, que é zero. No final, você precisa clicar em Train Model. Agora você só tem que esperar. Você pode ver o comando, solicitar o CMD e esperar que ele termine um monte de coisas. E então você pode
ver que ele
dirá algo como época uma
época até chegar ao fim
da quantidade
de épocas Então, dirá que foi bem-sucedido
no final. Como você pode ver aqui, diz
que o treinamento está concluído
e o programa está encerrado e, em seguida, é um sucesso
final
e salvador no checkpoint Se disser isso, significa
que você clonou
com sucesso
seu modelo de voz Ele está pronto para uso
agora mesmo em qualquer aplicativo
que você possa imaginar. No próximo vídeo, mostrarei
como
usá-los nas aplicações do modelo de
voz clone.
4. Usando modelo de voz em conversão: Agora é hora de
usar o modelo de voz em RVC. Da última vez que treinamos o modelo de
voz na guia Treinar, agora ele está disponível para uso
na inferência do modelo Se você acessar o Model
Inference, atualizar a lista de vozes e o
caminho do índice e abrir isso, não
verá muitos modelos porque eu já
clonei É claro que você precisa de
permissão para clonar vozes. Não basta clonar vozes. Tudo bem, se você
passar por isso, encontrará
seu modelo de voz. No meu caso, eu tenho a
voz clonada do último vídeo, que é Adel Agora você o seleciona e pode usá-lo aqui. Portanto, haverá
várias configurações. Mas agora vamos usar isso apenas para fala a fala. Então, como vamos fazer
isso é
trazer qualquer áudio do Youtube ou algo parecido, baixá-lo e
colocar esse áudio. Em seguida, vamos converter a voz da
pessoa em nossa voz. Então, vamos fazer isso. Então,
eu baixei um
áudio de três MP desse vídeo. Reflexões sobre humanidade,
fama e amor. Shao Han, o famoso ator
indiano, ele disse algumas coisas muito boas
aqui e eu queria ver como soaria se fosse eu quem
dissesse essas coisas Então eu baixei o áudio
e agora vou
usá-lo no RBC para converter a
voz dele em minha voz Então, vamos seguir
em frente e fazer isso. Primeiro, você
precisa seguir em frente e encontrar o caminho do áudio que deseja usar para
converter a voz da pessoa em áudio, na voz
do modelo de voz. Então, você clica com o botão direito do mouse no arquivo em vez da pasta
desta vez, copia o caminho
dele e cola
aqui e está pronto. Desde que a voz seja homem para homem e de
mulher para mulher. Se for de homem para mulher, você deve alterar essa opção aqui, como você pode ver aqui. Ele até recomenda que você diga mais 12 teclas para conversão de homem para mulher
e menos 12 teclas para conversão de mulher para homem. No momento, é de homem para homem. Então isso significa que simplesmente
deixamos como zero. Mas se fosse um homem gostar da Hana ou de outra pessoa,
teríamos que diminuir isso em menos 12 Se fosse de mulher para
mulher, zero também. Mas se fosse de mulher para homem, como Hana, por exemplo, minha voz, eu a
configuraria para menos 12 Por exemplo, se você
fosse uma mulher e estivesse convertendo a voz de Michael
Jackson, sua voz, você tinha que configurá-la para 12
positivos para que
funcionasse corretamente Então, agora que
é do mesmo sexo, deixamos como zero. E então temos que definir isso como estranho porque tem a melhor
qualidade para conversão de voz E aqui há
várias outras configurações. Você pode examiná-los
e ver o que eles fazem. Alguns deles são
como para respirar. Vou apenas dar
algumas explicações sobre isso. Este serve para filtrar
o sopro e outras coisas,
e este é para
evitar artefatos e outras coisas Mas você precisa equilibrá-los. Em cada configuração, todos eles fazem algum tipo de coisa de
uma forma ou de outra, como esta aqui para imitar o volume
dos vocais originais Como o volume
alto ou baixo. E este é para
reamostragem do áudio,
este é para a intensidade do sotaque Você entendeu a ideia.
As configurações recomendadas são apenas para
diminuir um pouco o sotaque. E isso tudo porque
, se for muito alto,
pode levar a artefatos e estamos prontos
para clicar em Converter Agora, como você pode ver
aqui, ele está carregando, então só temos que
esperar que ele termine de carregar. Em seguida, obteremos nossos resultados em breve, enquanto nosso áudio
estiver sendo convertido. Aqui embaixo está
escrito conversão em lote. Isso é como converter
vários arquivos de áudio. Eu nunca o usei, então
não tenho certeza de como vai funcionar, mas acho que ele faz
o que diz que faz Você não precisa realmente
passar por tudo isso. Você pode se concentrar apenas
no que está no topo. Então, vamos lá. Nosso
áudio está pronto, vamos ouvi-lo. Então, sim. Então, sim, quando o áudio
está sendo convertido, ele converte literalmente
tudo, como o som de aplausos, o som da música É por isso que você
precisa trazer um áudio que tenha apenas a fala
ou a voz de alguém
e, se você tiver algum outro ruído, ele também o converterá. Mas está tudo bem nesse caso ,
porque é só o começo. Vamos avançar um pouco. Parece um pouco descuidado da minha parte. Agora, eu me lembro da noite meu pai morreu e me lembro do motorista de um vizinho que estava nos
levando ao hospital. Ele murmurou algo
sobre que as pessoas não dão gorjetas tão bem e vão
embora para o. Então, sim, você pode ver que a
voz foi convertida. Mas, infelizmente, como o áudio original
tem algum eco, o som do público como a multidão e
todo esse barulho, todos
eles influenciaram a qualidade dessa
conversão final Então você precisa encontrar
algo que soe bem
para poder convertê-lo. E vamos falar
direto sobre isso na música cover. Mas antes disso, isso
é fala a fala. Certo? Vou te
mostrar rapidamente como você pode usar isso
para conversão de texto em fala. Infelizmente, porém, a conversão de
texto em voz exige que você pague uma
assinatura de 11 voltas, como você pode ver aqui, diz que
você começa e depois se inscreve e
pede que você pague E então, quando você pagar, eu vou te
mostrar o que você pode fazer. Tudo bem, então estamos em 11 laboratórios. Como eu já paguei
pela assinatura anteriormente,
posso acessá-la. Então, como você o usa
para conversão de texto em fala Clique no
sinal de mais aqui clique em clonagem de voz
instantânea Então você dá o
nome, o que quiser. Como, por exemplo, meu
nome que eu tinha, Belushi. E então você tem que clicar
aqui e selecionar sua voz, não o modelo de voz. Você precisa selecionar a gravação que você gravou
anteriormente. Tudo bem. Vou selecionar o arquivo da
minha gravação de voz
e clicar em Confirmar que tenho
os direitos e o consentimento e adicionar voz. Aguarde. E agora eu posso, agora você
pode usar sua voz. Você pode digitar qualquer coisa em
qualquer idioma e funciona. Então, digamos que eu vou
dizer algo como olá, lá estou eu, Dragon. Olá, aí estou eu, dragão. Quero dizer, às vezes
parece um pouco estranho. Você tem que brincar
com as configurações. Continuem avançando, pessoal. Quanto mais dados você obtiver, melhores serão
os resultados. Vamos ver como eu
soo em espanhol. Ah, bom. Aparentemente, sou eu falando
espanhol. Então é assim que você
usa a conversão de texto em fala. Então é isso nesta parte, e na próxima parte,
vamos experimentar uma música cover.
5. Cover de IA W/RVC: Bem-vindos a todos. Já era hora de
usarmos nosso modelo de voz
para uma música cover de IA. Então, vamos direto ao assunto. Então, primeiro de tudo, você precisa ir ao
Youtube e escolher qualquer tipo de música que você gostaria converter em sua voz. No meu caso, eu gostaria de ter uma música cover de IA de Diamonds Então, primeiro você precisa baixar
o áudio da música. Você pode usar qualquer tipo de
site para baixar o áudio. Vou usar o meu próprio, que é o fork
video downloader Eu recomendo. É bom. Depois de
baixar sua música, você precisa renomeá-la para que
ela não tenha erros Você precisa remover os espaços
e, sim, clicar em Enter. Vamos direto ao trabalho de conversão de
voz. Temos que usar o acompanhamento
vocal, que é a aba de separação de instrumentos E aqui você deve remover o caminho
porque ele tem problemas. Não use o caminho.
Em vez disso, traga o áudio e arraste-o até aqui. E então, no modelo
que não é o modelo de voz, você precisa selecionar HP
três, todos os vocais. O resto das coisas fazem
diferentes tipos de coisas. Aqui explica isso, mas alguns deles servem
para remover o eco, obtendo apenas o vocal principal Mas para o propósito
deste tutorial, você deve usar os vocais. E então aqui,
há um problema. Diz aqui a
saída para vocais e aqui está a saída
para acompanhamento Na verdade, é
o oposto. Então, aqui deve estar
no caminho de saída para instrumentos e aqui deve
estar o caminho de saída para vocais. Acho que eles tiveram alguns
problemas para nomeá-lo e os
confundiram ao nomeá-los Então, o que eu
gostaria de fazer é ter uma pasta para vocais
e acompanhamento, que são os instrumentos, assim aqui Instrumentos e vocais. E então, quando você
entra nela, há uma pasta de instrumentos e
uma pasta de vocais. Clique com o botão direito do mouse no caminho de cópia
dos vocais e depois acompanhe
o acompanhamento,
porque, como mencionei, está
confuso por E depois voltamos. Clicamos com
o botão direito do mouse no caminho do instrumento e colamos nos vocais. E então podemos
exportá-lo em qualquer formato. E eu gostaria de
exportá-lo em MP três. Em seguida, clicamos em Exportar. Depois, podemos ver o
comando, acionar o CMD e
esperar que ele faça sua mágica Então, como você pode ver aqui,
ele está fazendo seu trabalho. É separar os vocais
do instrumento para que
possamos usar os Tudo bem, então, quando estiver
pronto, pode aparecer
um texto em vermelho que diz que
esse arquivo ou diretório não existe. Isso lhe dá a falsa ideia que talvez você tenha
cometido um erro, mas não, na verdade, funciona. E a prova é que
aqui diz sucesso. Então você pode ir direto para
as pastas e ver esses instrumentos e
vocais entrarem nos vocais Na verdade, por algum motivo
, dirá instrumento, mas não é o instrumento. Acho que isso significou que o
instrumento foi removido. Então, está nos vocais agora. Vamos usar os vocais para
converter a voz de
Rihanna na minha Vamos direto para a
inferência de modelos aqui. Já que estamos fazendo uma
conversão de Rihanna feminina para masculina para significar, defina
isso para menos 12 e
então temos que copiar o caminho do vocal mas que por algum motivo
diz cópia do instrumento, cole aqui,
acho que terminamos Clicamos em Converter, deixamos o RVC fazer sua mágica Tudo bem, então está tudo pronto, mas esses são apenas os vocais, então vamos ouvir um pouco, uma forma imediata. Tudo bem, então você
ouviu os vocais. Agora precisamos realmente
misturar os vocais com
o instrumento Então, parece uma capa completa, então você pode fazer isso com qualquer software
de edição que você tenha. Premiere Pro ou qualquer outra coisa. Eu vou te mostrar
um exemplo disso. Primeiro você precisa
clicar nos Três Pontos
aqui e baixar o
áudio para o seu PC Então você pode renomeá-lo para
algo como seu nome, que é, no meu
caso, meu nome é À frente.
Vocais de diamante. Aí está. E vamos seguir em frente e usar
o software de edição
para criar uma boa capa. Quando você mistura seus vocais
com o instrumento, aponte o instrumento,
não é chamado de
instrumento aqui Quando você vai tocar instrumentos, por algum motivo, isso é
chamado de vocais. Não sei por que o RVC confundiu isso. Não são os vocais, pessoal, é o instrumento,
na verdade, está misturado. Jogamos aqui e sacou. Agora você pode ir em frente e
ouvir a capa com sua voz. Sim, quando. Uau, sim. Como isso é IA,
pode não parecer perfeito, mas bem, pelo menos sabemos como eu soo
quando canto isso. Sim, não é? Sim, então esse será o
seu projeto de classe. Você deve me mostrar
qual música você usou e me mostrar os resultados em
vinil de
sua capa de IA depois de
remover os vocais e instrumentos e depois converter os vocais
em sua voz, e depois de
mixá-los, seus vocais, seu vocal personalizado, feito pela
IA e
o IA e E me mostre os resultados finais. Tudo bem, você pode precisar de
algumas habilidades de edição. Eu não vou te ensinar que
você deve aprender sozinho. Mas mostre-me os resultados finais
e me deixe impressionado. Tudo bem, pessoal, e eu vou
te contar na próxima lição.
6. Conversão de voz sem GPU: Tudo bem, pessoal. Nesta
parte, mostrarei como
usar seu modelo de
voz para fazer cover de uma música sem
placa gráfica. A propósito, isso também funciona no seu
telefone, desde que você já tenha o arquivo de modelo de voz
PTH preparado ou talvez o baixe
do Discord, como pré-preparado
por outra pessoa Eu vou
te mostrar como fazer isso. Primeiro de tudo, você
precisa abrir seu navegador, seja ele um Google
Chrome ou qualquer outra coisa, e depois pesquisar kits de aplicativos. Eu simplesmente gosto disso. Tudo bem, como você
pode ver aqui. E centro de imprensa, e então
você terá esses resultados. Clique em Minhas vozes. Basicamente, este site permitirá
que você
faça um
cover de I apenas usando o motor
que está nos servidores, mas também tem algumas limitações e eu vou resolver isso primeiro. Você precisa ir
em frente e fazer login. Quando você fizer login, ele
solicitará seu e-mail. Se você já tem o Gmail, basta continuar com o Google e esperar que ele carregue.
Então, ele carregará. Então você verá aqui que
as limitações são que, se você estiver fazendo isso sem nenhuma assinatura e
de graça, você terá algum limite de tempo. Por exemplo, agora
eu tenho 15 minutos restantes. Isso significa que eu só posso fazer músicas de até 15 minutos,
não mais do que isso. E acho que se regenera. Sim. Como você pode ver aqui, ele será atualizado primeiro Acho que é,
sim, 14 de janeiro. Então eu acho que é tipo mensal. Ele será atualizado
mensalmente todas as vezes. E também os caracteres
para conversão de texto em fala, mas eu recomendo usar texto
para fala em 11 risadas. Não é muito
bom aqui. Quer dizer, no que diz respeito à
conversão de texto em fala, eu o testei da última vez, talvez uma ou duas semanas
atrás, e não é muito bom. Então, vamos nos
concentrar apenas na
música I cover para fazer sua voz funcionar. Aqui, você precisa
clicar em Carregado na minha seção de voz e depois
clicar em Carregar sua primeira voz, ou talvez seja a segunda. Terceiro. Depois de fazer isso, você clicará em Voice Model
aqui e
procurará seu
arquivo PTH onde quer que o tenha colocado Quer dizer, se você não
sabe onde ele está localizado, você precisa acessar o
arquivo de modelos RVC que criamos
nos vídeos anteriores E então você verá
seu arquivo PTH na pasta Weights no software beta
do RVC Quando você for lá, clique em Pesos e você
terá seus arquivos PTH. Talvez você só tenha
um porque, desde que está começando, tem
seu primeiro modelo de voz. Então você terá o
PTH em algum lugar talvez na parte superior, clique
duas vezes nele E então você pode nomeá-lo. Vou chamá-la com meu próprio nome porque é minha
voz. E depois desça. Você também pode exibir a
imagem se quiser, mas vou pular isso Eu vou te mostrar de qualquer maneira. Você clica nele,
vai para Imagens, e então você pode simplesmente colocar sua própria imagem ou quem quer que
seja e depois fazer o upload do modelo E então, como você pode ver
no canto inferior direito
, está sendo carregado. Está fazendo o upload do modelo de
voz que
preparamos no URVCVtwo
ou talvez você o tenha baixado deste tribunal para que possa ser
usado Depois de fazer o upload, você pode usá-lo em seu telefone. Você não precisa de nada, como se nem precisasse de
um médico forte ou algo assim Na verdade,
funciona com essa GPU. Funciona. Você não precisa de
um laptop muito forte. Você só precisa de
uma conexão com a
Internet, um navegador e pronto. Isso significa que
provavelmente pode até funcionar no seu Nokia. No que me diz respeito, você pode trabalhar com qualquer telefone que você possa imaginar. Qualquer laptop. E quero dizer, desde que você tenha carregado o
modelo de voz no site, depois de fazer o upload do seu modelo de
voz no site, você pode ver que tem opções
diferentes lá. Temos para entrada de voz, temos arquivo de áudio, você pode soltar os vocais ou inserir o link
da música no Youtube E opções diferentes aqui como gravar sua própria voz ou a de outra pessoa e depois convertê-la
no modelo aqui. Portanto, é semelhante à conversão de voz
RVC que mostrei
nos vídeos anteriores E sim, temos configurações
de ventilador, vamos superar isso. Então, agora estamos
focando na música cover de I, então vou pesquisar no YouTube.com, vou
pesquisar estradas rurais, uma das
músicas mais populares conhecidas no planeta Terra, então vou clicar nela Desculpe por isso. De qualquer forma, foi um pouco alto
para mim, então
vou copiar o
link da música de Country Roads e
clicar no link Entrar no Youtube
e colar aqui. E então vamos
lá. Nós temos isso. Então, vamos para Configurações avançadas. E aqui é muito importante, assim como mostrei
no vídeo anterior. exemplo, quando
convertemos as vozes, precisamos ter cuidado com
o tom. Se é homem para homem,
mulher para mulher, agora é homem para homem, é 00, tudo bem. Mas às vezes você
precisa se ajustar, mesmo que seja do mesmo sexo e
se for de um gênero diferente, por exemplo, homem para mulher, você precisa
aumentá-lo em 12 positivos. E se for o oposto de mulher
para homem, isso significa menos 12. E se for de mulher para mulher, assim como de
homem para homem, é zero. Mas às vezes precisamos nos ajustar acordo com o tom
da voz da pessoa. Porque não
temos apenas um campo para homens e um
campo para mulheres. Todos os sexos, todas as pessoas neste planeta têm tons
diferentes Mas, de um modo geral, de
homem para mulher, a conversão
deles, como quando
você converte entre eles, geralmente
é em torno de menos
12 a 12 entre isso. De qualquer forma, agora é masculino, voz de
John Denver na
minha voz, de homem para homem Isso significa zero aqui. Quer dizer, também posso ajustar o tom se achar
que não soa bem, mas vou
deixá-lo em zero por enquanto. Força de conversão, eu
recomendaria apenas diminuí-la. Talvez em 75 ou talvez 70%. Porque
valores altos, como afirma aqui, também podem levar à correção excessiva
de artefatos E o volume do modelo,
deixe como está. Esse é o volume
do nosso modelo de voz. Então aqui eu recomendo simplesmente
desligar tudo isso. O Compressor serve basicamente para quando as músicas ficam muito altas. Passe alto, passe baixo. São apenas alguns efeitos parecidos com
áudio. Se for muito barulhento, haverá uma marcha para que não
fique muito Assim como o compressor, basicamente os efeitos de
pós-processamento, você pode colocar o refrão
para fazer sua voz soar basicamente como
se fosse um canto, não
sei como explicar,
mas é como ajustar automaticamente, reverberar, atrasar o que são
, reverberar como echo, até mesmo atrasar o como echo Basicamente, o que
mencionamos aqui, se estiver ficando muito alto,
isso o comprimirá Faça-o mais baixo e não muito alto, mas vamos
deixar como está. Vamos clicar em Converter. Então podemos esperar. Isso também é bom. É muito simplificado
, na minha opinião. Muito simplificado do que no RVC,
porque quando você coloca o link, basicamente ele
fará tudo por você Ele vai dividir
o que é chamado, os vocais dos instrumentos, e então vai
converter sua voz E então ele vai misturar
os dois juntos. Então você não
precisa fazer tudo isso, basta
fornecer o link. E apenas algumas
configurações e depois boom. Agora tudo
o que você precisa fazer é
esperar alguns
segundos e tudo funcionará. Lembre-se de que isso funciona com
laptops e telefones, qualquer coisa que você
tenha, funciona. No momento, usamos o link do Youtubes para colocar a música cover da IA Ele fará tudo sozinho, mas se você tiver seus próprios
vocais ou seu próprio discurso, você também pode colocá-los aqui Porque isso não é apenas
para músicas cover de IA, isso também se você tiver um vocal separado que
já tenha preparado. Talvez um personalizado, não
sei, em algum lugar
como fora do Youtube. E então você pode simplesmente colocá-lo
aqui e pronto, funciona. Ou se você tem algum
tipo de fala como na conversão RBC que mostrei
nos vídeos anteriores, você coloca aqui e
depois o mesmo conceito Você tem
configurações avançadas e depois pode ajustar o tom e outras coisas São apenas coisas semelhantes
, mas entradas diferentes. Como você viu anteriormente, ou você coloca o link do Youtube
ou coloca seu próprio áudio. Esse áudio pode ser fala, pode ser vocal,
pode ser qualquer coisa, ou você pode gravar
áudio que
também está aqui nas opções,
como existem outras Depois, houve uma última coisa, é como uma versão beta, mas não importa agora. No momento, demorou cerca
de 2 minutos para fazer isso. Então, vamos ouvir isso, certo? E também, você pode baixá-lo, a
propósito, e você
também pode compartilhá-lo e outras coisas. Então, vamos ouvir isso. Então, depois de clicar na placa, você precisa esperar quase o
paraíso, West Virginia. Sim, parece
muito bom, certo? Nossa, a música cover, como se tivesse avançado Parece muito melhor agora. De qualquer forma, voltando ao assunto. Então, quando você acessa o arquivo de áudio, ou você coloca seus próprios vocais ou qualquer outra voz
que deseja
converter ou traz
um link do Youtube ou seu cabo aqui ou um áudio de
demonstração gratuito. Não tenho certeza. Ah, diz que você pode
experimentar algum modelo de graça, mas isso não importa de qualquer maneira. Então é isso para este vídeo. Esse é o site, que se
chama apps do kits into Ti. Mas não digite
isso no seu navegador. Como aplicativos, kits de pontos no I,
porque, por algum motivo
, isso gera um erro. O que eu sugiro é que
você digite aqui, app Kitai e depois
entre neste link aqui, porque é assim que
funciona para mim Sim, é isso mesmo. E nos
vemos na aula do Linkt
7. FINAL: conversão em tempo real: Olá a todos. Bem-vindo à última parte
desta videoaula. Será sobre o uso
da voz em tempo real, usando um software chamado Okada Então, vamos
instalá-lo. A primeira coisa que você precisa
fazer é acessar o Google e pesquisar Okada
getup Depois disso, você
obterá esses resultados. Entre neste link, clique nele e vá rolar até
ver um índice. Aqui, você clica naquele
que é um aviso de isenção de responsabilidade em que
isso não funciona Não tente, mesmo que esteja escrito Mac. Não instale no Mac porque não funciona, é
muito fraco para isso. O Windows geralmente funciona para isso. Se você é um usuário do Windows, vá em frente e baixe este. Se você é usuário,
basta comprar um PC com Windows quando chegar aqui.
Se você é usuário do Windows. Se você chegar aqui,
quando chegar aqui, role para baixo e
encontrará versões diferentes. Como você pode ver no canto inferior esquerdo da tela
,
ao passar o mouse sobre os links, é possível ver as
diferentes versões Eu olho a versão mais recente
e faço o download, no meu caso, na data atual, que é 121-22-0203, parece que
esta é a versão mais Vá em frente e baixe isso. Clique nele e depois
coloque
aqui e
aguarde o download Eu já
baixei um antes. Eu vou cancelá-lo. Eu vou te mostrar como
o que você vai fazer. Basicamente, você
terá esse arquivo zip, você precisa clicar nele. E então, se você estiver
usando um Windows 78, uma versão diferente, você
terá essas opções. Talvez você não tenha vento, talvez tenha isso sobre aquilo. Ou se você tiver
esse extrato aqui. Depois de fazer isso, você terá essa pasta
aqui. Clique duas vezes nele. Clique duas vezes novamente. Sim, você terá esses tipos de pastas
e arquivos aqui. Precisamos procurar algo
que diga, deixe-me ver. Acho que se chama
Start Underscore HTTP. Sim, aí está. Esse é o arquivo de execução. O que vamos fazer
é clicar com o
botão direito do mouse nele e
mostrar mais opções. E envie para o Desktop. Clique em seguida, você o terá
no Desktop aqui. Você pode ir em frente e
renomeá-lo para, se quiser. Vou ligar para ele também porque
eu já instalei. Em seguida, você clica duas vezes nele. Depois de clicar nele, demorará um pouco. Na primeira execução, ele
mostrará barras de download e instalações de
coisas. Depois disso, quando terminar, você pode aparecer
com essa janela branca Sim. Além disso, ao
executá-lo, novamente, você não precisa passar
pela instalação, basta clicar duas vezes nele. É isso mesmo. Depois de ter
essa janela, clique em Iniciar. Sim, você terá os
primeiros quatro modelos, ou talvez cinco
modelos pré-instalados que você pode usar. Elas são todas como vozes femininas. Se você cair, terá
diferentes tipos de configurações. Talvez isso seja confuso, mas vou explicar agora Primeiro, você tem que escolher
seu modelo, por exemplo, eu clico em um modelo
feminino agora, aí está pronto para uso e você pode alterar
o ganho e a saída. Mas também uma coisa importante
é que você tem que mudar a melodia. Assim como no RVC, quando é de mulher para homem, você precisa ajustá-lo, também de homem para mulher, e talvez às vezes de
homem para homem ou mulher para mulher, dependendo do
tom da voz Agora, como minha
voz está mais profunda, preciso aumentá-la. Vou
aumentá-lo em 12 positivos, assim como fizemos
no software Okta Mas no software Okta, estamos mudando a
voz do modelo para nossa voz Aqui estou mudando minha voz
para a voz dessa pessoa. É o oposto. É
como se fosse invertido. Uma vez que é de homem para mulher. No momento, tenho que aumentar
ainda mais o tom positivo 12. Você também pode ajustar
as entradas e saídas, se quiser, mas deixe como está e depois
desça aqui também. É melhor usar isso com
um microfone, se você tiver. Um microfone externo
como este aqui. Funcionará muito melhor do que um microfone que está no laptop. Mas você pode ir em frente
e tentar ver. Às vezes funciona,
mas você pode ter alguns
problemas de eco para combater isso Você tem essa opção
aqui chamada eco um,
supressão Eles funcionam, mas não são os melhores. Se você tiver um microfone externo
funcionará muito, muito melhor. E então aqui você deve selecionar R M P O N X e, em
seguida, rolar para baixo. Deixe-os como
estão 256,40 96. Esses são como os melhores. P se estiver na CPU, mude para GP zero. Então aqui você deve selecionar sua entrada e esse é o microfone que
você vai usar. No meu caso, é a onda três de Mic
Lago. A saída é onde você
vai ouvir a voz. Antes de te
ensinar como usá-lo nesta quadra, primeiro
precisaremos ouvi-lo. Vou selecionar meus
fones de ouvido para poder ouvi-los. E depois desça
até as configurações avançadas. Mude o tanque para 300
e a qualidade RVC para alta. Você deve sempre alterar isso para alto depois de reiniciar
para obter os melhores resultados. Depois disso, você pode ir em
frente e clicar em Iniciar, para ouvir a
si mesmo falando. Você tem que esperar um minuto
e depois falar. Fale. Olá. Olá. Meu nome é Ah Dragon. Estou aqui para te ensinar
como lutar contra inimigos. Sim, como você ouviu,
funciona muito bem. E você também pode usar
o modelo V RVC que você treinou nas aulas
anteriores Como você vai fazer
isso? Primeiro, vamos localizar seu modelo RVC Como localizá-lo. Vá para a área de trabalho. Lembra daquele atalho
que criamos para o RVC? Clique com o botão direito do mouse, clique
em Abrir localização do arquivo
e, em seguida, role para cima até
encontrar a pasta chamada Pesos Talvez ele esteja localizado forma diferente para você, se
você não o encontrou. Pode estar em algum lugar nos registros, como você pesquisa por ele
ou você mesmo procura por ou pesquisa aqui por pesos digitando os pesos Em seguida, ele mostrará a localização da pasta.
Você vai lá mesmo. E depois de
encontrá-lo, clique com o botão
direito mostre mais opções. Se você estiver no Windows 11
e depois for enviado para o Desktop, dessa forma você terá acesso
fácil aos seus modelos pois eles estão todos localizados
aqui na área de trabalho. No momento, tenho
modelos diferentes por aqui. Talvez você tenha uma
da lição anterior. Então, quando você voltar para Okada, você pode ir para Editar Role para baixo até um espaço vazio,
como um espaço em branco. No meu caso, são 12 agora, porque eu tenho outros
que estão ocupados. Clique em Carregar. Clique em Selecionar. O arquivo iria para o
local da pasta do seu modelo. Vá para a área de trabalho e, em seguida, role. Digamos que você encontre a
pasta de pesos que você criou. Você também pode renomeá-lo se
quiser clicar duas vezes nele Em seguida, selecione o arquivo PTH que você tem para o modelo
que você já criou Por exemplo, minha
voz eu tinha V dois. E então eu clico em Carregar. Mais uma coisa, ok. Funciona apenas com a forma como requer conexão com a
Internet. Portanto, verifique se você tem uma
ótima conexão com a Internet. Sim, depois de selecionar
isso e clicar em Carregar, basta fechar e você
encontrará seu molar
em algum lugar aqui Será como o
último que você criou. Então eu o tenho aqui. Clique nele. Como
é minha voz, soará como minha voz, então não preciso
afiná-la nem nada. Então, vou clicar
em Iniciar. Olá. Olá. Meu nome é Zahid Dragon. Meu nome é Zahi Dragon. Estou aqui para te ensinar a
lutar, lutar contra inimigos, inimigos. Então, sim, essa é a minha voz. Agora vou te ensinar como
você pode usar essas vozes em tempo real no Discord ou em outros
aplicativos Eu vou te mostrar no Discord e depois
vou te dar uma ideia geral de como você pode usá-lo em outros softwares Não vou mostrar
todos os outros softwares, vou apenas
mostrar um discord
e ter uma ideia de como você pode usá-lo
em outros softwares Vamos ao Google e depois
você pesquisa por cabo VBD. Depois de pesquisar isso, você
terá links diferentes aqui. Você clica no primeiro depois baixa
o do Windows, porque de qualquer forma, isso só
funcionará no Windows. Vai baixar,
espere uns 5 segundos, eu acho. E então você clica nele. Então você precisa extrair isso. Você deve clicar com o botão direito do mouse nele. Ou sim, clique com o botão direito do mouse
e mostre na pasta, depois clique com o botão direito novamente. Então, assim como com
o arquivo
anterior, o arquivo zip anterior,
vamos extrair. Depois de extraí-lo,
você verá esse pop-up Role para baixo para encontrar o cabo
VB configurado 64 Você clica com o botão direito do mouse e
executa como administrador. Clique em. Depois disso, aqui deve
dizer driver instalado
ou algo assim. Como eu já o
tenho instalado, ele diz remover o driver, então eu não vou fazer isso. Eu já tenho isso.
E depois disso, você estará pronto para usar sua conversão de voz em tempo
real. Primeiro de tudo, você
precisa reiniciar o software Kara. Então,
vamos fazer isso. Vamos reiniciá-lo. Sim. Apenas espere por isso. Como você verá aqui. Como você notará
aqui, é mais rápido. Eu não mostrei a
instalação
como ela será
depois de instalada. Mas eu não quero
tirar muito tempo de você,
então eu acabei de te mostrar. Mas, basicamente, a primeira
vez vai ser mais longa. A segunda vez será tão rápida quanto essa. Sim, depois de
instalar
o cabo de áudio VB , rolamos para baixo. Vamos deixar a entrada
como está nosso microfone. E então a saída, nós a
mudamos para entrada de cabo. Basicamente, o
cabo de áudio VB é como um cabo virtual
que
não podemos ver que se conecta
entre o software,
quero dizer, o software de
troca de voz que você vai usar
para mudar sua voz e o software para o qual você vai usá-lo, como o Discord Primeiro, conectamos o
software na saída
à entrada do que
é chamado de cabo. Basicamente, ele vai inserir
a voz no cabo
virtual e, em
seguida, emiti-la. Quer dizer, vamos conectar o cabo de saída no disco, na entrada do discord aqui na saída selecionamos a entrada
do cabo, certo? Então vamos para a discórdia. Vamos para Configurações,
vamos para voz e vídeo. E então, no dispositivo de entrada, vou
alterá-lo para saída de cabo. Agora, se eu usar minhas
vozes aqui, se eu clicar em
Iniciar, vai funcionar. Depois disso, se você quiser usá-lo
para um software que
não tenha as configurações de entrada
e saída, você pode alterar
o padrão acessando as configurações do Windows,
pesquisando as configurações. E então aqui você
pesquisa a entrada. E então ele mostrará a entrada de
som. Clique nele. Então, aqui você apenas altera a entrada para a
saída do cabo. Essa. Depois de fazer isso,
quero dizer que não vou fazer
isso agora, porque
senão você não vai me ouvir. Mas depois de fazer isso,
você está pronto
para falar com pessoas francas
ou simplesmente se
divertir, rir
e
se divertir com seus amigos
e esse tipo de coisa Sim, então, apesar de tudo, esse é o fim do projeto. Espero que você tenha gostado. Certifique-se de concluir
o projeto que eu lhe atribuí
nas aulas anteriores. E também espero que você deixe uma avaliação para mim e
para esta turma. E talvez eu não sei se há
um comentário em Schultre, mas me diga o que você acha
ou me mande uma mensagem ou algo assim Diga-me se você gostou e se gostaria de aulas
diferentes. Estou aqui para te ajudar. E se você tiver outras
perguntas, é isso. Quer dizer, pergunte-me nos comentários
ou onde quer que estejam, DM's, se você gostaria que eu
fizesse algum tipo de serviço, eu tipo de serviço para você Estou disponível em fibra. Você pode me ver como
me chamo SamArb no Maya 8156 e esses são
meus shows que eu posso ensinar,
você pode pessoalmente ou
curtir um a um ao vivo e
eu posso direitos autorais para Eu tenho arte. Posso criar dois modelos de RVCV
para você, se quiser, entre em contato comigo sobre fibra vejo na próxima vez. Tchau tchau.