Inteligência artificial: clonagem de voz usando RVC V2 | Aahid Al Balushi | Skillshare

Velocidade de reprodução


1.0x


  • 0.5x
  • 0.75x
  • 1x (Normal)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Inteligência artificial: clonagem de voz usando RVC V2

teacher avatar Aahid Al Balushi, AI Expert

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

    • 1.

      Introdução

      2:40

    • 2.

      Instalando RVC

      1:46

    • 3.

      Como clonar sua voz

      10:17

    • 4.

      Usando modelo de voz na conversão

      6:11

    • 5.

      Música cover com IA W/RVC

      5:13

    • 6.

      Conversão de voz sem GPU

      11:14

    • 7.

      FINAL: conversão em tempo real usando Okada

      14:59

  • --
  • Nível iniciante
  • Nível intermediário
  • Nível avançado
  • Todos os níveis

Gerado pela comunidade

O nível é determinado pela opinião da maioria dos estudantes que avaliaram este curso. Mostramos a recomendação do professor até que sejam coletadas as respostas de pelo menos 5 estudantes.

101

Estudantes

--

Projeto

Sobre este curso

APRENDA A TECNOLOGIA DA CLONAGEM POR VOZ

Vou ensinar como clonar sua própria voz ou a de outra pessoa (com permissão), usando as melhores ferramentas de clonagem de IA disponíveis até o momento. Vamos passar pelo processo de criação de clones de voz passo a passo.

ESBOÇO DO AULA:

  • Como obter os dados necessários para a clonagem de voz.
  • Como instalar e usar a ferramenta de clonagem
  • Como usar o modelo clonado
  • Como fazer a modelo clonada cantar QUALQUER música

RESULTADOS DE APRENDIZAGEM:

  • Aprenda como extrair os dados necessários
  • Aprenda como clonar vozes
  • Aprender como usar o modelo clonado em diferentes softwares.
  • Aprenda a fazer a modelo cantar corretamente, sem erros.

Se você tiver alguma dúvida, sinta-se à vontade para entrar em contato comigo! Vou responder o mais rápido possível!

Conheça seu professor

Teacher Profile Image

Aahid Al Balushi

AI Expert

Professor
Level: All Levels

Nota do curso

As expectativas foram atingidas?
    Superou!
  • 0%
  • Sim
  • 0%
  • Um pouco
  • 0%
  • Não
  • 0%

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Introdução: Olá a todos. Bem-vindo ao curso de clonagem de voz feito por mim, Ahad Dragon, também conhecido como Ahad De qualquer forma, vou te ensinar esse incrível software RVC que existe e é o software de clonagem de voz mais realista que existe no momento É melhor até do que 11 laboratórios e outras coisas que você já deve ter ouvido falar do RVC Significa conversão de voz baseada em recuperação e eu vou te ensinar como você vai utilizá-la e usá-la da melhor maneira possível. Então, qual é a estrutura central que vou te ensinar? Bem, bem, essa é a estrutura principal. Em primeiro lugar, vou te ensinar como instalar o RVC localmente no seu PC Vamos explicar passo a passo como você pode instalá-lo com sucesso e ele também funciona para Mac e Windows. Em segundo lugar, vou te ensinar e explicar toda a interface de usuário ou interface de usuário do RVC E você precisará entendê-los antes de fazer qualquer tipo de coisa, caso contrário, não conseguirá nem mesmo clonar sua voz Em seguida, extrairemos a quantidade necessária dados de voz limpos sem nenhum ruído de fundo. E então, no final, vamos treinar o modelo de voz. E vou explicar cada seção para que você evite os erros, os erros comuns que todo mundo comete, inclusive eu quando comecei toda essa jornada, depois de clonarmos o modelo de voz No final do software, mostrarei as aplicações para usar esse próprio modelo de voz, incluindo as músicas cover de IA mais populares. Aposto que todos vocês querem fazer alguns covers de IA, especialmente com sua própria voz cantando em espanhol ou japonês ou qualquer outro tipo de idioma que você possa imaginar. Isso não seria possível se eu não te ensinasse como fazer com que soasse perfeito. Porque mesmo que você faça sua capa, se soar estranho, então qual é o objetivo Precisa soar exatamente como sua voz. Porque há muitos detalhes que você precisa aprender ao fazer seus covers de I ou qualquer outra coisa, como convertê-los de mulheres para homens ou vice-versa. No final de todo esse curso, vou te ensinar como usar essa voz, o modelo de voz clonada, em tempo real Essa é a parte mais intrigante para mim. Sim, haverá um projeto de classe no qual você terá que clonar sua voz E depois de clonar sua voz, você precisa usá-la de forma perfeita e adequada para fazer uma música cover de I. E sim, então é isso e vamos direto ao curso. 2. Instalando o RVC: Gente, bem-vindos à primeira parte dessa aula de clonagem de voz A primeira coisa que vamos fazer é instalar o software RVC. Vamos direto ao assunto. Você precisa primeiro ir ao Google e digitar get RVC. Sim. Em seguida, você rola para baixo até ver sua conversão de voz baseada em Cheval, que significa RVC Então você tem que descer até ver a coisa verde que diz Últimas aqui e atualizada. Clique nele. Então você tem duas versões, para usuários do Vida GP ou usuários do AMD Oriental GPA Placa gráfica Nvidia. Faça o download do arquivo acima. Caso contrário, se você tiver o AMD Oriental baixe o que está na parte inferior. Como eu tenho o Vida, vou baixar este e depois vou esperar que ele seja instalado. Eu já o instalei. Eu vou pular essa parte. Mas, basicamente, o que você vai fazer é, depois de instalado, extraí-lo. E então você terá uma pasta que diz RVC beta 0717 ou qualquer versão que você tenha baixado ou algo parecido Você clica duas vezes nele. Você precisa rolar para baixo até encontrar a coisa que diz Go Web Bat e escrever, clicar nela, mostrar mais opções se estiver usando o Windows 11 e enviar para a área de trabalho. motivo pelo qual temos que fazer isso é porque não queremos acessar a pasta toda vez que queremos iniciar o RVC Você escreve, clica nele se quiser e pode alterá-lo para RVC. Eu já fiz isso. Como você pode ver aqui, eu já tenho meu RVC instalado. Então você tem que fazer isso e então você instalou o RVC com sucesso Continue na próxima parte do vídeo. 3. Como clonar sua voz: Tudo bem então. Agora que você instalou o RVC, é hora de clonar sua voz Bem, antes de começarmos a usar o RVC, você precisa realmente ter os dados da sua voz Ou você grava sua voz ou se você tem alguma outra antiga, como notas de voz que você tinha. Você pode simplesmente misturá-los em um software de edição e depois cloná-lo Mas ele precisa estar limpo e alta qualidade, sem nenhum ruído de fundo. Se você não tem isso, vá em frente e pegue o melhor microfone que você tem em casa. Seja o seu telefone ou como este microfone aqui. Sim, vá em frente e grave. Você pode gravar sua voz talvez como um gravador de voz em seu telefone ou em qualquer outro lugar. Como você pode ver agora, eu já gravei minha voz anteriormente, então já me preparei para que ela seja clonada Então, aqui você pode ir em frente e ouvir como eu estou falando. Meu nome é Ah Dragon. Olá pessoal. Portanto, este é um bom exemplo de como os dados de voz devem soar sem nenhum ruído de fundo e em alta qualidade. Tudo bem, então vamos começar o RVC. Então você clica duas vezes nele e então você verá um comando, um CMD, abrir e você apenas espera por ele aqui Você tem que ter um pouco de paciência. Pode levar um ou dois minutos para funcionar. Então, como você pode ver agora, ele abrirá no seu navegador padrão. No meu caso, ele abriu no Google Chrome. E aqui estamos. Então, quando o RVC for iniciado, você ficará surpreso quantas configurações e opções você tem Mas não se preocupe, explicarei tudo em breve. Tudo é fácil. Você só precisa entendê-los. Eles são todos um monte de textos e muitas coisas, mas você não precisa necessariamente ajustar tudo aqui. Você tem inferência de modelo aqui. Você poderá usar seu modelo depois de treiná-lo. Aqui, usaremos isso para remover os vocais das músicas e também remover os instrumentos das músicas para que você possa criar uma capa de IA da sua voz E aqui no Train Tab você poderá clonar sua voz É aqui que vamos começar. E aqui é como uma coisa experimental em que você pode pegar dois modelos de voz, misturá-los e obter um modelo de voz único, como em fantasias ou animes como Dragon Ball Se você assiste Dragon Ball ou gosta de Goku e Vigita, eles se fundem e então eles têm uma voz única ou algo parecido Sim, e aqui na exportação, não tenho certeza do que é isso, mas acho que o ON X é algum tipo de software. Então, aqui você pode exportar seu modelo de voz para o ONNX. E aqui você tem algumas perguntas frequentes, mas na minha experiência, elas não são realmente úteis. Se você tiver alguma dúvida, terei respostas melhores para elas do que aqui. Aqui, acho que é apenas um conhecimento geral caso você tenha algum problema. Mas nem todo erro está listado aqui. De qualquer forma, é aqui que começaremos na guia trem. Então, vamos para a aba do trem. Como você pode ver, haverá muitas coisas. Vamos começar do topo até o fundo, onde, na verdade, vamos começar a treinar a voz. Primeiro de tudo, primeiro passo, precisamos nomear nosso modelo de voz. Aqui você precisa se certificar de não usar caracteres especiais além sublinhado ou talvez um sinal de menos Se você usar qualquer caractere especial diferente desses, porque está usando Python como linguagem de programação, haverá erros, então você tem que nomeá-lo de algo como, no meu caso, vou nomeá-lo algo como, à frente Vali First, vamos pular esses dois e precisamos escolher a versão dois porque queremos a versão dois porque queremos melhor qualidade possível Queremos usar o RVC V two, que é o mais recente, melhores recursos Então, como você pode ver aqui, agora temos três opções para as quais você pode escolher isso, acho que é um modelo de voz de tamanho menor Mas como queremos o melhor, precisamos escolher as melhores opções. Então 48 K, e aqui está escrito Orientação de tom para o modelo , necessária para cantar. Opcional para fala. Diz opcional, mas eu meio que discordo disso. Porque sem isso, você não terá emoções em seu modelo de voz. E seu modelo de voz não terá vários tons. Ele terá apenas um tom e soará monótono É mais ou menos assim, Dom Faso, se você definir como falso, é assim que vai soar Então você tem que definir isso como verdadeiro. Então ele pode dizer domas, então ele pode ter tons diferentes Em seguida, ele diz o número de processos CP usados para processamento de dados de extração de pitch. Se você quiser que seja preciso, configure-o para o máximo. E a segunda etapa, aqui vamos implementar os dados de voz a partir dos quais você preparou antes que eles precisem do caminho do treinamento. Você precisará ir para a pasta de treinamento, por exemplo, eu tenho os meus em arquivos e depois em vozes. E agora eu tenho minha voz aqui. O que temos que fazer é voltar. Precisamos clicar com o botão direito do mouse na pasta em que nossos dados de voz estão localizados e copiar como caminho. Em seguida, voltamos ao navegador. E destaque tudo isso e controle V e cole. Então, a ideia do alto-falante cantor, que é o seu modelo de voz. Basta definir qualquer número e deixá-lo em zero. Eu prefiro deixá-lo como padrão para que não tenhamos problemas. Em seguida, clicamos em Dados do processo e depois esperamos. Essa caixa será destacada em laranja, o que significa que está em execução, então só precisamos esperar que ela termine. Quando terminar, ele parará. Sim. É assim que ficará quando terminar Também dirá pré-processo e dirá Sucesso. Etapa dois, aqui ele mostrará sua GPU. Se você tiver mais de uma bolsa, ela mostrará 01 a, e aqui você poderá selecionar sua GPU No momento, se você tiver apenas uma GPU, deixe-a em zero e você também deve selecionar a melhor GPU que você tem No meu caso, essa é a melhor GPU e a única GPU que eu tenho que é zero E isso é RTX 30 80. Na verdade, isso funciona com todo e qualquer laptop ou PC disponível. Porém, quanto melhor seu laptop, mais rápidos serão os resultados. Não demorará muito para treinar o modelo de voz. Se você tem um PC melhor, precisa selecionar o algoritmo para extração de palhetas para obter a melhor qualidade. Selecione Colheita. Há PM e há O, mas são relativamente piores. Selecione Colheita e clique em Extração de recursos. Então agora você só precisa esperar por isso. Você pode rolar se quiser. Você pode dar uma olhada nas coisas que estão acontecendo e esperar por elas. Você também pode ver as mudanças em tempo real aqui no comando. E também mais uma coisa, não feche. Quer dizer, você pode minimizar o prompt de comando ou o CMD, mas não clique em X. Caso contrário, todo o programa não funcionará Como na verdade está sendo executado nele, o navegador é como uma interface de usuário para que possamos acessá-lo. Então, agora está pronto, está tudo pronto, pronto e parou de brilhar Descemos na etapa três. E aqui vamos definir as configurações para treinar nosso modelo de voz. Primeiro, você tem que selecionar a época antes de entrarmos na frequência segura, temos que entrar na época, você entende o que é Épocas. O que são épocas épocas são basicamente como quantas vezes sua IA treinará sua voz se você configurá-la para uma vez Você vai treinar uma vez, 20 vezes, 200 vezes, e quanto mais, melhor. Mas, como regra geral, é assim que deve ser Vou abrir minha nota para te mostrar. Se seu modelo de voz for inferior a 10 minutos, a época deverá estar entre 100, 200 épocas Se seu modelo de voz, quero dizer, se seu áudio de voz for igual ou superior a 10 minutos, você pode ir 200 a 300. Qualquer coisa acima de 300 realmente não faz muita diferença Se você já teve problemas ao configurar essas épocas, tente diminuí-las e depois clique em Treinar novamente Porque às vezes, talvez seu laptop seja multitarefa ou talvez se sua GPU não seja tão forte, acho que pode haver alguns erros Portanto, você deve retreinar seu modelo de voz usando épocas mais baixas Então, por uma questão de tempo, vídeo, vou definir as épocas para 20. A frequência de salvamento é como quantas épocas até que seu software salve o modelo de treinamento Normalmente deixo às cinco para não perder. Mas se você contratar cerca de 2.200 ou 300, você pode definir como 25 ou 50, o que você quiser Depende da rapidez com que seu PC treina o modelo de voz e depende de quantas épocas você o configurou para deixar esse tamanho de lote por GPU como padrão, até mesmo salvar apenas o arquivo de ponto de verificação mais recente para economizar espaço em até mesmo salvar disco, basta deixá-lo como padrão, o que, como você sabe, se você clicar em sim, diz que grandes conjuntos de dados consumirão muita memória da GPU, talvez não seu PC treina o modelo de voz e depende de quantas épocas você o configurou para deixar esse tamanho de lote por GPU como padrão, até mesmo salvar apenas o arquivo de ponto de verificação mais recente para economizar espaço em disco, basta deixá-lo como padrão, o que, como você sabe, se você clicar em sim, diz que grandes conjuntos de dados consumirão muita memória da GPU, talvez não fornecem muitas melhorias de velocidade. Deixe como você sabe aqui. Clique em Sim, só por segurança , pois quando ele for salvo, você poderá usar esse modelo. Então você tem aqueles modelos pré-treinados baseados, caminho G e caminho D. Essas coisas são como quando você treina seu modelo de voz e, como está apenas começando, não precisa pensar muito sobre isso Mas se você quiser treinar novamente seus modelos depois de treiná-los, acesse a pasta RVCs e encontre o caminho e o caminho D do modelo de voz E depois passe pelos caminhos aqui para que você possa melhorar esse modelo de voz. Em seguida, insira a GPU que você está usando, que é zero. No final, você precisa clicar em Train Model. Agora você só tem que esperar. Você pode ver o comando, solicitar o CMD e esperar que ele termine um monte de coisas. E então você pode ver que ele dirá algo como época uma época até chegar ao fim da quantidade de épocas Então, dirá que foi bem-sucedido no final. Como você pode ver aqui, diz que o treinamento está concluído e o programa está encerrado e, em seguida, é um sucesso final e salvador no checkpoint Se disser isso, significa que você clonou com sucesso seu modelo de voz Ele está pronto para uso agora mesmo em qualquer aplicativo que você possa imaginar. No próximo vídeo, mostrarei como usá-los nas aplicações do modelo de voz clone. 4. Usando modelo de voz em conversão: Agora é hora de usar o modelo de voz em RVC. Da última vez que treinamos o modelo de voz na guia Treinar, agora ele está disponível para uso na inferência do modelo Se você acessar o Model Inference, atualizar a lista de vozes e o caminho do índice e abrir isso, não verá muitos modelos porque eu já clonei É claro que você precisa de permissão para clonar vozes. Não basta clonar vozes. Tudo bem, se você passar por isso, encontrará seu modelo de voz. No meu caso, eu tenho a voz clonada do último vídeo, que é Adel Agora você o seleciona e pode usá-lo aqui. Portanto, haverá várias configurações. Mas agora vamos usar isso apenas para fala a fala. Então, como vamos fazer isso é trazer qualquer áudio do Youtube ou algo parecido, baixá-lo e colocar esse áudio. Em seguida, vamos converter a voz da pessoa em nossa voz. Então, vamos fazer isso. Então, eu baixei um áudio de três MP desse vídeo. Reflexões sobre humanidade, fama e amor. Shao Han, o famoso ator indiano, ele disse algumas coisas muito boas aqui e eu queria ver como soaria se fosse eu quem dissesse essas coisas Então eu baixei o áudio e agora vou usá-lo no RBC para converter a voz dele em minha voz Então, vamos seguir em frente e fazer isso. Primeiro, você precisa seguir em frente e encontrar o caminho do áudio que deseja usar para converter a voz da pessoa em áudio, na voz do modelo de voz. Então, você clica com o botão direito do mouse no arquivo em vez da pasta desta vez, copia o caminho dele e cola aqui e está pronto. Desde que a voz seja homem para homem e de mulher para mulher. Se for de homem para mulher, você deve alterar essa opção aqui, como você pode ver aqui. Ele até recomenda que você diga mais 12 teclas para conversão de homem para mulher e menos 12 teclas para conversão de mulher para homem. No momento, é de homem para homem. Então isso significa que simplesmente deixamos como zero. Mas se fosse um homem gostar da Hana ou de outra pessoa, teríamos que diminuir isso em menos 12 Se fosse de mulher para mulher, zero também. Mas se fosse de mulher para homem, como Hana, por exemplo, minha voz, eu a configuraria para menos 12 Por exemplo, se você fosse uma mulher e estivesse convertendo a voz de Michael Jackson, sua voz, você tinha que configurá-la para 12 positivos para que funcionasse corretamente Então, agora que é do mesmo sexo, deixamos como zero. E então temos que definir isso como estranho porque tem a melhor qualidade para conversão de voz E aqui há várias outras configurações. Você pode examiná-los e ver o que eles fazem. Alguns deles são como para respirar. Vou apenas dar algumas explicações sobre isso. Este serve para filtrar o sopro e outras coisas, e este é para evitar artefatos e outras coisas Mas você precisa equilibrá-los. Em cada configuração, todos eles fazem algum tipo de coisa de uma forma ou de outra, como esta aqui para imitar o volume dos vocais originais Como o volume alto ou baixo. E este é para reamostragem do áudio, este é para a intensidade do sotaque Você entendeu a ideia. As configurações recomendadas são apenas para diminuir um pouco o sotaque. E isso tudo porque , se for muito alto, pode levar a artefatos e estamos prontos para clicar em Converter Agora, como você pode ver aqui, ele está carregando, então só temos que esperar que ele termine de carregar. Em seguida, obteremos nossos resultados em breve, enquanto nosso áudio estiver sendo convertido. Aqui embaixo está escrito conversão em lote. Isso é como converter vários arquivos de áudio. Eu nunca o usei, então não tenho certeza de como vai funcionar, mas acho que ele faz o que diz que faz Você não precisa realmente passar por tudo isso. Você pode se concentrar apenas no que está no topo. Então, vamos lá. Nosso áudio está pronto, vamos ouvi-lo. Então, sim. Então, sim, quando o áudio está sendo convertido, ele converte literalmente tudo, como o som de aplausos, o som da música É por isso que você precisa trazer um áudio que tenha apenas a fala ou a voz de alguém e, se você tiver algum outro ruído, ele também o converterá. Mas está tudo bem nesse caso , porque é só o começo. Vamos avançar um pouco. Parece um pouco descuidado da minha parte. Agora, eu me lembro da noite meu pai morreu e me lembro do motorista de um vizinho que estava nos levando ao hospital. Ele murmurou algo sobre que as pessoas não dão gorjetas tão bem e vão embora para o. Então, sim, você pode ver que a voz foi convertida. Mas, infelizmente, como o áudio original tem algum eco, o som do público como a multidão e todo esse barulho, todos eles influenciaram a qualidade dessa conversão final Então você precisa encontrar algo que soe bem para poder convertê-lo. E vamos falar direto sobre isso na música cover. Mas antes disso, isso é fala a fala. Certo? Vou te mostrar rapidamente como você pode usar isso para conversão de texto em fala. Infelizmente, porém, a conversão de texto em voz exige que você pague uma assinatura de 11 voltas, como você pode ver aqui, diz que você começa e depois se inscreve e pede que você pague E então, quando você pagar, eu vou te mostrar o que você pode fazer. Tudo bem, então estamos em 11 laboratórios. Como eu já paguei pela assinatura anteriormente, posso acessá-la. Então, como você o usa para conversão de texto em fala Clique no sinal de mais aqui clique em clonagem de voz instantânea Então você dá o nome, o que quiser. Como, por exemplo, meu nome que eu tinha, Belushi. E então você tem que clicar aqui e selecionar sua voz, não o modelo de voz. Você precisa selecionar a gravação que você gravou anteriormente. Tudo bem. Vou selecionar o arquivo da minha gravação de voz e clicar em Confirmar que tenho os direitos e o consentimento e adicionar voz. Aguarde. E agora eu posso, agora você pode usar sua voz. Você pode digitar qualquer coisa em qualquer idioma e funciona. Então, digamos que eu vou dizer algo como olá, lá estou eu, Dragon. Olá, aí estou eu, dragão. Quero dizer, às vezes parece um pouco estranho. Você tem que brincar com as configurações. Continuem avançando, pessoal. Quanto mais dados você obtiver, melhores serão os resultados. Vamos ver como eu soo em espanhol. Ah, bom. Aparentemente, sou eu falando espanhol. Então é assim que você usa a conversão de texto em fala. Então é isso nesta parte, e na próxima parte, vamos experimentar uma música cover. 5. Cover de IA W/RVC: Bem-vindos a todos. Já era hora de usarmos nosso modelo de voz para uma música cover de IA. Então, vamos direto ao assunto. Então, primeiro de tudo, você precisa ir ao Youtube e escolher qualquer tipo de música que você gostaria converter em sua voz. No meu caso, eu gostaria de ter uma música cover de IA de Diamonds Então, primeiro você precisa baixar o áudio da música. Você pode usar qualquer tipo de site para baixar o áudio. Vou usar o meu próprio, que é o fork video downloader Eu recomendo. É bom. Depois de baixar sua música, você precisa renomeá-la para que ela não tenha erros Você precisa remover os espaços e, sim, clicar em Enter. Vamos direto ao trabalho de conversão de voz. Temos que usar o acompanhamento vocal, que é a aba de separação de instrumentos E aqui você deve remover o caminho porque ele tem problemas. Não use o caminho. Em vez disso, traga o áudio e arraste-o até aqui. E então, no modelo que não é o modelo de voz, você precisa selecionar HP três, todos os vocais. O resto das coisas fazem diferentes tipos de coisas. Aqui explica isso, mas alguns deles servem para remover o eco, obtendo apenas o vocal principal Mas para o propósito deste tutorial, você deve usar os vocais. E então aqui, há um problema. Diz aqui a saída para vocais e aqui está a saída para acompanhamento Na verdade, é o oposto. Então, aqui deve estar no caminho de saída para instrumentos e aqui deve estar o caminho de saída para vocais. Acho que eles tiveram alguns problemas para nomeá-lo e os confundiram ao nomeá-los Então, o que eu gostaria de fazer é ter uma pasta para vocais e acompanhamento, que são os instrumentos, assim aqui Instrumentos e vocais. E então, quando você entra nela, há uma pasta de instrumentos e uma pasta de vocais. Clique com o botão direito do mouse no caminho de cópia dos vocais e depois acompanhe o acompanhamento, porque, como mencionei, está confuso por E depois voltamos. Clicamos com o botão direito do mouse no caminho do instrumento e colamos nos vocais. E então podemos exportá-lo em qualquer formato. E eu gostaria de exportá-lo em MP três. Em seguida, clicamos em Exportar. Depois, podemos ver o comando, acionar o CMD e esperar que ele faça sua mágica Então, como você pode ver aqui, ele está fazendo seu trabalho. É separar os vocais do instrumento para que possamos usar os Tudo bem, então, quando estiver pronto, pode aparecer um texto em vermelho que diz que esse arquivo ou diretório não existe. Isso lhe dá a falsa ideia que talvez você tenha cometido um erro, mas não, na verdade, funciona. E a prova é que aqui diz sucesso. Então você pode ir direto para as pastas e ver esses instrumentos e vocais entrarem nos vocais Na verdade, por algum motivo , dirá instrumento, mas não é o instrumento. Acho que isso significou que o instrumento foi removido. Então, está nos vocais agora. Vamos usar os vocais para converter a voz de Rihanna na minha Vamos direto para a inferência de modelos aqui. Já que estamos fazendo uma conversão de Rihanna feminina para masculina para significar, defina isso para menos 12 e então temos que copiar o caminho do vocal mas que por algum motivo diz cópia do instrumento, cole aqui, acho que terminamos Clicamos em Converter, deixamos o RVC fazer sua mágica Tudo bem, então está tudo pronto, mas esses são apenas os vocais, então vamos ouvir um pouco, uma forma imediata. Tudo bem, então você ouviu os vocais. Agora precisamos realmente misturar os vocais com o instrumento Então, parece uma capa completa, então você pode fazer isso com qualquer software de edição que você tenha. Premiere Pro ou qualquer outra coisa. Eu vou te mostrar um exemplo disso. Primeiro você precisa clicar nos Três Pontos aqui e baixar o áudio para o seu PC Então você pode renomeá-lo para algo como seu nome, que é, no meu caso, meu nome é À frente. Vocais de diamante. Aí está. E vamos seguir em frente e usar o software de edição para criar uma boa capa. Quando você mistura seus vocais com o instrumento, aponte o instrumento, não é chamado de instrumento aqui Quando você vai tocar instrumentos, por algum motivo, isso é chamado de vocais. Não sei por que o RVC confundiu isso. Não são os vocais, pessoal, é o instrumento, na verdade, está misturado. Jogamos aqui e sacou. Agora você pode ir em frente e ouvir a capa com sua voz. Sim, quando. Uau, sim. Como isso é IA, pode não parecer perfeito, mas bem, pelo menos sabemos como eu soo quando canto isso. Sim, não é? Sim, então esse será o seu projeto de classe. Você deve me mostrar qual música você usou e me mostrar os resultados em vinil de sua capa de IA depois de remover os vocais e instrumentos e depois converter os vocais em sua voz, e depois de mixá-los, seus vocais, seu vocal personalizado, feito pela IA e o IA e E me mostre os resultados finais. Tudo bem, você pode precisar de algumas habilidades de edição. Eu não vou te ensinar que você deve aprender sozinho. Mas mostre-me os resultados finais e me deixe impressionado. Tudo bem, pessoal, e eu vou te contar na próxima lição. 6. Conversão de voz sem GPU: Tudo bem, pessoal. Nesta parte, mostrarei como usar seu modelo de voz para fazer cover de uma música sem placa gráfica. A propósito, isso também funciona no seu telefone, desde que você já tenha o arquivo de modelo de voz PTH preparado ou talvez o baixe do Discord, como pré-preparado por outra pessoa Eu vou te mostrar como fazer isso. Primeiro de tudo, você precisa abrir seu navegador, seja ele um Google Chrome ou qualquer outra coisa, e depois pesquisar kits de aplicativos. Eu simplesmente gosto disso. Tudo bem, como você pode ver aqui. E centro de imprensa, e então você terá esses resultados. Clique em Minhas vozes. Basicamente, este site permitirá que você faça um cover de I apenas usando o motor que está nos servidores, mas também tem algumas limitações e eu vou resolver isso primeiro. Você precisa ir em frente e fazer login. Quando você fizer login, ele solicitará seu e-mail. Se você já tem o Gmail, basta continuar com o Google e esperar que ele carregue. Então, ele carregará. Então você verá aqui que as limitações são que, se você estiver fazendo isso sem nenhuma assinatura e de graça, você terá algum limite de tempo. Por exemplo, agora eu tenho 15 minutos restantes. Isso significa que eu só posso fazer músicas de até 15 minutos, não mais do que isso. E acho que se regenera. Sim. Como você pode ver aqui, ele será atualizado primeiro Acho que é, sim, 14 de janeiro. Então eu acho que é tipo mensal. Ele será atualizado mensalmente todas as vezes. E também os caracteres para conversão de texto em fala, mas eu recomendo usar texto para fala em 11 risadas. Não é muito bom aqui. Quer dizer, no que diz respeito à conversão de texto em fala, eu o testei da última vez, talvez uma ou duas semanas atrás, e não é muito bom. Então, vamos nos concentrar apenas na música I cover para fazer sua voz funcionar. Aqui, você precisa clicar em Carregado na minha seção de voz e depois clicar em Carregar sua primeira voz, ou talvez seja a segunda. Terceiro. Depois de fazer isso, você clicará em Voice Model aqui e procurará seu arquivo PTH onde quer que o tenha colocado Quer dizer, se você não sabe onde ele está localizado, você precisa acessar o arquivo de modelos RVC que criamos nos vídeos anteriores E então você verá seu arquivo PTH na pasta Weights no software beta do RVC Quando você for lá, clique em Pesos e você terá seus arquivos PTH. Talvez você só tenha um porque, desde que está começando, tem seu primeiro modelo de voz. Então você terá o PTH em algum lugar talvez na parte superior, clique duas vezes nele E então você pode nomeá-lo. Vou chamá-la com meu próprio nome porque é minha voz. E depois desça. Você também pode exibir a imagem se quiser, mas vou pular isso Eu vou te mostrar de qualquer maneira. Você clica nele, vai para Imagens, e então você pode simplesmente colocar sua própria imagem ou quem quer que seja e depois fazer o upload do modelo E então, como você pode ver no canto inferior direito , está sendo carregado. Está fazendo o upload do modelo de voz que preparamos no URVCVtwo ou talvez você o tenha baixado deste tribunal para que possa ser usado Depois de fazer o upload, você pode usá-lo em seu telefone. Você não precisa de nada, como se nem precisasse de um médico forte ou algo assim Na verdade, funciona com essa GPU. Funciona. Você não precisa de um laptop muito forte. Você só precisa de uma conexão com a Internet, um navegador e pronto. Isso significa que provavelmente pode até funcionar no seu Nokia. No que me diz respeito, você pode trabalhar com qualquer telefone que você possa imaginar. Qualquer laptop. E quero dizer, desde que você tenha carregado o modelo de voz no site, depois de fazer o upload do seu modelo de voz no site, você pode ver que tem opções diferentes lá. Temos para entrada de voz, temos arquivo de áudio, você pode soltar os vocais ou inserir o link da música no Youtube E opções diferentes aqui como gravar sua própria voz ou a de outra pessoa e depois convertê-la no modelo aqui. Portanto, é semelhante à conversão de voz RVC que mostrei nos vídeos anteriores E sim, temos configurações de ventilador, vamos superar isso. Então, agora estamos focando na música cover de I, então vou pesquisar no YouTube.com, vou pesquisar estradas rurais, uma das músicas mais populares conhecidas no planeta Terra, então vou clicar nela Desculpe por isso. De qualquer forma, foi um pouco alto para mim, então vou copiar o link da música de Country Roads e clicar no link Entrar no Youtube e colar aqui. E então vamos lá. Nós temos isso. Então, vamos para Configurações avançadas. E aqui é muito importante, assim como mostrei no vídeo anterior. exemplo, quando convertemos as vozes, precisamos ter cuidado com o tom. Se é homem para homem, mulher para mulher, agora é homem para homem, é 00, tudo bem. Mas às vezes você precisa se ajustar, mesmo que seja do mesmo sexo e se for de um gênero diferente, por exemplo, homem para mulher, você precisa aumentá-lo em 12 positivos. E se for o oposto de mulher para homem, isso significa menos 12. E se for de mulher para mulher, assim como de homem para homem, é zero. Mas às vezes precisamos nos ajustar acordo com o tom da voz da pessoa. Porque não temos apenas um campo para homens e um campo para mulheres. Todos os sexos, todas as pessoas neste planeta têm tons diferentes Mas, de um modo geral, de homem para mulher, a conversão deles, como quando você converte entre eles, geralmente é em torno de menos 12 a 12 entre isso. De qualquer forma, agora é masculino, voz de John Denver na minha voz, de homem para homem Isso significa zero aqui. Quer dizer, também posso ajustar o tom se achar que não soa bem, mas vou deixá-lo em zero por enquanto. Força de conversão, eu recomendaria apenas diminuí-la. Talvez em 75 ou talvez 70%. Porque valores altos, como afirma aqui, também podem levar à correção excessiva de artefatos E o volume do modelo, deixe como está. Esse é o volume do nosso modelo de voz. Então aqui eu recomendo simplesmente desligar tudo isso. O Compressor serve basicamente para quando as músicas ficam muito altas. Passe alto, passe baixo. São apenas alguns efeitos parecidos com áudio. Se for muito barulhento, haverá uma marcha para que não fique muito Assim como o compressor, basicamente os efeitos de pós-processamento, você pode colocar o refrão para fazer sua voz soar basicamente como se fosse um canto, não sei como explicar, mas é como ajustar automaticamente, reverberar, atrasar o que são , reverberar como echo, até mesmo atrasar o como echo Basicamente, o que mencionamos aqui, se estiver ficando muito alto, isso o comprimirá Faça-o mais baixo e não muito alto, mas vamos deixar como está. Vamos clicar em Converter. Então podemos esperar. Isso também é bom. É muito simplificado , na minha opinião. Muito simplificado do que no RVC, porque quando você coloca o link, basicamente ele fará tudo por você Ele vai dividir o que é chamado, os vocais dos instrumentos, e então vai converter sua voz E então ele vai misturar os dois juntos. Então você não precisa fazer tudo isso, basta fornecer o link. E apenas algumas configurações e depois boom. Agora tudo o que você precisa fazer é esperar alguns segundos e tudo funcionará. Lembre-se de que isso funciona com laptops e telefones, qualquer coisa que você tenha, funciona. No momento, usamos o link do Youtubes para colocar a música cover da IA Ele fará tudo sozinho, mas se você tiver seus próprios vocais ou seu próprio discurso, você também pode colocá-los aqui Porque isso não é apenas para músicas cover de IA, isso também se você tiver um vocal separado que já tenha preparado. Talvez um personalizado, não sei, em algum lugar como fora do Youtube. E então você pode simplesmente colocá-lo aqui e pronto, funciona. Ou se você tem algum tipo de fala como na conversão RBC que mostrei nos vídeos anteriores, você coloca aqui e depois o mesmo conceito Você tem configurações avançadas e depois pode ajustar o tom e outras coisas São apenas coisas semelhantes , mas entradas diferentes. Como você viu anteriormente, ou você coloca o link do Youtube ou coloca seu próprio áudio. Esse áudio pode ser fala, pode ser vocal, pode ser qualquer coisa, ou você pode gravar áudio que também está aqui nas opções, como existem outras Depois, houve uma última coisa, é como uma versão beta, mas não importa agora. No momento, demorou cerca de 2 minutos para fazer isso. Então, vamos ouvir isso, certo? E também, você pode baixá-lo, a propósito, e você também pode compartilhá-lo e outras coisas. Então, vamos ouvir isso. Então, depois de clicar na placa, você precisa esperar quase o paraíso, West Virginia. Sim, parece muito bom, certo? Nossa, a música cover, como se tivesse avançado Parece muito melhor agora. De qualquer forma, voltando ao assunto. Então, quando você acessa o arquivo de áudio, ou você coloca seus próprios vocais ou qualquer outra voz que deseja converter ou traz um link do Youtube ou seu cabo aqui ou um áudio de demonstração gratuito. Não tenho certeza. Ah, diz que você pode experimentar algum modelo de graça, mas isso não importa de qualquer maneira. Então é isso para este vídeo. Esse é o site, que se chama apps do kits into Ti. Mas não digite isso no seu navegador. Como aplicativos, kits de pontos no I, porque, por algum motivo , isso gera um erro. O que eu sugiro é que você digite aqui, app Kitai e depois entre neste link aqui, porque é assim que funciona para mim Sim, é isso mesmo. E nos vemos na aula do Linkt 7. FINAL: conversão em tempo real: Olá a todos. Bem-vindo à última parte desta videoaula. Será sobre o uso da voz em tempo real, usando um software chamado Okada Então, vamos instalá-lo. A primeira coisa que você precisa fazer é acessar o Google e pesquisar Okada getup Depois disso, você obterá esses resultados. Entre neste link, clique nele e vá rolar até ver um índice. Aqui, você clica naquele que é um aviso de isenção de responsabilidade em que isso não funciona Não tente, mesmo que esteja escrito Mac. Não instale no Mac porque não funciona, é muito fraco para isso. O Windows geralmente funciona para isso. Se você é um usuário do Windows, vá em frente e baixe este. Se você é usuário, basta comprar um PC com Windows quando chegar aqui. Se você é usuário do Windows. Se você chegar aqui, quando chegar aqui, role para baixo e encontrará versões diferentes. Como você pode ver no canto inferior esquerdo da tela , ao passar o mouse sobre os links, é possível ver as diferentes versões Eu olho a versão mais recente e faço o download, no meu caso, na data atual, que é 121-22-0203, parece que esta é a versão mais Vá em frente e baixe isso. Clique nele e depois coloque aqui e aguarde o download Eu já baixei um antes. Eu vou cancelá-lo. Eu vou te mostrar como o que você vai fazer. Basicamente, você terá esse arquivo zip, você precisa clicar nele. E então, se você estiver usando um Windows 78, uma versão diferente, você terá essas opções. Talvez você não tenha vento, talvez tenha isso sobre aquilo. Ou se você tiver esse extrato aqui. Depois de fazer isso, você terá essa pasta aqui. Clique duas vezes nele. Clique duas vezes novamente. Sim, você terá esses tipos de pastas e arquivos aqui. Precisamos procurar algo que diga, deixe-me ver. Acho que se chama Start Underscore HTTP. Sim, aí está. Esse é o arquivo de execução. O que vamos fazer é clicar com o botão direito do mouse nele e mostrar mais opções. E envie para o Desktop. Clique em seguida, você o terá no Desktop aqui. Você pode ir em frente e renomeá-lo para, se quiser. Vou ligar para ele também porque eu já instalei. Em seguida, você clica duas vezes nele. Depois de clicar nele, demorará um pouco. Na primeira execução, ele mostrará barras de download e instalações de coisas. Depois disso, quando terminar, você pode aparecer com essa janela branca Sim. Além disso, ao executá-lo, novamente, você não precisa passar pela instalação, basta clicar duas vezes nele. É isso mesmo. Depois de ter essa janela, clique em Iniciar. Sim, você terá os primeiros quatro modelos, ou talvez cinco modelos pré-instalados que você pode usar. Elas são todas como vozes femininas. Se você cair, terá diferentes tipos de configurações. Talvez isso seja confuso, mas vou explicar agora Primeiro, você tem que escolher seu modelo, por exemplo, eu clico em um modelo feminino agora, aí está pronto para uso e você pode alterar o ganho e a saída. Mas também uma coisa importante é que você tem que mudar a melodia. Assim como no RVC, quando é de mulher para homem, você precisa ajustá-lo, também de homem para mulher, e talvez às vezes de homem para homem ou mulher para mulher, dependendo do tom da voz Agora, como minha voz está mais profunda, preciso aumentá-la. Vou aumentá-lo em 12 positivos, assim como fizemos no software Okta Mas no software Okta, estamos mudando a voz do modelo para nossa voz Aqui estou mudando minha voz para a voz dessa pessoa. É o oposto. É como se fosse invertido. Uma vez que é de homem para mulher. No momento, tenho que aumentar ainda mais o tom positivo 12. Você também pode ajustar as entradas e saídas, se quiser, mas deixe como está e depois desça aqui também. É melhor usar isso com um microfone, se você tiver. Um microfone externo como este aqui. Funcionará muito melhor do que um microfone que está no laptop. Mas você pode ir em frente e tentar ver. Às vezes funciona, mas você pode ter alguns problemas de eco para combater isso Você tem essa opção aqui chamada eco um, supressão Eles funcionam, mas não são os melhores. Se você tiver um microfone externo funcionará muito, muito melhor. E então aqui você deve selecionar R M P O N X e, em seguida, rolar para baixo. Deixe-os como estão 256,40 96. Esses são como os melhores. P se estiver na CPU, mude para GP zero. Então aqui você deve selecionar sua entrada e esse é o microfone que você vai usar. No meu caso, é a onda três de Mic Lago. A saída é onde você vai ouvir a voz. Antes de te ensinar como usá-lo nesta quadra, primeiro precisaremos ouvi-lo. Vou selecionar meus fones de ouvido para poder ouvi-los. E depois desça até as configurações avançadas. Mude o tanque para 300 e a qualidade RVC para alta. Você deve sempre alterar isso para alto depois de reiniciar para obter os melhores resultados. Depois disso, você pode ir em frente e clicar em Iniciar, para ouvir a si mesmo falando. Você tem que esperar um minuto e depois falar. Fale. Olá. Olá. Meu nome é Ah Dragon. Estou aqui para te ensinar como lutar contra inimigos. Sim, como você ouviu, funciona muito bem. E você também pode usar o modelo V RVC que você treinou nas aulas anteriores Como você vai fazer isso? Primeiro, vamos localizar seu modelo RVC Como localizá-lo. Vá para a área de trabalho. Lembra daquele atalho que criamos para o RVC? Clique com o botão direito do mouse, clique em Abrir localização do arquivo e, em seguida, role para cima até encontrar a pasta chamada Pesos Talvez ele esteja localizado forma diferente para você, se você não o encontrou. Pode estar em algum lugar nos registros, como você pesquisa por ele ou você mesmo procura por ou pesquisa aqui por pesos digitando os pesos Em seguida, ele mostrará a localização da pasta. Você vai lá mesmo. E depois de encontrá-lo, clique com o botão direito mostre mais opções. Se você estiver no Windows 11 e depois for enviado para o Desktop, dessa forma você terá acesso fácil aos seus modelos pois eles estão todos localizados aqui na área de trabalho. No momento, tenho modelos diferentes por aqui. Talvez você tenha uma da lição anterior. Então, quando você voltar para Okada, você pode ir para Editar Role para baixo até um espaço vazio, como um espaço em branco. No meu caso, são 12 agora, porque eu tenho outros que estão ocupados. Clique em Carregar. Clique em Selecionar. O arquivo iria para o local da pasta do seu modelo. Vá para a área de trabalho e, em seguida, role. Digamos que você encontre a pasta de pesos que você criou. Você também pode renomeá-lo se quiser clicar duas vezes nele Em seguida, selecione o arquivo PTH que você tem para o modelo que você já criou Por exemplo, minha voz eu tinha V dois. E então eu clico em Carregar. Mais uma coisa, ok. Funciona apenas com a forma como requer conexão com a Internet. Portanto, verifique se você tem uma ótima conexão com a Internet. Sim, depois de selecionar isso e clicar em Carregar, basta fechar e você encontrará seu molar em algum lugar aqui Será como o último que você criou. Então eu o tenho aqui. Clique nele. Como é minha voz, soará como minha voz, então não preciso afiná-la nem nada. Então, vou clicar em Iniciar. Olá. Olá. Meu nome é Zahid Dragon. Meu nome é Zahi Dragon. Estou aqui para te ensinar a lutar, lutar contra inimigos, inimigos. Então, sim, essa é a minha voz. Agora vou te ensinar como você pode usar essas vozes em tempo real no Discord ou em outros aplicativos Eu vou te mostrar no Discord e depois vou te dar uma ideia geral de como você pode usá-lo em outros softwares Não vou mostrar todos os outros softwares, vou apenas mostrar um discord e ter uma ideia de como você pode usá-lo em outros softwares Vamos ao Google e depois você pesquisa por cabo VBD. Depois de pesquisar isso, você terá links diferentes aqui. Você clica no primeiro depois baixa o do Windows, porque de qualquer forma, isso só funcionará no Windows. Vai baixar, espere uns 5 segundos, eu acho. E então você clica nele. Então você precisa extrair isso. Você deve clicar com o botão direito do mouse nele. Ou sim, clique com o botão direito do mouse e mostre na pasta, depois clique com o botão direito novamente. Então, assim como com o arquivo anterior, o arquivo zip anterior, vamos extrair. Depois de extraí-lo, você verá esse pop-up Role para baixo para encontrar o cabo VB configurado 64 Você clica com o botão direito do mouse e executa como administrador. Clique em. Depois disso, aqui deve dizer driver instalado ou algo assim. Como eu já o tenho instalado, ele diz remover o driver, então eu não vou fazer isso. Eu já tenho isso. E depois disso, você estará pronto para usar sua conversão de voz em tempo real. Primeiro de tudo, você precisa reiniciar o software Kara. Então, vamos fazer isso. Vamos reiniciá-lo. Sim. Apenas espere por isso. Como você verá aqui. Como você notará aqui, é mais rápido. Eu não mostrei a instalação como ela será depois de instalada. Mas eu não quero tirar muito tempo de você, então eu acabei de te mostrar. Mas, basicamente, a primeira vez vai ser mais longa. A segunda vez será tão rápida quanto essa. Sim, depois de instalar o cabo de áudio VB , rolamos para baixo. Vamos deixar a entrada como está nosso microfone. E então a saída, nós a mudamos para entrada de cabo. Basicamente, o cabo de áudio VB é como um cabo virtual que não podemos ver que se conecta entre o software, quero dizer, o software de troca de voz que você vai usar para mudar sua voz e o software para o qual você vai usá-lo, como o Discord Primeiro, conectamos o software na saída à entrada do que é chamado de cabo. Basicamente, ele vai inserir a voz no cabo virtual e, em seguida, emiti-la. Quer dizer, vamos conectar o cabo de saída no disco, na entrada do discord aqui na saída selecionamos a entrada do cabo, certo? Então vamos para a discórdia. Vamos para Configurações, vamos para voz e vídeo. E então, no dispositivo de entrada, vou alterá-lo para saída de cabo. Agora, se eu usar minhas vozes aqui, se eu clicar em Iniciar, vai funcionar. Depois disso, se você quiser usá-lo para um software que não tenha as configurações de entrada e saída, você pode alterar o padrão acessando as configurações do Windows, pesquisando as configurações. E então aqui você pesquisa a entrada. E então ele mostrará a entrada de som. Clique nele. Então, aqui você apenas altera a entrada para a saída do cabo. Essa. Depois de fazer isso, quero dizer que não vou fazer isso agora, porque senão você não vai me ouvir. Mas depois de fazer isso, você está pronto para falar com pessoas francas ou simplesmente se divertir, rir e se divertir com seus amigos e esse tipo de coisa Sim, então, apesar de tudo, esse é o fim do projeto. Espero que você tenha gostado. Certifique-se de concluir o projeto que eu lhe atribuí nas aulas anteriores. E também espero que você deixe uma avaliação para mim e para esta turma. E talvez eu não sei se há um comentário em Schultre, mas me diga o que você acha ou me mande uma mensagem ou algo assim Diga-me se você gostou e se gostaria de aulas diferentes. Estou aqui para te ajudar. E se você tiver outras perguntas, é isso. Quer dizer, pergunte-me nos comentários ou onde quer que estejam, DM's, se você gostaria que eu fizesse algum tipo de serviço, eu tipo de serviço para você Estou disponível em fibra. Você pode me ver como me chamo SamArb no Maya 8156 e esses são meus shows que eu posso ensinar, você pode pessoalmente ou curtir um a um ao vivo e eu posso direitos autorais para Eu tenho arte. Posso criar dois modelos de RVCV para você, se quiser, entre em contato comigo sobre fibra vejo na próxima vez. Tchau tchau.