Transcrições
1. Sobre o curso: Neste curso em vídeo, aprenda a fase do abraço
e seus conceitos Hugging Face é uma
empresa e comunidade de
código aberto que se
concentra no processamento de linguagem natural e inteligência artificial É mais conhecida por sua biblioteca de
transformadores, que fornece ferramentas e modelos
pré-treinados para uma
ampla variedade de tarefas de PNL, como classificação de texto, análise de
sentimentos, tradução automática Neste curso, abordamos as seguintes lições com exemplos de execução
ao vivo. Vamos começar com
a primeira lição.
2. Abraçando o rosto — introdução e características: Nesta lição,
aprenderemos o que é abraçar o rosto. Com isso,
também entenderemos as características. Vamos começar. Hugging Face é uma empresa amplamente
conhecida e comunidade de código
aberto
que se concentra na PNL, que é o processamento de linguagem natural Também se concentra na inteligência
artificial. Hugging Face é mais conhecida por sua biblioteca de transformadores, que fornece ferramentas e modelos
pré-treinados Para que uma ampla variedade de tarefas de PNL, como análise de
sentimentos, tradução
automática e
resumo de texto, possa ser As bibliotecas
Hugging Face mais usadas são transformadores,
conjuntos de dados e tokenizadores Vamos ver os recursos.
Inclui muitas bibliotecas. Uma das principais bibliotecas
são os transformadores. Isso inclui
modelos pré-treinados, como o BT. Abraçar o rosto também
inclui o Model Hub. Essa é uma plataforma na qual os usuários podem compartilhar e baixar modelos
pré-treinados. Com isso, os usuários também podem baixar conjuntos de dados
e outros recursos Hugging Face também inclui uma biblioteca para uma
variedade de conjuntos de A biblioteca é chamada Biblioteca de Conjuntos de
Dados e
é usada para tarefas de PNL Hugging Face também
tem uma plataforma para hospedar e compartilhar demonstrações e aplicativos de
aprendizado de máquina , chamada de spaces Com isso, usando o Hugging Face, você pode facilmente implantar e usar modelos em ambientes de produção Hugging Face é ter uma forte comunidade
e colaboração Essa é uma comunidade
de desenvolvedores, amantes que contribuem
para o ecossistema. Vamos ver alguns dos
modelos populares do Hugging Face. O pássaro amplamente usado
é usado para entender o contexto das palavras
em uma frase. Sua forma completa é
representada por
codificadores bidirecionais de transformadores. É uma poderosa estrutura de aprendizado
de máquina de código aberto desenvolvida pelo Google para PNL Ele se destaca na compreensão do contexto de palavras
e frases,
analisando as relações
entre elas maneira bidirecional permitindo
que os computadores
entendam melhor o significado
da Também inclui PT, que é um transformador generativo
pré-treinado,
também um transformador de texto em texto
com aquele robô que é uma abordagem de bot robusta Robota é um modelo de linguagem
baseado em transformadores que emprega autoatenção para
analisar Robota aplica o mascaramento dinâmico onde o
padrão de mascaramento Ele oferece desempenho aprimorado
em várias tarefas de PNL. Portanto, você também pode relacionar a
BT com a Robota. Considere que o principal objetivo
do modelo Robota é melhorar o desempenho do modelo
de bordo abordando suas limitações Esses foram os
modelos populares da fase de abraços. Nesta lição, vimos
o que é a fase do abraço, seus recursos de introdução
e alguns modelos populares Obrigado por
assistir ao vídeo.
3. Abraçando o rosto — casos de uso: Nesta lição,
entenderemos os casos de uso da fase de abraços Hugging Face suporta
uma ampla variedade de casos de uso em PNL, visão
computacional e até mesmo
aplicações multimodais Vamos ver os casos de uso. A fase de abraço é amplamente utilizada. Discutimos alguns casos de uso
importantes aqui, começando com o EI
conversacional, que você já
conhece, ou seja, chatbds Ok, crie fóruns de
bate-papo inteligentes usando modelos como GPT, Blender board Essas ferramentas de bate-papo podem ser usadas para suporte
ao cliente, como assistência
virtual Com isso, você também pode criar sistemas de diálogo
interativos. Eles podem ser usados como assistência
educacional , bem como como conselhos de terapia. Em seguida, vem a análise de sentimentos, como o nome sugere, você pode analisar facilmente o feedback
do cliente, analisar suas postagens
nas redes sociais ou as respostas à
pesquisa para determinar o sentimento que é positivo,
negativo ou Com isso, gere
texto, gere facilmente artigos, blogs e até poemas
usando modelos como o GPT As citações também podem ser
facilmente geradas,
gerando trechos de código em
qualquer linguagem de programação Com isso, o conteúdo
pode ser gerado, incluindo
descrições de produtos, avaliações, planos
de marketing e outros. Em seguida, vem o resumo do texto. Se você quiser
resumir seu texto, digamos que você queira
resumir notícias, você pode fazer isso facilmente Com isso, digamos que você tenha alguns documentos PDF e queira
apenas resumi-los Esses documentos longos
podem ser facilmente resumidos em pontos
importantes Com isso, você também
pode fazer anotações de reuniões. Em seguida, vem o reconhecimento de sua
entidade nomeada, extraia
facilmente nomes, habilidades
e experiência dos currículos. Também é útil na área da saúde
identificar o diagnóstico, o nome dos pacientes, alguns termos
médicos e outros. Com isso, você também pode
extrair o nome das empresas forma como elas estão trabalhando de seus relatórios
financeiros. Portanto, também é usado
no domínio financeiro. Tradução automática,
como o nome sugere, você pode traduzir
o aplicativo do seu site e até documentos de um
idioma para outro, digamos, do
inglês para o espanhol. Também pode ser usado em
idiomas poucos recursos. Isso
é para tradução. caso de uso de perguntas e respostas é útil principalmente para o suporte
ao cliente Com isso,
responda facilmente às perguntas feitas pelos alunos com base em um livro ou notas
específicas As perguntas frequentes podem ser respondidas facilmente e, quando eu disse suporte
ao cliente, isso significa
que vimos tickets de
suporte em sites para que os usuários possam
fazer perguntas com facilidade Com isso, você pode recuperar
facilmente respostas de grandes documentos
ou bancos Use-o também para
reconhecimento e síntese de fala. Você também pode converter
fala em texto, criar aplicativos de controle de voz
usando modelos de fala em texto
e de texto em fala. Você também pode fornecer legendas em tempo
real, gerar descrições
para imagens Digamos que você tenha digitalizado um documento ou imagens e
queira um texto deles, você pode facilmente conseguir isso Além disso, se você quiser
ler ou digitalizar imagens, isso também pode ser feito. Isso significa resposta visual. Em seguida, vêm seus sistemas de
recomendação. Você deve ter visto isso no
Netflix ou no Amazon Prime. Recomende facilmente
filmes ou séries da web usando o que as pessoas realmente estão
curtindo em suas contas Com esse NAS, a pesquisa resulta da compreensão da intenção
dos usuários e de seu contexto Também detecte fraudes com facilidade. Com relação aos e-mails, detecte e
filtre
facilmente os e-mails do Sam, saúde
mental também pode ser
monitorada por meio de um modelo, analisando
facilmente o texto ou a
fala para que
as emoções possam ser detectadas, como estresse, ansiedade
ou até depressão. Com isso, entenda
as emoções dos clientes durante as
chamadas de suporte ou até mesmo o bate-papo. Texto para fala e fala
para texto também podem ser obtidos e traduções
em tempo real podem ser facilmente trabalhadas. Os aplicativos multimodais
analisam facilmente o conteúdo de vídeo. Com aplicativos multimodais,
você pode analisar facilmente, nem mesmo texto, mas
também vídeo e áudio Aplicativos de realidade aumentada também podem ser criados com facilidade para gerar dados de texto
sintético para treinamento e modelos de
aprendizado de máquina Você também pode parafrasear texto, identificar relações
entre entidades no texto, avaliar facilmente as redações ou tarefas
dos
alunos, criar ferramentas para correção
gramatical, vocabulário, vocabulário Uso em saúde
e ciências da vida. A partir dos
registros médicos de um paciente, você pode
extrair facilmente os insights. A partir de documentos legais,
extraia facilmente as principais cláusulas, obrigações ou qualquer risco possível Com isso, você também pode criar narrativas baseadas em
IA para jogos Analise as mídias sociais
com facilidade para que você possa identificar os
tópicos mais populares ou até mesmo as hashtags Analise também o impacto da
postagem feita por influências. Aplicativos multilíngues também podem ser criados para que você
possa ativar a pesquisa em
vários Discurso de ódio e conteúdo
prejudicial é algo que precisa ser corrigido. Com isso, você pode facilmente
detectá-los e moderá-los. Preveja facilmente as tendências do mercado de
ações analisando artigos de notícias, sentimentos nas redes
sociais, publicações
no Twitter e outros. Preveja eventos como o lançamento de
um produto, conteúdo de e-mail
personalizado
para campanhas de marketing, personalize o conteúdo do site ou do aplicativo com base nas preferências
e no comportamento do usuário. Ajuste modelos pré-treinados
para sua tarefa específica. Além disso, você pode comparar
o desempenho de diferentes modelos
em conjuntos de dados personalizados. Então, pessoal, vimos alguns dos ótimos casos de uso
da fase de abraços Nas próximas aulas,
implementaremos algumas delas.
4. Biblioteca de transformadores de abraços faciais: Nesta lição,
entenderemos a biblioteca de transformadores
da fase de abraço Também aprenderemos como
instalá-lo. Vamos ver. A biblioteca de transformadores é a biblioteca principal para modelos e pipelines
pré-treinados É uma biblioteca
Python de código aberto. Como eu disse antes, a Hugging phase desenvolveu a biblioteca de
transformadores, que é modular
e extensível Inclui milhares de modelos
pré-treinados para uma ampla variedade de tarefas de PNL,
como tradução, resumo de
texto,
classificação de texto e Portanto, nesta lição,
entenderemos o que é a biblioteca de transformadores, por que usar a biblioteca de
transformadores
, seus casos de uso e também
como instalar Vamos começar. Então, já vimos o que é a biblioteca de
transformadores aqui. Agora veremos por que usar
a biblioteca de transformadores. A biblioteca Transformers é
amplamente usada porque
é bastante simples de usar
com modelos complexos de PNL Ele fornece acesso
a modelos de ponta. Com isso, é apoiado por uma comunidade
grande e ativa. Ele suporta personalização
e ajuste fino. Com isso, você pode integrar a biblioteca de transformadores
com outras ferramentas Aqui estão alguns casos de uso
da biblioteca transformers, classifique os textos em categorias,
como classificação de texto no caso de
detecção de spam em Também identifique
entidades como nomes, datas e localizações no texto, que é chamado de reconhecimento de
entidade nomeada. Traduza textos entre diferentes idiomas
do inglês para o alemão com isso, gere
texto usando modelos como o GPT Implemente também a
resposta quotidiana. Isso é responder
com base em um determinado contexto. Vamos ver como instalar a biblioteca
de transformadores. Então, aqui estão maneiras diferentes. Use o PIP para instalar a biblioteca de
transformadores. PIP é um
gerenciador de pacotes para baixar, instalar e gerenciar pacotes e bibliotecas do
Python Com isso, você
também pode usar o Google Colab. Aqui você pode encontrar algumas
diferenças na sintaxe. Há um sinal de exclamação se você o estiver instalando no Google
Colab Com isso, você também pode instalar a
biblioteca de transformers diretamente do repositório Hugging Phase Então, vamos ver como instalá-lo. Usaremos o Google Colab para isso. Adicionaremos o seguinte
comando. Vamos ver. Aqui está o nosso navegador, vou digitar Google Colab e pressionar Enter Aqui está o link fornecido apenas
pelo Google
colab.research.google.com Aqui você pode ver que eu
já entrei na minha conta do Gmail, então
ela será aberta diretamente Eu cliquei em então ele está me pedindo para criar
um novo caderno aqui Esses são meus cadernos já
criados. Vou clicar em Novo caderno. Portanto, é um aplicativo web gratuito. Então, agora vamos usar o mesmo
comando aqui para instalá-lo. Eu vou te mostrar novamente.
Aqui está o comando. Ok, vamos digitar
o mesmo comando. Ok, o espaço PIP instala transformadores
espaciais. Depois disso, o que
precisamos
fazer é clicar aqui.
Está escrito para executar aqui. Você pode ver as execuções? Dessa forma, podemos instalar a biblioteca de transformadores
usando o Google Colab Você pode adicionar o nome do
seu notebook Python aqui. Então, isso criou um
Notebook Python. Se você conhece o Anaconda, pode facilmente adivinhar o que é um notebook
Python Salve-o aqui
e renomeie-o mais tarde. Então, aqui eu acabei de implementar essa sintaxe para instalar
a biblioteca de transformadores. Nesta lição, vimos o que
é a biblioteca de transformadores. Também vimos por que
é tão popular
, também vimos alguns casos de
uso e como instalá-lo.
5. Biblioteca de conjuntos de dados do rosto abraçado: Nesta lição,
entenderemos a biblioteca de conjuntos de dados
na fase de abraços Com isso,
também veremos como
instalá-lo . Vamos começar. A biblioteca de conjuntos de dados
fornece acesso fácil a uma ampla variedade
de conjuntos de dados para PNL e outras tarefas de aprendizado de máquina É desenvolvido pela Hugging
Face e é uma biblioteca Python. Isso torna mais fácil
para desenvolvedores e pesquisadores trabalharem com dados para treinar
e avaliar modelos Então, nesta lição,
veremos o que é a
biblioteca de conjuntos de dados e por que usá-la Portanto, use casos da biblioteca de
conjuntos de dados e como instalá-la Vamos começar. Já abordamos o que é a biblioteca
de conjuntos de dados Então, vamos começar explicando por que
usar a biblioteca de conjuntos de dados. Um dos motivos é a
eficiência, o carregamento lento
e o streaming, facilitando o trabalho com grandes
conjuntos Os conjuntos de dados podem ser enormes e sempre precisamos de uma
biblioteca ou tecnologia para facilitar o trabalho de acessar e
trabalhar nesses conjuntos Então, essa biblioteca realmente ajuda. Ele tem uma API unificada para
processar conjuntos de dados. Você também pode trabalhar com a Biblioteca
Transformers e
outras estruturas de ML com a biblioteca outras estruturas de ML com conjuntos de dados para que
a integração e a
interoperabilidade Milhares de conjuntos de dados são
fornecidos pela Huggingfas. Ele oferece suporte a conjuntos de dados personalizados
e pipelines de pré-processamento. Portanto, antes de instalar
a biblioteca de conjuntos de dados, deixe-me mostrar seu site Então, aqui está o link huggface.co, site oficial
dos Assim, você pode ver
quantos conjuntos de dados são fornecidos em mais de 350
K, e aqui está Se você clicar em qualquer um deles, poderá
obter todos os detalhes. Neste tutorial, também
mostraremos como baixar e acessar um conjunto de dados facilmente
usando o Huggingface Posteriormente, verei os casos de uso
ou a biblioteca de conjuntos de dados com facilidade para carregar e
pré-processar conjuntos para tarefas como Isso se enquadra na classificação de
texto. Com isso, você
também pode trabalhar com análise
de sentimentos e respostas
diárias Usando isso, você pode
criar facilmente sistemas de atendimento diário Alguns conjuntos de dados também são
fornecidos para tradução propósito de
reconhecimento da entidade nomeada também
pode ser preenchido com alguns conjuntos de dados já
fornecidos pela Hugging Carregue e pré-processe
seus conjuntos de dados personalizados
usando a biblioteca de conjuntos de dados Agora vamos ver como instalar a Biblioteca
de conjuntos de dados. Assim, você pode usar o gerenciador de
pacotes PIP PPAs para baixar, instalar e gerenciar pacotes e bibliotecas Python Basta usar o comando PIP
Space install space datasets. Com isso, você também pode
usar o Google Colab facilmente. Mas há uma diferença
entre as duas sintaxes. Você tem um ponto de exclamação para o Google Colab.
Veremos isso mais tarde. Com isso, você pode baixá-lo
diretamente do repositório HuggFasGitHub
usando
a sintaxe fornecida, os conjuntos de dados Git plus github.com
hugfacelash. Diga
ao S pip para instalar o pacote do repositório de conjuntos de dados hugging repositório HuggFasGitHub
usando
a sintaxe fornecida, os conjuntos de dados Git plus github.com
hugfacelash. Diga
ao S pip para instalar o pacote do repositório de conjuntos de dados hugging Phase no Github. repositório HuggFasGitHub
usando
a sintaxe fornecida, os conjuntos de dados Git plus github.com
hugfacelash. Diga
ao S pip para instalar o pacote do repositório de conjuntos de dados hugging Phase no Github. Agora vamos ver como instalar a biblioteca
de conjuntos de dados. Já vimos o Google Colab. Então, vou usar a segunda sintaxe para instalar a biblioteca de conjuntos de dados
no Google Então, essa foi a nossa Gold Collab. Já vimos como instalar a biblioteca
de transformadores. Podemos instalar a
biblioteca de conjuntos de dados aqui mesmo, mas deixe-me criar um novo
caderno, vá para Arquivo Clique em Novo caderno. Agora, um
novo caderno Python Vamos digitar o comando
para instalar conjuntos de dados, Pip install PIP space
install space datasets e apenas executar a célula a Eu também mostrei isso antes. Vamos esperar. O Tik Mark está visível. Isso significa que o
instalamos com sucesso. Você também pode
salvá-lo aqui, eu já lhe disse antes, salve e
vamos adicionar o nome ao
nosso notebook Python Então, dessa forma, pessoal,
podemos instalar facilmente
a biblioteca de conjuntos de dados Nas próximas aulas, também
veremos como trabalhar com eles
e seus casos de uso. Pessoal, vimos o que é
a biblioteca de conjuntos de dados. Entendemos facilmente
o conceito
, também seus casos de uso,
e também vimos como instalar
a biblioteca de conjuntos de dados
6. Biblioteca de tokenizers para abraçar o rosto: Nesta lição,
entenderemos biblioteca de tokenizadores
da fase
de abraços Com isso, também
veremos como instalá-lo. A Biblioteca de Tokenizadores é
uma biblioteca rápida e eficiente
para tokenizar texto,
que geralmente é usada junto com a biblioteca que geralmente é usada Já vimos a biblioteca de
transformadores antes nas aulas anteriores Portanto, a biblioteca tokenizer é uma
biblioteca rápida, eficiente e flexível
projetada para
tokenizar dados projetada para
tokenizar O que é uma etapa crucial no processamento da linguagem
natural. A tokenização envolve a
divisão de textos em unidades menores,
como palavras,
subpalavras ou caracteres, subpalavras ou caracteres, depois eles são convertidos em representações
numéricas Nesta lição,
entenderemos o que é a biblioteca do tokenizer, por que usá-la, seus casos de uso como instalá-la Então, vamos começar, já
vimos o que é a biblioteca de
tokenizers Então, agora veremos por que usar
a biblioteca de tokenizers. É muito rápido
para tokenização, que significa otimizado
para tokenização rápida, mesmo Ele também oferece suporte a tokenizadores
personalizados, além de ser flexível o suficiente para suportar vários A integração é possível. Isso significa que você pode trabalhar com outras bibliotecas de rostos atraentes,
como transformers Ele tem uma API fácil
para tokenizar, decodificar e Com isso, você pode
acessar facilmente tokenizadores pré-treinados. Agora vamos ver os casos de uso. Tokenize facilmente os dados textuais para classificar o texto para detecção de
spam Com isso, você
também pode analisar o spam. Faça análises de
sentimentos com facilidade, alinhe os tokens
com os rótulos das entidades Também é usado para tradução
automática. Alguns de seus outros casos de uso incluem geração de texto e
até mesmo respostas a perguntas. Com isso, treine e use tokenizadores para conjuntos de dados
específicos do domínio Agora, vamos ver como instalar
a biblioteca de tokenizers. Podemos usar o
gerenciador de pacotes PEP PIPs para baixar, instalar e gerenciar pacotes
Python, usar o espaço
Syntax PIP instalar e gerenciar pacotes
Python,
usar o espaço
Syntax PIP para instalar tokenizers para instalá-lo. Com isso, também podemos usar a biblioteca de tokenizers
no Já vimos como instalar
uma biblioteca no Google Collab. Da mesma forma, podemos usar o ponto de exclamação PIP space install space
tokenizers para instalá-lo Além disso, na terceira forma, você pode pedir ao PIP que instale
o pacote a partir do repositório de conjuntos de dados da fase
de abraço Você também pode usar
a terceira forma que é instalada diretamente do repositório Github,
Digite
o espaço PIP Instale o espaço Git
mais o caminho do Github
para instalá-lo mais o caminho do Github Agora vamos ver como instalar a Biblioteca
Tokenizers
no Abriremos o Google Colab novamente. Então, aqui está nosso Google Colab. Já instalamos
a biblioteca de transformadores e
conjuntos de dados. Podemos instalar a
Biblioteca Tokenizer aqui mesmo, mas deixe-me criar um novo Notebook
Python,
GodOfle clique em New Notebook GodOfle Agora, vamos digitar o comando. exclamação, espaço
PIP, instale tokenizadores de
espaço Clique aqui, Execute o Sell. Agora, a biblioteca de tokenizers
será instalada. Você também pode salvar isso.
Como eu disse antes, ele criará um notebook
Python Então, aqui, vou digitar o sublinhado
de Smith. Você pode adicionar qualquer nome. E
esse é o nosso caderno Python Ok, utilizaremos todas
essas bibliotecas mais tarde quando trabalharmos nos casos de
uso do Hugging Então, pessoal, vimos o que é
a biblioteca de tokenizers. Também vimos sua finalidade, bem
como os casos de uso. Com isso, também instalamos a biblioteca de tokenizers
no
7. Abraçando o token de acesso facial (chave API) e como criar: Nesta lição, aprenderemos o que é um símbolo em excesso de abraço Com isso, também
aprenderemos como
criá-lo . Vamos começar. Considere um token em excesso como uma sequência segura de caracteres. Isso é usado principalmente para acessar serviços
e recursos da fase
de abraço A fase de abraço, a chave de API e o
token de excesso da fase de abraço são Então, nesta lição,
veremos o que é um token em excesso, ou
seja, uma chave de API. Com isso, aprenderemos quando precisamos de um token de excesso da
fase de abraço Além disso, entenderemos que quando o token de
excesso da fase de abraço não for necessário, no final,
aprenderemos como criar uma chave de API. Vamos começar. Então, abordamos o que é um APK, ou
seja, um token
em excesso na fase de abraço Agora vamos ver quando
precisamos de um token de excesso da
fase de abraço Aqui está. Ao usar um modelo
privado ou fechado ou uma API de inferência,
você precisa de um token de excesso de fase de abraço Você deve ter ouvido falar
sobre Meta Sama. É um modelo privado. Para acessá-lo, você
precisa se autenticar. Isso significa que você
precisa criar uma chave de API. Você precisa de um token. Com isso, se você estiver usando
a API de inferência huggingpas,
precisará de um
token de acesso para fazer chamadas de API precisará de um
token de acesso para fazer Além disso, se você estiver
fazendo upload de modelos conjuntos de dados ou até mesmo espaços
para o hub Hugging Pace, precisará Agora vamos ver quando
você não precisa de um token de acesso
huggingfas Obviamente, se você estiver
acessando modelos públicos que estão disponíveis publicamente
para download e uso, você não precisa de um token em excesso. Assim como o GPD two, também, se você estiver usando os modelos por meio da
biblioteca de transformadores da fase Hugging, não
precisará Eles estão
disponíveis publicamente e podem ser
baixados facilmente sem qualquer autenticação,
sem qualquer APake Além disso, muitos modelos de
código aberto estão disponíveis para acessar
esses modelos, você não precisa de uma chave de API, não precisa de um token de acesso porque eles estão disponíveis
gratuitamente. Portanto, nas próximas aulas, trabalharemos
apenas nesses modelos
públicos e de código aberto para que não haja necessidade de
criar um token de acesso à fase de abraço Agora, vamos ver como criar
um token de acesso à fase de abraço Então, acessaremos o site da Hugging
Phase e
criaremos um token de acesso
. Então, vamos começar. Abra o site oficial huggface.co, clique em Entrar e pressione Enter. Então aqui está, você precisa se juntar. Isso significa que você precisa criar
uma conta no Hugging face. Aqui você pode usar
seu endereço de e-mail. Então, deixe-me criar minha conta. Então, aqui eu adicionei uma conta, meu ID de e-mail. Não,
digite a senha. Aqui está agora, clique em Avançar, complete seu perfil
aqui, adicione um nome de usuário. Adicione seu nome. Você também pode
adicionar seu nome de usuário do Twitter. Esses também são perfis opcionais
do LinkedIn. Você também pode fazer o upload do
seu OTR. Vou clicar. Além disso, você pode adicionar seu nome de
usuário do iTub e
seu site Como você pode ver,
eles são opcionais. Clique em Eu tenho vermelho. E depois
disso, clique em Criar conta. Criamos uma conta. Você precisa verificar suas
cartas de e-mail para obter um link de confirmação. Agora sua conta está verificada. Seu endereço de e-mail
foi verificado. Clique no seu perfil. Vá abaixo. Está escrito em excesso de tokens. Aqui está. Clique nele. Agora, você precisa criar um
novo token clicando aqui. Lembre-se de não compartilhar seus tokens
excedentes com ninguém. Crie um novo token.
Adicione o nome do token. Digamos que eu digite a chave Demo. Ok. Agora vá abaixo. Clique em Criar token. A
chave foi criada com sucesso. Você pode copiá-lo e salvá-lo. Aqui está escrito,
salve-o em algum lugar seguro. Você não poderá vê-lo novamente depois de
fechar este modelo. Clique em Concluído. Agora todas as
suas chaves estão visíveis. Aqui está, criamos
uma única chave agora
e, ao clicar
aqui, você pode editá-la. Você pode editar as permissões
e também excluí-las. Ok, vimos o que são fichas em excesso ou
chave APA em uma cara de abraço Com isso, também
aprendemos a criar.
8. Baixe um conjunto de dados sobre o rosto abraçado: Nesta aula,
nós vamos aprender como baixar um conjunto de dados
da fase Hugging Para isso, usaremos a biblioteca
de conjuntos de dados. Vamos ver que um conjunto se refere a uma coleção
de dados estruturados, que podem ser usados para treinar, avaliar ou testar modelos de aprendizado
de máquina Portanto, a Hugging Pace é ter muitos conjuntos
de dados em sua plataforma, que podem ser usados para
vários casos de uso Usaremos a
biblioteca de conjuntos de dados para baixar um conjunto de dados da fase
Hugging. Deixe-nos ver. Primeiro, vamos ver os conjuntos de dados. Acesse os conjuntos de dados slash do
site Hugging Phase. Então, esses são os conjuntos de dados
fornecidos pela Hugging face. Você pode ver muitos deles. Vamos ver como
podemos baixá-lo. Então, iremos para a mesma
plataforma, o Google Colab, que usamos anteriormente
neste tutorial. Aqui está. Ok. Então esse é o
caderno que já criamos. Primeiro, instalamos a biblioteca
de conjuntos de dados. Eu já te disse
como instalá-lo no Google Colab usando
o comando PIP. Depois disso, carregamos um conjunto de dados usando o conjunto de dados
load underscoe Função. Essa função
pode baixar conjuntos de dados do hub Hugging Face ou
carregá-los de Estamos baixando um conjunto de dados do Hugging
Face Hub agora mesmo Aqui está. Ok, aqui estamos
carregando o conjunto de dados do IMDB Depois disso, estou imprimindo o conjunto de dados usando
o método print Aqui, estamos importando a função de conjunto de dados de
sublinhado de carga conjunto de dados de
sublinhado Isso fornece acesso a vários conjuntos de dados públicos,
como o IMDB, neste caso Aqui estamos carregando
o conjunto de dados do IMDB. O conjunto de dados do IMDB contém resenhas de
filmes rotuladas como positivas ou negativas ou
classificação Quando você executa, ele
baixa e processa
automaticamente o conjunto de dados. Aqui estamos imprimindo
o conjunto de dados. Isso dividirá o conjunto de dados
em treinamento e teste. Ok, isso exibirá
uma visão geral do conjunto de dados, incluindo o número de
amostras em cada divisão Vamos ver depois de
executar, aqui está,
ele está nos mostrando a estrutura do conjunto
de dados do IMDB Como dicionário de conjuntos de dados, que organiza o conjunto de dados em diferentes
divisões O trem contém 25 Kos com texto
especial para resenhas de filmes e rótulo para sentimentos
como positivos ou negativos Aqui, para teste, são 25 Kos para fins de teste
com os mesmos recursos Ele contém 50 Kos, mas essa divisão normalmente não tem rótulos para análise de
sentimentos. É frequentemente usado para tarefas como pré-treinamento ou aprendizado
semisupervisionado. Nisso, pessoal,
podemos baixar um conjunto de dados.
9. Baixe um modelo do Hugging Face: Nesta lição,
aprenderemos como baixar um modelo
do Hugging Deixe-nos ver. Então, para fazer o download, usaremos a biblioteca de
transformadores Com isso, também podemos baixar diretamente do
Hugging Face Hub Vamos ver um guia passo a passo para baixar e usar
modelos da Hugging Usaremos a biblioteca de
transformadores, que já discutimos Deixe-nos ver. Aqui está nosso código VS. Já criamos um
arquivo de caderno, caderno aberto. Então, aqui já criamos o modelo de download do AmtnderScoe. Nisso, o que fizemos primeiro, instalamos a biblioteca de
transformadores Já discutimos
que a Hugging Phase desenvolveu essa biblioteca Então, usamos o PIP para
instalá-lo no Google Colab. Depois disso, o que fizemos aqui, baixamos um modelo usando
a biblioteca de transformadores Usamos o
método pré-treinado From underscore para isso Esse método baixa
os pesos, a
configuração e o tokenizador do modelo do hugging Phase Estamos baixando um modelo de pássaro
pré-treinado. Aqui está. Depois de executar o que vamos conseguir, fizemos isso e
obtivemos a forma. Essa forma é comumente
vista em modelos bits em que cada token em uma sequência é representado por
um vetor de 768 dimensões Quando usamos o modelo sem caixa com
hífen básico de Burt e passamos a fase de entrada hello
hugging, a última forma de saída de
estado oculto
representa as dimensões do passamos a fase de entrada hello
hugging, a última forma de saída de
estado oculto
representa as dimensões do tensor. Neste exemplo, a forma que você normalmente vê
é a seguinte. Aqui, um está visível. É o tamanho do bastão, pois
há uma frase de entrada. Sete é o comprimento da sequência. Isso corresponde à versão tokenizada
da fase
de abraços
de saudação, incluindo tokens especiais Isso significa a seguinte fase de abraços e
saudações. 768 é o tamanho oculto. Cada token é representado como um padrão
vetorial de 768 dimensões para a arquitetura de base de pássaros Dessa forma, pessoal, podemos baixar
facilmente um modelo usando a biblioteca de transformadores
com o Google Colab
10. Análise de sentimentos usando o abraço do rosto: Nesta aula,
nós vamos aprender como implementar
a
análise de sentimentos com Hugging face Vamos entender
o que é
análise de sentimentos com seu tipo Depois disso, executaremos um exemplo de
codificação no Google Colab. Vamos ver se já discutimos a biblioteca de
transformadores fornecida pela Hugging É uma ferramenta poderosa para
tarefas como análise de sentimentos. Agora, o que é análise de sentimentos? Como o nome sugere,
isso inclui determinar o sentimento expresso
em um trecho de texto, como negativo ou neutro Então, digamos que eu amo críquete, então essa é uma frase positiva Ok, eu não gosto de algo, vou bater em algo, então esse
é um sentimento negativo Da mesma forma, quando eu explicar os tipos de análise de sentimentos, as coisas ficarão mais claras A primeira é a detecção de
polaridade positiva,
negativa ou neutra Eu amo esse produto, é
positivo, obviamente. O serviço é péssimo, não
é bom, é negativo. E quando as coisas não
estiverem claras, será neutro, como se o
pacote chegasse a tempo. Em seguida, vem a detecção de emoções. Digamos que você disse: Isso
não é bom, isso é patético. Isso é muito frustrante.
Isso é raiva. E a alegria é expressa por uma frase como “Estou
entusiasmado com os resultados Portanto, a detecção de emoções
inclui felicidade, frustração e outras emoções Em seguida, vem a análise
de sentimentos baseada em aspectos, como o sentimento em relação a um produto ou serviço
específico Como se a comida estivesse ótima,
mas o serviço fosse lento. Nesse caso, a comida está tendo um
sentimento positivo, obviamente Mas como o serviço não
foi bom, é um sentimento negativo Depois, a análise da intenção, como a intenção de comprar
algo para reclamar Digamos que você disse
: Posso comprar este produto? Então essa é uma intenção de compra. Então, esses eram os tipos
de análise de sentimentos. Agora, vamos ver o exemplo de
codificação. Para isso,
usaremos um modelo público. Portanto, não criaremos um token em excesso porque,
para modelos públicos, como eu já disse, não
precisamos dele. Executaremos o
código no Gool Colab. Para maior eficiência, também
podemos alterar o tempo de execução no Google Collab, então eu também vou mostrar
isso com o exemplo Vamos começar Aqui está o
nosso Google Colab. Ok, deixe-me abrir o
código, o arquivo, abrir o caderno. Eu já criei o projeto. Aqui está a análise de sentimentos. Aqui está. Portanto, para maior eficiência, podemos alterar o tipo de tempo de execução. Clique no menu de tempo de execução,
clique aqui, altere o tipo de tempo de execução. Ok. Podemos ver já
selecionamos a GPU
To, o que não é um problema Se o seu projeto for bastante complexo ou se você estiver tendo um projeto de
grande escala, você também pode selecionar a TPU V dois
hífen e oito Vou manter o mesmo, ok? Então, inicialmente aqui,
o que fizemos, primeiro, instalamos as bibliotecas
necessárias, ou
seja, transformadores e tocha Ok, usamos o papel. Já discutimos como
instalá-lo nas lições
anteriores. Depois disso, nós o executamos usando essas execuções importamos os
módulos necessários nesta linha. Aqui, carregamos o pipeline de
análise de sentimentos. A função de pipeline
fornece uma maneira simples realizar várias tarefas de PNL, incluindo análise de sentimentos. Você pode carregar um
modelo pré-treinado de análise de sentimentos da seguinte forma Então, aqui, o que fizemos foi
carregar o seguinte modelo. Ok. Depois disso,
realizamos uma análise de sentimentos. Como carregamos o pipeline de análise
de sentimentos, use-o para analisar o
sentimento de um trecho de texto Então, aqui, eu adoro jogar
e assistir críquete. Estas são minhas mensagens,
e eu odeio quando estamos em Collis é um século Então, obviamente, você pode adivinhar que
essa é uma frase positiva e essa é uma frase negativa. Você pode adivinhar isso facilmente. Então essa é a análise do sentimento. Aqui, a saída que você pode ver
é uma lista de dicionários. Aqui está aqui que cada dicionário contém o rótulo do sentimento
e o conjunto de confiança. Aqui está o rótulo e
o núcleo da confiança. Então, aqui analisamos vários textos ao mesmo
tempo, passando uma lista de picadas para o analisador
de sentimentos. Agora, vamos entender completamente
a saída. A pontuação na saída do pipeline de análise de sentimentos
da fase de abraço representa
o nível de confiança ou a
probabilidade que o modelo
atribui ao rótulo de sentimento preditivo o nível de confiança ou a probabilidade que o modelo
atribui ao rótulo atribui ao Isso indica a confiança do modelo de que o
texto fornecido corresponde ao sentimento
preditivo A pontuação é um valor de 0-1. Como você pode ver, a pontuação
mais próxima de um significa que o modelo está muito confiante
em sua previsão. Se a pontuação estivesse mais próxima de zero, isso significaria que o modelo está menos confiante em
sua previsão. O rótulo positivo
indica que o modelo prevê que o sentimento
do texto é positivo.
Isso é o seguinte. O negativo significa o
oposto, ou seja, negativo. Aqui está. Então, aqui você deve estar se
perguntando por que a pontuação é tão alta, próxima de um. Isso ocorre porque o modelo que
estamos usando foi ajustado em um grande conjunto de dados e é altamente preciso para tarefas de análise de
sentimentos. O texto de entrada provavelmente contém uma linguagem forte e inequívoca que torna mais fácil para o modelo prever o sentimento
com alta confiança,
como comer significa negativo
e amor significa positivo Então, dessa forma, pessoal, podemos trabalhar na análise de sentimentos
com um rosto abraçado
11. Classificação de texto usando o abraço do rosto: Nesta aula, nós
vamos aprender como podemos usar a fase de abraços
para classificação de texto Primeiro, entenderemos
o que é classificação de texto. Com isso, também veremos a diferença entre análise de
sentimentos e classificação de
texto Depois disso,
criaremos e executaremos um exemplo no Google
Colab. Vamos começar. A classificação de texto,
como o nome sugere, pode ser usada para detecção de spam. Portanto, no seu
ID de e-mail, você deve ter visto que alguns
e-mails vão para Spam, outros não são
considerados spam. Da mesma forma, você também pode
classificar artigos de notícias ou documentos como artigos esportivos na
categoria esportes, um artigo relacionado à tecnologia
na categoria tecnologia Além disso, também inclui um caso de uso
para detecção de intenção, como cancelar um pedido, reservar um voo e outros Então, vamos ver até agora, abordamos a análise
de sentimentos. Então, aqui está a
diferença entre análise
de sentimentos e classificação de
texto Como o nome sugere, a análise
de sentimentos é restrita. Isso é específico
para o sentimento. Digamos que tenha um sentimento positivo para um texto como I love Cricket Da mesma forma, os rótulos para classificação de texto
dependem da tarefa, como acabei discutir sobre spam ou não
spam ou tópicos diferentes. Com isso, para análise
de sentimentos, discutimos anteriormente que ela é principalmente positiva,
negativa ou neutra Alguns casos de uso
incluem classificar e-mails como spam ou não spam
na classificação de texto Na análise de sentimentos, um
dos casos de uso pode ser uma avaliação
positiva do produto Agora, vamos ver um
exemplo de codificação em que
detectaremos spam ou não
spam com base em um texto Usaremos um modelo
disponível publicamente que
é o seguinte. Portanto, não precisaremos nenhum token em excesso da
Hugging Face para Então, vamos ver o exemplo e classificar o texto como
spam ou não Spam Aqui está o nosso Google
Colab. Nós criamos esses cadernos até agora Vamos abrir nosso caderno de
classificação de texto , caderno
aberto. Aqui está. Nós já o
criamos. Vamos ver as etapas. Primeiro, instalaremos
as bibliotecas necessárias. Isso é para começar com
a biblioteca Hugging Face Transformers,
bem como com a biblioteca Então, usamos o
comando PIP install para isso.
Vamos lá embaixo. Depois disso, importaremos
os módulos necessários. Aqui, importamos
o módulo de tubulação. Em seguida, carregamos um modelo
pré-treinado de detecção de spam que é o seguinte aqui.
Ele está disponível gratuitamente. Por isso, não aplicamos nenhuma chave
para abraçar o rosto. Agora, a próxima etapa inclui
realizar a detecção de spam. Primeiro, definimos
vários textos para que
possamos detectar se esses
textos são spam ou não. Classificamos
vários textos ao mesmo tempo, passando
uma lista de sequências de caracteres. Aqui está. Mapeamos rótulos para spam
e não para spam aqui. Aqui está o mapeamento de rótulos. Negativo significa spam,
neutro significa não spam, positivo significa não spam. Ok. Para exibir os resultados, usamos os quatro em loop. Aqui está. O que vai acontecer? Uma pontuação será visível
na saída. Ok. A saída também
incluirá o rótulo, independentemente
de ser spam ou não. Com isso, a pontuação também
ficará visível. Essas são as pontuações de confiança. Aqui está, então, de
acordo com nosso modelo, o primeiro texto é um spam. Obviamente, porque está
mostrando parabéns. Temos um vale-presente da Amazon de 500
INR, clique aqui para solicitar agora O segundo não é um
spam. Obviamente, aqui Myth. Vamos ter uma reunião
amanhã às 12h. Então, obviamente, isso não
é um spam O último também é
considerado spam. Recebemos muitos desses e-mails de spam informando que sua conta do Gmail
foi comprometida Aqui, o intervalo de confiança
está exibindo a pontuação. Pontuações de confiança baixas indicam que o modelo não tem certeza
sobre suas previsões O modelo a seguir
foi ajustado para análise de sentimentos, mas não especificamente
para detecção de spam Ainda o estamos adaptando
para detecção de spam. Ok. É por isso que aqui
não está mostrando spam, mas a pontuação de confiança
é ainda menor que 0,7. Eu lhe disse que pontuações de baixa
confiança indicam que o modelo
não tem certeza sobre suas previsões Você pode definir um
modelo diferente aqui
a partir da fase de abraços Aqui estamos mostrando um exemplo. Dessa forma, podemos
usar a
biblioteca de transformers em Hugging
Face para Isso é para realizar a classificação
do texto.
12. Resumos de texto usando o abraço do rosto: Nesta aula, nós
vamos entender como realizar resumos
usando um abraço facial Primeiro, entenderemos
por que precisamos resumir
e, em seguida, veremos
um exemplo de codificação no Google Colab para resumir o texto.
Vamos começar. A fase de abraço
Transformers Library, como você já sabe,
é usada para Isso também inclui resumir
o texto. Então, por que resumir? Na verdade, a sumarização é usada
em muitos
aplicativos do mundo real Você deve ter visto o resumo de artigos
longos em pequenos trechos com o resumo documentos
ou trabalhos de pesquisa Os chatbots também fornecem respostas
rápidas e concisas. Com isso, você pode
extrair pontos-chave e resumos de um documento e também de grandes conjuntos de Agora vamos ver um exemplo. Aqui, usaremos o
seguinte modelo, que está
disponível publicamente no Hugging face. Portanto, não precisamos
adicionar o token em excesso. Ok, vamos executar o código no Google Colab como vimos antes Então, vamos ver o código. Então,
aqui está o nosso Google Colab Abriremos nosso
arquivo de código, abriremos o caderno. Então, aqui estamos discutindo
sobre a sumarização. Aqui está nosso código.
Primeiro, o que fizemos foi instalar as bibliotecas
necessárias. Portanto, instalamos os
transformadores a biblioteca Pytoch aqui usando o comando PIP Já discutimos
esse comando antes. Depois disso, usaremos o Atomdel
para sequência a sequência LM e o tokenizador automático
para obter mais controle
sobre o processo, para que
possamos carregar o modelo e o Então, isso é o
que fizemos aqui. Aqui, carregamos o seguinte
modelo pré-treinado para resumo Então, aqui definimos o texto
de entrada para resumir. Então esse é o nosso texto.
Vamos resumir isso Primeiro, tokenizamos o texto de entrada usando
o seguinte Ok, então aqui você pode
ver alguns parâmetros. Esses parâmetros controlarão o
tamanho e a qualidade dos resumos tamanho máximo do sublinhado é o número máximo de
tokens no resumo Definimos 512, então aqui o resumo
não terá mais do que 512 tokens Nós tokenizamos o texto
de entrada aqui. Para gerar o resumo,
usamos o método generate. Aqui temos alguns parâmetros para a entrada, os
seguintes, tokenizados Em seguida, o comprimento máximo, que é o número máximo de
tokens no resumo. Esse é o número mínimo
de tokens no resumo. sublinhado de comprimento.
O que é isso? Isso incentiva resumos mais longos
ou mais curtos. Aqui estão dois, o que
significa resumos mais longos. feixes Num underscoe controlam a largura de busca
do feixe,
aumentam os valores, melhoram a qualidade, mas diminuem Aqui, definimos para quatro. Isso significa quatro
feixes para decodificação. Ok, então aqui está nossa opinião, e este é o resumo aqui. Imprimimos o resumo
aqui. Nós resumimos isso. Ok. Então, dessa forma, pessoal, podemos usar a fase de abraços Então, dessa forma, pessoal,
podemos resumir o texto facilmente.
13. Texto para texto (traduzir) usando o abraço do rosto: Nesta lição,
entenderemos como
podemos realizar a tradução
usando o Hugging Isso é geração de texto para texto. Vamos ver para a tarefa de tradução, usaremos a biblioteca Hugging
Phase Transformers Alguns modelos já estão
disponíveis para isso. Portanto, a tradução, como
todos sabemos, inclui,
digamos, a tradução do
inglês, do texto para o espanhol Essa é uma parte dos modelos de
texto para texto que requer um prefixo de tarefa para especificar
o tipo de tarefa, por exemplo, tradução,
resumo e outros geração de texto para texto inclui não apenas tradução,
mas também resumo, paráfrase, resposta a
perguntas e até classificação de sentimentos A geração de texto para texto inclui
não apenas tradução,
mas também resumo,
paráfrase, resposta a
perguntas e até classificação de sentimentos. Então, vamos ver a
diferença entre texto para texto e geração de
texto. Portanto, a geração de texto é usada para geração de
texto autoprogressiva em que o modelo gera texto sequencialmente,
um token por vez,
como sistemas de diálogo, preenchimentos de texto
e outros A classe de
geração de texto para texto é usada para
tarefas de sequência em sequência, em
que o modelo pega uma sequência de entrada e gera uma sequência de saída, como resumo de texto, paráfrase e até tradução Agora, vamos ver um
exemplo para realizar a tradução usando a biblioteca Hugging
Phase Transformers Neste usaremos um modelo
T five underscore Small, que está disponível publicamente
na fase Hugging Este modelo é uma versão
menor
do modelo T five e pode ser usado para tarefas
como resumo, tradução e até mesmo
responder perguntas Vamos ver o exemplo
no Google Colab. Aqui está um Google Colab. Acabamos ver o exemplo de
resumo de texto Agora vamos abrir. Agora, vamos abrir o exemplo da tradução. Aqui está. Primeiro,
instalaremos as bibliotecas necessárias. Isso é o seguinte
aqui. Usamos o comando PIP space
install Já vimos esse
comando antes. Depois disso, carregaremos um modelo de tradução
pré-treinado. Foi aqui que
carregamos o modelo T five. É um modelo versátil de
texto para texto. Isso pode lidar com a
tradução prefixando a entrada com um prompt
específico da tarefa Então, estamos carregando
um modelo T five. Aqui. Aqui
preparamos o texto de entrada. Então esse é o texto
que vamos traduzir,
traduzir do inglês para o espanhol. Esse é o texto a seguir
que vamos traduzir. Tokenize o texto de entrada em IDs
de entrada que o
modelo pode processar Use o modelo para gerar
o texto traduzido. Você pode personalizar o processo de
geração com parâmetros como comprimento máximo e feixes de sublinhado
Nam que também vimos
na lição anterior Aqui, os tokens de saída
serão decodificados em texto
e, depois disso,
imprimiremos o texto traduzido Então, aqui está a saída, o texto
traduzido. Meu nome é Amed Devan
e adoro críquete. Então aqui está
traduzido para o espanhol. Então, dessa forma, pessoal,
podemos realizar a tradução.
14. Respondendo a perguntas usando o abraço do rosto: Nesta aula, nós
vamos entender como usar a
fase de abraço para responder. Também veremos um
exemplo. Vamos começar. Portanto, usaremos a biblioteca de
transformadores da fase de abraço para realizar a tarefa de resposta
Quotien Executaremos o código
no Google Colab. Então, aqui vamos usar
o modelo a seguir, que está disponível publicamente
na fase de abraços, então não precisamos criar
um token em excesso para Vamos ver o exemplo
no Google Colab. Então, aqui vamos abrir nosso código. Primeiro, instalaremos as bibliotecas necessárias que
mostramos. Usamos o mesmo comando de
instalação do PIP que vimos antes para instalar as bibliotecas
necessárias Depois disso,
carregaremos um modelo de controle de qualidade e
um tokenizador pré-treinados modelo de controle de qualidade e
um tokenizador Aqui está nosso modelo
e o tokenizador. Prepare a entrada para a tarefa de controle de qualidade. Isso é para a tarefa de
responder diariamente. Precisamos de um contexto e
também de um quotien. Qual é o contexto agora? um parágrafo ou texto em que
a resposta pode ser encontrada. Isso é o seguinte. Também estou fornecendo
um contexto, e
aqui está a citação Então isso é sobre mim,
e aqui está
a pergunta que você quer responder. OK. Então, dissemos as duas coisas. Depois disso, tokenizaremos a entrada,
tokenizaremos o contexto e o
quotien usando o
tokenizador contexto e o
quotien usando o
tokenizador.
Fizemos as duas coisas. Obtenha a previsão do modelo, passe a entrada tokenizada para o modelo para obter a resposta.
Isso é o seguinte. Ele também extrairá as pontuações inicial
e final. Obterei as
posições inicial e final mais
prováveis aqui e ele as
usará para converter IDs de
token de volta em
palavras, para que a resposta
seja exibida aqui. Os tokens de resposta e discoteca serão colocados aqui e serão
decodificados de volta para Isso terá sua saída. Então, aqui o quotien era onde se baseia o
meio do um. O contexto era o seguinte, e a resposta é delicatessen Então, dessa forma, pessoal,
podemos responder facilmente.
15. Texto para imagem usando o abraço do rosto: Nesta aula,
entenderemos como
podemos transformar texto em imagem
usando um abraço facial. Vamos entender
com um exemplo, então aqui vamos usar a biblioteca de difusores Hugging
Face Este exemplo também usará o modelo de difusão
estável, que é um dos modelos de imagem de texto mais
populares disponíveis na biblioteca de
difusores Agora, o que é a
biblioteca de difusores e a difusão estável? A biblioteca de difusores
é uma biblioteca
Python de código aberto para
se concentrar em
modelos de difusão para gerar imagens
, áudio e outros tipos de dados se concentrar em
modelos de difusão para gerar imagens , áudio e outros tipos Essa é uma classe de modelos
generativos desenvolvida
apenas pela Hugging O que é difusão estável? É um modelo de difusão latente projetado para geração de
imagens de alta qualidade Assim, você pode gerar imagens
de bailes de texto usando isso. É também um dos modelos generativos mais
populares. Vamos ver o exemplo. Aqui, usaremos um
modelo disponível publicamente no huggingface Vamos ver o exemplo e
converter texto em imagem. A saída será gerada como uma imagem
no próprio Google Colab. Então vamos ver. Aqui
está nosso Google Colab Vamos abrir nosso caderno
para texto em imagem. Aqui está. Primeiro, instalaremos as bibliotecas
necessárias usando o mesmo
comando pip install que já discutimos Então, agora vamos carregar a tubulação de difusão
estável. A biblioteca de difusores fornece um
canal de difusão estável que
facilita a geração de
imagens a partir de solicitações de texto Vamos carregar o modelo de
difusão estável aqui. Agora, gere uma imagem
a partir de um prompt de texto, gere
facilmente uma
imagem passando um texto promocional para o pipeline.
Aqui está nosso aviso. Carros voadores sobrevoam uma paisagem urbana
futurista ao pôr do sol. O seguinte
gerará a imagem. OK. Aqui está nossa imagem. Essa imagem será salva no Google Colab
usando apenas o mesmo método e também imprimirá a imagem
salva como imagem de
sublinhado gerada com pontos PNG O arquivo PNG será gerado, onde ficará visível no
Google Colab, clique aqui Você pode ver os arquivos. Agora, vou executá-lo. Vou executá-lo. Vou executar isso agora. Agora, estou correndo para gerar
uma imagem e salvá-la. Ok, então aqui está nossa
imagem. Está escrito. Imagem salva como PNG de ponto de imagem de
sublinhado gerada. Ok, então ele gerou isso. Eu vou para cá a partir daqui. Você pode baixá-lo. Você também
pode copiar o caminho. Vou clicar em Baixar. Foi baixado. Ok, aqui está. Então, geramos uma imagem
que é texto para imagem.
16. Texto para vídeo usando o abraço do rosto: Nesta aula,
entenderemos como transformar texto em vídeo
usando a expressão de insistência Isso é chamado de síntese
de texto em vídeo. Entenderemos o que é e também executaremos
um exemplo de amostra. Então, vamos começar com a conversão de texto em vídeo, incluindo
a geração de vídeo a partir de descrições
textuais como digitar um texto e
gerar um Como vimos na lição
anterior, texto para imagem, digitamos um
texto e geramos uma imagem Nesse caso,
geraremos um vídeo. Portanto, temos muitos modelos
e ferramentas
pré-treinados para gerar vídeos. Abraçar o rosto fornece
os mesmos modelos. A síntese de texto para vídeo,
Tom, acabei de contar, inclui a geração de
uma sequência de quadros com base em uma descrição
textual Como é uma tarefa complexa, requer a combinação de
diferentes modelos de PNL
com modelos generativos ou
mesmo modelos de difusão Ok, os modelos de difusão que
vimos na lição anterior são usados para gerar
imagens ou vídeos Vamos ver algumas estruturas de
geração de vídeo antes de seguir
para o exemplo Um dos mais
populares é o runway ML. Ele oferece ferramentas para
geração e edição de vídeo. Principalmente para vídeos gerados, você pode usar os laboratórios da PIA. Com esse percebedor mental profundo, o
IO também pode ser usado para
lidar com entradas multimodais A entrada multimodal pode incluir imagens de
texto e até vídeos. Você precisa usar uma
biblioteca como Pitch ou tensor flow para
criar pipelines para gerar quadros de
vídeo Vamos ver um
exemplo. Então, aqui também
usaremos a
biblioteca de difusores Já discutimos
a biblioteca de difusores. É uma
biblioteca de código aberto desenvolvida pela Hugging Face e usada para gerar imagens
e até vídeos Usaremos o modelo de divisão estável
disponível publicamente. Em nosso exemplo,
executaremos o código no Google
Colab como vimos antes Vamos começar. Aqui
está um Google Collab Vamos abrir nosso código,
arquivo, abrir caderno. Abriremos nosso caderno
para texto em vídeo. Vou digitar o vídeo apenas
para pesquisar. Aqui está. Primeiro, vamos instalar. Então, aqui usamos o comando pip install para
instalar os transformadores, bem
como a biblioteca de difusores também com o Depois disso, carregaremos um texto modelo de imagem, então aqui
estamos carregando. Esse é o modelo que eu
já te contei. Usamos a
biblioteca de difusores para carregar um texto
pré-treinado modelo
de imagem, como difusão
estável Gere quadros a partir do texto
primeiro, definimos o baile. Aqui, geraremos quadros
individuais com base
na descrição do texto. Esta é a descrição do texto, uma paisagem urbana futurista
à noite Isso gerará dez quadros
usando o loop externo. Aqui está dez e
será anexado. Posteriormente, usamos a biblioteca OpenCV para esboçar
os quadros em Aqui estamos usando o OpenCV dentro do laço externo
para que possamos costurá-lo Também usamos
a biblioteca Numpi. Estamos usando a matriz
Numpi nela. Portanto, isso salvará
os quadros como imagens. E isso unirá
os quadros em vídeos, e o seguinte
exibirá a saída, que reúne os quadros
usando o loop externo E a saída
será exibida
assim na forma de quadros. Então, aqui, quando eu corro,
ele me exibe dez quadros porque estamos
gerando dez quadros aqui. E depois disso,
ele exibirá o vídeo. Então aqui está a saída, o vídeo
de saída terá o seguinte nome output
underscore video dot mp four, mas também
gerará quadros Quantos quadros? Dez quadros. O formato do quadro será
o seguinte: quadro
sublinhado o valor de I. Então, os quadros seriam como quadro sublinhado
zero ponto PNG, quadro sublinhado um ponto PNG e continuarão até nove Isso significa dez quadros. E a saída estará aqui, eu te disse. Agora vamos executá-lo. R Agora vamos clicar aqui. E aqui você pode ver que eu disse que ele gerará dez quadros. quadro sublinha zero ponto png até nove e o
vídeo de saída estará aqui Então essa foi a saída.
Vou clicar aqui e clicar em Baixar. Faça o download. Clique com o botão direito e abra.
Aqui está nosso vídeo. Ok, você pode ver dez quadros. Então, dessa forma, pessoal,
podemos gerar vídeo a partir de texto
com um rosto abraçado. Obrigado por
assistir ao vídeo.