Transcrições
1. Apresentação: Treinar seu próprio modelo é lento, caro e exagerado
para a maioria dos projetos O verdadeiro problema está em
saber por onde começar, como obter resultados confiáveis sem perder tempo ou dinheiro. Olá, sou Alvin,
pesquisador
de uma grande empresa de tecnologia Eu ensinei mais de 60.000
estudantes no Skillshare e obtive meu PhD
em IA Nesta aula, apresentarei um
manual simples e repetível para criar
um ChaChipt
personalizado para um ChaChipt
personalizado Faremos isso em três etapas. Etapa número um, defina o
escopo do seu projeto. Defina como usar a IA forma
mais eficaz
para seu caso de uso. Etapa número dois,
avaliar modelos. Mostrarei como
navegar por uma grande variedade de modelos proprietários e
de
código aberto Etapa número três,
refinar a qualidade. Certifique-se de que o modelo retorne exatamente o que você precisa
todas as vezes. Ao final deste
curso, você terá um processo de três etapas para
usar em qualquer ideia baseada em IA. Este curso
pressupõe que você tenha feito meu curso de IA para iniciantes, como funciona o Chat Tippit Mas, além disso, nenhum
conhecimento técnico é necessário. Tudo que você precisa é de um laptop, Internet e uma hora de
tempo. Vamos começar.
2. Projeto de escopo: texto para texto: Bem-vindo à IA para iniciantes. Crie um Chachi
BT personalizado em três etapas. Antes de começarmos, vamos
revisar algumas terminologias. Vou simplificar muito essas definições para
transmitir a ideia principal LLM ou modelo de linguagem grande é um modelo que gera texto Você fornece Tex como entrada
e o LLM produz a saída
do Texas IA ou inteligência artificial geralmente
é um produto
que usa um LLM. O HHIBT é especificamente o produto de IA da
Open AI. Portanto, IA versus CIBT é como
lenços versus lenços de papel. Lenços de papel são o produto geral, e Kleenex é um nome de produto de
marca comercial específico Se você achou isso
confuso, tudo bem. Eu abordo isso com mais
detalhes em AI para iniciantes, como funciona o HachBT, que
você pode encontrar neste link Como você já está inscrito, você receberá este curso sem nenhum
custo extra Também recomendo usar minhas ferramentas de IA para iniciantes
para aprender aprendizado de máquina, onde discuto uma estrutura
para aprender IA e ML Você pode encontrar esse
curso neste link. Não há necessidade de
anotar esses links, pois você encontrará todos os
links desta lição neste URL. Agora vamos criar seu
Chachi BT personalizado em três etapas. Essas etapas são para que
todos possam seguir, mesmo se você for um profissional, mesmo que tenha
um orçamento enorme. Qualquer pessoa que crie uma IA personalizada
precisa dessas três etapas. Primeiro passo, defina o escopo do seu projeto, determine o que sua IA fará e como você avaliará
suas capacidades. Etapa dois, avalie os modelos. Há diretrizes sobre
quais tipos de modelos usar e quando. Etapa três, refinar a qualidade. Não há necessidade de treinamento e mostraremos dois
métodos para melhorar a qualidade. Agora vamos começar com a primeira etapa,
definir o escopo do seu projeto. A primeira etapa aqui é restringir seu foco às tarefas de texto
para texto. Ou seja, você fornece
o AI Tex como entrada e obtém texto como saída.
Deixe-me explicar o porquê. Primeiro, por experiência própria,
sabemos que IA pode absorver muito
mais do que texto. Podemos fornecer imagens de IA, PDFs, sites,
vídeos e muito mais Também pode gerar
mais do que texto. IA pode produzir imagens, códigos, gráficos, áudio e
muito, muito mais São muitas mídias diferentes. No entanto, lembre-se do
que dissemos antes. A IA é um produto
que usa um LLM, e um LLM é um
modelo que recebe entradas
do Texas e gera
texto como Então, de volta ao nosso diagrama.
Vamos ampliar. O produto de IA e uma análise
do LLM subjacente. Observe que o LLM aceita
apenas texto. Todas as outras entradas são primeiro
convertidas em texto. Sabendo disso, o caso
ideal é fornecer o texto da IA diretamente e pular totalmente o
processo de conversão Isso ocorre porque o texto transmite mais
informações por palavra Deixe-me explicar com um exemplo. Digamos que haja uma página da web com resultados de um jogo de futebol
recente Quantas palavras existem nesta página? IC um, dois, três, quatro, cinco, seis, 789, dez, 11, 12 Então, um total de 12 palavras. Eu poderia dar à IA
esse texto diretamente, apenas 12 palavras, ou eu poderia fazer uma captura de tela
dessa página da web e dar
essa imagem à A IA então
traduziria essa imagem
em incríveis 2030 palavras visuais São mais de 170 vezes mais palavras para a mesma quantidade
de informações. Concluindo, o Tex
é mais eficiente na comunicação de informações
do que imagens de texto Como resultado disso, para
simplificar, para seu projeto, opte pelo texto
e pelas tarefas do TextOut. Aqui está outro exemplo. Então, você quer pedir feedback ao HattBT
sobre seus slides. Você tem várias opções
para formatos de download. não baixe o conjunto de
slides como PDF e, entanto, não baixe o conjunto de
slides como PDF e, definitivamente,
não baixe como imagens. Em vez disso, baixe os slides
em formato de texto simples. Esse formato de texto simples contém
apenas o texto bruto
de todos os meus slides, sem qualquer formatação extra ou informações
desnecessárias Agora posso fazer o upload desse arquivo e pedir ao HattPT que forneça
feedback sobre meus slides Felizmente, meus slides são fornecidos
apenas como texto bruto, que
torna eficiente o processamento do
Chat TPT Resumindo, se você quiser
alimentar um arquivo para o HachBT, exporte esse arquivo em formato de
texto simples sempre Vamos fazer mais um exemplo. Digamos que eu queira perguntar ao HattBT sobre uma postagem de blog que estou lendo Não faça uma captura de tela da página da web. Em vez disso, forneça diretamente ao HattBT o URL da página da web e você descobrirá que o
HTHBT realmente
acessará essa página da web para nós, resumindo Podemos verificar se o HTTP acessa o URL correto
clicando nas fontes E no
lado direito, veremos a página original
listada como uma citação Isso significa que a HatchBT
conseguiu acessar o texto bruto na
página da web e, como antes,
ingerir informações
com eficiência, ingerir informações Em resumo, forneça URLs de páginas da web
diretamente para que o HachPT possa acessar a página da web e extrair seu conteúdo como texto
bruto Para resumir esta
lição em uma única lição, concentre-se nas tarefas de conversão de texto em texto Isso significa fornecer dados
de texto simples sempre que possível
para nosso projeto. E isso agora conclui a primeira subetapa
da primeira Reduzimos o escopo do nosso projeto
focando em tarefas de texto para texto Na próxima lição,
falaremos sobre algumas tarefas de conversão de texto em texto para
as quais a IA é mais adequada. E se quiser
obter uma cópia
desses slides e ver recursos
adicionais, você pode acessar esse URL.
3. Projeto de escopo: recursos: Nesta lição, continuaremos discutindo como definir o
escopo do seu projeto. Agora, para recapitular, estamos atualmente na primeira etapa de
um processo de três etapas Meu objetivo nesta primeira
etapa é ajudar
você a reduzir o escopo
do seu projeto. Na
lição anterior, reduzimos seu foco às tarefas de conversão de
texto em texto E nesta lição, vou restringir
ainda mais seu foco aos recursos específicos de conversão
de texto em texto. Primeiro, nosso foco é criar uma IA
personalizada confiável e precisa para produção. Então, podemos
perguntar: o que a IA pode fazer de forma confiável e precisa
o suficiente para a produção Existem muitas tarefas desse tipo, mas vou me
concentrar apenas em três delas. Nossa primeira categoria
é a sumarização. Por exemplo, a Amazon usa IA para resumir avaliações de produtos
em uma seção de clientes O Slack usa IA para
resumir canais, e Noon usa IA para resumir as reuniões do
Zoom Há muitos exemplos
comerciais apenas
de sumarização. Agora, vamos tentar isso nós mesmos. Digamos que você administre uma padaria
com centenas de avaliações. Você gostaria de obter informações dessas avaliações para ajudar
sua padaria a crescer No seu navegador,
acesse chattbt.com. Você verá uma página como esta. Vamos colar algumas
avaliações e pedir HatchiBT que resuma
essas Aqui está nosso resumo. HattiBT diz que as opiniões sobre o
croissant de amêndoa são variadas, que parece Você mesmo pode ver as
avaliações
neste URL para avaliar se concorda
ou não. Resumindo, a IA é bastante
hábil em resumir. A IA também está pronta
para produção para estruturar dados. Estruturar dados é uma
maneira elegante de dizer que a IA pode traduzir blocos de texto em tabelas de dados
bem organizadas E em um nível superficial,
isso parece legal. Mas deixe-me enfatizar, legal
é um eufemismo. Ser capaz de pegar dados
não estruturados e extrair dados estruturados
limpos é na verdade, uma superpotência de IA extremamente
útil Deixe-me explicar com um exemplo. Vamos voltar para nossa padaria. Com base em nossas 671 avaliações, gostaríamos de saber
o que nossos clientes
pensam sobre nossos produtos de panificação Por exemplo, os clientes
gostaram do croissant de amêndoa? Na verdade, vamos primeiro perguntar: quais clientes já experimentaram o croissant de
amêndoa Idealmente, teríamos uma tabela
de dados
bem organizada como essa, uma lista de dados verdadeiros para
aqueles
que gostaram e falsos para
aqueles que não gostaram, não
temos essa tabela Temos muitos e muitos comentários como
esse. Agora, precisamos ler cada resenha
e determinar quais avaliações mencionaram
até mesmo croissants de
amêndoa Há muitas maneiras de
mencionar croissants de amêndoa. A crítica poderia dizer croissant de
amêndoa
com amêndoa ou massa com Então você pode dizer: vamos
procurar a palavra amêndoa. Mas isso também incluiria
outros croissants,
porque a padaria também vende croissants de
chocolate com amêndoa e croissants de amêndoa com mirtilo. Resumindo, detectar menções ao
croissant de amêndoa é difícil, porque o texto não
estruturado é Felizmente, porém, a IA
é perfeita para isso. Deixe-me mostrar para você
acessar chattbt.com. Acesse esse URL para
copiar o prompt. Em seguida, cole o prompt aqui. O aviso fornece ao
ChaChiBT uma lista de avaliações de padarias e solicita que ele identifique os amantes do croissant Clique em correr e você terá uma
boa tabela de resultados. Em vez de
ler as avaliações, podemos ver facilmente quais clientes experimentaram o
Amend Croissant Existem três desses revisores
e, desses três,
dois gostaram Como resultado, concluímos que
67% dos clientes que experimentaram
o Amen Croissant E com isso, podemos
analisar facilmente grandes quantidades
de texto dessa forma, tudo porque a IA pode converter texto
não estruturado em formatos
estruturados E agora você deve ser capaz de
ver o quão valiosos são os dados
estruturantes. É um superpoder
para analisar dados. A terceira tarefa para a qual a
IA está
pronta para produção é a codificação
e pequenos passos Há muitas
histórias de sucesso nesse espaço. Cursor aumenta a produtividade do
desenvolvedor oferecendo um editor de código
baseado em IA, que pode escrever e
executar código para você Lovable permite que qualquer pessoa
gere aplicativos do zero sem escrever
nenhum código sozinha No entanto, para seu primeiro projeto, não peça à IA que crie bases de código
inteiras. Trate a IA como um engenheiro júnior, tarefas
simples e etapas
individuais. A IA é muito boa em gerar
trechos de codificação inicial, em encontrar e
corrigir pequenos bugs e adicionar um recurso
que envolve apenas alguns arquivos.
Vamos
ver isso em ação. Acesse chattbt.com. Vamos pedir ao HattBT que trace um
gráfico circular de sobremesas de croissant
alemãs usando os dados anteriores. Conforme solicitado, o ChaChiBT começa a
escrever e escrever código, o que agora nos dá um gráfico circular O ChaChiBT também nos fornece
o código da trama, que nós mesmos poderíamos executar Resumindo, a IA é muito capaz de escrever
código em pequenos passos. Em resumo, a IA está
pronta para produção para resumir, estruturar dados e codificar A sumarização é
incorporada
aos produtos da Amazon, Slack e Notion estruturação das
informações corporativas em um formato pesquisável é dominada
pelo glean e pelo A codificação é dominada pelo
cursor e é adorável. Obviamente, a IA pode ser aplicada de muitas outras maneiras
diferentes. Mas aqui, nos concentramos em recursos que já
obtiveram sucesso comercial. Agora você já viu recursos
que o Custom Chat Tipts pode realizar com qualidade
de produção Agora, discutimos vários recursos de
IA que já
foram comprovados
comercialmente e repetidamente, tornando razoável
confiar nesses
recursos em nosso
primeiro projeto Você pode acessar esse URL para ver
todos os prompts que usei, vinculados aos exemplos completos de conversas
e
a mais recursos
4. Projeto de escopo: tarefa e métrica: Na última lição, vimos as capacidades gerais nas
quais a IA é melhor. Agora, vamos traduzir os recursos
gerais em um projeto específico. Na primeira parte, reduzimos seu foco ao texto
geral da tarefa de texto Na última lição, restringimos
ainda mais seu foco a três recursos
específicos:
resumo, estruturação de
dados e codificação Nesta lição,
finalmente definiremos seu projeto. Para seu projeto, primeiro você
precisa definir a tarefa. O que a IA fará por você? Em seguida, defina o que o LLM
receberá como entrada. Ele receberá resenhas, e-mails, ensaios e, finalmente, definirá qual texto o LLM
produzirá como saída Produzirá resumos,
tabelas, tópicos? Vamos ver um exemplo. R: Estou
procurando um lugar para comer. O café delicioso tem uma classificação baixa, e eu quero saber Minha primeira reação é fazer com que a
IA resuma minhas avaliações. Vamos preencher o modelo do
projeto. Nossa tarefa é
resumir as avaliações. Nossa opinião será composta por avaliações e nossa saída
será um resumo. Isso não parece ser
uma definição útil. Então, vamos ser mais específicos. Na
página do restaurante, eu
percorro as avaliações com avaliações
muito baixas Uma pessoa confundiu este lugar com seu restaurante irmão. Outra pessoa
reclamou da
ordem em que os pratos
foram servidos, e a última avaliação não
gostou da atitude da
equipe de garçons Todas essas são preocupações válidas, mas eu pessoalmente só me
preocupo com a comida. Então, eu quero
filtrar avaliações não alimentares. Sabendo que esse é meu
objetivo, vamos agora traduzir isso em
um projeto concreto. Para o nosso modelo. Eu gostaria de detectar críticas não alimentares A entrada é uma avaliação de
restaurante e a saída é verdadeira ou falsa. Se a
avaliação deduz estrelas ou não por motivos
não alimentares. Agora
estamos no negócio. É assim que a definição
do seu projeto deve ser específica. No entanto, temos mais um
componente, a métrica. Em um nível alto,
a métrica informa se os resultados da IA são bons Para começar, sua primeira
métrica será eu acho que os resultados da IA são razoáveis? Avalie
primeiro manualmente. Aqui está uma resenha que
reclama da ordem em que os pratos
foram servidos Perguntamos à IA:
esta avaliação deduz estrelas
por motivos não alimentares A IA faz uma previsão. Sim. Agora, eu acho razoável? Eu tenho. A avaliação está deduzindo estrelas pelo
serviço, não pela A IA passa nessa primeira verificação. Aqui está outra crítica
que
reclama do frescor do peixe Perguntamos à IA:
esta avaliação deduz estrelas
por motivos não alimentares A IA faz uma previsão. Não. Eu não acho nada razoável? Eu tenho. Esta análise deduziu estrelas precisamente
por motivos alimentares A IA passa nessa segunda verificação. Aqui está uma crítica que mostra confusão sobre
o nome do restaurante. Perguntamos à IA Esta avaliação deduz
estrelas por motivos não alimentares A IA faz uma previsão. Não. Eu não acho nada razoável? Desta vez, eu não tenho. A avaliação deduziu estrelas pelo nome
do restaurante, não pela A IA falha nessa terceira verificação. Aqui está o scorecard da IA. Achamos que as saídas são razoáveis
duas em cada três vezes. Portanto, para concluir, sua primeira avaliação é que os resultados da IA são, em
sua maioria, razoáveis No entanto, as melhores métricas
quantificarão a qualidade. Então, vamos ser mais específicos. De volta ao nosso scorecard, descobrimos que a IA estava correta duas em
cada três vezes Então, dizemos que a IA
alcançou 67% de precisão. Agora, sua métrica é
a porcentagem de avaliações que a IA
classifica corretamente. Dito de forma mais sucinta,
nossa métrica é precisão do
modelo em avaliações que rotulamos
como verdadeiras O mesmo vale para as
estrelas dedutivas da avaliação por motivos não alimentares. Agora podemos pegar qualquer IA e calcular sua
precisão em nossa tarefa Aqui está agora nossa definição idiota de
projeto. Adicionamos a precisão
métrica da precisão com
que a IA
prevê o verdadeiro ou o falso, em comparação com seus próprios rótulos
nas avaliações de restaurantes Vamos fazer outro exemplo. Digamos que você esteja organizando
um Hackathon
e, depois que o
portal de inscrições on-line fechar dentro do prazo, dezenas de pessoas enviam inscrições
atrasadas por e-mail Seu objetivo geral é
organizar as inscrições atrasadas
enviadas por e-mail. Mais concretamente, sua tarefa é detectar
se um e-mail
é uma entrada do Hackathon A entrada é um e-mail. O resultado, independentemente de
o e-mail ser ou não um envio para o
Hackathon A métrica também é a precisão, quantos e-mails estão corretamente classificados como entradas ou não. Agora, usando a IA, podemos gerar
uma tabela de dados e pronto. Agora é muito
mais fácil determinar quais envios atrasados
aceitar em grande escala sem precisar ler
todos os 100 e-mails para encontrar as inscrições
do Hackathon Em resumo, defina a
tarefa, a entrada para sua IA, a saída de sua
IA e a métrica,
que determina o quão boas são as saídas do
seu modelo Isso conclui esta lição. Nesta lição, finalmente
definimos seu projeto
depois de
definir o escopo e, além disso concluímos a primeira
das três etapas Agora você definiu o escopo do seu projeto e estamos prontos para
começar Você pode acessar a CRL para obter uma cópia desses slides
e recursos adicionais
5. Avalie modelos: teste os melhores: Bem-vindo de volta. Nas aulas
anteriores, reduzimos nosso foco
às tarefas de texto para texto Em seguida, recursos específicos e,
em seguida, defina a métrica da tarefa. Isso concluiu nossa primeira
tarefa, definir o escopo do projeto. Em nossa segunda etapa, avaliaremos os modelos para escolher o melhor modelo
para nosso caso de uso. Para escolher um modelo, você avaliará vários modelos quanto à
capacidade de concluir sua tarefa. Começaremos com as melhores opções porque queremos saber. Alguma IA pode ao menos
completar nossa tarefa? Se a melhor IA não conseguir
resolver sua tarefa
, as IAs menos inteligentes
certamente também não o farão. Então, comece com a IA
mais inteligente. De acordo com o site da Open EI, se você usa os planos
gratuito ou plus, GPD five thinking é o seu modelo
mais inteligente Se você está no plano Pro, GPD five Pro é seu modelo
mais inteligente Vamos começar nossos
testes por meio de chatbots, uma interface simples
para um teste rápido Acesse chatbt.com. Você verá uma tela como essa. No canto superior esquerdo,
expanda a lista suspensa. Nesse menu suspenso, você verá rapidamente o modelo mais rápido, mas relativamente
menos inteligente. Pensando, um modelo mais
inteligente. Use isso se você estiver
nos planos gratuito ou plus. E, finalmente, P, o modelo
mais inteligente. Use isso se você estiver
no plano profissional. Vou usar o GPT five thinking para que todos possam
reproduzir meus resultados Agora selecionamos um LLM. Então, o que devemos perguntar ao Chat GBT? Vamos usar nosso projeto
da última lição. Lembre-se de que nosso objetivo é
filtrar as críticas não alimentares. As entradas são avaliações de
restaurantes e as saídas
são verdadeiras ou falsas,
verdadeiras se as estrelas forem deduzidas
por Então, para nossa pergunta, tudo bem,
dadas as
avaliações de restaurantes, a saída é verdadeira
se uma avaliação deduzir dadas as
avaliações de restaurantes, a saída é verdadeira estrelas
por motivos não alimentares Em seguida, incluo três avaliações. A primeira avaliação
reclama do serviço, segunda reclama do sabor
e a terceira gosta da comida, mas achou que o serviço estava lento Esperamos que a IA retorne verdadeira porque a primeira avaliação
deduz estrelas pelo serviço,
falsa, porque a segunda
avaliação deduz a estrela é precisamente para comida e A última avaliação não
deduz nenhuma estrela. Vamos tentar esse prompt agora. Primeiro, acesse esse UOL
e copie o prompt. Em seguida, volte para chattbt.com. Cole no prompt. Clique em correr. ChatTBTTS por alguns segundos e,
em seguida, dá uma resposta correta
, verdadeira, falsa, falsa Como resultado, concluímos que a IA pode concluir nossa
tarefa corretamente. Especificamente, o GPT cinco
completa nossa tarefa. Testar o chatbot não é suficiente porque os chatbots não
são determinísticos Isso significa que eles não retornam sempre
os mesmos resultados. Por exemplo, vamos perguntar ao
HathBT uma piada sobre papai. Chat TBT faz uma piada
sobre espantalhos. Vamos fazer isso de novo, exatamente
na mesma solicitação. O HatchiBT faz uma piada
sobre o alfabeto. Faça isso mais uma vez. Piadas
do Chat TBT sobre Portanto, exatamente a mesma solicitação gerava
respostas diferentes todas as vezes Isso mostra nosso ponto anterior que os chatbots
não são determinísticos Como resultado, precisamos deixar
de testar o chatbot e passar a testar a API A API, por padrão, tem muito
menos aleatoriedade injetada. Portanto, se a IA concluir
a tarefa uma vez, podemos ter certeza de que a IA
concluirá a tarefa repetidamente Acesse a plataforma dotopen.com. Sua página da web
ficará assim. Certifique-se de clicar em
Login no canto superior direito, caso ainda não
tenha feito isso. Em seguida, clique no painel
no canto superior direito. Nossa página agora
ficará assim. Clique em criar no
centro da página. Sua tela
agora deve ficar assim. No canto inferior direito,
clique em Limpar automaticamente. Isso garante que,
sempre que clicarmos em Enviar, imitemos o mesmo comportamento do
envio de chamadas de API separadas Agora peça uma piada sobre o pai, mas antes de pressionar Enter, observe que esse exemplo específico pode custar até dois
décimos de um Depois de clicar em Executar, o JTBT faz
uma piada sobre o alfabeto. Vamos pedir uma piada sobre o pai novamente. Certifique-se de que a opção Limpar automaticamente
no canto inferior direito esteja selecionada e envie. JTBT faz exatamente a
mesma piada sobre o alfabeto com E tentamos novamente ouvir
exatamente a mesma piada do alfabeto. Os resultados são
quase idênticos. Isso é muito melhor
do que o chatbot, que retorna respostas completamente
diferentes a cada vez Portanto, podemos concluir que as chamadas de
API são em sua maioria
determinísticas, definitivamente muito mais do
que o chatbot Então, vamos tentar novamente nosso exemplo de prompt de
projeto por meio da API. Lembre-se de que esta é a
nossa sugestão anterior. Esperamos que a IA retorne
verdadeiro, falso e falso. Acesse esse URL para copiar novamente o
exemplo de prompt do projeto. Em seguida, de volta à plataforma do openai.com, cole
esse prompt Antes de clicar em Executar, observe que este exemplo custará
quatro décimos de centavo A API GPD five retorna
primeiro os
tokens pensantes por alguns segundos. Em seguida, finalmente retorna a resposta final correta,
verdadeira, falsa, falsa. Vamos tentar mais uma vez. E, novamente, o GPD cinco retorna a resposta correta,
verdadeira, falsa, falsa E mais uma vez. E, novamente, a resposta correta,
verdadeira, falsa, falsa. Então, como antes, o GPD cinco completa
corretamente nossa tarefa. Ainda mais importante, o GPT
cinco faz isso repetidamente. Essa é uma grande vitória. Isso significa que nosso projeto agora
pode
concluir repetidamente nossa tarefa
usando a API do GPD five Em resumo, teste primeiro a melhor e
mais inteligente IA. Primeiro por meio de bots de bate-papo
para simplificar, depois por meio da API para
reprodutibilidade, e isso conclui nossos
testes por meio Geralmente,
terminamos de testar a melhor IA. E na próxima lição,
otimizaremos os custos testando modelos mais rápidos e
baratos. Caso você esteja se perguntando
como calculei o custo de uma chamada de API, explicarei isso e incluirei mais recursos no site do
curso neste URL
6. Avalie modelos: otimize o custo: Bem vindo de volta. Para recapitular, você está na etapa dois de três Mas até agora, você só
testou a melhor IA. Testamos a melhor IA via chat e depois testamos via API. Agora é hora de
otimizar os custos e encontrar o modelo mais barato
que ainda possa concluir nossa tarefa repetidamente. Lembre-se de que o
GPD cinco concluiu nossa tarefa de projeto de exemplo
com sucesso e repetidamente, e ela custou cerca de
quatro décimos de Incluirei todos os cálculos de
custos no site do nosso curso,
se você estiver interessado. Aqui está o
custo do GPD five para nosso exemplo, junto com seus custos por token, acordo com a página de preços da
API da OpenAI Vamos experimentar o próximo modelo
mais barato nossa lista, o GPT five Mini seletor de modelos, selecione GPD five Mini Sua tela
agora deve se parecer com a minha. Cole o exemplo de prompt
do projeto e o GPD five Mini responderá
verdadeiro falso falso, concluindo
corretamente a tarefa Vamos analisar o
custo. Este exemplo custou 700 centavos E quando adicionamos
isso à nossa tabela, podemos ver que
reduzimos o custo de concluir nossa
tarefa em cinco vezes. Vamos agora testar nosso
modelo mais barato, o GPT five Nano. No seletor de modelos, escolha GPT five Sua tela
agora deve se parecer com a minha. Cole o exemplo de
prompt do projeto e, mais uma vez, obteremos true false false, a resposta correta.
Veja o custo novamente. O custo do nosso exemplo agora é três centésimos de um E em nossa tabela, podemos
ver que agora reduzimos o custo de concluir nossa
tarefa em mais duas vezes. Mas vamos reduzir ainda mais os
custos. Até agora, mantivemos o raciocínio
no nível médio padrão. Em vez disso, queremos reduzir o raciocínio
ao mínimo. Deixe-me te mostrar como fazer isso. De volta a esta página da web, ao
lado do nome do modelo, clique no ícone de configurações No menu, selecione esforço de
raciocínio. Isso lhe dará
outra lista suspensa. Selecione mínimo, que
ficará assim. Clique fora do pop-up. Em seguida, cole seu
exemplo de prompt de projeto. E, loucamente, GPT
five Nana, sem raciocinar, ainda responde
verdadeiro, falso, falso, completando a tarefa perfeitamente.
Veja o custo agora. O custo do nosso exemplo agora
é de 4000 centavos, o nos
dá essa
tabela final de resultados Reduzimos ainda mais os custos
em mais sete vezes. Essa é uma redução de custos absurda. Diante desses resultados, declaramos GPT five Nano sem
justificar Agora, conclua as
três partes da etapa dois, teste via chatbot,
teste por meio da API
e, finalmente, encontre o
modelo mais barato que ainda funciona Isso produziu o modelo
Open EI mais barato que poderia resolver
com sucesso nossa
tarefa GPT five Nano Em resumo, teste primeiro a melhor e
mais inteligente IA. Primeiro por meio de bots de bate-papo
para simplificar, depois por meio da API para
reprodutibilidade e, em
seguida, teste uma IA iterativamente
mais barata Agora otimizamos os
custos com sucesso, reduzindo os custos em mais de 88 vezes, e pronto para
avaliar modelos Isso conclui principalmente a etapa dois. Acabamos com os modelos
proprietários, mas agora precisamos
repetir esse processo para outra vasta categoria de
opções de modelos de código aberto Como de costume, você pode encontrar
todos os cálculos, solicitações e mais
recursos neste URL
7. Avalie modelos: código aberto: Vamos explorar mais uma categoria de modelos, modelos de código aberto. Atualmente, estamos na
segunda das três etapas em que estamos avaliando modelos para
determinar qual deles usar Felizmente, há um hub
padronizado para todos os modelos
de código aberto Visite esse URL e você verá várias
opções. É avassalador. No entanto, aqui estão algumas
heurísticas para navegar nesse grande
repositório Regra número um, use modelos ajustados às
instruções. Normalmente, os modelos
ajustados às instruções têm instruções no nome em algum
lugar O motivo dessa regra é que os LLMs são treinados
em três estágios No primeiro estágio
chamado pré-treinamento, LLMs simplesmente predizem
a próxima palavra No segundo estágio, chamado SFT
ou ajuste fino supervisionado, os modelos aprendem a
responder perguntas No último estágio, chamado Aprendizado por
Reforço com Feedback
Humano ou RLHF, os modelos aprendem a alinhar as respostas
às preferências humanas,
sendo úteis, honestos Tecnicamente falando,
apenas a segunda etapa é chamada de ajuste de instruções,
mas, na prática, os modelos de código
aberto ajustados por
instruções passaram
pelo SFT e pelo De qualquer forma, você não quer um modelo que tenha passado apenas
pelo pré-treinamento porque esses modelos respondem automaticamente às perguntas,
não às perguntas. Então, em resumo, regra número um, use modelos ajustados por instruções Para a regra número dois,
use modelos pequenos. Obviamente, essa não é
uma regra rígida, mas eu a recomendo fortemente. Agora, digamos que você me ignore. E se você quiser usar modelos
massivos de código aberto, os maiores e os melhores? Bem, vamos ver qual modelo de
código aberto é o melhor. Aqui está a arena do chatbot. Os modelos Gemini Open AI e Grock
four são todos proprietários. Portanto, o modelo de
código aberto mais bem classificado é o Kimik. Vamos ao site da Kimi K. De acordo com esta página da web, Kimi K tem 1 trilhão Então, realisticamente, precisaríamos GPUs de
16 H 100 para executar esse modelo Primeiro, isso é caro. As GPUs de 16 H 100 custam 64 USD
por apenas 1 hora de uso. Em segundo lugar, é complicado
fazer inferências para
um modelo tão grande Tudo isso para dizer que, se você quiser
usar modelos de código
aberto de última geração, deve usar APIs
que
servem modelos de código aberto porque seus preços se
beneficiam de economias de escala. É mais barato chamar uma API do que executar
esses modelos massivos sozinho. Para obter detalhes, você pode
ver esta postagem do blog, que vou colocar no site do
nosso curso. Para usar modelos de código
aberto de última geração, vamos seguir as
mesmas três subetapas Teste via chatbot, teste via
API e otimize custos. A partir da primeira subetapa, vamos testar via chatbot Acesse gpthss.com. Lembre-se de que essa foi a
nossa sugestão anterior. Esperamos que a IA retorne
verdadeiro, falso e falso. Primeiro, acesse esse URL
e copie o prompt. Em seguida, você verá uma página
da web como essa. Eu escolhi continuar
com o raciocínio visível, mas você pode escolher qualquer uma das opções Nenhuma das opções altera a
qualidade das respostas da IA. Cole seu prompt e clique em Executar. Então você verá verdadeiro falso
falso, a resposta correta. Na barra lateral esquerda, agora clique em GBTOSS 20 bilhões, o menor dos dois modelos de
código aberto da Open AI Em seguida, no canto superior direito, clique em Novo bate-papo. Sua tela ficará
assim, cole o prompt mais
uma vez e clique em Executar. Então, mais uma vez, você verá verdadeiro falso falso, a resposta correta. Vimos que o melhor
da
IA de código aberto pode concluir nossa tarefa. Agora vamos testar novamente via API. No huggingface.co, muitos modelos de código aberto
têm uma seção
no canto inferior direito onde
você pode enviar uma mensagem única para
testá-la Tecnicamente, isso também não é
gratuito, mas você pode enviar solicitações sem adicionar informações de
cobrança Cole seu prompt e o
Deep Seek R passa. Ele gera verdadeiro falso falso. Isso significa que a IA de código aberto, como o Deepsk, também pode
resolver nossa tarefa Deepsek R one teria custado um terço de um centavo para
executar Como antes, vamos agora encontrar o modelo mais barato
que pode completar nossa tarefa. Vamos experimentar o próximo modelo
mais barato. Deep Seek R one Lama 7 bilhões. Esse modelo também obtém a resposta correta, verdadeiro falso falso. Deep Seek Lama
custou um sexto de um centavo, então agora reduzimos
nosso custo pela metade Agora vamos experimentar o próximo Deep Seek V três
mais barato. Tecnicamente, o Deep Seek V three respondeu corretamente ao verdadeiro
falso falso. Acabou de fazer isso
com muito texto extra. Infelizmente, se o Deep Seek formatos diferentes a cada vez,
nosso código de projeto não
seria capaz de
analisar a
saída nosso código de projeto não
seria capaz de
analisar a do LLM Felizmente, temos uma
maneira de corrigir isso, que mostrarei Mas, por enquanto, Deep Seek
V three não passa. Ele tem a inteligência
, mas não a formatação. Vamos tentar o próximo mais barato nossa lista, Lama 370 bilhões Infelizmente, Hugging Face
continua me dando erros. Então eu encontrei um
outro site aleatório. Eu não necessariamente endosso,
mas qualquer site serve. E parece que
Lama 370 bilhões de respostas corretas com
verdadeiras falsas quedas Então, Lama: 370 bilhões de passes. Vamos experimentar o próximo modelo
mais barato da nossa lista. Deep procura Quin menor modelo
destilado do Deep Seek RO
apenas emite uma sequência infinitamente
longa Então, isso é uma falha difícil. Quin falhou
catastroficamente, como vimos. E com isso dito, agora concluímos nossa tabela de resultados. Podemos listar novamente todos os
preços e centavos e, em
seguida, comparar os preços da Open
AI com os preços open source para comparar a
inteligência por dólar Aqui estão os vencedores
de cada categoria. Observe a diferença no custo. É verdade que eu poderia ter testado modelos
menores de código aberto que são mais
baratos do que 70 bilhões,
mas
mais capazes do que o Quinn , mas menores, e eles
podem executar sua própria
máquina gratuitamente, então não adianta
testar suas APIs A API Open EI é
15 vezes mais barata para essa tarefa específica de detectar corretamente críticas
não alimentares com base em nossos Geralmente, para a vanguarda da
classe de modelos de ponta, os modelos proprietários superam os modelos de código
aberto em inteligência por dólar Então, se estamos considerando o código
aberto, vamos nos
afastar da vanguarda e optar por pequenos modelos de código
aberto. Na verdade, esses modelos podem ser muito econômicos
para serem executados sozinhos. Então, em resumo, eu recomendo usar pequenos modelos de código aberto. Pelo menos por enquanto, para os grandes modelos de código aberto de
última geração, concluímos nossas
três subetapas Isso conclui a avaliação de
grandes modelos de código aberto. Na próxima lição,
veremos pequenos modelos de
código aberto, pequenos o suficiente para serem executados gratuitamente. Como de costume, você pode
encontrar todos os links, cadernos e outros recursos
no site do curso
8. Demonstração: execute um modelo de código aberto: Agora vamos executar modelos
de código aberto gratuitamente. Atualmente, estamos na
segunda das três etapas. Agora estamos testando pequenos modelos de código
aberto. Por enquanto, vamos tratar Lama
3,28 bilhões como nosso padrão. Esse é um pequeno modelo de linguagem que deve caber no seu laptop. Obviamente, existem muitos
outros modelos de código aberto. Mas antes de discuti-los,
os próximos slides se referirão
a alguns termos como GPU, nó, RAM e precisão Se você não estiver familiarizado
com esses termos, pode ignorar
minha explicação com segurança e
se concentrar apenas na conclusão Também incluirei definições no
site do curso neste URL. Agora, voltando à regra número dois, dissemos anteriormente que devemos
usar modelos pequenos. Mas sejamos mais precisos
sobre o que significa pequeno. Por pequeno, quero dizer modelos de GPU
única, que são muito mais simples do que GPUs e, especialmente
, de
vários nós para Agora que nos limitamos aos modelos código aberto de GPU
única,
quais modelos de código aberto
cabem em uma única Bem, isso
depende de dois fatores, a RAM que sua GPU tem e a
precisão do seu modelo Vou colocar a explicação completa
no site do curso. Mas, por enquanto,
diremos que LLMs com 16 bilhões ou menos de parâmetros
podem caber em uma única GPU Vamos usar isso para encontrar um modelo de código
aberto para usar. De volta ao site da Hugging face, no lado esquerdo,
filtre pelo tamanho do modelo Queremos 16 bilhões
ou menos de parâmetros, mas 12 bilhões é o valor
mais próximo que podemos usar. Em seguida, no canto superior direito,
classifique os modelos por curtidas. Depois das duas modificações,
você verá uma página como essa. Analisando o
número de downloads, vemos com cliques o vencedor
Lama 3,18 bilhões de Instruct, que teve mais de 9
milhões de downloads no vemos com cliques o vencedor
Lama 3,18 bilhões de Instruct,
que teve mais de 9
milhões de downloads no
último mês. Vamos
usar esse modelo. Para nossos experimentos de código aberto, usaremos um modelo de 8
bilhões de parâmetros da família Lama de LLMs Este é um dos modelos
mais baixados no último mês
da Hugging E o mais importante,
determinamos que esse modelo
se encaixa nas GPUs que estamos usando Acesse esse URL para abrir o código inicial que
escrevi para você Você deveria ver um
caderno como este. Agora, na parte superior do arquivo, clique em Executar tudo.
Talvez você veja um erro. Se você ver um erro como esse, precisará executar
cada etapa manualmente. Para executar manualmente, mova o cursor para que ele
passe sobre a etapa um Um botão Executar aparecerá. Clique no botão Executar. Depois disso, mesmo que a
etapa um ainda esteja em execução, você pode passar o
mouse imediatamente sobre a etapa dois e clicar no botão Executar Em seguida, você deve
ver linhas pontilhadas como essa indicando que a etapa
dois está na fila. Se você pressionou executar tudo ou
executou as primeiras etapas manualmente, seu notebook agora está instalando pré-requisitos e Isso levará de cinco
a 10 minutos. Então, durante esse tempo, continue
assistindo a este vídeo
passo a passo. Depois de alguns minutos,
a primeira etapa será concluída. Se você ver uma marca de seleção verde, isso significa que a primeira etapa
foi concluída com sucesso Depois de mais alguns minutos, a etapa dois também deve terminar. Novamente, você deve ver uma marca de seleção verde
indicando sucesso. Agora, independentemente de você
já ter executado a etapa três, ao lado da etapa três, clique em Executar. Depois de alguns segundos, veremos os resultados de Lama
discutindo o significado da vida. Agora você deve ver o prompt. Agora você deve
alterar o prompt para o que desejar e pressionar
o botão Executar mais uma vez. Trate isso como um bot de bate-papo
pessoal. Você pode perguntar ou dizer o que normalmente
diria ao Chat GBT Por exemplo, podemos fazer com que o
Lama
nos explique um pouco de matemática ou que o Lama nos fale sobre nossa plataforma de
aprendizado on-line favorita. Essa é efetivamente sua
própria IA em execução na nuvem. Ninguém além de você está usando
este LLM dedicado. Agora é hora de testar o Lama
em nosso projeto de exemplo. Clique em Executar na última
célula aqui para testar a habilidade do
Lama de identificar críticas
não alimentares Mas, infelizmente,
Lama se engana, dizendo que tanto a primeira
quanto a terceira avaliações são verdadeiras e que ambas
não são críticas alimentares Em outras palavras,
Lama prediz verdadeiro falso verdadeiro em vez
de verdadeiro falso falso Vamos corrigir isso
na próxima lição sem treinar o
modelo. É isso mesmo. Agora executamos nosso
primeiro LLM de código aberto e finalmente concluímos
a segunda das três etapas Como mencionei
antes, nosso próximo passo é refinar a qualidade Em particular,
melhoraremos essa capacidade de
LLMs de código aberto para concluir
nosso projeto de exemplo
9. Refine a qualidade: inputs do engenheiro: Nesta lição,
vamos melhorar
nossos recursos de LLMs
alterando nossas entradas Geralmente, isso é chamado de engenharia
rápida. Agora estamos na
terceira das três etapas e agora estamos refinando a qualidade Há duas subetapas aqui. A primeira delas é
projetar nossas entradas. Se ainda não o fez,
acesse esse URL para abrir o código inicial que
escrevi para você Se você tiver o
caderno da última aula ainda aberto, use o mesmo caderno. Se você estiver abrindo este
notebook pela primeira vez, na parte superior do
arquivo, clique em Executar tudo. As duas primeiras etapas levarão
cerca de cinco a 10 minutos, então você pode continuar assistindo a
essa caminhada
enquanto isso Lembre-se de nossa lição anterior, Lama 8 bilhões não
conseguiu concluir nossa tarefa. O formato e a
precisão das saídas estavam ambos errados. Nossa primeira abordagem para corrigir
isso é ser específica. Parece uma dica boba, mas basta especificar o
formato Por exemplo, forneça três
linhas de saída para cada linha, indicando verdadeiro ou falso,
sem texto extra, sem Eu já adicionei isso ao seu caderno em uma célula
intitulada dica um. Em seu caderno, role para baixo até a
seção de demonstração de entradas de estrutura, conforme mostrado aqui o mouse sobre a célula
que diz a dica um e clique no
botão Executar que aparece Depois de alguns segundos,
você verá a seguinte saída,
true, false, true. As saídas ainda estão incorretas. Esperamos verdadeiro, falso, falso, mas corrigimos o formato apenas
adicionando algumas instruções
ao prompt. Nossa próxima abordagem é
fornecer exemplos. Vamos adicionar alguns. Agora vamos adicionar
três exemplos de avaliações. Cinco em cinco, o
frango estava salgado,
mas bom, três em cinco, o marinero estava muito azedo,
três em cinco, o
garçom não teve paciência E, finalmente, vamos adicionar
as saídas desejadas. As duas primeiras avaliações
envolvem críticas alimentares
e a última revisão envolve
uma crítica não alimentar Portanto, esperamos falso falso verdadeiro. Eu já adicionei isso ao seu
caderno em uma célula
intitulada dica dois. Role para baixo e passe o mouse sobre essa célula intitulada Dica dois Clique no
botão Executar para os colegas
e, após alguns segundos, você verá verdadeiro, falso, verdadeiro Infelizmente, as
saídas ainda estão erradas, mas temos mais um truque Para a terceira abordagem, solicitaremos uma
cadeia de pensamento. Resumindo, peça
ao Lama que mostre seu trabalho. Em nossa solicitação para o modelo, simplesmente
perguntaremos o primeiro
motivo, passo a passo. Em seguida, especificamos o
formato de saída com muita precisão. Como sempre, eu já adicionei isso
ao seu caderno. Role para baixo, passe o mouse sobre
o título da célula Dica três e clique no
botão Executar que aparece Depois de alguns segundos, Lama
finalmente prediz corretamente. Vemos um bloco de
pensamentos que pedimos e as saídas corretas
verdadeiras falsas falsas Portanto, agora podemos dizer que Lama 3,18 bilhões pode concluir
nossa tarefa com sucesso Recapitulando, aplicamos três dicas. Seja específico, forneça exemplos e peça uma cadeia de pensamento. Juntos, esses três
permitiram que nosso modelo Lama identificasse com sucesso críticas
não alimentares Agora, e se usarmos esse prompt novo e aprimorado em nossos
modelos anteriores? Parece que o Deep Seek V three agora responde com
sucesso à
pergunta com verdadeiro falso falso, mas Quin 1,5 bilhão ainda
produz lixo sem sentido Como resultado, nossos resultados de código
aberto agora parecem assim: em um alto nível. Ao comparar preços da IA
aberta com os preços do código
aberto, Pei ainda oferece uma
inteligência muito maior por dólar, embora agora tenhamos um
Lama ativo de 8 bilhões que pode produzir
respostas corretas de
forma confiável em hardware de nível gratuito, ainda mais barato do que
todos os itens acima Em resumo, seja específico, forneça exemplos e
peça uma cadeia de pensamento. Isso é tudo para a primeira subetapa engenharia das entradas de nossos modelos Então, em resumo,
melhoramos com sucesso a capacidade do Lama de
concluir nossa tarefa de exemplo. Na próxima lição, faremos
um conjunto final de
melhorias para fazer com que nosso modelo de código aberto funcione forma robusta em grandes
quantidades de dados Como de costume, você pode
encontrar todos os prompts e o código inicial que
usei neste URL
10. Refine a qualidade: restrição nas saídas: Nesta lição,
vamos melhorar
nossos recursos de LLMs
estruturando nossos resultados Uma palavra de advertência. Esta lição
apresenta muitos códigos. Se você não se sente à vontade
com o código, concentre-se
apenas nas
conclusões que eu
discuto , em vez
do código Esta é a nossa terceira
de três etapas. Na última lição,
projetamos nossas entradas para melhorar a qualidade
das respostas do
modelo Nesta lição,
melhoraremos a qualidade restringindo
nossos resultados Se ainda não o fez,
acesse este L para abrir o código
inicial que
escrevi para você Se você tiver o caderno
da última aula ainda aberto, use o mesmo caderno. Se você estiver abrindo este
notebook pela primeira vez na parte superior do
arquivo, clique em Executar tudo. As duas primeiras etapas levarão
cerca de cinco a 10 minutos, então você pode continuar assistindo a
essa caminhada
enquanto isso Lembre-se de nossa demonstração de código
aberto, Lama 8 bilhões não
conseguiu concluir nossa tarefa. O formato e a
precisão das saídas estavam ambos errados. Vamos reproduzir
esse resultado novamente. Em seu notebook, role para baixo até a demonstração das saídas da estrutura Passe o mouse sobre o exemplo
A e clique em Executar. Você receberá essa bolha de texto. Está errado e está formatado
incorretamente. Queremos uma lista de coisas verdadeiras ou falsas. Corrija isso. Na lição
anterior, aplicamos três dicas. Seja específico, forneça exemplos e peça uma cadeia de pensamento. Depois de aplicar essas dicas, Lama produziu as
saídas corretas true false false No entanto, a correção
teve um custo. O prompt original
tinha 288 caracteres. No entanto, o novo prompt
tem 1.312 caracteres. Essa é uma entrada colossal 4,5
vezes maior. São muitas entradas. Então, podemos melhorar o formato e a
exatidão da
saída sem aumentar o número
de tokens de entrada E a resposta é, claro, sim, deixe-me explicar.
Aqui está o LLM. Ele usa texto como entrada e
produz texto como saída. Nesse caso, nossa entrada
são nossas bananas. E, infelizmente,
os resultados do LLM. Essa nem é uma
resposta válida para a pergunta. Para corrigir isso, forçamos o LLM
a produzir somente sim ou não. Dessa forma, mesmo que
a saída esteja errada, pelo
menos a saída é válida. Para fazer isso, precisamos
modificar essa etapa no final,
como os LLMs traduzem as
saídas em palavras Vamos ampliar. Na verdade, o LLM primeiro gera
uma lista de números Esses números são,
na verdade, probabilidades que correspondem
a determinadas palavras Em nosso exemplo, a
primeira probabilidade é a probabilidade de sim. A segunda, a
probabilidade de não, a terceira para R e a última para é. A probabilidade mais alta é 60%, e a
palavra correspondente é R. Então, finalmente
produzimos R. É assim que o
LLM prevê normalmente, mas nosso objetivo é
produzir apenas sim ou Então, vamos fazer algumas mudanças. Primeiro, ignore
todas as outras palavras. Considere apenas sim ou não. E agora consideramos a probabilidade
mais alta, 10%, o que corresponde a sim. Finalmente, produzimos sim. E com isso, restringimos
com sucesso nosso LLM a produzir
apenas sim ou não, usando a palavra válida de maior
probabilidade Neste exemplo, queríamos
apenas sim ou não. Então, usamos as probabilidades
dessas duas palavras e simplesmente escolhemos a mais
provável das Agora, nosso LLM é forçado
a emitir sim ou não
e, o mais importante, fizemos isso sem alterar o
número de tokens de entrada Navegue de volta ao
seu notebook e role para baixo até a configuração da etapa zero. Passe o mouse sobre a célula
e clique em Executar. Você não verá nenhuma saída para
a etapa. Agora você está configurado. Em nosso primeiro exemplo, forçaremos o verdadeiro ou o falso. Da mesma forma, podemos dizer
que forçaremos um booleano. Um booleano é verdadeiro ou falso. Por exemplo, primeiro,
perguntamos se M são bananas, frutas e a
produção forçada é verdadeira ou falsa. Agora, passe o mouse sobre o exemplo
um e clique em Executar. Isso produzirá um
único booleano verdadeiro. Isso está correto.
Bananas são frutas. No nosso próximo exemplo, forçaremos três booleanos
em vez de apenas um Agora, verificamos se bananas, amêndoas e
batatas são frutas Passe o mouse sobre o
exemplo dois e pressione Executar. Agora você verá as saídas
verdadeiras, falsas falsas. Isso está correto. Agora vamos
ver se podemos usar isso para restringir o formato de saída
de nossas críticas não alimentares Passe o mouse sobre o exemplo
B e clique em Executar. E essa saída é de
três booleanos. O formato de saída é válido. Infelizmente, a saída ainda
está errada. Deve ser verdadeiro, falso,
falso, não verdadeiro, falso, verdadeiro. Então, vamos continuar.
Em nosso terceiro exemplo, forçaremos o modelo
a raciocinar passo a passo. Para esta etapa, solicitaremos que
o modelo raciocine primeiro. Em seguida, force o modelo a produzir
texto entre as tags de reflexão. Você pode escolher o
formato que quiser para pensar. Esse é exatamente o formato que eu escolhi. Como antes, a dica é
verificar se bananas, amêndoas e
batatas são frutas Passe o mouse sobre o exemplo
três e clique em Executar. Isso levará algum tempo para
ser executado, cerca de 45 segundos. Então você verá a saída final
com o raciocínio correto e melhor
ainda, as
saídas corretas verdadeiro, falso, falso Agora, vamos aplicar os
mesmos resultados estruturados ao nosso projeto de exemplo
para críticas não alimentares Passe o mouse sobre o exemplo
C e clique em Executar. Você verá o raciocínio e a
resposta correta no final Agora, ao estruturar nossas saídas, melhoramos a qualidade
do nosso modelo e forçamos saídas
a corresponderem a um formato específico
. Isso é uma vitória ganha. Também reduzimos drasticamente o
tamanho do prompt. O prompt original
tinha 288 caracteres. Da última lição,
precisávamos de 1.312 caracteres. Nesta lição,
precisávamos apenas de 386 caracteres, junto com saídas estruturadas para obter a resposta correta Com a engenharia rápida,
precisávamos de um prompt
4,5 vezes maior para
produzir as saídas certas Com saídas estruturadas,
temos um prompt muito mais curto, apenas 1,3 vezes maior E temos a garantia
de que a saída sempre será válida. Isso não quer dizer que um
seja melhor do que o outro, mas quero enfatizar que a engenharia
rápida e as saídas
restritivas serão, na verdade, usadas juntas maioria das vezes para maximizar a qualidade do
modelo Agora, vamos tentar restringir as saídas de um modelo proprietário,
ou seja, também dos modelos de IA aberta Acesse platform.openi.com. Sua página da web
ficará assim. Certifique-se de clicar em Login
no canto superior direito, se
ainda não o fez. Em seguida, clique no painel
no canto superior direito. Clique em Criar no
centro da página e você verá
uma página como essa. Clique no seletor de modelos. No menu suspenso,
selecione GPT five Nano e sua tela
agora deve ficar assim No canto inferior direito,
certifique-se de selecionar Limpar automaticamente. Em seguida, ao lado do nome do modelo, clique no ícone Configurações. Isso abrirá
um menu de configurações. Clique na
lista suspensa de formato de texto e, na lista suspensa, você pode clicar em Assim, você pode configurar saídas
restritas. Certifique-se de que seja um esquema JSON
e não um objeto JSON. Isso abrirá uma
caixa de diálogo como esta. Cole o seguinte, que você realmente
obterá desse URL. Copie o esquema JSON
de saída restrita. Em seguida, cole o esquema
JSON aqui. Role até a parte inferior da
caixa de diálogo e clique em Salvar. Veremos o esquema JSON
refletido no menu aqui. Em seguida, clique fora do menu. A partir desse URL, copie o
prompt de exemplo do projeto anterior. Cole o exemplo de
prompt do projeto aqui e clique em Executar. E agora temos a
saída no formato JSON. Experimente quaisquer alterações aleatórias que
desejar no prompt, o EPI sempre retornará
saídas nesse formato E com isso, você restringiu
com sucesso as
saídas desse GPT Em resumo, a estruturação
das saídas força a saída a ser válida Podemos forçar sim ou não,
podemos forçar números, podemos forçar qualquer
formato específico que desejarmos para modelos de código aberto e
proprietários Discutimos como isso funciona, um exemplo simples para
identificar frutas e uma melhoria para nossa detecção
de críticas não relacionadas a frutas Agora é o fim
da nossa terceira etapa. Vimos duas maneiras de melhorar a qualidade do
nosso modelo sem nenhum tipo de
treinamento, e isso conclui nossa aula
sobre estruturação de resultados E, de fato, isso conclui
nossa terceira das três etapas. E agora você termina apenas o início de sua
jornada construindo com a IA. Esses são os primeiros
passos que todos devem dar para um
projeto envolvendo IA. Você pode acessar esse URL para obter
uma cópia do código inicial, outras solicitações e
mais recursos Na próxima lição,
encerraremos a aula.
11. Conclusão: Você chegou ao
final do curso. Vamos encerrar com uma rápida
recapitulação do que você aprendeu. Primeiro, defina o escopo do seu projeto. Para fazer isso, dividimos isso
em três subetapas. Limite seu foco à tarefa
geral de conversão de texto em texto. Em seguida, restrinja seu foco aos texto estabelecidos e
comercialmente comprovados recursos de conversão de texto em texto estabelecidos e
comercialmente comprovados,
à
sumarização, à estruturação de
dados e à codificação Por fim, defina suas entradas,
saídas , sua tarefa
e sua métrica Como exemplo, essa foi a descrição do projeto para
detectar críticas não alimentares Para nossa segunda etapa, avalie os modelos, para que
possamos escolher um para usar. Para fazer isso,
temos novamente três subetapas. Em um alto nível, comece com a melhor e mais inteligente IA. Teste os modelos por meio do bot de bate-papo, as interfaces mais simples e
fáceis de usar, depois teste os modelos
por meio de uma API para que seus resultados sejam mais
repetíveis e reproduzíveis Por fim, otimize
o custo testando modelos
mais baratos e rápidos para ver se eles concluem
sua tarefa com sucesso. Depois de escolher um modelo, refinamos a qualidade Para fazer isso, tivemos duas subetapas. Comece a melhorar a qualidade
refinando suas entradas. Chamamos isso de engenharia rápida. Em seguida, restrinja as saídas. Isso pode melhorar ainda mais a confiabilidade e
a qualidade do seu modelo. E isso completa nosso processo de
três etapas, que agora você pode usar para criar
qualquer projeto envolvendo IA Isso é só o começo, mas
é uma base sólida para
entender o quão bem a IA
pode realizar sua tarefa. Agora, usando o
processo acima como guia, aplique isso ao seu
próprio projeto e publique o resultado na guia Projeto do
curso. Sinta-se à vontade para usar um dos meus projetos
de exemplo ou
criar um de sua preferência Estou muito animado para
ver o que você cria. Se você quiser saber mais
sobre aulas de acompanhamento, siga-me no Skillshare e
confira meus outros Parabéns. Estou chegando ao final do curso.