Inteligência artificial para iniciantes: crie um ChatGPT personalizado em 3 passos, gratuitamente

Alvin Wan, Research Scientist

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

- 1.
  
  Apresentação
  
  1:14
- 2.
  
  Projeto de escopo: texto para texto
  
  5:52
- 3.
  
  Projeto de escopo: recursos
  
  5:57
- 4.
  
  Projeto de escopo: tarefa e métrica
  
  5:32
- 5.
  
  Avalie modelos: teste os melhores
  
  6:22
- 6.
  
  Avalie modelos: otimize o custo
  
  3:40
- 7.
  
  Avalie modelos: código aberto
  
  7:03
- 8.
  
  Demonstração: execute um modelo de código aberto
  
  4:32
- 9.
  
  Refine a qualidade: inputs do engenheiro
  
  4:25
- 10.
  
  Refine a qualidade: restrição nas saídas
  
  9:18
- 11.
  
  Conclusão
  
  2:00

Nível iniciante

Nível intermediário

Nível avançado

Todos os níveis

989

Estudantes

Projetos

Sobre este curso

Você está animado em usar a IA em seu produto, mas se sente intimidado com todo o jargão e complexidade? A grande variedade de produtos aleatórios de terceiros? Vamos acabar com tudo esse burburinho: deixe-me mostrar como personalizar uma IA do zero — e em 3 passos rápidos.

Este curso foi projetado para empreendedores, desenvolvedores, gerentes de produtos e estudantes curiosos que desejam criar aplicativos de IA poderosos e personalizados sem APIs caras ou assinaturas de terceiros. Você vai descobrir os passos fundamentais para criar soluções de IA práticas e personalizadas usando ferramentas de código aberto totalmente gratuitas. E o mais importante, vamos melhorar as capacidades de seu LLM sem qualquer treinamento.

O que você aprenderá

Aqui está o que vamos fazer — rápido:

Escolha um problema real de texto-dentro/texto para fora que você se importa.
Defina a entrada, a saída e uma métrica rápida para que possamos julgar a qualidade.
Experimente o modelo de topo no chat e depois a API para resultados repetíveis e verificações de custo.
Desça para o modelo mais barato que ainda passe pela sua métrica.
Torne-o confiável com estrutura rápida e saídas restritas (para que ele sempre retorne o formato que seu aplicativo espera).
Conecte um pequeno modelo de código aberto em GPUs gratuitas e conecte-o para não ficar bloqueado pelo orçamento.

Não é necessário nenhum treinamento caro e vamos um passo mais além do “prompt do ChatGPT”.

Para quem é este curso?

Não é necessária nenhuma experiência anterior com IA ou programação, apenas curiosidade e desejo de aprender. Quer você seja iniciante ou tenha alguma experiência técnica, você vai sair com conhecimento prático e a confiança para começar a criar soluções de IA personalizadas. Dito isso, você aproveitará mais do curso se fizer primeiro meu curso Inteligência artificial para iniciantes: como aprender aprendizado de máquina e Inteligência artificial para iniciantes: como funciona o ChatGPT.

Recursos necessários:

Computador (Windows, macOS ou Linux)
Navegador Google Chrome
Conta do Google
Sem APIs pagas ou serviços de terceiros

Vamos mergulhar mais fundo?

Interessado em aprendizado de máquina avançado? Experimente meu curso Introdução à visão computacional (ML aplicada).
Quer programar? Confira Introdução à programação (Python) ou Introdução a OOP (Python).
Interessado em dados? Explore Introdução ao SQL (Design de banco de dados) ou Introdução aos Dados (Análise).

Conheça seu professor

Alvin Wan

Research Scientist

Top Teacher

Hi, I'm Alvin. I was formerly a computer science lecturer at UC Berkeley, where I served on various course staffs for 5 years. I'm now a research scientist at a large tech company, working on cutting edge AI. I've got courses to get you started -- not just to teach the basics, but also to get you excited to learn more. For more, see my Guide to Coding or YouTube.

Welcoming Guest Teacher Derek! I was formerly an instructor for the largest computer science course at UC Berkeley, where I taught for several years and won the Distinguished GSI (graduate student instructor) award. I am now a software engineer working on experimentation platforms at a large tech company. 4.45 / 5.00 average rating (943 reviews) at UC Berkeley. For more, see my Skillshare or Webs... Visualizar o perfil completo

Habilidades relacionadas

IA e inovação IA para desenvolvimento Fundamentos da IA Prompting

Level: Intermediate

Projeto prático de curso

Crie seu ChatGPT personalizado! Siga as etapas neste curso para descrever seu projeto e construir sua primeira IA personalizada:

Projeto de escopo
Avalie os modelos
Refine a qualidade

Analyse and tally 17 Reviews for a reginal hairdresser

Maria Charlton 8 curtidas

2 comentários

Blake Acosta 7 curtidas

1 comentário

Lakshya Soni 5 curtidas

1 comentário

Ifeoluwa Oladeni 5 curtidas

1 comentário

Nota do curso

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Apresentação: Treinar seu próprio modelo é lento, caro e exagerado para a maioria dos projetos O verdadeiro problema está em saber por onde começar, como obter resultados confiáveis sem perder tempo ou dinheiro. Olá, sou Alvin, pesquisador de uma grande empresa de tecnologia Eu ensinei mais de 60.000 estudantes no Skillshare e obtive meu PhD em IA Nesta aula, apresentarei um manual simples e repetível para criar um ChaChipt personalizado para um ChaChipt personalizado Faremos isso em três etapas. Etapa número um, defina o escopo do seu projeto. Defina como usar a IA forma mais eficaz para seu caso de uso. Etapa número dois, avaliar modelos. Mostrarei como navegar por uma grande variedade de modelos proprietários e de código aberto Etapa número três, refinar a qualidade. Certifique-se de que o modelo retorne exatamente o que você precisa todas as vezes. Ao final deste curso, você terá um processo de três etapas para usar em qualquer ideia baseada em IA. Este curso pressupõe que você tenha feito meu curso de IA para iniciantes, como funciona o Chat Tippit Mas, além disso, nenhum conhecimento técnico é necessário. Tudo que você precisa é de um laptop, Internet e uma hora de tempo. Vamos começar. 2. Projeto de escopo: texto para texto: Bem-vindo à IA para iniciantes. Crie um Chachi BT personalizado em três etapas. Antes de começarmos, vamos revisar algumas terminologias. Vou simplificar muito essas definições para transmitir a ideia principal LLM ou modelo de linguagem grande é um modelo que gera texto Você fornece Tex como entrada e o LLM produz a saída do Texas IA ou inteligência artificial geralmente é um produto que usa um LLM. O HHIBT é especificamente o produto de IA da Open AI. Portanto, IA versus CIBT é como lenços versus lenços de papel. Lenços de papel são o produto geral, e Kleenex é um nome de produto de marca comercial específico Se você achou isso confuso, tudo bem. Eu abordo isso com mais detalhes em AI para iniciantes, como funciona o HachBT, que você pode encontrar neste link Como você já está inscrito, você receberá este curso sem nenhum custo extra Também recomendo usar minhas ferramentas de IA para iniciantes para aprender aprendizado de máquina, onde discuto uma estrutura para aprender IA e ML Você pode encontrar esse curso neste link. Não há necessidade de anotar esses links, pois você encontrará todos os links desta lição neste URL. Agora vamos criar seu Chachi BT personalizado em três etapas. Essas etapas são para que todos possam seguir, mesmo se você for um profissional, mesmo que tenha um orçamento enorme. Qualquer pessoa que crie uma IA personalizada precisa dessas três etapas. Primeiro passo, defina o escopo do seu projeto, determine o que sua IA fará e como você avaliará suas capacidades. Etapa dois, avalie os modelos. Há diretrizes sobre quais tipos de modelos usar e quando. Etapa três, refinar a qualidade. Não há necessidade de treinamento e mostraremos dois métodos para melhorar a qualidade. Agora vamos começar com a primeira etapa, definir o escopo do seu projeto. A primeira etapa aqui é restringir seu foco às tarefas de texto para texto. Ou seja, você fornece o AI Tex como entrada e obtém texto como saída. Deixe-me explicar o porquê. Primeiro, por experiência própria, sabemos que IA pode absorver muito mais do que texto. Podemos fornecer imagens de IA, PDFs, sites, vídeos e muito mais Também pode gerar mais do que texto. IA pode produzir imagens, códigos, gráficos, áudio e muito, muito mais São muitas mídias diferentes. No entanto, lembre-se do que dissemos antes. A IA é um produto que usa um LLM, e um LLM é um modelo que recebe entradas do Texas e gera texto como Então, de volta ao nosso diagrama. Vamos ampliar. O produto de IA e uma análise do LLM subjacente. Observe que o LLM aceita apenas texto. Todas as outras entradas são primeiro convertidas em texto. Sabendo disso, o caso ideal é fornecer o texto da IA diretamente e pular totalmente o processo de conversão Isso ocorre porque o texto transmite mais informações por palavra Deixe-me explicar com um exemplo. Digamos que haja uma página da web com resultados de um jogo de futebol recente Quantas palavras existem nesta página? IC um, dois, três, quatro, cinco, seis, 789, dez, 11, 12 Então, um total de 12 palavras. Eu poderia dar à IA esse texto diretamente, apenas 12 palavras, ou eu poderia fazer uma captura de tela dessa página da web e dar essa imagem à A IA então traduziria essa imagem em incríveis 2030 palavras visuais São mais de 170 vezes mais palavras para a mesma quantidade de informações. Concluindo, o Tex é mais eficiente na comunicação de informações do que imagens de texto Como resultado disso, para simplificar, para seu projeto, opte pelo texto e pelas tarefas do TextOut. Aqui está outro exemplo. Então, você quer pedir feedback ao HattBT sobre seus slides. Você tem várias opções para formatos de download. não baixe o conjunto de slides como PDF e, entanto, não baixe o conjunto de slides como PDF e, definitivamente, não baixe como imagens. Em vez disso, baixe os slides em formato de texto simples. Esse formato de texto simples contém apenas o texto bruto de todos os meus slides, sem qualquer formatação extra ou informações desnecessárias Agora posso fazer o upload desse arquivo e pedir ao HattPT que forneça feedback sobre meus slides Felizmente, meus slides são fornecidos apenas como texto bruto, que torna eficiente o processamento do Chat TPT Resumindo, se você quiser alimentar um arquivo para o HachBT, exporte esse arquivo em formato de texto simples sempre Vamos fazer mais um exemplo. Digamos que eu queira perguntar ao HattBT sobre uma postagem de blog que estou lendo Não faça uma captura de tela da página da web. Em vez disso, forneça diretamente ao HattBT o URL da página da web e você descobrirá que o HTHBT realmente acessará essa página da web para nós, resumindo Podemos verificar se o HTTP acessa o URL correto clicando nas fontes E no lado direito, veremos a página original listada como uma citação Isso significa que a HatchBT conseguiu acessar o texto bruto na página da web e, como antes, ingerir informações com eficiência, ingerir informações Em resumo, forneça URLs de páginas da web diretamente para que o HachPT possa acessar a página da web e extrair seu conteúdo como texto bruto Para resumir esta lição em uma única lição, concentre-se nas tarefas de conversão de texto em texto Isso significa fornecer dados de texto simples sempre que possível para nosso projeto. E isso agora conclui a primeira subetapa da primeira Reduzimos o escopo do nosso projeto focando em tarefas de texto para texto Na próxima lição, falaremos sobre algumas tarefas de conversão de texto em texto para as quais a IA é mais adequada. E se quiser obter uma cópia desses slides e ver recursos adicionais, você pode acessar esse URL. 3. Projeto de escopo: recursos: Nesta lição, continuaremos discutindo como definir o escopo do seu projeto. Agora, para recapitular, estamos atualmente na primeira etapa de um processo de três etapas Meu objetivo nesta primeira etapa é ajudar você a reduzir o escopo do seu projeto. Na lição anterior, reduzimos seu foco às tarefas de conversão de texto em texto E nesta lição, vou restringir ainda mais seu foco aos recursos específicos de conversão de texto em texto. Primeiro, nosso foco é criar uma IA personalizada confiável e precisa para produção. Então, podemos perguntar: o que a IA pode fazer de forma confiável e precisa o suficiente para a produção Existem muitas tarefas desse tipo, mas vou me concentrar apenas em três delas. Nossa primeira categoria é a sumarização. Por exemplo, a Amazon usa IA para resumir avaliações de produtos em uma seção de clientes O Slack usa IA para resumir canais, e Noon usa IA para resumir as reuniões do Zoom Há muitos exemplos comerciais apenas de sumarização. Agora, vamos tentar isso nós mesmos. Digamos que você administre uma padaria com centenas de avaliações. Você gostaria de obter informações dessas avaliações para ajudar sua padaria a crescer No seu navegador, acesse chattbt.com. Você verá uma página como esta. Vamos colar algumas avaliações e pedir HatchiBT que resuma essas Aqui está nosso resumo. HattiBT diz que as opiniões sobre o croissant de amêndoa são variadas, que parece Você mesmo pode ver as avaliações neste URL para avaliar se concorda ou não. Resumindo, a IA é bastante hábil em resumir. A IA também está pronta para produção para estruturar dados. Estruturar dados é uma maneira elegante de dizer que a IA pode traduzir blocos de texto em tabelas de dados bem organizadas E em um nível superficial, isso parece legal. Mas deixe-me enfatizar, legal é um eufemismo. Ser capaz de pegar dados não estruturados e extrair dados estruturados limpos é na verdade, uma superpotência de IA extremamente útil Deixe-me explicar com um exemplo. Vamos voltar para nossa padaria. Com base em nossas 671 avaliações, gostaríamos de saber o que nossos clientes pensam sobre nossos produtos de panificação Por exemplo, os clientes gostaram do croissant de amêndoa? Na verdade, vamos primeiro perguntar: quais clientes já experimentaram o croissant de amêndoa Idealmente, teríamos uma tabela de dados bem organizada como essa, uma lista de dados verdadeiros para aqueles que gostaram e falsos para aqueles que não gostaram, não temos essa tabela Temos muitos e muitos comentários como esse. Agora, precisamos ler cada resenha e determinar quais avaliações mencionaram até mesmo croissants de amêndoa Há muitas maneiras de mencionar croissants de amêndoa. A crítica poderia dizer croissant de amêndoa com amêndoa ou massa com Então você pode dizer: vamos procurar a palavra amêndoa. Mas isso também incluiria outros croissants, porque a padaria também vende croissants de chocolate com amêndoa e croissants de amêndoa com mirtilo. Resumindo, detectar menções ao croissant de amêndoa é difícil, porque o texto não estruturado é Felizmente, porém, a IA é perfeita para isso. Deixe-me mostrar para você acessar chattbt.com. Acesse esse URL para copiar o prompt. Em seguida, cole o prompt aqui. O aviso fornece ao ChaChiBT uma lista de avaliações de padarias e solicita que ele identifique os amantes do croissant Clique em correr e você terá uma boa tabela de resultados. Em vez de ler as avaliações, podemos ver facilmente quais clientes experimentaram o Amend Croissant Existem três desses revisores e, desses três, dois gostaram Como resultado, concluímos que 67% dos clientes que experimentaram o Amen Croissant E com isso, podemos analisar facilmente grandes quantidades de texto dessa forma, tudo porque a IA pode converter texto não estruturado em formatos estruturados E agora você deve ser capaz de ver o quão valiosos são os dados estruturantes. É um superpoder para analisar dados. A terceira tarefa para a qual a IA está pronta para produção é a codificação e pequenos passos Há muitas histórias de sucesso nesse espaço. Cursor aumenta a produtividade do desenvolvedor oferecendo um editor de código baseado em IA, que pode escrever e executar código para você Lovable permite que qualquer pessoa gere aplicativos do zero sem escrever nenhum código sozinha No entanto, para seu primeiro projeto, não peça à IA que crie bases de código inteiras. Trate a IA como um engenheiro júnior, tarefas simples e etapas individuais. A IA é muito boa em gerar trechos de codificação inicial, em encontrar e corrigir pequenos bugs e adicionar um recurso que envolve apenas alguns arquivos. Vamos ver isso em ação. Acesse chattbt.com. Vamos pedir ao HattBT que trace um gráfico circular de sobremesas de croissant alemãs usando os dados anteriores. Conforme solicitado, o ChaChiBT começa a escrever e escrever código, o que agora nos dá um gráfico circular O ChaChiBT também nos fornece o código da trama, que nós mesmos poderíamos executar Resumindo, a IA é muito capaz de escrever código em pequenos passos. Em resumo, a IA está pronta para produção para resumir, estruturar dados e codificar A sumarização é incorporada aos produtos da Amazon, Slack e Notion estruturação das informações corporativas em um formato pesquisável é dominada pelo glean e pelo A codificação é dominada pelo cursor e é adorável. Obviamente, a IA pode ser aplicada de muitas outras maneiras diferentes. Mas aqui, nos concentramos em recursos que já obtiveram sucesso comercial. Agora você já viu recursos que o Custom Chat Tipts pode realizar com qualidade de produção Agora, discutimos vários recursos de IA que já foram comprovados comercialmente e repetidamente, tornando razoável confiar nesses recursos em nosso primeiro projeto Você pode acessar esse URL para ver todos os prompts que usei, vinculados aos exemplos completos de conversas e a mais recursos 4. Projeto de escopo: tarefa e métrica: Na última lição, vimos as capacidades gerais nas quais a IA é melhor. Agora, vamos traduzir os recursos gerais em um projeto específico. Na primeira parte, reduzimos seu foco ao texto geral da tarefa de texto Na última lição, restringimos ainda mais seu foco a três recursos específicos: resumo, estruturação de dados e codificação Nesta lição, finalmente definiremos seu projeto. Para seu projeto, primeiro você precisa definir a tarefa. O que a IA fará por você? Em seguida, defina o que o LLM receberá como entrada. Ele receberá resenhas, e-mails, ensaios e, finalmente, definirá qual texto o LLM produzirá como saída Produzirá resumos, tabelas, tópicos? Vamos ver um exemplo. R: Estou procurando um lugar para comer. O café delicioso tem uma classificação baixa, e eu quero saber Minha primeira reação é fazer com que a IA resuma minhas avaliações. Vamos preencher o modelo do projeto. Nossa tarefa é resumir as avaliações. Nossa opinião será composta por avaliações e nossa saída será um resumo. Isso não parece ser uma definição útil. Então, vamos ser mais específicos. Na página do restaurante, eu percorro as avaliações com avaliações muito baixas Uma pessoa confundiu este lugar com seu restaurante irmão. Outra pessoa reclamou da ordem em que os pratos foram servidos, e a última avaliação não gostou da atitude da equipe de garçons Todas essas são preocupações válidas, mas eu pessoalmente só me preocupo com a comida. Então, eu quero filtrar avaliações não alimentares. Sabendo que esse é meu objetivo, vamos agora traduzir isso em um projeto concreto. Para o nosso modelo. Eu gostaria de detectar críticas não alimentares A entrada é uma avaliação de restaurante e a saída é verdadeira ou falsa. Se a avaliação deduz estrelas ou não por motivos não alimentares. Agora estamos no negócio. É assim que a definição do seu projeto deve ser específica. No entanto, temos mais um componente, a métrica. Em um nível alto, a métrica informa se os resultados da IA são bons Para começar, sua primeira métrica será eu acho que os resultados da IA são razoáveis? Avalie primeiro manualmente. Aqui está uma resenha que reclama da ordem em que os pratos foram servidos Perguntamos à IA: esta avaliação deduz estrelas por motivos não alimentares A IA faz uma previsão. Sim. Agora, eu acho razoável? Eu tenho. A avaliação está deduzindo estrelas pelo serviço, não pela A IA passa nessa primeira verificação. Aqui está outra crítica que reclama do frescor do peixe Perguntamos à IA: esta avaliação deduz estrelas por motivos não alimentares A IA faz uma previsão. Não. Eu não acho nada razoável? Eu tenho. Esta análise deduziu estrelas precisamente por motivos alimentares A IA passa nessa segunda verificação. Aqui está uma crítica que mostra confusão sobre o nome do restaurante. Perguntamos à IA Esta avaliação deduz estrelas por motivos não alimentares A IA faz uma previsão. Não. Eu não acho nada razoável? Desta vez, eu não tenho. A avaliação deduziu estrelas pelo nome do restaurante, não pela A IA falha nessa terceira verificação. Aqui está o scorecard da IA. Achamos que as saídas são razoáveis duas em cada três vezes. Portanto, para concluir, sua primeira avaliação é que os resultados da IA são, em sua maioria, razoáveis No entanto, as melhores métricas quantificarão a qualidade. Então, vamos ser mais específicos. De volta ao nosso scorecard, descobrimos que a IA estava correta duas em cada três vezes Então, dizemos que a IA alcançou 67% de precisão. Agora, sua métrica é a porcentagem de avaliações que a IA classifica corretamente. Dito de forma mais sucinta, nossa métrica é precisão do modelo em avaliações que rotulamos como verdadeiras O mesmo vale para as estrelas dedutivas da avaliação por motivos não alimentares. Agora podemos pegar qualquer IA e calcular sua precisão em nossa tarefa Aqui está agora nossa definição idiota de projeto. Adicionamos a precisão métrica da precisão com que a IA prevê o verdadeiro ou o falso, em comparação com seus próprios rótulos nas avaliações de restaurantes Vamos fazer outro exemplo. Digamos que você esteja organizando um Hackathon e, depois que o portal de inscrições on-line fechar dentro do prazo, dezenas de pessoas enviam inscrições atrasadas por e-mail Seu objetivo geral é organizar as inscrições atrasadas enviadas por e-mail. Mais concretamente, sua tarefa é detectar se um e-mail é uma entrada do Hackathon A entrada é um e-mail. O resultado, independentemente de o e-mail ser ou não um envio para o Hackathon A métrica também é a precisão, quantos e-mails estão corretamente classificados como entradas ou não. Agora, usando a IA, podemos gerar uma tabela de dados e pronto. Agora é muito mais fácil determinar quais envios atrasados aceitar em grande escala sem precisar ler todos os 100 e-mails para encontrar as inscrições do Hackathon Em resumo, defina a tarefa, a entrada para sua IA, a saída de sua IA e a métrica, que determina o quão boas são as saídas do seu modelo Isso conclui esta lição. Nesta lição, finalmente definimos seu projeto depois de definir o escopo e, além disso concluímos a primeira das três etapas Agora você definiu o escopo do seu projeto e estamos prontos para começar Você pode acessar a CRL para obter uma cópia desses slides e recursos adicionais 5. Avalie modelos: teste os melhores: Bem-vindo de volta. Nas aulas anteriores, reduzimos nosso foco às tarefas de texto para texto Em seguida, recursos específicos e, em seguida, defina a métrica da tarefa. Isso concluiu nossa primeira tarefa, definir o escopo do projeto. Em nossa segunda etapa, avaliaremos os modelos para escolher o melhor modelo para nosso caso de uso. Para escolher um modelo, você avaliará vários modelos quanto à capacidade de concluir sua tarefa. Começaremos com as melhores opções porque queremos saber. Alguma IA pode ao menos completar nossa tarefa? Se a melhor IA não conseguir resolver sua tarefa , as IAs menos inteligentes certamente também não o farão. Então, comece com a IA mais inteligente. De acordo com o site da Open EI, se você usa os planos gratuito ou plus, GPD five thinking é o seu modelo mais inteligente Se você está no plano Pro, GPD five Pro é seu modelo mais inteligente Vamos começar nossos testes por meio de chatbots, uma interface simples para um teste rápido Acesse chatbt.com. Você verá uma tela como essa. No canto superior esquerdo, expanda a lista suspensa. Nesse menu suspenso, você verá rapidamente o modelo mais rápido, mas relativamente menos inteligente. Pensando, um modelo mais inteligente. Use isso se você estiver nos planos gratuito ou plus. E, finalmente, P, o modelo mais inteligente. Use isso se você estiver no plano profissional. Vou usar o GPT five thinking para que todos possam reproduzir meus resultados Agora selecionamos um LLM. Então, o que devemos perguntar ao Chat GBT? Vamos usar nosso projeto da última lição. Lembre-se de que nosso objetivo é filtrar as críticas não alimentares. As entradas são avaliações de restaurantes e as saídas são verdadeiras ou falsas, verdadeiras se as estrelas forem deduzidas por Então, para nossa pergunta, tudo bem, dadas as avaliações de restaurantes, a saída é verdadeira se uma avaliação deduzir dadas as avaliações de restaurantes, a saída é verdadeira estrelas por motivos não alimentares Em seguida, incluo três avaliações. A primeira avaliação reclama do serviço, segunda reclama do sabor e a terceira gosta da comida, mas achou que o serviço estava lento Esperamos que a IA retorne verdadeira porque a primeira avaliação deduz estrelas pelo serviço, falsa, porque a segunda avaliação deduz a estrela é precisamente para comida e A última avaliação não deduz nenhuma estrela. Vamos tentar esse prompt agora. Primeiro, acesse esse UOL e copie o prompt. Em seguida, volte para chattbt.com. Cole no prompt. Clique em correr. ChatTBTTS por alguns segundos e, em seguida, dá uma resposta correta , verdadeira, falsa, falsa Como resultado, concluímos que a IA pode concluir nossa tarefa corretamente. Especificamente, o GPT cinco completa nossa tarefa. Testar o chatbot não é suficiente porque os chatbots não são determinísticos Isso significa que eles não retornam sempre os mesmos resultados. Por exemplo, vamos perguntar ao HathBT uma piada sobre papai. Chat TBT faz uma piada sobre espantalhos. Vamos fazer isso de novo, exatamente na mesma solicitação. O HatchiBT faz uma piada sobre o alfabeto. Faça isso mais uma vez. Piadas do Chat TBT sobre Portanto, exatamente a mesma solicitação gerava respostas diferentes todas as vezes Isso mostra nosso ponto anterior que os chatbots não são determinísticos Como resultado, precisamos deixar de testar o chatbot e passar a testar a API A API, por padrão, tem muito menos aleatoriedade injetada. Portanto, se a IA concluir a tarefa uma vez, podemos ter certeza de que a IA concluirá a tarefa repetidamente Acesse a plataforma dotopen.com. Sua página da web ficará assim. Certifique-se de clicar em Login no canto superior direito, caso ainda não tenha feito isso. Em seguida, clique no painel no canto superior direito. Nossa página agora ficará assim. Clique em criar no centro da página. Sua tela agora deve ficar assim. No canto inferior direito, clique em Limpar automaticamente. Isso garante que, sempre que clicarmos em Enviar, imitemos o mesmo comportamento do envio de chamadas de API separadas Agora peça uma piada sobre o pai, mas antes de pressionar Enter, observe que esse exemplo específico pode custar até dois décimos de um Depois de clicar em Executar, o JTBT faz uma piada sobre o alfabeto. Vamos pedir uma piada sobre o pai novamente. Certifique-se de que a opção Limpar automaticamente no canto inferior direito esteja selecionada e envie. JTBT faz exatamente a mesma piada sobre o alfabeto com E tentamos novamente ouvir exatamente a mesma piada do alfabeto. Os resultados são quase idênticos. Isso é muito melhor do que o chatbot, que retorna respostas completamente diferentes a cada vez Portanto, podemos concluir que as chamadas de API são em sua maioria determinísticas, definitivamente muito mais do que o chatbot Então, vamos tentar novamente nosso exemplo de prompt de projeto por meio da API. Lembre-se de que esta é a nossa sugestão anterior. Esperamos que a IA retorne verdadeiro, falso e falso. Acesse esse URL para copiar novamente o exemplo de prompt do projeto. Em seguida, de volta à plataforma do openai.com, cole esse prompt Antes de clicar em Executar, observe que este exemplo custará quatro décimos de centavo A API GPD five retorna primeiro os tokens pensantes por alguns segundos. Em seguida, finalmente retorna a resposta final correta, verdadeira, falsa, falsa. Vamos tentar mais uma vez. E, novamente, o GPD cinco retorna a resposta correta, verdadeira, falsa, falsa E mais uma vez. E, novamente, a resposta correta, verdadeira, falsa, falsa. Então, como antes, o GPD cinco completa corretamente nossa tarefa. Ainda mais importante, o GPT cinco faz isso repetidamente. Essa é uma grande vitória. Isso significa que nosso projeto agora pode concluir repetidamente nossa tarefa usando a API do GPD five Em resumo, teste primeiro a melhor e mais inteligente IA. Primeiro por meio de bots de bate-papo para simplificar, depois por meio da API para reprodutibilidade, e isso conclui nossos testes por meio Geralmente, terminamos de testar a melhor IA. E na próxima lição, otimizaremos os custos testando modelos mais rápidos e baratos. Caso você esteja se perguntando como calculei o custo de uma chamada de API, explicarei isso e incluirei mais recursos no site do curso neste URL 6. Avalie modelos: otimize o custo: Bem vindo de volta. Para recapitular, você está na etapa dois de três Mas até agora, você só testou a melhor IA. Testamos a melhor IA via chat e depois testamos via API. Agora é hora de otimizar os custos e encontrar o modelo mais barato que ainda possa concluir nossa tarefa repetidamente. Lembre-se de que o GPD cinco concluiu nossa tarefa de projeto de exemplo com sucesso e repetidamente, e ela custou cerca de quatro décimos de Incluirei todos os cálculos de custos no site do nosso curso, se você estiver interessado. Aqui está o custo do GPD five para nosso exemplo, junto com seus custos por token, acordo com a página de preços da API da OpenAI Vamos experimentar o próximo modelo mais barato nossa lista, o GPT five Mini seletor de modelos, selecione GPD five Mini Sua tela agora deve se parecer com a minha. Cole o exemplo de prompt do projeto e o GPD five Mini responderá verdadeiro falso falso, concluindo corretamente a tarefa Vamos analisar o custo. Este exemplo custou 700 centavos E quando adicionamos isso à nossa tabela, podemos ver que reduzimos o custo de concluir nossa tarefa em cinco vezes. Vamos agora testar nosso modelo mais barato, o GPT five Nano. No seletor de modelos, escolha GPT five Sua tela agora deve se parecer com a minha. Cole o exemplo de prompt do projeto e, mais uma vez, obteremos true false false, a resposta correta. Veja o custo novamente. O custo do nosso exemplo agora é três centésimos de um E em nossa tabela, podemos ver que agora reduzimos o custo de concluir nossa tarefa em mais duas vezes. Mas vamos reduzir ainda mais os custos. Até agora, mantivemos o raciocínio no nível médio padrão. Em vez disso, queremos reduzir o raciocínio ao mínimo. Deixe-me te mostrar como fazer isso. De volta a esta página da web, ao lado do nome do modelo, clique no ícone de configurações No menu, selecione esforço de raciocínio. Isso lhe dará outra lista suspensa. Selecione mínimo, que ficará assim. Clique fora do pop-up. Em seguida, cole seu exemplo de prompt de projeto. E, loucamente, GPT five Nana, sem raciocinar, ainda responde verdadeiro, falso, falso, completando a tarefa perfeitamente. Veja o custo agora. O custo do nosso exemplo agora é de 4000 centavos, o nos dá essa tabela final de resultados Reduzimos ainda mais os custos em mais sete vezes. Essa é uma redução de custos absurda. Diante desses resultados, declaramos GPT five Nano sem justificar Agora, conclua as três partes da etapa dois, teste via chatbot, teste por meio da API e, finalmente, encontre o modelo mais barato que ainda funciona Isso produziu o modelo Open EI mais barato que poderia resolver com sucesso nossa tarefa GPT five Nano Em resumo, teste primeiro a melhor e mais inteligente IA. Primeiro por meio de bots de bate-papo para simplificar, depois por meio da API para reprodutibilidade e, em seguida, teste uma IA iterativamente mais barata Agora otimizamos os custos com sucesso, reduzindo os custos em mais de 88 vezes, e pronto para avaliar modelos Isso conclui principalmente a etapa dois. Acabamos com os modelos proprietários, mas agora precisamos repetir esse processo para outra vasta categoria de opções de modelos de código aberto Como de costume, você pode encontrar todos os cálculos, solicitações e mais recursos neste URL 7. Avalie modelos: código aberto: Vamos explorar mais uma categoria de modelos, modelos de código aberto. Atualmente, estamos na segunda das três etapas em que estamos avaliando modelos para determinar qual deles usar Felizmente, há um hub padronizado para todos os modelos de código aberto Visite esse URL e você verá várias opções. É avassalador. No entanto, aqui estão algumas heurísticas para navegar nesse grande repositório Regra número um, use modelos ajustados às instruções. Normalmente, os modelos ajustados às instruções têm instruções no nome em algum lugar O motivo dessa regra é que os LLMs são treinados em três estágios No primeiro estágio chamado pré-treinamento, LLMs simplesmente predizem a próxima palavra No segundo estágio, chamado SFT ou ajuste fino supervisionado, os modelos aprendem a responder perguntas No último estágio, chamado Aprendizado por Reforço com Feedback Humano ou RLHF, os modelos aprendem a alinhar as respostas às preferências humanas, sendo úteis, honestos Tecnicamente falando, apenas a segunda etapa é chamada de ajuste de instruções, mas, na prática, os modelos de código aberto ajustados por instruções passaram pelo SFT e pelo De qualquer forma, você não quer um modelo que tenha passado apenas pelo pré-treinamento porque esses modelos respondem automaticamente às perguntas, não às perguntas. Então, em resumo, regra número um, use modelos ajustados por instruções Para a regra número dois, use modelos pequenos. Obviamente, essa não é uma regra rígida, mas eu a recomendo fortemente. Agora, digamos que você me ignore. E se você quiser usar modelos massivos de código aberto, os maiores e os melhores? Bem, vamos ver qual modelo de código aberto é o melhor. Aqui está a arena do chatbot. Os modelos Gemini Open AI e Grock four são todos proprietários. Portanto, o modelo de código aberto mais bem classificado é o Kimik. Vamos ao site da Kimi K. De acordo com esta página da web, Kimi K tem 1 trilhão Então, realisticamente, precisaríamos GPUs de 16 H 100 para executar esse modelo Primeiro, isso é caro. As GPUs de 16 H 100 custam 64 USD por apenas 1 hora de uso. Em segundo lugar, é complicado fazer inferências para um modelo tão grande Tudo isso para dizer que, se você quiser usar modelos de código aberto de última geração, deve usar APIs que servem modelos de código aberto porque seus preços se beneficiam de economias de escala. É mais barato chamar uma API do que executar esses modelos massivos sozinho. Para obter detalhes, você pode ver esta postagem do blog, que vou colocar no site do nosso curso. Para usar modelos de código aberto de última geração, vamos seguir as mesmas três subetapas Teste via chatbot, teste via API e otimize custos. A partir da primeira subetapa, vamos testar via chatbot Acesse gpthss.com. Lembre-se de que essa foi a nossa sugestão anterior. Esperamos que a IA retorne verdadeiro, falso e falso. Primeiro, acesse esse URL e copie o prompt. Em seguida, você verá uma página da web como essa. Eu escolhi continuar com o raciocínio visível, mas você pode escolher qualquer uma das opções Nenhuma das opções altera a qualidade das respostas da IA. Cole seu prompt e clique em Executar. Então você verá verdadeiro falso falso, a resposta correta. Na barra lateral esquerda, agora clique em GBTOSS 20 bilhões, o menor dos dois modelos de código aberto da Open AI Em seguida, no canto superior direito, clique em Novo bate-papo. Sua tela ficará assim, cole o prompt mais uma vez e clique em Executar. Então, mais uma vez, você verá verdadeiro falso falso, a resposta correta. Vimos que o melhor da IA de código aberto pode concluir nossa tarefa. Agora vamos testar novamente via API. No huggingface.co, muitos modelos de código aberto têm uma seção no canto inferior direito onde você pode enviar uma mensagem única para testá-la Tecnicamente, isso também não é gratuito, mas você pode enviar solicitações sem adicionar informações de cobrança Cole seu prompt e o Deep Seek R passa. Ele gera verdadeiro falso falso. Isso significa que a IA de código aberto, como o Deepsk, também pode resolver nossa tarefa Deepsek R one teria custado um terço de um centavo para executar Como antes, vamos agora encontrar o modelo mais barato que pode completar nossa tarefa. Vamos experimentar o próximo modelo mais barato. Deep Seek R one Lama 7 bilhões. Esse modelo também obtém a resposta correta, verdadeiro falso falso. Deep Seek Lama custou um sexto de um centavo, então agora reduzimos nosso custo pela metade Agora vamos experimentar o próximo Deep Seek V três mais barato. Tecnicamente, o Deep Seek V three respondeu corretamente ao verdadeiro falso falso. Acabou de fazer isso com muito texto extra. Infelizmente, se o Deep Seek formatos diferentes a cada vez, nosso código de projeto não seria capaz de analisar a saída nosso código de projeto não seria capaz de analisar a do LLM Felizmente, temos uma maneira de corrigir isso, que mostrarei Mas, por enquanto, Deep Seek V three não passa. Ele tem a inteligência , mas não a formatação. Vamos tentar o próximo mais barato nossa lista, Lama 370 bilhões Infelizmente, Hugging Face continua me dando erros. Então eu encontrei um outro site aleatório. Eu não necessariamente endosso, mas qualquer site serve. E parece que Lama 370 bilhões de respostas corretas com verdadeiras falsas quedas Então, Lama: 370 bilhões de passes. Vamos experimentar o próximo modelo mais barato da nossa lista. Deep procura Quin menor modelo destilado do Deep Seek RO apenas emite uma sequência infinitamente longa Então, isso é uma falha difícil. Quin falhou catastroficamente, como vimos. E com isso dito, agora concluímos nossa tabela de resultados. Podemos listar novamente todos os preços e centavos e, em seguida, comparar os preços da Open AI com os preços open source para comparar a inteligência por dólar Aqui estão os vencedores de cada categoria. Observe a diferença no custo. É verdade que eu poderia ter testado modelos menores de código aberto que são mais baratos do que 70 bilhões, mas mais capazes do que o Quinn , mas menores, e eles podem executar sua própria máquina gratuitamente, então não adianta testar suas APIs A API Open EI é 15 vezes mais barata para essa tarefa específica de detectar corretamente críticas não alimentares com base em nossos Geralmente, para a vanguarda da classe de modelos de ponta, os modelos proprietários superam os modelos de código aberto em inteligência por dólar Então, se estamos considerando o código aberto, vamos nos afastar da vanguarda e optar por pequenos modelos de código aberto. Na verdade, esses modelos podem ser muito econômicos para serem executados sozinhos. Então, em resumo, eu recomendo usar pequenos modelos de código aberto. Pelo menos por enquanto, para os grandes modelos de código aberto de última geração, concluímos nossas três subetapas Isso conclui a avaliação de grandes modelos de código aberto. Na próxima lição, veremos pequenos modelos de código aberto, pequenos o suficiente para serem executados gratuitamente. Como de costume, você pode encontrar todos os links, cadernos e outros recursos no site do curso 8. Demonstração: execute um modelo de código aberto: Agora vamos executar modelos de código aberto gratuitamente. Atualmente, estamos na segunda das três etapas. Agora estamos testando pequenos modelos de código aberto. Por enquanto, vamos tratar Lama 3,28 bilhões como nosso padrão. Esse é um pequeno modelo de linguagem que deve caber no seu laptop. Obviamente, existem muitos outros modelos de código aberto. Mas antes de discuti-los, os próximos slides se referirão a alguns termos como GPU, nó, RAM e precisão Se você não estiver familiarizado com esses termos, pode ignorar minha explicação com segurança e se concentrar apenas na conclusão Também incluirei definições no site do curso neste URL. Agora, voltando à regra número dois, dissemos anteriormente que devemos usar modelos pequenos. Mas sejamos mais precisos sobre o que significa pequeno. Por pequeno, quero dizer modelos de GPU única, que são muito mais simples do que GPUs e, especialmente , de vários nós para Agora que nos limitamos aos modelos código aberto de GPU única, quais modelos de código aberto cabem em uma única Bem, isso depende de dois fatores, a RAM que sua GPU tem e a precisão do seu modelo Vou colocar a explicação completa no site do curso. Mas, por enquanto, diremos que LLMs com 16 bilhões ou menos de parâmetros podem caber em uma única GPU Vamos usar isso para encontrar um modelo de código aberto para usar. De volta ao site da Hugging face, no lado esquerdo, filtre pelo tamanho do modelo Queremos 16 bilhões ou menos de parâmetros, mas 12 bilhões é o valor mais próximo que podemos usar. Em seguida, no canto superior direito, classifique os modelos por curtidas. Depois das duas modificações, você verá uma página como essa. Analisando o número de downloads, vemos com cliques o vencedor Lama 3,18 bilhões de Instruct, que teve mais de 9 milhões de downloads no vemos com cliques o vencedor Lama 3,18 bilhões de Instruct, que teve mais de 9 milhões de downloads no último mês. Vamos usar esse modelo. Para nossos experimentos de código aberto, usaremos um modelo de 8 bilhões de parâmetros da família Lama de LLMs Este é um dos modelos mais baixados no último mês da Hugging E o mais importante, determinamos que esse modelo se encaixa nas GPUs que estamos usando Acesse esse URL para abrir o código inicial que escrevi para você Você deveria ver um caderno como este. Agora, na parte superior do arquivo, clique em Executar tudo. Talvez você veja um erro. Se você ver um erro como esse, precisará executar cada etapa manualmente. Para executar manualmente, mova o cursor para que ele passe sobre a etapa um Um botão Executar aparecerá. Clique no botão Executar. Depois disso, mesmo que a etapa um ainda esteja em execução, você pode passar o mouse imediatamente sobre a etapa dois e clicar no botão Executar Em seguida, você deve ver linhas pontilhadas como essa indicando que a etapa dois está na fila. Se você pressionou executar tudo ou executou as primeiras etapas manualmente, seu notebook agora está instalando pré-requisitos e Isso levará de cinco a 10 minutos. Então, durante esse tempo, continue assistindo a este vídeo passo a passo. Depois de alguns minutos, a primeira etapa será concluída. Se você ver uma marca de seleção verde, isso significa que a primeira etapa foi concluída com sucesso Depois de mais alguns minutos, a etapa dois também deve terminar. Novamente, você deve ver uma marca de seleção verde indicando sucesso. Agora, independentemente de você já ter executado a etapa três, ao lado da etapa três, clique em Executar. Depois de alguns segundos, veremos os resultados de Lama discutindo o significado da vida. Agora você deve ver o prompt. Agora você deve alterar o prompt para o que desejar e pressionar o botão Executar mais uma vez. Trate isso como um bot de bate-papo pessoal. Você pode perguntar ou dizer o que normalmente diria ao Chat GBT Por exemplo, podemos fazer com que o Lama nos explique um pouco de matemática ou que o Lama nos fale sobre nossa plataforma de aprendizado on-line favorita. Essa é efetivamente sua própria IA em execução na nuvem. Ninguém além de você está usando este LLM dedicado. Agora é hora de testar o Lama em nosso projeto de exemplo. Clique em Executar na última célula aqui para testar a habilidade do Lama de identificar críticas não alimentares Mas, infelizmente, Lama se engana, dizendo que tanto a primeira quanto a terceira avaliações são verdadeiras e que ambas não são críticas alimentares Em outras palavras, Lama prediz verdadeiro falso verdadeiro em vez de verdadeiro falso falso Vamos corrigir isso na próxima lição sem treinar o modelo. É isso mesmo. Agora executamos nosso primeiro LLM de código aberto e finalmente concluímos a segunda das três etapas Como mencionei antes, nosso próximo passo é refinar a qualidade Em particular, melhoraremos essa capacidade de LLMs de código aberto para concluir nosso projeto de exemplo 9. Refine a qualidade: inputs do engenheiro: Nesta lição, vamos melhorar nossos recursos de LLMs alterando nossas entradas Geralmente, isso é chamado de engenharia rápida. Agora estamos na terceira das três etapas e agora estamos refinando a qualidade Há duas subetapas aqui. A primeira delas é projetar nossas entradas. Se ainda não o fez, acesse esse URL para abrir o código inicial que escrevi para você Se você tiver o caderno da última aula ainda aberto, use o mesmo caderno. Se você estiver abrindo este notebook pela primeira vez, na parte superior do arquivo, clique em Executar tudo. As duas primeiras etapas levarão cerca de cinco a 10 minutos, então você pode continuar assistindo a essa caminhada enquanto isso Lembre-se de nossa lição anterior, Lama 8 bilhões não conseguiu concluir nossa tarefa. O formato e a precisão das saídas estavam ambos errados. Nossa primeira abordagem para corrigir isso é ser específica. Parece uma dica boba, mas basta especificar o formato Por exemplo, forneça três linhas de saída para cada linha, indicando verdadeiro ou falso, sem texto extra, sem Eu já adicionei isso ao seu caderno em uma célula intitulada dica um. Em seu caderno, role para baixo até a seção de demonstração de entradas de estrutura, conforme mostrado aqui o mouse sobre a célula que diz a dica um e clique no botão Executar que aparece Depois de alguns segundos, você verá a seguinte saída, true, false, true. As saídas ainda estão incorretas. Esperamos verdadeiro, falso, falso, mas corrigimos o formato apenas adicionando algumas instruções ao prompt. Nossa próxima abordagem é fornecer exemplos. Vamos adicionar alguns. Agora vamos adicionar três exemplos de avaliações. Cinco em cinco, o frango estava salgado, mas bom, três em cinco, o marinero estava muito azedo, três em cinco, o garçom não teve paciência E, finalmente, vamos adicionar as saídas desejadas. As duas primeiras avaliações envolvem críticas alimentares e a última revisão envolve uma crítica não alimentar Portanto, esperamos falso falso verdadeiro. Eu já adicionei isso ao seu caderno em uma célula intitulada dica dois. Role para baixo e passe o mouse sobre essa célula intitulada Dica dois Clique no botão Executar para os colegas e, após alguns segundos, você verá verdadeiro, falso, verdadeiro Infelizmente, as saídas ainda estão erradas, mas temos mais um truque Para a terceira abordagem, solicitaremos uma cadeia de pensamento. Resumindo, peça ao Lama que mostre seu trabalho. Em nossa solicitação para o modelo, simplesmente perguntaremos o primeiro motivo, passo a passo. Em seguida, especificamos o formato de saída com muita precisão. Como sempre, eu já adicionei isso ao seu caderno. Role para baixo, passe o mouse sobre o título da célula Dica três e clique no botão Executar que aparece Depois de alguns segundos, Lama finalmente prediz corretamente. Vemos um bloco de pensamentos que pedimos e as saídas corretas verdadeiras falsas falsas Portanto, agora podemos dizer que Lama 3,18 bilhões pode concluir nossa tarefa com sucesso Recapitulando, aplicamos três dicas. Seja específico, forneça exemplos e peça uma cadeia de pensamento. Juntos, esses três permitiram que nosso modelo Lama identificasse com sucesso críticas não alimentares Agora, e se usarmos esse prompt novo e aprimorado em nossos modelos anteriores? Parece que o Deep Seek V three agora responde com sucesso à pergunta com verdadeiro falso falso, mas Quin 1,5 bilhão ainda produz lixo sem sentido Como resultado, nossos resultados de código aberto agora parecem assim: em um alto nível. Ao comparar preços da IA aberta com os preços do código aberto, Pei ainda oferece uma inteligência muito maior por dólar, embora agora tenhamos um Lama ativo de 8 bilhões que pode produzir respostas corretas de forma confiável em hardware de nível gratuito, ainda mais barato do que todos os itens acima Em resumo, seja específico, forneça exemplos e peça uma cadeia de pensamento. Isso é tudo para a primeira subetapa engenharia das entradas de nossos modelos Então, em resumo, melhoramos com sucesso a capacidade do Lama de concluir nossa tarefa de exemplo. Na próxima lição, faremos um conjunto final de melhorias para fazer com que nosso modelo de código aberto funcione forma robusta em grandes quantidades de dados Como de costume, você pode encontrar todos os prompts e o código inicial que usei neste URL 10. Refine a qualidade: restrição nas saídas: Nesta lição, vamos melhorar nossos recursos de LLMs estruturando nossos resultados Uma palavra de advertência. Esta lição apresenta muitos códigos. Se você não se sente à vontade com o código, concentre-se apenas nas conclusões que eu discuto , em vez do código Esta é a nossa terceira de três etapas. Na última lição, projetamos nossas entradas para melhorar a qualidade das respostas do modelo Nesta lição, melhoraremos a qualidade restringindo nossos resultados Se ainda não o fez, acesse este L para abrir o código inicial que escrevi para você Se você tiver o caderno da última aula ainda aberto, use o mesmo caderno. Se você estiver abrindo este notebook pela primeira vez na parte superior do arquivo, clique em Executar tudo. As duas primeiras etapas levarão cerca de cinco a 10 minutos, então você pode continuar assistindo a essa caminhada enquanto isso Lembre-se de nossa demonstração de código aberto, Lama 8 bilhões não conseguiu concluir nossa tarefa. O formato e a precisão das saídas estavam ambos errados. Vamos reproduzir esse resultado novamente. Em seu notebook, role para baixo até a demonstração das saídas da estrutura Passe o mouse sobre o exemplo A e clique em Executar. Você receberá essa bolha de texto. Está errado e está formatado incorretamente. Queremos uma lista de coisas verdadeiras ou falsas. Corrija isso. Na lição anterior, aplicamos três dicas. Seja específico, forneça exemplos e peça uma cadeia de pensamento. Depois de aplicar essas dicas, Lama produziu as saídas corretas true false false No entanto, a correção teve um custo. O prompt original tinha 288 caracteres. No entanto, o novo prompt tem 1.312 caracteres. Essa é uma entrada colossal 4,5 vezes maior. São muitas entradas. Então, podemos melhorar o formato e a exatidão da saída sem aumentar o número de tokens de entrada E a resposta é, claro, sim, deixe-me explicar. Aqui está o LLM. Ele usa texto como entrada e produz texto como saída. Nesse caso, nossa entrada são nossas bananas. E, infelizmente, os resultados do LLM. Essa nem é uma resposta válida para a pergunta. Para corrigir isso, forçamos o LLM a produzir somente sim ou não. Dessa forma, mesmo que a saída esteja errada, pelo menos a saída é válida. Para fazer isso, precisamos modificar essa etapa no final, como os LLMs traduzem as saídas em palavras Vamos ampliar. Na verdade, o LLM primeiro gera uma lista de números Esses números são, na verdade, probabilidades que correspondem a determinadas palavras Em nosso exemplo, a primeira probabilidade é a probabilidade de sim. A segunda, a probabilidade de não, a terceira para R e a última para é. A probabilidade mais alta é 60%, e a palavra correspondente é R. Então, finalmente produzimos R. É assim que o LLM prevê normalmente, mas nosso objetivo é produzir apenas sim ou Então, vamos fazer algumas mudanças. Primeiro, ignore todas as outras palavras. Considere apenas sim ou não. E agora consideramos a probabilidade mais alta, 10%, o que corresponde a sim. Finalmente, produzimos sim. E com isso, restringimos com sucesso nosso LLM a produzir apenas sim ou não, usando a palavra válida de maior probabilidade Neste exemplo, queríamos apenas sim ou não. Então, usamos as probabilidades dessas duas palavras e simplesmente escolhemos a mais provável das Agora, nosso LLM é forçado a emitir sim ou não e, o mais importante, fizemos isso sem alterar o número de tokens de entrada Navegue de volta ao seu notebook e role para baixo até a configuração da etapa zero. Passe o mouse sobre a célula e clique em Executar. Você não verá nenhuma saída para a etapa. Agora você está configurado. Em nosso primeiro exemplo, forçaremos o verdadeiro ou o falso. Da mesma forma, podemos dizer que forçaremos um booleano. Um booleano é verdadeiro ou falso. Por exemplo, primeiro, perguntamos se M são bananas, frutas e a produção forçada é verdadeira ou falsa. Agora, passe o mouse sobre o exemplo um e clique em Executar. Isso produzirá um único booleano verdadeiro. Isso está correto. Bananas são frutas. No nosso próximo exemplo, forçaremos três booleanos em vez de apenas um Agora, verificamos se bananas, amêndoas e batatas são frutas Passe o mouse sobre o exemplo dois e pressione Executar. Agora você verá as saídas verdadeiras, falsas falsas. Isso está correto. Agora vamos ver se podemos usar isso para restringir o formato de saída de nossas críticas não alimentares Passe o mouse sobre o exemplo B e clique em Executar. E essa saída é de três booleanos. O formato de saída é válido. Infelizmente, a saída ainda está errada. Deve ser verdadeiro, falso, falso, não verdadeiro, falso, verdadeiro. Então, vamos continuar. Em nosso terceiro exemplo, forçaremos o modelo a raciocinar passo a passo. Para esta etapa, solicitaremos que o modelo raciocine primeiro. Em seguida, force o modelo a produzir texto entre as tags de reflexão. Você pode escolher o formato que quiser para pensar. Esse é exatamente o formato que eu escolhi. Como antes, a dica é verificar se bananas, amêndoas e batatas são frutas Passe o mouse sobre o exemplo três e clique em Executar. Isso levará algum tempo para ser executado, cerca de 45 segundos. Então você verá a saída final com o raciocínio correto e melhor ainda, as saídas corretas verdadeiro, falso, falso Agora, vamos aplicar os mesmos resultados estruturados ao nosso projeto de exemplo para críticas não alimentares Passe o mouse sobre o exemplo C e clique em Executar. Você verá o raciocínio e a resposta correta no final Agora, ao estruturar nossas saídas, melhoramos a qualidade do nosso modelo e forçamos saídas a corresponderem a um formato específico . Isso é uma vitória ganha. Também reduzimos drasticamente o tamanho do prompt. O prompt original tinha 288 caracteres. Da última lição, precisávamos de 1.312 caracteres. Nesta lição, precisávamos apenas de 386 caracteres, junto com saídas estruturadas para obter a resposta correta Com a engenharia rápida, precisávamos de um prompt 4,5 vezes maior para produzir as saídas certas Com saídas estruturadas, temos um prompt muito mais curto, apenas 1,3 vezes maior E temos a garantia de que a saída sempre será válida. Isso não quer dizer que um seja melhor do que o outro, mas quero enfatizar que a engenharia rápida e as saídas restritivas serão, na verdade, usadas juntas maioria das vezes para maximizar a qualidade do modelo Agora, vamos tentar restringir as saídas de um modelo proprietário, ou seja, também dos modelos de IA aberta Acesse platform.openi.com. Sua página da web ficará assim. Certifique-se de clicar em Login no canto superior direito, se ainda não o fez. Em seguida, clique no painel no canto superior direito. Clique em Criar no centro da página e você verá uma página como essa. Clique no seletor de modelos. No menu suspenso, selecione GPT five Nano e sua tela agora deve ficar assim No canto inferior direito, certifique-se de selecionar Limpar automaticamente. Em seguida, ao lado do nome do modelo, clique no ícone Configurações. Isso abrirá um menu de configurações. Clique na lista suspensa de formato de texto e, na lista suspensa, você pode clicar em Assim, você pode configurar saídas restritas. Certifique-se de que seja um esquema JSON e não um objeto JSON. Isso abrirá uma caixa de diálogo como esta. Cole o seguinte, que você realmente obterá desse URL. Copie o esquema JSON de saída restrita. Em seguida, cole o esquema JSON aqui. Role até a parte inferior da caixa de diálogo e clique em Salvar. Veremos o esquema JSON refletido no menu aqui. Em seguida, clique fora do menu. A partir desse URL, copie o prompt de exemplo do projeto anterior. Cole o exemplo de prompt do projeto aqui e clique em Executar. E agora temos a saída no formato JSON. Experimente quaisquer alterações aleatórias que desejar no prompt, o EPI sempre retornará saídas nesse formato E com isso, você restringiu com sucesso as saídas desse GPT Em resumo, a estruturação das saídas força a saída a ser válida Podemos forçar sim ou não, podemos forçar números, podemos forçar qualquer formato específico que desejarmos para modelos de código aberto e proprietários Discutimos como isso funciona, um exemplo simples para identificar frutas e uma melhoria para nossa detecção de críticas não relacionadas a frutas Agora é o fim da nossa terceira etapa. Vimos duas maneiras de melhorar a qualidade do nosso modelo sem nenhum tipo de treinamento, e isso conclui nossa aula sobre estruturação de resultados E, de fato, isso conclui nossa terceira das três etapas. E agora você termina apenas o início de sua jornada construindo com a IA. Esses são os primeiros passos que todos devem dar para um projeto envolvendo IA. Você pode acessar esse URL para obter uma cópia do código inicial, outras solicitações e mais recursos Na próxima lição, encerraremos a aula. 11. Conclusão: Você chegou ao final do curso. Vamos encerrar com uma rápida recapitulação do que você aprendeu. Primeiro, defina o escopo do seu projeto. Para fazer isso, dividimos isso em três subetapas. Limite seu foco à tarefa geral de conversão de texto em texto. Em seguida, restrinja seu foco aos texto estabelecidos e comercialmente comprovados recursos de conversão de texto em texto estabelecidos e comercialmente comprovados, à sumarização, à estruturação de dados e à codificação Por fim, defina suas entradas, saídas , sua tarefa e sua métrica Como exemplo, essa foi a descrição do projeto para detectar críticas não alimentares Para nossa segunda etapa, avalie os modelos, para que possamos escolher um para usar. Para fazer isso, temos novamente três subetapas. Em um alto nível, comece com a melhor e mais inteligente IA. Teste os modelos por meio do bot de bate-papo, as interfaces mais simples e fáceis de usar, depois teste os modelos por meio de uma API para que seus resultados sejam mais repetíveis e reproduzíveis Por fim, otimize o custo testando modelos mais baratos e rápidos para ver se eles concluem sua tarefa com sucesso. Depois de escolher um modelo, refinamos a qualidade Para fazer isso, tivemos duas subetapas. Comece a melhorar a qualidade refinando suas entradas. Chamamos isso de engenharia rápida. Em seguida, restrinja as saídas. Isso pode melhorar ainda mais a confiabilidade e a qualidade do seu modelo. E isso completa nosso processo de três etapas, que agora você pode usar para criar qualquer projeto envolvendo IA Isso é só o começo, mas é uma base sólida para entender o quão bem a IA pode realizar sua tarefa. Agora, usando o processo acima como guia, aplique isso ao seu próprio projeto e publique o resultado na guia Projeto do curso. Sinta-se à vontade para usar um dos meus projetos de exemplo ou criar um de sua preferência Estou muito animado para ver o que você cria. Se você quiser saber mais sobre aulas de acompanhamento, siga-me no Skillshare e confira meus outros Parabéns. Estou chegando ao final do curso.

Inteligência artificial para iniciantes: crie um ChatGPT personalizado em 3 passos, gratuitamente

Alvin Wan, Research Scientist

Assista a este curso e milhares de outros

Assista a este curso e milhares de outros

Aulas neste curso

1.

Apresentação

1:14

2.

Projeto de escopo: texto para texto

5:52

3.

Projeto de escopo: recursos

5:57

4.

Projeto de escopo: tarefa e métrica

5:32

5.

Avalie modelos: teste os melhores

6:22

6.

Avalie modelos: otimize o custo

3:40

7.

Avalie modelos: código aberto

7:03

8.

Demonstração: execute um modelo de código aberto

4:32

9.

Refine a qualidade: inputs do engenheiro

4:25

10.

Refine a qualidade: restrição nas saídas

9:18

11.

Conclusão

2:00

Sobre este curso

Conheça seu professor

Alvin Wan

Habilidades relacionadas

Projeto prático de curso

Nota do curso

Por que fazer parte da Skillshare?

Aprenda em qualquer lugar

Cursos relacionados

Transcrições