Gemini Google AI: a única IA que cuida de tudo (imagens, vídeo e texto)

Anna Kolenkina, Product Builder, Entrepreneur

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

- 1.
  
  Sejam bem-vindos ao curso sobre IA do Google Gemini!
  
  3:06
- 2.
  
  O que é o Gemini? Como entender o ecossistema de IA do Google
  
  5:57
- 3.
  
  Conheça a família de modelos Gêmeos
  
  4:38
- 4.
  
  Configurando o Gemini e seu primeiro chat
  
  4:53
- 5.
  
  Promovendo o Gemini para obter melhores resultados: introdução da seção
  
  1:39
- 6.
  
  O que é um prompt? Prompts, engenharia de propostas, propostas pessoais x de produção
  
  4:59
- 7.
  
  Como falar com a IA do Google Gemini Os elementos de um prompt efetivo
  
  7:57
- 8.
  
  Criando respostas do Gemini: gerador iterativo
  
  5:54
- 9.
  
  Tornando Gêmeos verdadeiramente seu: personalização
  
  7:14
- 10.
  
  Como compartilhar arquivos e outros conteúdos com a IA do Google Gemini
  
  9:20
- 11.
  
  Usando exemplos nas suas propostas
  
  10:37
- 12.
  
  Especificando o formato de saída no Gemini
  
  4:46
- 13.
  
  Acompanhe o processo: escolher o modelo certo e fazer um brainstorming com o Gemini
  
  9:43
- 14.
  
  Acompanhe: receba feedback com a IA do Google Gemini
  
  8:48
- 15.
  
  mantendo a realidade: estratégias práticas para minimizar alucinações de IA
  
  10:12
- 16.
  
  Como trabalhar com tela Gemini e pedras preciosas: introdução da seção
  
  1:38
- 17.
  
  Boas-vindas à tela Gemini
  
  3:39
- 18.
  
  Acompanhe: como criar e editar documentos no Gemini Canvas (parte 1)
  
  5:38
- 19.
  
  Acompanhe: como criar e editar documentos no Gemini Canvas (parte 2)
  
  5:42
- 20.
  
  Acompanhe: transformando um esboço de Gemini em um PDF polido com o Gamma
  
  9:29
- 21.
  
  O que são joias gêmeas e por que precisamos delas?
  
  5:34
- 22.
  
  Acompanhe: criando uma joia de verificação de gramática
  
  10:10
- 23.
  
  Acompanhe: Criando uma joia do treinador de fitness (parte 1)
  
  7:23
- 24.
  
  Acompanhe: Criando uma joia do treinador de fitness (parte 2)
  
  4:46
- 25.
  
  Gemini para criação visual: introdução da seção
  
  2:11
- 26.
  
  O que é uma nanobanana? Principais características explicadas
  
  6:42
- 27.
  
  Criando sua primeira imagem com o Gemini
  
  7:05
- 28.
  
  Sete dicas inspiradoras para criar imagens melhores
  
  6:17
- 29.
  
  mesclagem contextual, renovação iterativa e síntese visual
  
  7:50
- 30.
  
  O Editing Suite: transformando esboços em protótipos e restauração de fotos
  
  4:14
- 31.
  
  O conjunto de edições: edições direcionadas com a ferramenta de marcação e anotações externas
  
  6:30
- 32.
  
  Visuais complexos: menus, diagramas e infográficos
  
  6:15
- 33.
  
  Visuais complexos: adaptação de recursos em formatos e plataformas
  
  4:32
- 34.
  
  Além do bate-papo — pesquisa e construção aprofundados com o Gemini: introdução da seção
  
  1:25
- 35.
  
  Pesquisa aprofundada: respostas além do projeto
  
  5:48
- 36.
  
  Pesquisa aprofundada em ação — compreensão do tópico
  
  8:54
- 37.
  
  Pesquisa profunda em ação — decisões de compra
  
  5:23
- 38.
  
  Pesquisa profunda em ação — aprendendo um novo tema
  
  5:28
- 39.
  
  Além dos documentos: o que mais a tela pode fazer?
  
  6:08
- 40.
  
  Acompanhe: como criar um aplicativo com a tela — da pesquisa ao aplicativo de corrida
  
  9:30
- 41.
  
  Acompanhe: como criar um aplicativo com tela — refinando e compartilhando
  
  6:57

Nível iniciante

Nível intermediário

Nível avançado

Todos os níveis

Estudantes

Sobre este curso

Você está cansado de alternar entre várias ferramentas de IA para diferentes tarefas criativas? E se você pudesse trabalhar com uma IA que entende texto, analisa imagens, processa vídeos e se integra perfeitamente às ferramentas que você já usa todos os dias?

Conheça a IA do Google Gemini — a ferramenta que está mudando a forma como as pessoas criativas trabalham com vários formatos de conteúdo ao mesmo tempo.

Com mais de 750 milhões de usuários mensais (e crescendo mais rápido que o ChatGPT em muitos mercados), o Gemini não é apenas outro chatbot de IA — é seu parceiro criativo que mora no Gmail, no Google Docs, no Chrome e no seu telefone. É a IA que encontra você onde você já trabalha.

O que torna este curso diferente:

Este não é um curso técnico de IA. É um kit de ferramentas criativas para quem deseja produzir conteúdo melhor com mais rapidez, gerar visuais impressionantes e transformar ideias em realidade — tudo sem conhecimento técnico.

Nesse curso prático, você aprenderá a:

Criação de conteúdo multimodal:

Analise imagens e obtenha feedback criativo sobre seu trabalho visual
Processar vídeos para extrair insights, resumos e ideias de conteúdo.
Combinar texto, imagens e contexto de maneiras que o ChatGPT simplesmente não consegue
Gere visuais de IA diretamente em seu fluxo de trabalho

Ideação criativa e brainstorm:

Gere infinitos conceitos criativos em diversos formatos
Obter feedback profissional sobre seu trabalho instantaneamente
Supere bloqueios criativos com inspiração multimodal

Produtividade baseada em IA para pessoas de criação

Crie assistentes de IA personalizados para tarefas criativas específicas (verificação de gramática, voz da marca, treinamento físico)
Transforme pesquisas complexas em briefings criativos detalhados com pesquisa profunda
Resumir documentos longos, vídeos e conteúdo visual em segundos
Gerencie projetos criativos no Gmail, Docs e Drive de forma perfeita

Aplicativo sem código e criação de protótipos:

Crie aplicativos funcionais e protótipos interativos apenas descrevendo o que você quer, sem escrever código

Por que Gemini para criativos?

Ao contrário de outras ferramentas de IA, o Gemini se destaca em entender o contexto visual e textual, mantendo a direção criativa em projetos estendidos e trabalhando dentro das ferramentas do Google que você usa diariamente. É como ter um diretor de criação, analista visual e escritor de conteúdo combinado — disponível 24 horas por dia, 7 dias por semana, onde quer que você trabalhe.

O que você vai aprender

Foundation (perfeito para iniciantes em IA):

Como se comunicar com o Gemini usando técnicas de solicitação eficazes
Como estruturar suas instruções para melhores resultados
Como trabalhar com texto, imagens e vídeo em uma conversa

Aplicativos criativos:

Brainstorm com texto, imagem e análise de vídeo combinados
Criando campanhas de marketing com conteúdo visual e escrito
Como criar assistentes de IA personalizados para suas necessidades criativas específicas
Usando pesquisas aprofundadas para transformar ideias em estratégias criativas acionáveis

Técnicas criativas avançadas:

Combinando recursos visuais e palavras para melhores soluções criativas
Como detectar e evitar erros de IA (alucinações)
Como criar aplicativos e protótipos sem código para seu negócio criativo
Como integrar o Gemini em seu fluxo de trabalho existente no espaço de trabalho do Google

Você não precisa entender como a IA funciona nem ter nenhum conhecimento de programação. Se puder usar o Gmail ou o Google Docs, também pode usar o Gemini. Este curso foi projetado especificamente para pessoas criativas não técnicas que querem resultados poderosos sem complexidade.

Estrutura do curso:

Mais de 4 horas de tutoriais em vídeo passo a passo
Projetos criativos reais que você vai criar junto comigo!
Recursos para download, incluindo modelos de propostas e guias
Acesso à comunidade para se conectar com outros criativos e obter apoio.
Certificado de conclusão para mostrar suas novas habilidades de IA

Para quem é isso?

Freelancers e empreendedores solo:

Criadores de conteúdo que trabalham com vários formatos de mídia (texto, imagens, vídeo)
Designers gráficos que precisam de assistência de IA para desenvolver o conceito
Fotógrafos que querem feedback de IA e direção criativa
Coaches e consultores que criam materiais educacionais

Marketing e criação de negócios:

Gerentes de redes sociais criando conteúdo visual e escrito
Profissionais de marketing por e-mail criando campanhas multimídias
Estrategistas de marca que desenvolvem estratégias criativas abrangentes
Pequenos empresários gerenciando conteúdo em plataformas múltiplas

Profissionais criativos:

Escritores combinando pesquisa visual com criação de conteúdo
Criadores de cursos que desenvolvem materiais de aprendizagem multimídia
Designers de apresentação que trabalham em vários formatos
Qualquer pessoa que esteja usando várias ferramentas criativas e queira um parceiro de IA unificado.

Por que agora?

A IA está transformando o trabalho criativo, mas não está substituindo os criativos, está capacitando-os. As pessoas criativas que aprendem a colaborar com a IA hoje terão uma enorme vantagem amanhã. Este curso dá a você essa vantagem.

Conheça seu professor

Anna Kolenkina

Product Builder, Entrepreneur

Professor

I help professionals and fresh graduates to learn digital skills, start new careers and advance in their roles.

I started my journey in the IT industry and software product management 15 years back from being an IT and management consultant and then transitioning to a full-on startup Product Manager and Product Director. I've built products from scratch for different industries - commodities trading, logistics, natural language processing, and e-learning - and also for different markets, from Europe to Asia. I have a Master's Degree in Applied Informatics and an MBA from the National University of Singapore.

Before joining online education, I shared my expertise and knowledge with only a limited number of people - my co-workers and mentees. With Skillshare, I'd like to s... Visualizar o perfil completo

Habilidades relacionadas

ChatGPT Microsoft PowerPoint Canva OneNote IA para criatividade e inspiração IA e inovação IA para marketing e negócios

Level: Beginner

Projeto prático de curso

Vamos colocar suas novas habilidades em Gêmeos em prática criando algo visual ou interativo!

Aqui estão os passos do projeto:

Escolha o tipo de projeto:
- Crie visuais com o Nano Banana (diagramas, infográficos, menus ou edições de fotos)
- Crie um aplicativo sem código com o Gemini Canvas (com base nas técnicas da seção “Além da conversa”)
- Crie uma joia personalizada para uma tarefa criativa específica (como os exemplos de Verificação de Gramática ou Fitness Coach)
Fique à vontade para explorar suas próprias ideias! Se você tiver um caso de uso diferente para o Gemini que funcione melhor para você, seja na criação visual, edição de documentos no Canvas ou algo totalmente diferente, experimente!
Precisa de inspiração ou exemplos de proposta? Confira a pasta [Kit de ferramentas práticas — propostas, arquivos e exemplos] nos recursos do curso. Você vai encontrar propostas prontas para usar, arquivos de amostra e exemplos para ajudar a iniciar seu projeto.
Compartilhe seu trabalho: publique uma captura de tela de sua criação visual, aplicativo ou descrição da joia, juntamente com quaisquer detalhes relevantes sobre seu projeto, por exemplo, quais prompts funcionaram melhor, quais desafios você enfrentou ou como planeja usar isso em seu trabalho criativo.
Não se esqueça de revisar e fornecer feedback nos projetos de outros alunos do curso! :)

Boa prática!

Nota do curso

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Sejam bem-vindos ao curso sobre IA do Google Gemini!: Todos, e bem-vindos ao curso sobre o Google Gemini. Você sabia que o Google Gemini ultrapassou oficialmente 750 milhões de usuários ativos mensais Isso é quase três quartos de 1 bilhão de pessoas. Para colocar isso em perspectiva, crescimento da Gemini está atualmente superando quase todos os outros chatbots de IA do mercado, fechando a lacuna com o ChatGPT mais rápido do que qualquer um previu Mas não se trata apenas números, porque o Gemini foi criado pelo Google Agora é o EI mais integrado do mundo. Ele está dentro do seu Gmail, do Google Docs, do navegador Chrome e do seu celular Isso representa a maior mudança na forma como trabalhamos e criamos desde a invenção da Internet Estamos nos movendo em direção a um mundo em que a EI não serve apenas para usá-la. É um colaborador que já está onde você trabalha. Meu nome é Anna e eu serei sua instrutora neste curso Instrutor on-line com meus outros cursos disponíveis aqui na plataforma, foco em gerenciamento de produtos e IA generativa Ao participar deste curso, você terá acesso a mais de 4 horas de conteúdo HDVDo, tutoriais e atividades passo a passo destacando o mundo real, aplicações práticas das ferramentas Gemini, resumos em PDF para revisar os principais insights do curso e muito, resumos em PDF para revisar principais insights do Começaremos aprendendo do que o Gemini é capaz, como se comunicar com ele, estruturar suas solicitações e como fazer com que o Gemini funcione melhor para A partir daí, analisaremos cenários práticos usando o Gemini para debater ideias e obter feedback profissional Construindo seus próprios sistemas EI personalizados para tarefas específicas e gerando imagens de alta qualidade Também abordaremos técnicas avançadas, como pesquisas aprofundadas para transformar tarefas complexas em relatórios detalhados e criar aplicativos totalmente funcionais apenas descrevendo o que você deseja. Sem necessidade de codificação. E garantiremos que você saiba como identificar e evitar respostas incorretas da IA, para que seu trabalho seja sempre preciso. E sim, você não precisa de nenhuma formação técnica ou conhecimento prévio de IA para começar o curso. Então, vamos começar Ilsa no próximo vídeo. 2. O que é o Gemini? Como entender o ecossistema de IA do Google: Todos, e bem-vindos à primeira palestra do curso. Pense em todos os filmes de ficção científica que você já viu. Sempre existe aquele personagem, um assistente, que não espera apenas por um comando, mas realmente entende o mundo do herói. Ele antecipa os problemas antes que eles aconteçam e atua como um verdadeiro parceiro Durante anos, isso foi apenas ficção. Mas com a Gemini, estamos cada vez mais perto um futuro em que esse tipo de parceria está se tornando realidade Então, o que é Gêmeos? Gosto de pensar nisso como três camadas de uma casa, a base, o cérebro. Esses são os próprios modelos Gemini construídos pelo Laboratório de Pesquisa Deep Mind do Google Neste curso, usaremos a última geração dos modelos Gemini Isso inclui modelos de raciocínio de alto nível para lógica complexa, ferramentas avançadas de geração de imagens para visuais fotorrealistas e modelos de vídeo de próxima geração que podem gerar cenas de alta definição Esses modelos são nativamente multimodais, o que significa que eles não processam apenas texto Eles veem aqui e pensam em todos os meios ao mesmo tempo, assim como nós. Voltando à analogia da casa, o segundo nível é a sala de estar, o assistente Essa é a base em que passaremos a maior parte do tempo no aplicativo em seu telefone e no site gemini.google.com É um espaço criativo onde você pode conversar com códigos e usar ferramentas como o Jams para personalizar o comportamento do EI E, finalmente, a terceira camada é a infraestrutura. Este é o Gemini morando no Gmail, no Google Docs, e a pesquisa é a visão geral do EI que resume seus resultados de pesquisa ou o botão ajude-me a escrever que Neste curso, nosso foco está nessa camada intermediária, aquela GeminieIsIsTet A visão do Google em relação a isso é centrada em três partes: pessoal, proativa Vamos explorar o que isso significa. Primeiro, é pessoal. A maioria dos modelos de IA são generalistas. Eles sabem muito sobre o mundo, mas muito pouco sobre você. O Gemini foi projetado para ser sua extensão pessoal. Com sua permissão, ele pode se conectar ao seu contexto pessoal, seus e-mails, seus arquivos e seu histórico para fornecer ajuda que seja exclusivamente relevante para sua vida Em segundo lugar, é proativo. Hoje, a maior parte da IA é reativa. Você pergunta as respostas. O futuro de Gêmeos é ver o que está por vir. Se você tiver uma apresentação para um grande cliente na sexta-feira, Gemini não deve apenas lembrá-lo de que ela está chegando Ele deve examinar seu calendário uma semana antes e dizer: Percebi que sua reunião estratégica com a empresa A será na sexta-feira, base na proposta em sua campanha e na última ameaça por e-mail com a equipe. Aqui está o resumo da preparação e três perguntas que você provavelmente enfrentará. Em terceiro lugar, é poderoso. Com os últimos avanços do Gemini, estamos indo além da simples geração de texto para pensar que coisas existem, esteja você criando um site inteiro a partir de um único prompt ou criando um vídeo cinematográfico para O poder que costumava exigir uma equipe inteira de especialistas agora está ao seu alcance Mas ter todo esse poder não significa que eu esteja no comando. É importante lembrar que mesmo quando o geminiano está sendo proativo, está sempre assumindo sua liderança Não tem sua própria agenda secreta ou conjunto de crenças. Ele foi projetado para seguir as ordens. Você o fornece por meio de suas instruções e preferências. Portanto, seja atuando como pesquisador, programador ou colaborador criativo, você está sempre no banco do motorista Produtividade não é a EI fazendo suas próprias coisas. É o EI antecipando o que você precisa porque você já definiu a meta Agora que exploramos a visão e a arquitetura, é hora de passar da teoria à prática Na próxima palestra, examinaremos mais de perto os diferentes modelos especializados raciocínio, imagens e vídeo E também mostrarei como configurar sua conta no Gemini. Te vejo lá. 3. Conheça a família de modelos Gêmeos: Na última palestra, falamos sobre Gêmeos como uma casa de três camadas, o cérebro, o assistente e o motor integrado Agora vamos aprofundar um nível mais profundo nesse cérebro. A maioria dos modelos EI mais antigos foram treinados primeiro em texto e depois tiveram outros recursos em camadas O Gemini foi construído de forma diferente do zero para ser multimodal Isso significa que ele não lê apenas a descrição de um vídeo, eu realmente entendo o vídeo, o áudio, as imagens e o texto, tudo ao mesmo tempo. Se você estiver fazendo upload de 1.000 páginas em PDF, um vídeo de uma hora ou uma enorme base de código, Gemini processa tudo em um espaço unificado Não é traduzir secretamente imagens em texto nos bastidores, é vê-las Ao abrir o Gemini em geminiggle.com, você Pense neles como modos diferentes, cada um direcionando você para um modelo subjacente diferente que o Google otimizou para um tipo específico de tarefa A família completa do Google Model é vasta, mas para o uso diário, esses são os que você mais procurará. Antes de examiná-los, uma nota rápida sobre o que realmente é um modelo . Pense nisso como um especialista, você está contratando para um emprego. Cada modelo foi treinado de forma diferente, alimentado com diferentes tipos de dados e otimizado para diferentes pontos fortes. Quando você escolhe um modo em Gêmeos, você está basicamente escolhendo a qual especialista entregar sua tarefa Rápido é nosso velocista rápido e comunicativo. Esse é o especialista que você procura quando precisa de uma resposta instantânea. Um resumo rápido ou ajuda na redação de uma mensagem rápida. Ele é otimizado para velocidade e lida com um grande volume de solicitações. Só não exagere em nada que exija um raciocínio profundo em várias etapas Pensar é nosso estrategista. Esse especialista faz uma pausa antes de responder, mapeando sua lógica antes de dar uma Se você tiver um problema complexo, plano de várias etapas para resolver ou uma pergunta diferenciada em que uma resposta rápida possa errar É aquele que pensa antes de falar. Pro é nosso especialista. Você faz isso quando a tarefa é complexa, pesquisa profunda, análise de um documento grande, redação avançada que precisa ter o tom exato. Pro usa o modelo subjacente mais capaz da família, que significa que ele pode armazenar mais informações de uma vez e captar mais nuances que os outros modelos possam perder. A desvantagem é que ele é mais lento e tem limites de uso diário mais baixos Portanto, guarde-o para as tarefas realmente necessárias. Esses três modelos de raciocínio rápido e profissional são os modelos da linguagem Gemini Eles são o que impulsiona a conversa. Mas a família Gemini não para por aí. Ele também inclui modelos dedicados para geração de imagem e vídeo, e você os aciona simplesmente usando os comandos de geração de imagem ou geração de vídeo diretamente no bate-papo ou na interface do Gemini Ao fazer isso, a Gemini discretamente entrega a tarefa ao especialista certo nos bastidores, e nos encontraremos com esses especialistas posteriormente no curso Agora, depois de descobrirmos com quais modelos vamos trabalhar, deixe-me explicar como ter acesso ao Gemini 4. Configurando o Gemini e seu primeiro chat: Acesse gemini dot Google forward slash assinaturas para ver planos atuais e, apenas avise, os preços e a disponibilidade variam Então, o que você vê na tela pode parecer um pouco diferente do que estou mostrando aqui. O plano gratuito oferece acesso diário ao Gemini. É um bom ponto de partida e não requer nada mais do que uma conta do Google. O Google AI plus oferece mais acesso aos modelos e recursos mais capazes, incluindo geração aprimorada de imagens e vídeos, e você teria acesso ao Gemini no Gmail, bem como ao Google O Google AI Pro aumenta ainda mais com maiores limites de uso do Gemini em seu Gmail, Google MIT Docs, além slides e dois terabytes E, finalmente, o Google AI ultra é o melhor. Ele oferece os maiores limites de uso, além de acesso antecipado exclusivo aos novos recursos do Google. Minha recomendação aqui seria continuar com Google AI, desde que ele ofereça um teste gratuito, que significa que você pode acompanhar tudo o que eu demonstro aqui no curso sem nenhum custo, durante o primeiro mês. E depois desse mês de teste gratuito, você pode decidir se deseja continuar com sua assinatura ou se deseja downgrade para o Google plus ou retornar à assinatura gratuita Para começar, selecione seu plano de associação e clique em Começar. Em seguida, você precisa fornecer uma forma de pagamento para o teste, mas você não será cobrado se cancelar ou fazer o downgrade antes do fim do mês Depois de fazer login, isso é o que você vê no canto superior direito, você vê seu plano de associação Pro, caso você decida se inscrever como membro do AI pro ou, além disso, se decidir seguir em frente com esse plano no centro da tela, sua entrada principal de bate-papo abaixo da barra de entrada, você notará uma fileira de botões de início rápido. Esses são apenas atalhos para você começar rapidamente. Você também verá um seletor de modo. Atualmente, ele é exibido rapidamente. Este é o seletor de modelos sobre o qual acabamos de falar. Clique nele para alternar entre rápido, inteligente ou profissional, dependendo do que você precisa. No lado esquerdo, ao clicar no ícone do menu, abre sua barra lateral, onde você encontrará seu histórico de conversas Você também pode iniciar um novo bate-papo aqui. Vamos tentar fazer isso. Eu o mantenho no modo rápido neste bate-papo, pois vou fazer uma pergunta direta Estou começando o curso sobre Gêmeos com base na data de hoje. Quais são as três atualizações principais mais recentes o Google lançou para o ecossistema Gemini Solicito que o Gemini pesquise na web para verificá-los e resumi-los para mim. Vamos clicar em Enviar. Observe que Gêmeos não responde apenas de memória. Ele sai e pesquisa na web em tempo real e depois me traz os resultados relevantes para hoje quando eu gravo este tutorial. Aqui estão as três mudanças mais recentes que Gemini introduziu no mês passado E, claro, vamos falar sobre eles aqui no curso. Na próxima seção, pegamos tudo o que acabamos de configurar aqui e o colocamos em prática, começando com a forma de escrever um ótimo prompt. Te vejo lá. 5. Promovendo o Gemini para obter melhores resultados: introdução da seção: Bem-vindo à nova seção sobre engenharia rápida. Essa é a parte do curso que você aprende uma habilidade que torna cada ferramenta de IA mais útil: como redigir instruções que sempre oferecem excelentes resultados Começaremos com as definições do que é uma solicitação, o que significa uma solicitação e como engenharia rápida se encaixa no panorama geral Em seguida, veremos dois modos. Não há solicitações no chat e na produção quando você cria solicitações para serem reutilizadas. Depois disso, mostrarei uma fórmula simples de solicitação Você pode usar para quase tudo. Você também praticará a solicitação iterativa, como aproveitar as respostas anteriores e melhorar a produção passo a passo Você aprenderá a orientar com exemplos, a solicitar o formato de saída exato desejado e a trabalhar com arquivos e anexos E, claro, usaremos a solicitação multimodal. Man e seu prompt podem incluir texto e documentos, imagens de captura de tela e links Ao final desta seção, você se sentirá confiante em usar essas habilidades de estímulo em tarefas reais de trabalho ou projetos pessoais. Vamos começar 6. O que é um prompt? Prompts, engenharia de propostas, propostas pessoais x de produção: Todo mundo. Pense na última vez que você fez uma pergunta a alguém. A maneira como você formulou essa pergunta provavelmente influenciou a resposta que você recebeu Isso é exatamente o que estamos vendo hoje no mundo da IA. Começaremos detalhando três termos-chave que são essenciais para a comunicação com sistemas de IA O que exatamente é um prompt? O que queremos dizer com “inspirar”? E como a engenharia rápida reúne tudo isso? Também exploraremos essa distinção entre chat e solicitação corporativa. Vamos começar. Um prompt é a entrada que você fornece a uma IA, sua instrução, o que você quer e o contexto que você fornece. Texto, arquivos, imagens, links, exemplos ou dados. Pense nisso como o que impulsiona a resposta dos EIs. Solicitar é o ato de escrever essas instruções. É a atividade geral de interagir e dar instruções aos modelos de IA Esse é o processo de comunicação com o modelo. A engenharia imediata é uma abordagem mais especializada e sistemática para criar e refinar solicitações Envolve entender como o modelo raciocina, testar e iterar as instruções e considerar os casos Pense nisso como cozinhar. Um aviso é como uma única receita. Promptin é como cozinhar em geral, e engenharia rápida é como ser um chef profissional que desenvolve e testa receitas sistematicamente , considerando ingredientes, equipamentos, preferências do usuário e assim por diante Agora, existem dois tipos principais de solicitação que você precisa conhecer : a solicitação pessoal e a solicitação de produção ou empresarial A solicitação pessoal é o que a maioria das pessoas faz em um bate-papo. Você escreve uma solicitação, a IA responde e pode continuar refinando-a por meio É flexível e informal. Se sua primeira mensagem não for perfeita, não é grande coisa. Basta acompanhar, esclarecer e iterar. Por exemplo, pedir à N AI para ajudá-lo a escrever um e-mail, debater ideias ou resumir um documento na interface de bate-papo Essa é uma inspiração pessoal. A solicitação de produção ou empresa, por outro lado, ocorre quando você cria solicitações para serem reutilizadas por você, por uma equipe ou dentro de um produto ou fluxo O objetivo não é apenas uma boa resposta uma vez, mas resultados consistentes em várias execuções e muitas entradas Por exemplo, imagine um assistente de suporte ao cliente no site de uma empresa. Ele precisa responder a milhares de perguntas de clientes de forma confiável, incluindo informações do MC, como erros de digitação, solicitações pouco claras Nesse cenário, os prompts precisam ser mais estruturados, mais previsíveis e mais confiáveis É por isso que os prompts de produção geralmente incluem regras claras, formato de saída mais rígido e mais barreiras de proteção, pois eles foram feitos para funcionar repetidamente, não apenas uma vez feitos para funcionar repetidamente, não apenas Em outras palavras, a solicitação pessoal ou a solicitação por chat ajudam você a obter ótimos resultados primeiro e solicitação de produção ajuda a obter resultados confiáveis repetidamente Por que falamos tanto sobre essa distinção entre inspiração pessoal e inspiração de produção Porque a maneira como você escreve e refina os prompts muda dependendo da configuração Se você pesquisar materiais extras na solicitação, geralmente encontrará conselhos projetados para uso em produção, avisos que precisam funcionar de forma confiável para muitos usuários, muitas entradas e muitos casos extremos Isso é muito útil quando você está criando fluxos de trabalho repetíveis ou integrando a EI Mas se seu principal caso de uso for apenas usar uma IA em um bate-papo para obter ajuda no momento, você não precisa complicar demais então lembre-se dessa distinção Neste curso, vamos nos concentrar principalmente na solicitação pessoal em uma interface de bate-papo Agora que estamos na mesma página com a terminologia, vamos mergulhar no lado prático da inspiração pessoal Allca na próxima palestra. 7. Como falar com a IA do Google Gemini Os elementos de um prompt efetivo: Todo mundo. Bem-vindo à nossa primeira palestra sobre solicitação de bate-papo Aqui, você aprenderá como criar e refinar solicitações que podem ser usadas na interface de bate-papo Vamos começar. Ao conversar com um amigo, você não usa modelos rígidos ou estruturas formais Você tem uma conversa fluida natural. O mesmo princípio se aplica à solicitação de bate-papo com modelos de IA No entanto, há momentos em que um pouco de estrutura pode nos ajudar a obter melhores resultados e tornar um prompt mais eficaz do que outro. Então, vamos abordar os principais ingredientes de um aviso eficaz. A parte central de cada solicitação é a intenção ou tarefa principal Isso pode assumir a forma de instruções, como escrever um e-mail de cinco parágrafos para apresentar um novo aplicativo de produtividade aos proprietários de pequenas empresas, com foco em seus recursos de economia de tempo. Pense nas instruções como a tarefa que você deseja que o modelo execute. Outra forma que a intenção pode assumir é uma pergunta como: quais etapas devo seguir para criar um perfil atraente no Linkin Ou como faço para estruturar um plano de negócios para uma ideia de startup? Ao escrever uma tarefa, seu objetivo é ser claro e específico sobre o que você gostaria de alcançar. Escrever algo como me ajude com a apresentação não será suficiente para obter um documento de alta qualidade que você possa apresentar com confiança ao seu chefe, colegas ou investidores Como regra geral, lembre-se de que qualquer pessoa sem conhecimento específico do assunto deve ser capaz de entender sua solicitação e executá-la Se eles ficarem confusos sobre como seguir suas instruções, o sistema EI também ficará confuso. Não presuma que ele tenha alguma informação contextual sobre sua tarefa, como como os resultados serão usados, quem é o público-alvo Qual é a aparência da conclusão bem-sucedida da tarefa ou uma lista de pontos que você não abordará. Você mesmo precisa fornecer esses detalhes do contexto ou da tarefa. Por exemplo, se você quiser criar uma apresentação, inclua informações sobre o número de slides, a finalidade da apresentação os principais tópicos a serem abordados. Aqui está um exemplo de um prompt bem elaborado. Crie uma apresentação de sete slides sobre o tema da marca pessoal Inclua o que é, medidores de largura, principais componentes e etapas para desenvolver sua marca. Ou outro exemplo, explique como escrever um e-mail convincente em cinco etapas fáceis As instruções devem abranger elaboração e o engajamento da linha de assunto, a estruturação clara do e-mail e o uso de um tom profissional Torne o processo simples o suficiente para qualquer pessoa seguir, mesmo sem experiência prévia em redação formal. Você pode fornecer contexto, não apenas para a tarefa em si, mas também para o tom que você gostaria de usar. Por exemplo, use um tom de conversa que equilibre profissionalismo Você também pode especificar regras ou restrições que o sistema EI deve Por exemplo, na solicitação do guia de redação de e-mails que acabamos de abordar, você pode adicionar: Quando sua solicitação envolve afirmações factuais, como estatísticas, eventos atuais, características do produto, informações legais ou médicas ou qualquer coisa em que a precisão realmente importe, existem dois ingredientes extras que podem melhorar significativamente o resultado A primeira é a verificação da realidade, também chamada de aterramento. É quando você está contando ao EI. Não pareça apenas confiante, seja verificável. Portanto, você pode adicionar uma regra como, se fizer afirmações factuais, citar fontes e me dizer sobre o que não tem certeza, segundo ingrediente é o raciocínio Muitos tópicos mudam rapidamente: ferramentas, recursos de preços, políticas e melhores práticas. Por isso, ajuda dizer ao EI qual janela de tempo usar. Por exemplo, use fontes dos últimos 12 meses, a menos que todos os recursos sejam necessários. Aqui está o que acontece quando você adiciona os dois a um prompt. Essas duas adições são especialmente úteis quando você usa a IA para pesquisa ou tomada de decisões, não apenas para escrever, porque elas incentivam a resposta a ser clara sobre o que está comprovado, o que é atual e o que é incerto Outra forma de aprimorar sua solicitação é atribuir uma função específica ao executar uma tarefa. Isso também é conhecido como solicitação de função. A dramatização ajuda os modelos de IA a adotar as nuances de perspectivas específicas, melhorando a relevância e a qualidade de suas respostas. Por exemplo, atue como assistente executivo experiente com mais de 15 anos de experiência no gerenciamento de correspondência comercial de alto nível ou finja ser um redator profissional que virou consultor de redação de e-mails Você pode levar a função um passo adiante, fornecendo contexto ao público, além da função. Por exemplo, observe como o EI adapta os exemplos de prós e contras para torná-los identificáveis para identificáveis É muito incrível. E se você está se sentindo sobrecarregado com a ideia de criar um aviso tão detalhado, não se preocupe A vantagem de trabalhar em uma interface de bate-papo é que você não precisa criar um prompt perfeitamente pensado para iniciar a conversa. Você pode começar com uma pergunta ou tarefa ampla e refiná-la por meio do diálogo com o modelo EI Essa abordagem iterativa permite que você esclareça suas necessidades e melhore as respostas recebidas ao longo do tempo Falaremos mais sobre a solicitação interativa em nosso próximo vídeo e, por enquanto, vamos resumir o que falamos nesta palestra 8. Criando respostas do Gemini: gerador iterativo: Todos, bem-vindos de volta. Se, depois de assistir à palestra anterior, você achar que criar um bom prompt é uma tarefa árdua e precisa se transformar em um engenheiro rápido para ter sucesso nesse Aqui está um segredo que os especialistas usam. Pense na solicitação como uma conversa ou um processo de várias etapas, não uma pergunta única. Assim como você pode esclarecer as direções em uma nova cidade com um morador uma conversa ou um processo de várias etapas, não uma pergunta única Assim como você pode esclarecer local, você pode refinar suas solicitações com base nas Vamos dar uma olhada em um exemplo real de solicitação iterativa para ver como ela funciona Digamos que gostaríamos que o EI nos ajudasse a criar uma proposta comercial para um serviço móvel de tratamento de cães Primeiro passo, a solicitação inicial pode ser bastante ampla, como criar um esboço para uma proposta comercial para um serviço móvel de cuidados com cães Na segunda etapa, restringimos ou refinamos nossa solicitação inicial dizendo algo como: pegue o esboço, crie e expanda a seção de análise de mercado, crie e expanda a seção de análise de mercado, concentre-se nos dados demográficos e na concorrência em Na terceira etapa, solicitamos detalhes específicos. Por exemplo, agora desenvolva a seção de projeções financeiras, inclua custos iniciais, despesas operacionais mensais e previsões de receita para o primeiro ano Podemos repetir as etapas dois e três várias vezes, dependendo de quão satisfeitos estamos com as respostas. Às vezes, a solicitação iterativa é ainda mais poderosa quando você está trabalhando em algo que precisa ser preciso, não apenas bem escrito Por exemplo, primeiro passo, comece de forma ampla. Dê-me uma visão geral do mercado móveis para cães em áreas urbanas Segundo passo, peça suposições e evidências. Liste as principais suposições que você está fazendo. Se você mencionar fatos ou números, diga-me de onde eles vêm e sinalize qualquer coisa sobre a qual você não tenha certeza. Etapa três, verificação cruzada. Agora, sanidade, verifique sua própria resposta. Quais partes têm maior probabilidade de estar erradas ou desatualizadas? O que você verificaria primeiro? Dessa forma, você não está apenas aprimorando o texto, mas melhorando a confiabilidade do conteúdo à medida que Observe que, assim como um gerente de projeto qualificado se baseia em discussões e decisões anteriores, IA baseada em bate-papo mantém o contexto de sua conversa Isso significa que você pode consultar partes anteriores do bate-papo e desenvolvê-las em vez de repetir tudo do zero Então, você pode perguntar algo como, com base na estratégia de marketing que discutimos anteriormente neste bate-papo, vamos nos basear nela, mas focar em famílias suburbanas em áreas com opções limitadas de cuidados pessoais Obviamente, se você acha que sua conversa não está indo na direção certa, você sempre tem a opção de recomeçar e reformular a primeira pergunta A etapa final do processo iterativo geralmente envolve pedir à IA que aperfeiçoe a resposta Como alternativa, você pode pedir feedback sobre todo o conteúdo. Nesse caso, a proposta comercial, com foco em como ela pode ser melhorada ainda mais. Em seguida, você pode incluir essas alterações na versão final do documento. Essa abordagem passo a passo permite que você revise e refine a saída em cada estágio, faça ajustes com base nos resultados intermediários, mantenha o controle sobre o produto final e aumente a complexidade gradualmente Pense nisso como esculpir. Você começa com a forma básica e depois refina gradualmente os detalhes até conseguir exatamente o que deseja E isso é tudo para o vídeo. Vamos resumir os pontos-chave que acabamos de abordar. 9. Tornando Gêmeos verdadeiramente seu: personalização: Olá a todos, e bem-vindos de volta. Às vezes, quando você está conversando com um assistente de IA, parece que você está começando do zero todas as vezes. Você pode escrever o prompt perfeito e ainda obter uma resposta genérica porque o Gemini não tem ideia de quem você é e como trabalha. Neste vídeo, veremos como fazer o Gemini funcionar da maneira que você Há três níveis de personalização que você pode usar para personalizar sua experiência O nível um são as instruções básicas personalizadas. Você diz a Gêmeos como você queria se comportar todas as vezes. Seja sempre profissional, sempre formate as respostas como marcadores O que quer que funcione para você, evita que você se repita em cada solicitação O nível dois é a memória de bate-papo intermediária. É aqui que o Gemini começa a se lembrar dos fatos e preferências de suas conversas anteriores, para que você possa continuar exatamente de onde parou E o nível três é a inteligência pessoal mais avançada. Isso permite que o Gemini conecte os pontos em todo o seu ecossistema do Google, seu GML, suas fotos, YouTube e até mesmo seu Imagine em vez de passar horas jogando uma viagem de fim de semana. Você acabou de dizer que os geminianos planejam uma viagem para este sábado com base no meu hobby favorito Personal Intelligence encontra sua recente compra de equipamento de caminhada em Jimel, extrai suas fotos de trilhas favoritas do Google Fotos, verifica seu histórico de exibição no YouTube em busca de guias locais e sugere uma trilha específica, sabendo exatamente qual nível de dificuldade é adequado Uma coisa que vale a pena observar antes de começarmos inteligência pessoal ainda está sendo implementada, então vamos nos concentrar nos dois primeiros níveis hoje. Além disso, esses recursos de personalização fazem parte da assinatura do Google AI Pro Se você ainda não fez o upgrade, confira nossa palestra em que mostrei como obter acesso gratuito Vamos entrar na demonstração. Começaremos acessando o aplicativo web Gemini em gemini.google.com Eu já entrei na minha conta P. Em seguida, olhe para o canto inferior esquerdo da tela e clique no ícone de engrenagem de Configurações. Nesse menu, selecione contexto pessoal. A primeira configuração é chamada de seus melhores chapéus com Gêmeos. Quando está ligado, como na minha tela aqui, Gêmeos aprende com sua história para entendê-lo melhor com o tempo Quando acabei de ativar essa configuração, aqui está o que Gemini sugeriu para mim. Ele resumiu corretamente todas as coisas que venho trabalhando recentemente E, a propósito, se você quiser ter uma conversa privada que não esteja armazenada no histórico de bate-papo, você pode usar o bate-papo temporário. Você vê que ele está disponível aqui no canto superior esquerdo da tela. Então, vamos clicar nele. Vemos a mesma interface com a qual você já está familiarizado. Deixe-me perguntar uma coisa. Estou usando um modelo rápido , pois essa é apenas uma pergunta muito rápida. Então, aqui estão as sugestões. Eles são muito bons. E já que estávamos experimentando o bate-papo temporário, deixe-me dar uma olhada no meu histórico de bate-papo Você vê que não temos nada relacionado a um branco liso aqui. Deixe-me tentar atualizar a página para garantir que esse bate-papo temporário não seja salvo no histórico do bate-papo Sim, tudo bem. Mas, ao mesmo tempo, também perdemos essa conversa. Tudo bem, vamos voltar às configurações, ao contexto pessoal O segundo Google aqui se chama Your Instructions for Gemini Vemos que eles também estão ativos por padrão para adicionar uma nova instrução, um clique no AD. E aqui podemos incluir qualquer informação sobre seu comportamento, estilo de comunicação pessoal, quaisquer preferências que você queira compartilhar com a Gemini Então, aqui está meu aviso. Então, eu gostaria de dividir as instruções em duas partes. Primeiro, eu digo ao EI o que eu faço. Você vê aqui que eu compartilhei meu papel como educador e também como consultor, fornecendo um pouco de contexto sobre o que eu faço em ambas as funções E em segundo lugar, expliquei como gosto de trabalhar. Vamos salvar essas instruções clicando no botão Enviar. Tudo bem. E, finalmente, para ver tudo o que o Gemini armazenou, retorne às configurações e, a partir daqui, clique em Atividade Esta é a lista de todas as atividades que você teve recentemente com o aplicativo Gemini Você pode excluir manualmente bate-papos específicos caso não precise deles por determinados motivos, e também pode configurar um cronograma de exclusão Portanto, seus dados são apagados a cada poucos meses. Por exemplo, eu posso escolher uma duração aqui. Vivo 18 meses, o que é um período de tempo razoável para me livrar das conversas antigas, e clico em Avançar. Perfeito. E isso é tudo para este tutorial. Agora você já sabe como personalizar o gemini para funcionar exatamente do jeito que você quiser E Alca no próximo vídeo. 10. Como compartilhar arquivos e outros conteúdos com a IA do Google Gemini: Olá a todos, e bem-vindos de volta. Nas palestras anteriores sobre engenharia rápida, falamos muito sobre como estruturar suas instruções e quais informações incluir Mas, além das instruções, às vezes você também precisa fornecer ao EI materiais de origem, como documentos, planilhas, capturas de tela ou PDFs, para que ele possa revisá-los e analisá-los Vamos ver como isso funciona. Você pode fornecer informações de documentos e imagens para o Gemini de duas maneiras principais colando o texto diretamente no bate-papo ou anexando o arquivo inteiro à Portanto, a primeira opção de colar o texto funciona bem quando você só precisa de ajuda com um fragmento específico do seu Por exemplo, aqui está meu currículo, e eu quero feedback sobre apenas uma seção do documento, para que eu possa simplesmente copiá-lo, colá-lo no chat e depois dar as instruções ao Gemini Então eu disse que isso é um fragmento do meu currículo e perguntei à Gemini se essas habilidades são relevantes para cargo de chefe de produto de uma startup de fintech E aqui está a resposta. Mas, muitas vezes, você quer que Gemini trabalhe com o documento inteiro, como um PDF longo ou uma O Gemini pode lidar com praticamente qualquer tipo de arquivo comum , desde documentos do Word até arquivos CSV, fotos e até Para anexar o arquivo, clique no ícone de adição no lado esquerdo da barra de bate-papo. Você pode escolher um arquivo do seu dispositivo, do seu Google Drive, do seu Google Fotos. Então, vamos dar um exemplo. Preciso de algumas ideias sobre o que cozinhar para o jantar. O que vou fazer é enviar várias fotos dos ingredientes que tenho na minha geladeira. Esses são os ingredientes que eu tenho. Vou perguntar a Gemini, quais são as três receitas simples de jantar que posso fazer em menos de 20 minutos. E aqui estão as recomendações que a Gemini forneceu. Você vê que ele identificou com sucesso os ingredientes com base nas fotos. Aqui vemos a capacidade de Gêmeos de reconhecer objetos e aplicar a Frisonina criativa Em seguida, vamos experimentar o documento. Digamos que você tenha recebido um documento complexo de fatura de serviços públicos. Assim, você pode enviar este PDF para o Gemini e perguntar se ele pode resumir as principais cobranças. Vamos experimentar isso. Voltarei ao mesmo bate-papo, clicarei no ícone de adição e seguida, escolherei os arquivos do meu Drive local. E aqui está meu aviso. Vamos usar o modelo rápido aqui porque deve ser uma solicitação bem direta e vamos ver qual resposta receberemos Sim, um ótimo resumo correto das cobranças, bem como do meu uso de dados. Tudo bem aqui. Tudo bem, vamos tentar outra coisa e enviar diferentes tipos de documentos para o Gemini para ver se ele realmente funciona com arquivos diferentes Tenho um PDF com meu itinerário de voo para minha próxima viagem a Phuket E aqui eu tenho um guia de viagem com algumas informações sobre os passeios. Isso eu posso fazer lá enquanto estou em Phuket. Tudo bem. Essa demonstração demora um pouco. Então, o que eu vou fazer é parar com essa resposta. Vou copiar esse aviso e abrir um novo bate-papo. Eu incluí o mesmo aviso e, aqui, vamos começar a pensar. Porque eu tenho um documento PDF bastante complexo aqui. Também tenho imagens com datas concretas que Gemini precisa analisar e comparar com as datas deste documento Então, talvez seja melhor mudar para um modelo mais inteligente Vamos experimentar isso. Agora obtivemos o resultado quase imediatamente. Então, vamos ler o que Gêmeos nos diz. Ele reconhece todas as informações nos documentos que forneci e também descobriu uma boa recomendação sobre o que posso fazer logo após chegar ao meu destino É aqui que vemos o Gemini atuando como nosso cardinador pessoal conectando pontos em diferentes E lembre-se de que, embora o Gemini possa ler e analisar esses arquivos para gerar resumos, tabelas ou recomendações, ele não alterará o arquivo original Tudo bem, continuando com nossa demonstração, digamos que eu tenha um arquivo de áudio que eu quero que o Gemini analise, como sempre clicando no botão Mais Em seguida, seleciono meu arquivo de áudio e aqui está meu prompt. Você pode resumir os pontos principais desse áudio? Vou continuar usando modo de pensamento aqui porque essa é uma tarefa mais complexa do que apenas fazer uma pergunta rápida. E aqui está o resumo. Este é o resumo correto fornecido pela Gemini. Posso confirmar isso, pois esta é a gravação que eu mesmo preparei para meu outro curso. Ótimo trabalho, Gêmeos. E deixe-me também demonstrar como ele pode funcionar com vídeos. Eu tenho este link para a apresentação principal do Google. E como agora estou trabalhando no curso Gemini, quero que o Gemini me ajude a encontrar todos os momentos em que os palestrantes falam sobre o aplicativo Gemini, Vamos pressionar Enter e ver o que o Gemini vai sugerir. Aqui está a análise detalhada deste vídeo. E o que eu realmente gosto aqui é que ele incluiu os códigos de tempo. Por exemplo, vemos aqui que Gemini mencionou sobre o contexto pessoal e incluiu esse código de tempo específico em que um dos palestrantes estava falando sobre essa funcionalidade Então, se eu quiser revisar essa conversa, posso simplesmente clicar nesse código de tempo. Eu serei redirecionado para esta parte da apresentação. E isso é tudo para esta palestra. Vamos resumir brevemente o que aprendemos aqui. A maioria dos modelos modernos de IA aceita formatos de arquivo comuns, incluindo PDFs, documentos do Word, arquivos do Excel, CSVs, imagens e arquivos de texto Os arquivos podem ser enviados usando um botão de upload ou ícone de anexo na interface de bate-papo Você precisa dar instruções claras sobre o que deseja que a IA faça com os arquivos. Ser específico com suas solicitações leva a melhores resultados. Você pode fazer upload de vários arquivos e pedir ao modelo de IA que os compare ou analise juntos. A IA geralmente não edita seu arquivo diretamente, mas pode gerar conteúdo aprimorado. Você pode copiar de volta para o seu documento. Tudo bem, e nos vemos na próxima palestra. 11. Usando exemplos nas suas propostas: Todos, e bem-vindos de volta à nova palestra, onde continuamos falando sobre como se comunicar com sistemas de EI e o que incluir em sua solicitação Até agora, abordamos vários componentes que podem ser incluídos em um prompt, uma tarefa ou o que você gostaria de alcançar, seguidos por detalhes específicos ou contexto e regras necessárias para realizar a tarefa ou responder a uma pergunta. Em seguida, está o contexto da função, uma função específica que o EI desempenhará ao realizar uma tarefa. Opcionalmente, você também pode apresentar o público-alvo da sua tarefa Por fim, mencionamos que você pode compartilhar conteúdo adicional anexando documentos à sua conversa ou incluindo o texto como dados de entrada diretamente no bate-papo e em relação à ordem dos componentes em sua solicitação A ordem é importante para alguns elementos, mas não para outros. Por exemplo, é recomendável incluir o contexto de RL anteriormente no prompt, embora os dados de entrada possam não ser necessários dependendo da tarefa, e sua ordenação também seja flexível Mas, em geral, se você seguir a ordem mostrada nos slides da apresentação do curso, será um ótimo começo para uma solicitação eficaz Ok, vamos apresentar outro elemento de alerta. Exemplos. Exemplos também conhecidos como fotos funcionam como demonstrações que orientam o modelo generativo de IA sobre o tipo de saída que você está procurando, incluindo o formato da resposta e o que você deseja evitar Talvez você já tenha ouvido falar de termos como um tiro ou alguns disparos. Eles se referem ao uso um ou vários exemplos em sua descrição rápida. Para solicitações de bate-papo, os exemplos geralmente demonstram o tom. Por exemplo, formal versus informal, sério versus cronograma, empático versus fato e estilo, como tamanho da frase, padrões de formato, marcadores versus parágrafos, nível de detalhes técnicos, terminologia básica versus avançada Vamos examinar alguns exemplos concretos. Primeiro, vou pedir ao Gemini um e-mail simples sem dar nenhum exemplo Então, aqui está meu aviso. Para esta demonstração, vou usar o modelo Fest. Vamos executá-lo. Este e-mail é bom, mas também é bastante genérico. Agora, vamos torná-lo muito mais específico, mostrando um exemplo do tom e da estrutura que queremos. Então, aqui está meu outro aviso. Então, eu tenho a mesma instrução no início e, em seguida, forneci um exemplo como referência de estilo que menciona o tom, o comprimento da frase e a estrutura que eu gostaria que o Gemini usasse Vamos executar essa segunda versão. Agora, se compararmos essa nova resposta com a versão inicial, vemos que ela parece mais humana. As frases são mais curtas e a estrutura está mais próxima do que mostramos no exemplo. E enquanto estamos aqui no exemplo de e-mail, deixe-me mostrar rapidamente o que o Gemini pode fazer com esse e-mail a seguir Descobriu-se que você não precisa copiar e colar o e-mail na sua caixa de entrada Se você olhar logo abaixo da resposta, verá mais ícones. Vamos clicar nele. E aqui você verá o rascunho na opção Gmail Se você clicar nele, o Gemini abrirá uma nova janela e colocará esse texto exato em um rascunho real do Gmail, que você poderá editar posteriormente e eventualmente, enviá-lo ao destinatário Então, vamos tentar fazer isso. Gemini está redigindo um e-mail. Vamos dar uma olhada. Vou clicar em Abrir o Gmail Vemos que ele foi escolhido corretamente no assunto do e-mail. Esse é o texto exato que vimos no chat. Vamos tentar algo um pouco mais avançado. Até agora, usamos exemplos para fixar o tom e o estilo de resposta. Mas você também pode usar exemplos para definir uma estrutura mental. A estrutura mental não muda apenas as palavras que Gêmeos usa. Isso muda a lógica usada para resolver seu problema. Então, em vez de escrever uma longa lista de regras, como ser prático ou não ser muito acadêmico, você pode simplesmente mostrar a Gêmeos uma foto ou um exemplo da perspectiva que você queria adotar Então, vamos passo a passo. Em primeiro lugar, vou abrir um novo chat. E aqui, eu gostaria de mudar para um modelo profissional. E só para avisar que, se você estiver em um plano gratuito, ainda terá acesso ao modelo profissional. Veja, estou usando minha conta gratuita e ainda posso selecionar esse modelo. Mas seus limites de uso podem ser menores do que nos planos pagos. Então, estou voltando à minha conta que uso para esta demonstração. Primeiro, vamos ver como o Gemini lida com solicitações sem nenhum enquadramento Vou perguntar sobre um tópico popular: marca pessoal. Quero aprender sobre marca pessoal. Como devo começar? Vamos pressionar Enter. Se estivermos interessados, podemos analisar o processo de pensamento de Gêmeos Veja, essas são as etapas necessárias para nos dar essa recomendação. Tudo está correto, mas é muito teórico. Parece uma longa lista de tarefas antes mesmo de você começar. Agora vamos usar um exemplo único para mudar a lógica para uma estrutura mental prática. Quero que Gemini aja como um treinador que valoriza pequenas vitórias imediatas em vez de grandes teorias Então, aqui está meu novo aviso, além da minha instrução original. Também incluí um exemplo de lógica prática. Vamos entrar e ver o que Jimmy e eu sugeriríamos aqui. Está vendo isso? Como eu classifiquei a lógica como prática e mostrei a Gemini o exemplo do olá mundo, ela não está mais me dando uma lista de leitura Ele literalmente me diz as recomendações práticas, coisas que eu posso fazer agora. Então, agora, Gêmeos está refletindo a maneira de pensar, não apenas o tom e o estilo, como em nosso primeiro Tudo bem. E vamos dar mais um exemplo rápido. Isso é especialmente útil quando você está fazendo pesquisas. Digamos que você queira que o Gemini não apenas responda à pergunta, mas também mostre de onde vêm as informações Você pode incluir um exemplo que demonstre o formato Por exemplo, você pode escrever um prompt completo como esse. E o que é importante, eu também forneci regras para Gêmeos. Para os casos, não consegue encontrar uma fonte confiável para uma reclamação. Vamos executá-lo. Esse tipo de exemplo torna a saída muito mais estruturada e fácil confiar porque você está mostrando o formato exato que deseja como evidência. Tudo bem. Além da solicitação de uma ou algumas fotos, existe outra técnica que usa exemplos interativos Os exemplos interativos diferem dos exemplos regulares porque criam uma experiência de aprendizado dinâmica, de ida e volta, em que experiência de aprendizado dinâmica, de ida e volta, em que cada exemplo se baseia entendimento ou feedback anteriores, enquanto os exemplos regulares são demonstrações de estudos Exemplos interativos envolvem participação ativa e iteração. Veja como os exemplos interativos funcionam. Você fornece um exemplo de versão inicial. A IA fornece feedback e sugestões específicos. Você cria uma versão aprimorada com base nesse feedback. A IA analisa as melhorias e sugere mais refinamentos Você itera novamente, se necessário. A chave é que cada iteração se baseie no feedback da versão anterior, criando um processo de melhoria colaborativo Ok, ótimo. E pronto , neste vídeo, vamos abordar rapidamente o que aprendemos aqui. E nos vemos no próximo vídeo onde abordaremos mais uma técnica de solicitação 12. Especificando o formato de saída no Gemini: Cada um. Estamos quase terminando abordar os principais ingredientes de um bom aviso. Há ainda outro componente que você pode achar que vale a pena incluir em suas informações imediatas sobre o formato que você deseja que a resposta da IA assuma. Vamos falar sobre isso agora. Lembre-se de que em nossa primeira palestra sobre inspiração, dissemos que é importante incluir informações sobre o esboço básico ou a lista Você não o abordará como contexto para sua tarefa. Acontece que você também pode especificar suas preferências de formatação para a resposta, o que pode ajudar a organizar as informações com mais eficiência Essas informações podem não ser necessárias dependendo da tarefa, mas se você as incluir, é melhor colocá-las no final da solicitação do que no início Vamos ver alguns exemplos de formatação que você pode solicitar Você pode solicitar estilos de formatação específicos. Por exemplo, se precisar um relatório comercial, você pode dizer: Formate isso como um relatório profissional com cabeçalhos, subtítulos e parágrafos curtos e claros IA estruturará as informações adequadamente, preparando-as para uso profissional. Ao trabalhar com dados ou análises, você pode solicitar tabelas ou layouts específicos Em vez de uma parede de texto, você pode dizer, apresente a comparação desses três produtos em um formato de tabela claro com recursos na coluna da esquerda. Isso facilita a compreensão e o uso de informações complexas . E aqui estão mais alguns formatos e padrões que são especialmente úteis para pesquisas ou tomadas de decisão. Tabela de comparação. Forneça uma tabela de comparação dessas opções com colunas para os principais recursos, prós, contras e as quatro melhores. Mapeamento de fontes, liste as fontes que você usou e explique brevemente o que cada fonte suporta em sua resposta. Fatos versus interpretações. Separe sua resposta em duas seções, fatos, declarações verificáveis e interpretações, seu raciocínio, suposições Você pode solicitar uma formatação de markdown específica. A IA pode usar texto em negrito, itálico, cabeçalhos e marcadores Basta pedir pontos-chave em negrito ou termos importantes em itálico, e a resposta será formatada conforme solicitado Você pode organizar suas dicas usando marcadores para a dica principal do Claridm, apoio e outros detalhes Por fim, lembre-se de que você sempre pode pedir para reformatar a resposta se a primeira versão não for exatamente o que você precisava É perfeitamente normal dizer: Você poderia reorganizar essas informações como uma lista numerada Ou, por favor, divida isso em parágrafos mais curtos para facilitar a leitura do clima Ok, e isso é tudo para esta breve palestra. Vamos recapitular os pontos principais que acabamos de abordar. Sempre especifique o formato desejado antecedência para obter a resposta mais útil Você pode solicitar estruturas específicas como relatórios, tabelas ou listas. As tabelas de comparação são ótimas para a tomada de decisões. Você pode solicitar uma tabela estruturada com prós, contras e a melhor forma. Para tarefas de pesquisa, você pode solicitar fontes e até mesmo separar fatos de interpretações para maior clareza Um modelo de IA pode adaptar seu estilo de escrita para atender às suas necessidades, do casual ao profissional. formatação Markdown ajuda a destacar informações importantes Você pode solicitar a reformatação se a primeira resposta não estiver correta. Instruções claras de formatação levam a respostas mais úteis e acionáveis E isso é tudo neste vídeo e, como sempre, AlCa no próximo 13. Acompanhe o processo: escolher o modelo certo e fazer um brainstorming com o Gemini: Todo mundo. Até agora, exploramos Brampton em partes isoladas É hora de reunir essas peças em um fluxo de trabalho completo de ponta a ponta. Ao longo do caminho, mostrarei alguns pacotes de produtividade disponíveis no Gemini, como verificar a precisão das respostas e exportá-las diretamente para o Google Vamos explorar dois cenários que são, de longe, um dos meus favoritos quando se trata de trabalhar com a Gemini Eles estão discutindo ideias e obtendo feedback. Mas antes de começarmos com nosso primeiro cenário, vamos falar um pouco sobre como escolher seu modelo de IA. Você me viu alternando entre eles ao longo desta seção de demonstrações e pode estar se perguntando: então, qual modelo você deve escolher? E quando sua escolha depende do seu plano de assinatura. Se você é um usuário pago, sugiro que faça do pensamento sua escolha padrão. Seu poder de raciocínio lida com quase tudo, mude para o rápido, apenas para tarefas de baixo risco, como verificações gramaticais rápidas ou perguntas rápidas, e mude para profissional quando você está lidando com documentos longos, pesquisas aprofundadas ou qualquer coisa que exija foco constante em uma grande quantidade de conteúdo e é aí que ele Trabalho com o Gemini há algum tempo e esse é o melhor fluxo de trabalho que criei depois de muitas experiências Se você é um usuário gratuito, mantenha-se rápido como padrão, pois os modelos mais avançados têm cotas diárias limitadas no plano gratuito, então você precisa ser estratégico e guardar esses créditos para quando realmente precisar deles Passe a pensar quando uma tarefa exigir lógica profunda ou raciocínio em várias etapas e mude para profissional quando estiver trabalhando com conteúdo grande ou precisar desse alto nível de nuance Agora, com isso em mente, vamos entrar em nosso primeiro cenário de acompanhamento do processo de brainstorming Quero que você imagine que é o gerente de marketing de uma startup de tecnologia do sono muito ambiciosa e criativa chamada Snooze Estamos prestes a lançar o Snooze One, o primeiro piloto automático do mundo Como você pode ver em nosso briefing interno, este colchão tem tudo, este colchão tem tudo desde tecnologia de zoneamento climático, análise de sincronização de sonhos e o mecanismo de história Vibe Preciso criar uma campanha de lançamento nas redes sociais que faça com que o sono inteligente pareça essencial. Então, vamos abrir o Gemini para começar a demonstração. Estou selecionando o modelo de pensamento porque precisamos um estrategista criativo que possa lidar com nuances E vamos começar nosso brainstorming. Aqui está o primeiro prompt que vou usar. Você vê que eu primeiro apresento o papel que eu quero que Gêmeos assuma Em seguida, incluí um pouco de contexto em termos do que estamos prestes a lançar. Nosso público-alvo. E então eu dei a tarefa à Gemini de sugerir temas de conteúdo de tendas para nossa janela de lançamento de 30 dias E deixe-me também incluir o arquivo PDF que você acabou de ver para fornecer ainda mais contexto ao Gemini E vamos pressionar Enter , então aqui estão os dez temas que Gemini sugeriu Eu gosto mais desse tema. Então, vamos pedir a Gemini que se aprofunde nesse tema específico Então, aqui está meu segundo aviso. E deixe-me especificar que quero dez ideias de custo. Vamos pressionar Enter. Ótimas sugestões. E caso você não goste de algumas delas, pode sempre pedir a Gemini que sugira outras dez ideias Então, vamos fazer isso. Percebo que quando você faz isso várias vezes, você pode dar ótimas sugestões. Então, por favor, tente fazer isso e não use apenas a primeira lista de ideias que a Gemini fornece Vamos fazer mais uma iteração. Dei alguns comentários à Gemini sobre a lista de ideias que ela forneceu Bom. Vejo que podemos continuar trabalhando com algumas das ideias. Mas antes de começarmos a fazer os roteiros reais para nossa postagem ou vídeos, deixe-me fazer outra pergunta ao Gemini Antes de prosseguirmos, quero saber quais são as tendências atuais de conteúdo de mídia social para lançamentos de produtos de tecnologia, como no nosso caso. Aqui estão as tendências. Você vê que ele retomou corretamente o ano atual. E aqui está meu próximo aviso. Vou pedir à Gemini que sugira dez IDs de roteiro de vídeo em formato curto para a série Vibe Check Storytelling Digamos que eu gostaria o Instagram fosse nossa plataforma preferida. E observe que eu também incluí este PDF com as ideias de ganchos virais que eu quero que o Gemini use ao preparar a resposta Isso é chamado de aterramento. Então, estou ancorando a resposta dos EIs em nosso estilo de marca específico para que os scripts não pareçam genéricos Em seguida, eu também forneci a estrutura para o script e pronto. Vamos pressionar Enter. Tudo bem, vemos que o Gemini incluiu alguns espaços reservados, e eu realmente quero ter um roteiro completo pronto para o teleprompter para que possamos gravar possamos Então, ao fazer um brainstorming, começo pedindo a Gemini que explore uma ampla variedade de ideias e, em seguida, posso repetir essas E então eu geralmente seleciono uma ideia de que gosto e peço a Gemini que se restrinja a esse tópico e, digamos, crie uma postagem ou uma história relacionada à ideia de minha escolha Tudo bem, nosso roteiro está pronto. Posso continuar conversando com Gemini e pedir para ajustar esse roteiro ou adotar outra ideia para expandir Mas digamos que eu esteja bem com isso. Na verdade, posso exportar esse script diretamente para o Google Doc. Você vê três pontos que eu posso ouvir. Se eu clicar nele, posso escolher exportar dois cães e vamos ver o que acontece. Gemini me diz que o novo documento foi criado. Vamos clicar em Abrir. Muito bom. Temos até uma tabela com códigos de tempo e texto exato que precisamos dizer muito legal. E você também vê aqui brincadeiras de Gêmeos para exportar essa tabela Vamos tentar fazer isso também. Pessoalmente, gosto de exportar para o Google Docs nesse cenário Acho que funciona melhor para esse tipo de documento, mas você entendeu. Isso é tudo para este tutorial e Alca para o próximo. 14. Acompanhe: receba feedback com a IA do Google Gemini: Todo mundo. Bem-vindo ao segundo vídeo de acompanhamento. Vamos explorar a obtenção de feedback do Gemini. Esse caso de uso é um dos primeiros com os quais comecei. Ao usar o assistente EI. Eu costumava enviar meus documentos como apresentações, relatórios, currículo, e pedir feedback à EI para que eu pudesse obter uma segunda opinião sobre o assunto e fazer melhorias Mas o Gemini levou esse processo para um nível totalmente novo, pois é nativamente multimodal, que significa que ele pode processar não apenas textos mas outros tipos de Agora você pode obter feedback personalizado sobre seu desempenho real, não apenas sobre o que você escreveu. A razão pela qual Gêmeos é tão dominante aqui é sua enorme janela de contexto Essa é a primeira vez que estamos usando esse termo. Então, vamos apresentá-lo. A janela de contexto é essencialmente a memória de curto prazo do IIS. É a quantidade de dados que o modelo pode armazenar em seu cérebro ao mesmo tempo para entender a solicitação. Enquanto outros modelos podem ter dificuldade em lembrar mais do que alguns minutos de filmagem, Gemini pode processar até 1 milhão de tokens Para se ter uma ideia, é cerca de uma hora de vídeo ou milhares de páginas de texto de uma só vez. Essa memória enorme é exatamente o motivo pelo qual vemos tantos usuários migrando para o Gemini para análise de vídeo Mas não acredite apenas na minha palavra . Vamos verificar isso. Vou usar o modo de raciocínio para verificar a reclamação. E esse é o prompt que vou usar primeiro. Deixe-me pressionar Enter. A razão pela qual comecei com essa pergunta é porque quero mostrar a você a função de verificação dupla de resposta. E aqui está a resposta com os detalhes sobre por que os profissionais estão migrando para o Gemini Para acessar a função de verificação dupla de resposta, clique no ícone de três pontos na parte inferior da E aqui você verá a resposta de verificação dupla. Esse recurso usa a pesquisa do Google para encontrar conteúdo um pouco semelhante ou diferente das declarações geradas pelo Gemini E observe que esse recurso foi criado especificamente para verificar afirmações factuais Ele não aparecerá para coisas como escrita criativa, código ou tarefas similares. Gemini começou a avaliar as declarações E aqui vemos os destaques verdes confirmando as afirmações que E podemos até expandir essa janela para ver o artigo detalhado que a Gemini usou para validar essa afirmação Esse é um recurso bastante conveniente. E agora vamos ser técnicos. Gravei um vídeo meu durante uma entrevista na Zoom para a função de chefe de produto. Esta é uma gravação de 1 hora, que é uma quantidade enorme de informações. E por causa disso, vou escolher o modelo profissional. Mas primeiro, vamos começar um novo bate-papo. Aqui vou escolher P. O modelo Pro foi projetado com um teto de inteligência muito maior e é superior em manter um entendimento coerente durante toda a hora de Então, deixe-me anexar a filmagem primeiro. Tenho dez fragmentos de vídeo diferentes aqui e também envio minhas instruções Comecei dando a Gemini papel de coach de liderança executiva Eu forneci o contexto em termos do vídeo, o que estou fazendo aqui, e essa é minha tarefa. Com as perguntas específicas que eu quero que Gemini responda Minha expectativa da Gemini é me fornecer informações em termos de minha presença, comunicação, estilo e clareza, minha força e áreas de melhoria E também pedi à Gemini que fornecesse os registros de data e hora específicos para suas observações, para que eu possa encontrar rapidamente o fragmento ao qual Gêmeos se refere Veja como a Gemini processa essas informações. E aqui está o feedback. Essas são ótimas observações e coisas que eu definitivamente poderia melhorar. E agora vamos pegar esse feedback e transformá-lo em algo útil. Vou pedir à Gemini reescreva meu roteiro de “Fale-me sobre você para que seja mais contundente e mais relevante para a função de chefe de produto para a qual vou me candidatar Quando você trabalha com o Pmdel, como no nosso exemplo atual, a geração de respostas leva muito mais tempo, portanto, esteja ciente disso E, finalmente, aqui está a versão reescrita da minha introdução Tell me About Yourself, parece muito boa Mas é claro que, se eu o usasse em uma conversa real na próxima vez, preferiria mudar algumas coisas para garantir que soasse mais como eu. Ótimo trabalho, Gêmeos. E assim, você transformou Gemini em seu treinador pessoal Eu posso imaginar muitos casos de uso para esse tipo de feedback em vídeo. Imagine que você está fazendo um desafio de ioga de 28 dias e precisa de feedback diário sobre se está melhorando ou se tem medo de falar em público, para que possa gravar a si mesmo, enviar o vídeo para o Gemini, junto com os slides da apresentação, junto com os slides da apresentação e perguntar o que funcionou e o que não funcionou. O que notei quando comecei a fazer isso regularmente é um efeito colateral positivo que eu não tinha. esperar. O fato de você estar gravando si mesmo o torna mais autoconsciente. Mesmo antes de Gêmeos dizer qualquer coisa, você começa a prestar mais atenção ao que está fazendo e como está fazendo Mas é isso, e isso é importante. Aceite o feedback da IA com cautela. Esses modelos são incrivelmente poderosos, mas cometem erros. Por exemplo, no exemplo que acabamos de ver, Gêmeos me disse que eu estava sentado o tempo todo enquanto estava em pé Portanto, use os insights como ponto de partida, mas sempre confie em si mesmo para o julgamento final. Informe-me nas perguntas e respostas deste vídeo quais cenários você experimentará com Alcia no próximo 15. mantendo a realidade: estratégias práticas para minimizar alucinações de IA: Todos, imaginem perguntar ao assistente de IA sobre um evento noticioso recente e ele citar com segurança um artigo detalhado que na verdade não existe ou perguntar sobre figuras públicas e obter respostas que misturam fatos reais com detalhes completamente inventados Não são bugs ou falhas. Eles são o que chamamos de alucinações em IA. E eles são um dos maiores desafios ao trabalhar com grandes modelos de linguagem. Vamos explorar por que essas alucinações acontecem, como identificá-las e, o mais importante, técnicas práticas que você pode usar imediatamente para obter respostas mais precisas Para entender por que esses erros acontecem, precisamos ver como esses modelos são construídos Ao contrário de um humano que realmente entende um tópico, modelo de linguagem funciona prevendo a próxima palavra mais provável em uma sequência com base em padrões estatísticos , porque eles são projetados para serem o mais úteis possível Eles geralmente priorizam fornecer uma resposta completa e fluente em vez de admitir que são inseguro Quando um modelo atinge uma lacuna nas informações em que foi treinado ou quando encontra uma solicitação ambígua, ele pode preencher as lacunas adivinhando o som mais provável em adivinhando o Não é uma falha. É um efeito colateral da IA priorizar uma conversa tranquila em vez da verdade verificada Agora que entendemos por que as alucinações ocorrem, vamos explorar como identificá-las Pense nisso como desenvolver suas habilidades de verificação de fatos de IA. Depois de conhecer os sinais de alerta, eles se tornam muito mais fáceis de detectar. Aqui estão os principais sinais de alerta a serem observados. Detalhes excessivamente específicos. Quando o modelo de IA fornece detalhes muito específicos, especialmente sobre eventos ou estatísticas recentes, isso deve desencadear um exame mais minucioso Por exemplo, se ele fornece números ou estatísticas exatas para eventos de nicho ou que mudam rapidamente, sem citar uma fonte ao vivo, isso é uma bandeira vermelha Nesses casos, a IA pode estar generalizando a partir de padrões históricos semelhantes, em vez relatar o evento específico sobre o qual você perguntou Citações, exemplos ou estatísticas com som perfeito. Se você notar uma resposta que parece muito perfeita, esse é um bom motivo para verificar as informações. E acredite, quanto mais experiência você tiver trabalhando com ferramentas de EI, melhor você estará exportando esses dois bons momentos para serem verdadeiros Você desenvolverá um instinto para reconhecer quando algo parece errado ou excessivamente E essa é a sua dica para se aprofundar, verificar fatos ou cruzar fontes Confie, mas verifique. Essa é a regra de ouro ao trabalhar com conteúdo gerado por EI. Respostas inconsistentes. Se você fizer a mesma pergunta várias vezes e obtiver detalhes específicos diferentes a cada vez, isso é um forte indicador de alucinação Declarações excessivamente definitivas. Quando a IA faz declarações muito definitivas sobre tópicos que deveriam ter alguma incerteza, especialmente em relação a eventos futuros ou tópicos complexos, seja cauteloso Saber por que as alucinações acontecem e como identificá-las é um Mas como podemos realmente evitá-los? Vamos analisar quatro estratégias úteis que ajudarão você a obter respostas sempre mais confiáveis e precisas. Estratégia um. Seja explícito sobre a incerteza Em vez de fazer uma pergunta direta que force a IA a adivinhar, esclareça pedindo que ela priorize a precisão em vez Por exemplo, em vez de escrever, quais foram as principais conclusões do relatório de Johnson? Experimente isso. Se você verificou o acesso ao relatório da Johnson, compartilhe suas principais descobertas. Se você não tiver 100% de certeza sobre nenhum detalhe, indique explicitamente quais partes você não pode verificar Ou, em vez de listar todas as empresas que usam essa tecnologia, experimente com base nos dados nos quais você foi treinado. Você pode listar exemplos verificados de empresas que usam essa tecnologia? Forneça as fontes ou o contexto específicos para cada exemplo e indique se algum desses casos é especulativo em vez de confirmado Em vez de qual é o tamanho do mercado de AIChatBDS no momento Você pode fornecer as estimativas mais recentes do tamanho do mercado para AIChatBDs a partir Especifique o período de tempo exato para todos os dados que você compartilha e me avise se você não tiver acesso aos números mais recentes. Observe como cada solicitação revisada dá permissão explícita para reconhecer incertezas e limitações Essa simples mudança pode melhorar drasticamente a confiabilidade das respostas. Estratégia dois, exija citações baseadas em evidências. Ao pedir fontes, não procure apenas uma lista de links. Às vezes, a IA pode gerar citações perfeitas para artigos ou sites que não existem. Em vez disso, instrua o modelo a citar a frase específica da fonte que apóia sua conclusão Ao forçar o EI a combinar sua afirmação palavra a palavra com um texto existente, você reduz significativamente sua capacidade inventar detalhes no meio Estratégia três: use formatos de saída estruturados. Solicitar resultados estruturados pode ajudar a minimizar as alucinações forçando o modelo de IA pode ajudar a minimizar as alucinações , forçando o modelo de IA a organizar as informações de forma mais sistemática. Por exemplo, analise esses dados de vendas usando a seguinte estrutura, pontos de dados verificados, números diretos do documento, métricas calculadas, mostre seus cálculos, interpretações, claramente identificados como interpretações, e incertezas, áreas em dados Estratégia quatro. Implemente etapas de verificação. Inclua etapas de verificação diretamente em suas solicitações para aprimorar a precisão e a confiabilidade das respostas Por exemplo, você pode pedir uma lista todas as suposições feitas durante a análise, destacar áreas nas quais ela tem menor confiança ou certeza Recomende informações adicionais que possam ajudar a validar suas conclusões Essa abordagem garante saída mais completa e transparente, facilitando a avaliação da qualidade da resposta. Agora que você tem todas as informações sobre alucinações de IA, reserve um momento para revisar uma de suas Como você pode modificá-lo usando as estratégias que acabamos de abordar? Lembre-se de que o objetivo não é eliminar completamente as alucinações, mas criar um fluxo de trabalho em que elas tenham menos probabilidade de impactar seus resultados Compartilhe sua solicitação original e revisada na seção de perguntas e respostas deste vídeo E, como sempre, vamos recapitular brevemente os pontos-chave desta palestra alucinações de IA acontecem quando modelos de linguagem geram falsas, mas plausíveis alucinações acontecem porque a IA é uma contadora de histórias confiante que prioriza uma conversa tranquila em vez de comparar seu trabalho com um livro didático ou fatos Os sinais de alerta de alucinações incluem detalhes excessivamente específicos, citações com som perfeito, respostas inconsistentes e declarações excessivamente definitivas incluem detalhes excessivamente específicos, citações com som perfeito, respostas inconsistentes e declarações excessivamente definitivas. Seja explícito sobre a incerteza nas instruções para incentivar a IA a reconhecer suas limitações Solicite citações e raciocínios para verificar os resultados da IA e Use formatos de saída estruturados para minimizar as alucinações organizando as informações de forma sistemática Incorpore etapas de verificação nas solicitações, como destacar incertezas Tudo bem. E é isso para esta palestra, e nos vemos no próximo vídeo 16. Como trabalhar com tela Gemini e pedras preciosas: introdução da seção: Bem-vindo à próxima seção. Até agora, você deve ter um bom entendimento de como falar com geminianos Embora continuemos desenvolvendo esses fundamentos, é hora de subir de nível. Estamos indo além das instruções básicas de ida e volta para explorar o Canvas e os jams Começaremos com o Canvas, um espaço de trabalho lado a lado onde você pode editar texto, comparar versões e repetir seu Não comece do zero toda vez e faça muito mais. Então, aprenderemos geleias. Eles são como especialistas personalizados que se lembram de suas regras específicas, para que você não precise repeti-las. Vamos construir dois deles juntos, gramatical e ortográfico Este jam atua como um editor profissional para lucrar com sua escrita mantendo sua voz inalterada e um preparador físico de IA, pode assistir seus vídeos de exercícios, verificar sua segurança em seu formulário e até mesmo criar fundo motivacionais personalizados para Ao final desta seção, você não estará apenas enviando solicitações. Você criará sua própria equipe pessoal de especialistas para transformar suas ideias rápidas em trabalhos finalizados ou para automatizar suas rotinas Vamos começar. 17. Boas-vindas à tela Gemini: Todo mundo. Bem-vindo de volta à primeira palestra desta seção Até agora, vimos a interface de bate-papo padrão do Gemini, como aquelas com as quais estamos acostumados a trabalhar em diferentes mensageiros É ótimo para fazer uma pergunta rápida, receber feedback ou fazer um brainstorming Mas pode parecer um pouco limitado quando você está trabalhando em um documento totalmente novo. Ou um conteúdo que precisa de várias revisões. Isso ocorre porque, quando você está redigindo algo complexo, você precisa de mais do que uma conversa de ida e volta Você precisa de um espaço de trabalho com várias ferramentas de edição. É aí que entra o Gemini Canvas. Pense no Gemini Canvas como um espaço de trabalho colaborativo. Em um bate-papo padrão, o EIS fornece uma resposta e, se você quiser alterar uma frase, geralmente precisará pedir que tudo seja reescrito No Canvas, o Gemini abre uma janela lado a lado. À esquerda, você tem seu bate-papo. À direita, você tem um documento vivo. Não é mais apenas um chatbot , é um editor sentado ao seu lado Você pode clicar no texto, alterar as palavras sozinho ou destacar um parágrafo específico e contar a Gemini Faça apenas esta punção parcial. Se isso soa bem, espere até ouvir isso. O Canvas não serve apenas para escrever, é também para construir. Direto do menu da interface, você pode gerar páginas da web, infográficos visuais para dados complexos e até mesmo ferramentas de estudo, como questionários Para quem prefere ouvir. Há visões gerais em áudio que criam resumos de suas descobertas no estilo podcast Talvez o mais impressionante seja que você possa gerar miniaplicativos funcionais Basta descrever uma ferramenta como um organizador de receitas para a família ou um calendário pessoal e o Canvas criará e executará o código para você em tempo real Você não precisa saber programar. Você só precisa descrever o que a ferramenta deve fazer em um processo agora conhecido como codificação vibe Agora, como o Canvas é tão poderoso, pode ser tentador começar a criar aplicativos e jogos No entanto, vamos dar um passo de cada vez. Por enquanto, nesta seção do curso, vamos nos concentrar inteiramente na elaboração de documentos Usando uma empresa imaginária de colchões de IA como nosso exemplo, veremos como usar o espaço de trabalho do Canvas para refinar uma narrativa e gerar suporte e recursos visuais Depois de dominarmos a criação de documentos, passaremos para os recursos mais avançados, como criação de aplicativos interativos e prototipagem rápida, posteriormente no curso Na próxima lição, mostrarei como abrir a interface do Canvas e começaremos nosso primeiro rascunho colaborativo Te vejo na próxima. 18. Acompanhe: como criar e editar documentos no Gemini Canvas (parte 1): Conforme prometido neste vídeo, vamos colocar a mão na massa. Exploraremos como navegar na área de trabalho do Canvas, como fazer edições direcionadas usando o recurso ask Gemini, alteraremos partes específicas do documento sem reescrever todo o Também daremos uma olhada nas ações rápidas para alterar coisas como tom e tamanho do documento. Finalmente, vamos nos tornar multimodais. Daremos vida à marca com logotipos e imagens de produtos gerados pela EI. Vamos mudar para o Gemini para a demonstração. Vamos começar mudando para o modo Canvas. Para isso, estou clicando em Ferramentas e escolho Canvas na janela pop-up. Vamos também mudar o modelo para o pensamento. E vou começar com um amplo prompt de conversação. Aqui está o que vou digitar. Eu dei a Gemini um pouco de contexto em termos do que estou prestes a fazer Eu forneci a tarefa. Eu disse que preciso de uma breve descrição da empresa e do novo produto que essa empresa está prestes a lançar. Também forneci detalhes sobre o estilo. Eu quero que Gemini atenda. Vamos pressionar Enter e ver o que Gemini escreverá. Ele está abrindo a área de trabalho do Canvas com o bate-papo no lado esquerdo e com o texto no lado direito Vemos aqui que ele criou a descrição da empresa, incluindo nome , motor e uma breve visão geral do que a empresa está fazendo. seguir, temos as informações sobre o produto, incluindo as principais características do colchão, e ele até sugeriu alguns objetivos de brainstorming para minha Perfeito. Vamos explorar esse espaço de trabalho no lado direito No topo da área de trabalho, você pode ver primeiro algumas ferramentas de edição Por exemplo, você pode alterar o estilo do título do seu texto. Você pode adicionar uma lista com marcadores ou um número na lista, ou até mesmo algumas fórmulas aqui Se quiser, você pode imprimir esta página. um documento PDF, e há outras funções aqui que exploraremos um pouco mais tarde neste e nos seguintes tutoriais A verdadeira mágica nesse espaço de trabalho é o recurso ask Gemini Digamos que você queira fazer uma alteração em uma parte do seu texto. E em vez de pedir um rascunho totalmente novo no chat, você pode simplesmente destacar a parte que deseja editar e depois escrever sua solicitação para o Gemini Por exemplo, eu gostaria de mudar a localização do escritório da empresa. Então, o que vou fazer é destacar este texto e incluir apenas minhas instruções para a mudança que quero que o Gemini faça Veja, a Gemini fez a alteração e incluiu esse novo texto diretamente no documento E na barra lateral esquerda, vemos que ela incluía o texto informativo e até mesmo alguma descrição dessa alteração Deixe-me folhear este texto e ver que tipo de edições eu gostaria de fazer além da localização do escritório M Posso continuar trabalhando nesse documento e indo e voltando, incluindo as mudanças, até o momento em que ficarei totalmente satisfeito com o texto. Francamente, eu uso o Canvas para criação de documentos por causa desse recurso ask Gemini Como na maioria dos casos, preciso ajustar uma parte muito específica de um documento. No entanto, aqui está o que descobri após semanas de experiências com ele Como o Gemini está se concentrando nessa parte específica de um documento, às vezes perde o panorama geral Percebi casos em que ele repete frases usadas em outras partes do documento ou traz termos que não são introduzidos até mais tarde Então, definitivamente, faça uma revisão rápida do seu trabalho para garantir que tudo se encaixe. E isso é tudo na primeira parte deste tutorial. E nos vemos na segunda. 19. Acompanhe: como criar e editar documentos no Gemini Canvas (parte 2): Bem-vindo à segunda parte do tutorial, onde exploramos o Gemini Canvas para criação de documentos Além de perguntar a Gemini, existem ações rápidas que você pode achar úteis para fazer alterações em seu texto A primeira ação rápida é alterar o comprimento. Isso é ótimo se você precisar expandir rapidamente uma seção com mais detalhes ou reduzi-la a um resumo detalhado. Digamos que queremos alterar o tamanho do nosso texto, eu estou clicando nesse botão e, em seguida, preciso escolher o tamanho que eu gostaria para o meu novo texto. Digamos que eu queira que seja mais longo do que o atual e vamos aguardar as mudanças. E Gemini expandiu esse texto. Você vê que ele destacou o novo texto na cor azul aqui. Vamos voltar aos botões de ação da semana. E o segundo é para mudar o tom. Portanto, caso você queira parecer mais profissional ou , por outro lado, um pouco mais falador, esse é o botão que o ajudaria a mudar o clima de sua escrita com literalmente apenas um Vamos selecionar a mudança de tom, e eu posso ir do formal ao muito formal ou casual e muito casual. Francamente, estou bem com o tom atual do texto, mas, por exemplo, vamos torná-lo um pouco mais formal para o propósito desta demonstração Vemos que Gemini mudou quase todo o fragmento do texto aqui. Eu preferiria voltar para a versão anterior. Mas acho que você entendeu o que essa opção de mudança de tom pode fazer. Então, estou retornando à versão anterior do documento. E, por fim, também há a função de sugerir edições. É como ter um corpo de escrita. O Gemini lhe dará feedback e mostrará maneiras de melhorar sua escrita sem alterar o texto original imediatamente. Vamos tentar essa função também. Tudo bem, ótimo Vemos que o Gemini incluiu algumas mudanças nas informações sobre o motivo dessa mudança Se eu estiver bem com todas essas mudanças, posso aplicá-las todas. Se você não gostar da sugestão do Gemini e quiser retornar à versão anterior do documento, você pode dizer isso ao Gemini diretamente aqui no chat Legal. Então, vamos clicar em Aplicar para as sugestões restantes para que possamos mantê-las na nova versão do documento. Tudo bem. Vamos continuar a demonstração. E, na próxima etapa, quero criar alguns recursos visuais para mostrar capacidades multimodais do Teremos uma seção dedicada à criação de conteúdo visual posteriormente no curso. Então, por enquanto, vou digitar um prompt direto muito curto E deixe-me pressionar Andrew para ver os resultados. E aqui está a primeira imagem. É incrível que a Gemini tenha até incluído o nome do produto aqui em um lado do colchão Gemini também me diz que ele só pode gerar uma imagem por vez Está me perguntando se eu gostaria de continuar com o logotipo da empresa. O Gemini está ficando muito bom em incluir textos nas imagens E vamos pedir vários recursos visuais . Ótimo. E você vê por que é importante criar imagens nesse mesmo bate-papo em que criamos o texto original. Gemini usa o contexto das conversas anteriores para criar a imagem Você vê que foram necessárias informações sobre um ângulo de três graus, embora esse ângulo pareça um pouco maior para mim. Mas tudo bem. Podemos ajustar isso por meio iterações trabalhando nessa imagem Também incluiu o nome do colchão aqui. Vamos criar a quarta imagem. Isso é incrível. Você vê que, na descrição, temos a informação de que esse recurso cria uma cúpula de ar limpo sobre as travessas, e é exatamente isso que vemos aqui na foto. Incrível. E vamos verificar o texto. Umidade ideal, qualidade do ar. Sim, e o texto está correto. Não vejo nenhum erro aqui. Tudo bem, vamos terminar este tutorial antes que fique muito longo. Continuaremos trabalhando com o texto e as imagens em nosso próximo vídeo. 20. Acompanhe: transformando um esboço de Gemini em um PDF polido com o Gamma: Agora temos a história de fundo da nossa marca, características do produto e as imagens organizadas no Gemini Pense nisso como nosso estúdio de desenho. O espaço para o pensamento e a escrita fundamentais. No entanto, nosso rascunho de trabalho não está concluído. Se você precisar apresentar isso a um gerente ou cliente como um relatório profissional, precisamos mover esse conteúdo para uma ferramenta de design dedicada, como o Canva ou o Gamma App Você pode pensar: não posso simplesmente pedir ao Gemini que gere o PDF para mim? Boa pergunta. E sim, essa também era minha intenção quando recebi a tarefa de criar o PDF final. Veja como o Gemini lida com isso. Se você tentar criar PDF no Canvas, não obterá o documento final. A ferramenta Canvas foi criada para edição e colaboração ao vivo, não para publicação. Como ele opera em um espaço de trabalho privado, ele não pode ver seus arquivos de imagem locais para incluí-los no documento Se você tentar exportar daqui, verá um arquivo com espaços reservados vazios onde suas imagens deveriam estar Claro, você também pode tentar um bate-papo normal. É mais funcional. Ele pode gerar arquivos em segundo plano para fornecer um PDF para download No entanto, ele carece do controle de layout e polimento necessários para uma apresentação profissional. Aqui está o PDF que o Gemini criou para mim. É um bom começo, mas exigiu uma formatação manual significativa para ter a aparência correta Então, para deixar nossa apresentação pronta, em que o texto flua corretamente em torno das imagens e a marca seja consistente, passamos do estúdio de desenho para um estúdio de design No próximo tutorial, usarei o aplicativo Gamma para demonstrar isso É minha principal ferramenta há quase um ano e é o que eu uso em quase todo o meu trabalho de design. No entanto, os mesmos princípios se aplicam a outras plataformas semelhantes, como Canva ou Adobe Vamos voltar para Gêmeos e preparar nosso conteúdo para a mudança Vamos transferir nossos ativos, texto e imagens para o aplicativo Gamma. Vou começar copiando o texto. Para isso, clicarei no botão Compartilhar e Exportar. E a partir daqui, vou escolher Copiar conteúdo. E eu já baixei as quatro imagens que geramos no tutorial anterior Então, tudo está pronto para mudarmos para o Gamma. Vamos abrir o aplicativo Gamma. Aqui está a página principal do Gamma. A parte central é a grade de conteúdo. Essa área exibe nossos projetos, também chamados de Gammas. A barra superior aqui é para criar novos documentos. No lado esquerdo, temos modelos. Aqui, podemos acessar layouts predefinidos para iniciar nosso design de apresentação Temos coisas úteis como imagens MAI. Onde podemos visualizar e usar imagens que geramos usando a ferramenta de imagem EI integrada Gammas Também podemos criar pastas para separar nossos materiais por temas ou tópicos específicos. Então, vamos direto para a criação de um arquivo PDF. Vou escolher Criar novo com IA. E aqui temos opções diferentes. Como já temos um texto, que copiei do Gemini, vou escolher essa opção de colar no texto E aqui vou incluir o texto de Gêmeos. A seguir, temos várias opções sobre o que o aplicativo Gamma pode fazer com nosso conteúdo E é importante que escolhamos preservar esse texto exato. O que significa que a Gamma não fará nenhuma modificação em nosso rascunho Esse é o método mais eficaz para nosso exemplo, pois nos permite usar o Gemini para o trabalho pesado de pensar e redigir e, em seguida, usar Gamma para lidar com a formatação e o embelezamento Vou selecionar continuar para solicitar o editor aqui. Aqui podemos escolher temas diferentes para nossa apresentação. Vamos escolher esse e clicar em Selecionar tema. Antes de clicarmos em Gerar, observe os dois modos na parte superior, formato livre e cartão por cartão. Deixe-me explicar rapidamente a diferença. Quando você escolhe cartão por cartão, Gamma divide automaticamente seu conteúdo em slides numerados separados Uma ideia por cartão, mas você ainda pode reorganizar os cartões ou adicionar novos. É perfeito para apresentações. O Reform mantém tudo como um documento de fluxo contínuo, mais parecido com um relatório do que com uma apresentação de slides Mesmo conteúdo, mas é lido de cima para baixo sem desgostos entre as seções Isso lhe dá mais controle sobre o layout e o fluxo. É ótimo para documentos ou relatórios. Para nossa demonstração, escolherei o formato livre porque quero que nosso texto e imagens fluam juntos naturalmente E vamos clicar em gerar. O Gamma começa a criar nossos slides. Em primeiro lugar, o que eu costumo fazer é pedir ao Gamma que sugira vários outros layouts para que eu possa comparar o layout padrão com outras Então, para isso, clico no botão Editar com agente e, a partir daqui, escolho Testar novo layout. Vamos dar mais uma volta para ver se há algo melhor do que nossa primeira opção padrão. Acho que vou escolher esse. Eu gosto dessa imagem de fundo aqui. Vamos para o próximo slide. Incluirei a imagem do nosso logotipo em vez desta. Para mudar a imagem, vou clicar nessa. Em seguida, vou para Editar imagem. E a partir daqui, estou escolhendo o upload da imagem ou o URL. Eu tenho minhas imagens no meu Drive local. E aqui vamos nós. Essa é nossa primeira imagem. Vamos anexá-lo. Perfeito. Vamos para o terceiro slide. Tudo bem, estamos prontos para ir. Vamos fazer a verificação final e dar uma olhada rápida em todos os nossos slides. Para exportar esse arquivo, clicamos no ícone de três pontos. Aqui escolhemos Exportar e eu vou exportar para PDF. Vamos abrir o arquivo imediatamente e vamos lá. Parece legal. Portanto, essa é minha maneira favorita de trabalhar quando se trata de criar novos documentos. Deixei que a Gemini fizesse a parte do pensamento criativo e depois deixei minha ferramenta de design preferida, e depois deixei minha ferramenta de design preferida como a Gamma, fazer com que parecesse uma boa Espero que você tenha gostado desse tutorial e, como sempre, nos vemos no próximo. 21. O que são joias gêmeas e por que precisamos delas?: Todos, quando vocês começam a usar o Gemini regularmente, percebem rapidamente que há certas coisas para as quais o usam repetidamente, seja para fazer um brainstorming, obter feedback ou gerar novos conteúdos Vocês podem se pegar digitando mesmas instruções e fornecendo o mesmo contexto repetidamente, o que pode começar a parecer um pouco repetitivo, que pode começar a parecer um pouco repetitivo percebem rapidamente que há certas coisas para as quais o usam repetidamente, seja para fazer um brainstorming, obter feedback ou gerar novos conteúdos. Vocês podem se pegar digitando as mesmas instruções e fornecendo o mesmo contexto repetidamente, o que pode começar a parecer um pouco repetitivo, como o seu próprio digital versão do dia da marmota. Bem, hoje estamos encerrando esse ciclo. Vamos explorar um recurso que permite empacotar essas instruções repetitivas e transformá-las em sua equipe de especialistas em IA ou assistentes pessoais Eles são chamados de Gemini Gems. E, não, não estamos falando de diamantes aqui. Porém, quando você vê quanto tempo eles economizam, você pode pensar que eles são igualmente valiosos. Então, o que exatamente é um Pense neles como versões personalizadas do Gemini criadas para ajudá-lo a lidar com tarefas repetitivas ou obter profundo conhecimento em áreas específicas Quando você conversa com Jam, Gemini se lembra automaticamente de suas metas e diretrizes , evitando que você se repita em Portanto, enquanto um geminiano padrão é como um bibliotecário, que sabe onde está tudo, uma joia é como um especialista dedicado Ele não sabe apenas sobre um tópico. Ele segue suas regras específicas para realizar trabalhos para você. Existem três tipos de geleias, geleias pré-fabricadas. Essas são ferramentas prontas para uso criadas pelo Google. Você não pode ver ou editar sua lógica subjacente. Você só pode fixá-los na barra lateral para acesso rápido. Eles geralmente têm interfaces exclusivas, como o layout do livro de histórias de dez páginas que os jams regulares simplesmente não conseguem imitar Geléias personalizadas. Esse é o foco dos nossos próximos tutoriais, porque você mesmo os cria. Você fornece as instruções e pode carregar até dez arquivos pessoais para atuar como base de conhecimento do Jams É a diferença entre um assistente geral e um especialista dedicado, adaptado especificamente aos seus dados e às suas metas. Geléias em Opal. O Ople é um projeto experimental que leva a IA além de simples janelas de bate-papo Esses tambores são miniaplicativos interativos que seguem um fluxo de trabalho específico Seu recurso de destaque é a capacidade de remixá-los. Você pode usar uma ferramenta pré-construída, como um estilista de moda e modificar suas etapas internas para criar algo novo Eles são altamente visuais e podem gerar texto, imagens e vídeos simultaneamente. Vamos explorar essas barragens nas seções posteriores do curso. Agora, como já trabalhamos com o Canvas, agora você pode ter uma pergunta lógica. Como um Jam é realmente diferente? A chave é pensar no Canvas como seu espaço de trabalho compartilhado. É a mesa colaborativa onde você e o EI trabalham lado a lado em documentos ou códigos longos Gems, por outro lado, são seus especialistas táticos Você usa um tambor para produzir o rascunho inicial, como gerar uma primeira versão especializada com base nos dados enviados, e depois transfere esse trabalho para o Canvas para refiná-lo e aprimorá-lo Um é o especialista, você solicita a saída inicial. A outra é a mesa onde o projeto é concluído. Obviamente, você também pode usar a bateria sozinha para determinadas tarefas, e isso nos leva à nossa próxima palestra subsequente Mas antes de começarmos a trabalhar com bateria, vamos recapitular brevemente o que aprendemos aqui Tudo bem E isso é tudo para este vídeo. Te encontro na próxima. 22. Acompanhe: criando uma joia de verificação de gramática: Todos, e bem-vindos ao nosso primeiro tutorial sobre Gemini Gems Hoje, vou mostrar como criar um especialista personalizado para revisar sua redação, seja redigindo páginas de destino, descrições de produtos, e-mails rápidos ou qualquer outro É como ter um segundo par de olhos que lhe dá total confiança em cada palavra que você compartilha. Vamos abrir o Gemini para criar esse Jam. Vamos começar clicando em Jams. Na barra lateral, acessamos o Jam Manager aqui, a seção em que criamos gemas personalizadas E aqui eu vou clicar em New Jam. Vamos começar fornecendo o nome do nosso Jam. Aqui está a descrição da minha gema. Em seguida, incluí minhas instruções. Essa é, de longe, a parte mais importante da sua joia. Incluí a descrição da função, dizendo que você é especialista em verificar gramática, ortografia e pontuação em textos em inglês e corrigi-los se encontrar algum erro. Em seguida, forneço uma descrição do público-alvo Se você acompanhar e criar o mesmo tipo de joia, poderá alterar o público-alvo para algo que seja mais relevante para seu caso de uso Em seguida, temos as regras básicas seguidas pelas informações sobre a saída que estamos procurando e também temos um prompt inicial Você vê que eu estou usando hash tags no texto da instrução. Eles funcionam como divisores de seção que criam um esqueleto limpo para suas instruções Eles tornam o cérebro de Gems mais organizado para que a IA saiba onde uma regra termina e a próxima começa Agora vamos voltar ao conjunto de regras e discuti-las. Como eu realmente crio essa lista? É altamente recomendável realizar a tarefa que você deseja automatizar três a cinco vezes manualmente antes mesmo de tentar criar o congestionamento Se você seguir direto as instruções, pode parecer intimidante Cada regra nessa lista existe porque é uma preferência específica. Descobri ao longo de semanas solicitando manualmente a IA. Você também pode notar que estou usando palavras no registro de copos, como por exemplo, aqui. Não há requisitos técnicos para usá-los. Gêmeos é muito sofisticado. Ele entende letras minúsculas, assim como letras maiúsculas. Mas descobri que usá-los ainda é útil. Pense nessas palavras como palavras poderosas. Podemos usá-los para destacar as regras não negociáveis, para que a IA saiba exatamente o que é obrigatório versus talvez Tudo bem, vamos seguir em frente. Por enquanto, estou bem com essas instruções, embora sempre possamos voltar a essa lista depois de criarmos essa jam e editá-la posteriormente. Também podemos escolher uma ferramenta padrão. Essa ferramenta será selecionada quando você iniciar a nova conversa com o Jam. Vou escolher o Canvas como a ferramenta padrão. Em vez de uma conversa confusa no bate-papo, seu texto direcionado deslizará para fora em um painel lateral limpo, perfeitamente formatado e pronto para copiá-lo Você também pode incluir arquivos na base de conhecimento se quiser que seu jam faça referência a qualquer fonte externa. Ao preparar a resposta, você vê que podemos fazer upload de arquivos de diferentes fontes aqui. Mas para esse exemplo específico, vou deixá-lo vazio. E estamos prontos. Então, vamos salvar a mãe. Estou clicando no botão Salvar. E podemos começar nosso novo bate-papo. Aqui está o texto que eu quero que Gemini verifique. Eu cometi vários erros gramaticais aqui de propósito. Então, vamos ver se ele será capaz encontrá-los e corrigir esse rascunho. Está abrindo uma tela com nosso novo texto. Parece ótimo para mim. E lembre-se de que você pode usar essa interface do Canvas para fazer algumas edições rápidas nesse texto, caso queira introduzir algumas alterações aqui, por exemplo, vamos destacar reconciliar e pedir para encontrar uma alternativa. E se concordarmos com essas edições, podemos clicar em Compartilhar e exportar, escolher copiar conteúdo ou podemos optar por exportar esse texto diretamente para o nosso Google Docs. Deixe-me voltar ao nosso JAM, você vê que o temos na lista de joias aqui na barra lateral esquerda Uma coisa que notei não há como iniciar uma conversa aqui Então, quando abri essa interface, não está muito claro para mim o que devo fazer aqui? Eu fiz algumas pesquisas e encontrei este artigo com exatamente a mesma pergunta. Descobriu-se que esses iniciadores de conversa não são suportados por gemas no momento Também há uma solução alternativa que podemos tentar. O artigo diz que você pode simular instruções iniciais como essa, incluindo uma descrição adicional em Certo, vamos tentar incluir um exemplo de um iniciador de conversa para ver se isso vai ajudar Estou voltando para o meu Jam. Se eu clicar nos três pontos, CN, posso escolher a opção Editar e podemos fazer as alterações aqui que quisermos Deixe-me incluir este exemplo abaixo da versão atual das instruções. E o que também podemos fazer aqui, além de incluir um exemplo de nosso prompt inicial, podemos usar esse botão mágico para que Gemini reescreva nossas instruções e as aprimore Vamos experimentar isso. Talvez isso ajudasse. Vejo que o Gemini removeu nosso exemplo do prompt inicial. O que decidi fazer incluir a regra número seis, pedindo aos geminianos que sempre iniciassem a conversa com o seguinte prompt inicial Vamos ver se isso vai funcionar. Então, vou atualizar minhas instruções de gemas, salvá-las e vamos testar. Quando abri meu Jam atualizado, ainda não tinha nenhuma conversa para iniciar uma conversa aqui Infelizmente, todos os meus outros experimentos com instruções definidas de Jams para adicionar o iniciador de conversa não tiveram sucesso. Diante disso, vamos definir a descrição do jam para fornecer informações sobre o que um usuário precisa fazer para iniciar a conversa. Para isso, vamos retornar à interface de edição do JAMS. Incluí enviar seu texto para começar. Texto no final da descrição do Jam, vou atualizá-lo e vamos testá-lo novamente. Nossa instrução está aqui, e vamos enviar outra coisa para variar. Eu tenho esse fragmento. Vamos ver como Gemini vai lidar com isso. Perfeito. E se eu estiver de acordo com essa jam e quiser compartilhá-la com meus amigos ou colegas, posso clicar no botão Compartilhar e escolher Compartilhar. Jim e eu criaremos um link. Eu posso copiá-lo e depois enviá-lo. Deixo o link para essa confusão nos recursos deste vídeo, caso você queira testá-lo. E eu vou te encontrar no próximo tutorial onde vamos construir o personal coach Jam 23. Acompanhe: Criando uma joia do treinador de fitness (parte 1): Agora vamos criar uma jam que funcione com vídeo. Digamos que eu esteja fazendo um desafio de treino online de 28 dias no aplicativo e quero saber se estou realmente melhorando a cada dia. Vou me gravar fazendo os exercícios diários e pedir feedback ao meu preparador físico de IA como uma palavra de cautela, como já discutimos, embora a IA seja uma boa parceira para monitorar seu movimento e forma, ela não é um especialista médico. Sempre consulte o profissional de saúde antes de iniciar o novo programa de condicionamento físico. Essa ferramenta é para treinamento e progresso, não para aconselhamento médico Ok, vamos abrir o Gemini para começar a demonstração. Vamos criar um novo Jem. Estou expandindo esse menu. Vá até Jams. Aqui vemos geleias feitas por laboratórios. Estou rolando para baixo até Jam Manager. Eu já tenho a revisão gramatical e ortográfica Jam visível aqui na lista das minhas E, por enquanto, deixe-me criar um novo. Estou clicando em New Gem. Vamos fornecer o nome, a descrição e as instruções para nosso treinador de IA personalizado Jam. Eu incluí essa descrição. Essa jam analisa seus vídeos de treino para fornecer feedback detalhado sobre o desempenho e cria fundos de telefone motivacionais verticais personalizados fundos de telefone motivacionais verticais para manter você inspirado E aqui estão minhas instruções. Então, como sempre, comecei descrevendo o papel. Quero que essa música toque. No nosso caso, eu queria ser preparador físico profissional. Em seguida, incluí uma tarefa para essa geléia. Estamos pedindo à Gemini que analise nossos vídeos de treino, procurando dicas de engajamento e segurança, como Cin ou Domin, e eu também descrevi que quero que a Gemini crie uma imagem vertical com uma Também incluí os prompts iniciais, embora tenhamos visto que prompts iniciais não estão funcionando bem Mesmo assim, vamos verificar o que acontecerá dessa vez. E para tornar esse drama verdadeiramente pessoal, vou enviar uma imagem para a base de conhecimento que representa a vibração da imagem motivacional que eu quero que a Gemini Estou clicando no botão Mais. Eu tenho meu arquivo de referência no meu Drive local, então vou escolher Enviar arquivos. Esta é minha pasta, e essa é a citação motivacional que eu selecionei Obviamente, você também pode incluir outros arquivos aqui, por exemplo, caso tenha um trabalho de pesquisa que queira que esse jam analise ao fornecer as recomendações e não apenas usar seu conhecimento geral, sempre poderá fazer o upload desse arquivo aqui. E em termos de ferramenta padrão, para esse jam, não vou escolher nada aqui. Isso ocorre porque nosso preparador físico está fazendo duas coisas muito diferentes. Ele nos dá feedback em texto e cria uma imagem de alta resolução. Portanto, ao permitir que a Gemini escolha a melhor ferramenta para cada tarefa, garantimos que os planos de fundo do telefone tenham uma aparência nítida e nosso feedback seja entregue sem problemas técnicos Tudo está bem aqui. Estamos prontos para clicar em Seguro. A propósito, observe que também há essa janela de visualização que você pode usar para testar suas instruções antes de salvá-las. Mas no meu caso, eu já fiz o primeiro teste antes de começar a gravar esse tutorial, então estou pronto para começar. Vou clicar em Seguro e começar nosso bate-papo. Enviei meu primeiro vídeo do primeiro dia do meu treino e vamos esperar um pouco até que o Gemini o processe Nosso vídeo foi enviado e, antes de pressionarmos Enter, vamos falar sobre a seleção de modelos aqui. Então, como esse congestionamento envolve análise multimodal, exibição de vídeos, verificação de filas de segurança e fornecimento de feedback estruturado, escolherei um modelo de pensamento que priorize E estamos todos prontos aqui, e eu vou apertar Enter. E aqui estão as recomendações da Gemini. Em primeiro lugar, gosto muito que nos diga que essas informações são apenas para fins informativos E para aconselhamento médico ou diagnóstico, devemos consultar o profissional. Isso é totalmente verdade. Observe que ele identificou com sucesso que esta é minha sessão de treino do primeiro dia . Por causa do nome relevante desse arquivo, havia um treino do primeiro dia no nome. Aqui está o scorecard, o que eu acertei em cheio e uma coisa Eu posso concordar com isso. E depois, há uma pergunta. Você gostaria que eu criasse seu plano de fundo personalizado de motivação diária para telefone, com base no seu progresso no primeiro dia? Sim, definitivamente, sim. Então, vamos responder. Sim. E aqui vamos nós. Temos essa citação perfeita, mas há um problema com essa imagem. Se a compararmos com minha imagem de referência original, descobriremos que elas não são iguais. Aqui está uma imagem que pedi que Gemini criasse. Você vê que o plano de fundo é completamente diferente. Então, vamos voltar à nossa tarefa e trabalhar com o Gemini para ver se podemos mudar isso e garantir que ele crie imagens com fundo semelhante ao nosso arquivo de referência 24. Acompanhe: Criando uma joia do treinador de fitness (parte 2): Bem vindo de volta. Na primeira parte deste tutorial, configuramos a lógica central do nosso preparador físico Jam. Mas nos deparamos com uma limitação. Embora tenhamos enviado uma imagem de referência para a base de conhecimento que gerava motivação diária, os planos de fundo não se pareciam em nada com a nossa imagem original Vamos corrigir isso entendendo como o sistema realmente processa esses diferentes tipos de dados. Já mencionei antes que Gêmeos é multimodal. Ele pode ver, ler e ouvir tudo ao mesmo tempo. Tudo isso é verdade. No entanto, há uma diferença técnica em como uma gem lê um arquivo e como ela cria uma imagem. Quando aplaudimos uma referência à base de conhecimento, o Gemini usa sua capacidade de visão para analisar o arquivo e resumi-lo em dados baseados em texto para sua memória de longo prazo Mas quando o am gera uma nova imagem, ele aciona um modelo de geração de imagem separado De acordo com a documentação técnica da Gemini, esse modelo de geração não pode ver diretamente os pixels brutos dos arquivos da sua base de conhecimento Ele recebe apenas um prompt baseado em texto. Se suas instruções simplesmente disserem que correspondem ao estilo na base de conhecimento, a IA está trabalhando a partir de um resumo, não da fonte original, e o estilo original se perde. Para resolver isso, passamos da referência para a especificação. Em vez de mostrar ao jam um arquivo e esperar que ele interprete o estilo corretamente, vamos escrever uma especificação visual diretamente nas instruções Isso garante que toda vez que a jam criar uma imagem, ela siga suas regras exatas sem qualquer suposição Veja como fazemos isso. Acesse sua lista de Jams, encontre aquela que você gostaria de editar e clique no ícone de edição E a partir daqui, siga suas instruções. Na seção de motivação, vamos remover essa instrução vaga Em seguida, adicionaremos uma descrição para nossa imagem para criá-la, abriremos um bate-papo separado, aplaudiremos sua imagem de referência e usaremos esse prompt Eu sugiro mudar para o modelo de pensamento aqui de acordo com os resultados. Depois de ter a descrição da imagem, cole-a diretamente nas instruções do Jams Aqui está a descrição que tenho para minha imagem de referência. Isso define o layout, os telefones e a atmosfera. Portanto, o modelo tem um conjunto claro de grades de proteção. Depois de fazer isso, podemos clicar em Atualizar para salvar as alterações. Deixe-me começar um novo gráfico para testar as mudanças que acabamos de fazer. R Você vê que nossa nova imagem e a de referência não são iguais, mas muito semelhantes em seu layout, hierarquia visual e estética geral, um livro didático de vidro fosco sobre uma paisagem urbana em tons pastel ao entardecer. Você vê que nossa nova imagem e a de referência não são iguais, mas muito semelhantes em seu layout, hierarquia visual e estética geral, hierarquia visual e estética geral livro didático de vidro fosco sobre uma paisagem urbana em tons pastel E isso é tudo para este tutorial. Por favor, escreva nos comentários deste vídeo em que jam você está planejando trabalhar. E eu vou ver no vídeo a seguir. 25. Gemini para criação visual: introdução da seção: Bem-vindo a esta nova seção do curso. Você já me viu criando algumas imagens com o Gemini no início do curso e agora é hora de entrar nos detalhes Vamos usar as ferramentas de imagem e vídeo da Gemini para um test drive adequado E eu acho que essa é uma das partes mais visuais de todo o curso. Começaremos com a geração de imagens e não apenas com o básico. Eu vou te mostrar como usar técnicas como mesclagem contextual Onde você combina imagens de referência para criar algo completamente novo e um refinamento iterativo, onde você direciona gêmeos como um fotógrafo ajustando um elemento vez até obter exatamente a foto desejada Também analisaremos a síntese visual, na qual você entrega vários ingredientes ao Gemini e o deixará criar uma única cena perfeita A partir daí, entraremos no que chamo de suíte de edição, onde usaremos o Gemini para trabalhar com imagens que você já tem pense em restaurar fotos antigas, transformar esboços em fotos de produtos e fazer edições precisas usando a ferramenta de marcação de construção da Gemini Em seguida, analisaremos a criação sistemas visuais completos, infográficos, fluxogramas e ativos adaptados para diferentes plataformas e tamanhos de tela Concluiremos esta seção com o tutorial sobre criação de vídeos. E, claro, também compartilharei minhas principais dicas e recomendações práticas que desenvolvi trabalhando com o Gemini, outro software de geração de imagens e vídeos de IA que ajudarão você a obter melhores resultados Tudo bem. Vamos ser criativos. 26. O que é uma nanobanana? Principais características explicadas: Você deve ter notado um pequeno moja de banana estranho aparecendo em seu aplicativo Gemini Não é apenas um ícone fofo. É uma pequena pista de uma história engraçada de nomenclatura por trás desse modelo Antes do lançamento oficial desse modelo, Google o submeteu para testes anônimos em uma plataforma chamada ALM Arena, um site público em que as pessoas comparam dois modelos de IA lado a lado e votam no resultado que preferem sem saber qual modelo é qual é a forma como os laboratórios de IA coletam feedback do mundo real antes de um lançamento completo O modelo precisava de um nome de espaço reservado, algo que não sugerisse que fosse um produto do Google para enviá-lo ao site da LM Arena Às 2:30 da manhã, a gerente de produto do Google chamada Nina digitou Nano Pensando que era apenas um marcador de espaço reservado que ninguém fora da plataforma de teste jamais veria Mas o modelo teve um desempenho tão bom que as pessoas no X ficaram obcecadas com essa misteriosa poderosa Nano Banana, especulando sobre qual laboratório a havia construído, se era um projeto secreto do Google ou se era algo totalmente Em vez de corrigir discretamente o registro, o Google se inclinou Eles adicionaram a imagem da banana ou o aplicativo Gemini e até criaram uma edição limitada de mercadorias com tema de banana O motivo pelo qual a banana se tornou viral não foi apenas o nome do cavalo. Era um recurso específico que as ferramentas de imagem de EI estavam errando antes, consistência de caracteres no passado Se você carregasse uma foto e pedisse a uma IA que a reimaginasse, obteria algo que se parecesse vagamente com você O que as pessoas começaram a chamar de seu primo distante da IA, Nano Banana, mudou o fato de você enviar uma foto sua, que preserva sua imagem real cenários completamente diferentes Você pode se transformar em Personalizado em cartão ou em cerâmica, e é reconhecidamente você em cada um Você pode se transportar para lugares diferentes, roupas diferentes, décadas diferentes O rosto continua sendo seu. Você pode até mesmo adicionar movimento transformando retrato estético em um pequeno vídeo em que o sujeito vira a cabeça ou muda de expressão Veremos isso com mais detalhes quando visualizarmos o modelo de vídeo de Gemini Mas a consistência do personagem é apenas uma parte disso. Deixe-me explicar outras coisas que fazem com que valha a pena entender esse modelo. A mesclagem de cenas permite fazer upload duas fotos separadas e fundi-las em uma única imagem coerente Você pode colocar você e uma figura histórica na mesma mesa ou criar uma foto de grupo de pessoas que nunca estiveram no mesmo lugar. O Gemini lida com a iluminação, os ângulos e o contexto. Portanto, o resultado parece uma imagem em vez de algo que parece costurado edição multiturna transforma sua conversa em uma tela viva Você não precisa acertar tudo na primeira solicitação. Você pode começar com uma sala vazia e fazê-la existir, pintar as paredes, adicionar um sofá de couro, colocar uma xícara de café fumegante na mesa Cada prompt se baseia no último. Uma coisa importante a lembrar é que o bate-papo mantém o contexto em todas as suas edições Portanto, se você quiser iniciar um projeto completamente separado, abra um novo bate-papo em vez de continuar no mesmo tópico. mistura de design consiste em pegar a textura ou a linguagem visual de uma coisa e mapeá-la em outra coisa — inteiramente o padrão de uma asa de borboleta se tornando um vestido de alta moda A textura de um ladrilho de mármore envolvendo um par de tênis tem menos a ver com a edição de uma foto e mais com a fusão de dois mundos que normalmente não se encaixam Agora, uma coisa importante a entender sobre como tudo isso se encaixa próprio Gemini é um modelo de raciocínio e linguagem em sua essência Os recursos de imagem e vídeo vêm de modelos especializados dedicados que Gemini chama de bastidores para obter imagens Isso é Nano Banana. Oficialmente chamada Gemini 2.5 flash Image, embora ninguém a chame assim Para vídeo, é um modelo chamado VO. Pense neles como a equipe criativa da Gemini disponível mediante solicitação Quando você pede ao Gemini que gere ou edite uma imagem, ele entrega a tarefa ao Nano Banana Quando você pede um vídeo, ele chama VO. A conversa permanece em Gêmeos. O trabalho especializado acontece abaixo. Na próxima palestra, abriremos o Gemini e tentaremos criar nossas primeiras imagens. Eu vou te encontrar lá. 27. Criando sua primeira imagem com o Gemini: Agora que você viu a prévia das capacidades visuais do Gemini, vamos colocar a mão na massa e criar nossa primeira imagem A criação de imagens está disponível em todos os planos. Vamos abrir o Gemini e começar a trabalhar. Para criar uma imagem, você tem duas opções. Opção 1: crie uma imagem em seu bate-papo existente em que você faça perguntas ou trabalhe na criação de um novo conteúdo, como em nossa última palestra, quando trabalhamos no resumo do produto para uma empresa de colchões de IA A segunda opção é começar do zero. Isso é o que eu vou fazer desta vez. Vou começar com um simples prompt. Um gato laranja fofo dormindo em um sofá. Para dizer ao Gemini que vamos criar uma imagem, vamos escolher a imagem na lista de ferramentas Dessa forma, a Gemini sabe que estamos esperando uma imagem como saída, então não precisamos digitar essas instruções verbais no prompt A próxima etapa antes de gerar uma imagem é escolher um modelo de geração de imagem, seja ele de raciocínio rápido ou profissional. Vou escolher rápido desta vez. Uma forma alternativa de criar uma imagem seria digitar create a image of diretamente em seu prompt. E, nesse caso, não precisamos selecionar Criar imagem na lista de ferramentas. Essa é minha forma preferida de trabalhar com a Gemini. Mas para esta demonstração, vamos continuar com a opção Criar imagem selecionada. Nossa imagem está pronta, muito boa, considerando o quão curta é nossa solicitação e que é apenas nossa primeira iteração. Você pode compartilhar, copiar ou baixar essa imagem ou continuar ajustando a imagem apenas conversando com o Gemini e adicionando mais detalhes à sua solicitação original Você vê que o Gemini modifica o prompt da imagem adicionando mais detalhes enquanto mantém todo o contexto anterior no Mas caso você queira recomeçar com uma de suas iterações anteriores, clique em mais e escolha a ramificação em Novo bate-papo Em seguida, você pode dar a solicitação ao Gemini e, nesse caso, o Gemini mudará a imagem selecionada Obviamente, você pode dar Gemini o aviso inteiro imediatamente ou, em vez de descrever os detalhes você mesmo, escolher um estilo ou, em vez de descrever os detalhes você mesmo, escolher Por exemplo, em vez de descrever luz que queremos ter em nossa imagem, vamos escolher o cinema na lista aqui Você me viu selecionando entre o modo rápido e o modo de pensamento. No aplicativo Gemini, esses modos representam quanto poder de processamento e raciocínio a IA usa para criar sua imagem, enquanto os nomes de modelos específicos, como nana Banana, evoluem rapidamente na forma como esses Permanece constante. Eu sempre recomendo verificar as páginas oficiais de suporte do Gemini para ver os nomes das versões mais recentes Mas aqui está a melhor maneira de pensar sobre seu fluxo de trabalho. Pense no modo rápido como uma camada interativa. Ele foi desenvolvido para oferecer velocidade e iteração rápida. Se você estiver mudando a cor da camisa, experimentando um novo penteado, trocando um plano de fundo ou gerando muitas variações, mantenha-o no modo de pensamento rápido, a camada de raciocínio. Isso leva mais tempo porque é mais cuidadoso antes de Use-o quando precisar de precisão, como texto limpo e legível para atribuir fotos consistentes do produto ou cenas complexas em que os detalhes realmente importam Você pode me perguntar, mas Anna, por que eu não usaria pensamento o tempo todo se é mais poderoso. É uma pergunta justa, mas há duas vantagens práticas. O primeiro é o tempo. O primeiro modo é a ferramenta de velocidade de pensamento. O modo de pensamento requer um período de espera enquanto o EI pensa no prompt. Em segundo lugar, são os limites de uso, porque modo de pensar é mais caro do ponto de vista computacional. Geralmente, tem limites diários mais restritos do que o modo rápido. Meu processo recomendado usa o modo rápido para explorar e gerar opções aproximadas rapidamente. E depois de encontrar seu conceito de herói, mude para o modo de pensar para obter o acabamento final de alta fidelidade. Comece com o modo de pensar imediatamente, somente para tarefas de alta complexidade, como visualizar fluxos de processos ou criar imagens com textos localizados específicos Tudo bem. Agora você tem uma ideia inicial de como fazer com que o Gemini crie imagens No próximo vídeo, vamos nos aprofundar um pouco e aprender como criar um bom prompt LCR no próximo 28. Sete dicas inspiradoras para criar imagens melhores: Olá, pessoal, e bem-vindos de volta à palestra. Como esta seção do curso trata da geração de imagens, não podemos ignorar um tópico tão importante quanto a criação dessas instruções No próximo vídeo, compartilharei minhas sete principais recomendações sobre como criar prompts eficazes. Vamos começar. Às vezes, você verá saídas sólidas com instruções abertas simples, especialmente se estiver aberto a No entanto, quando você tem uma visão específica em mente, descrever vários detalhes pode ajudar a levá-lo à perfeição. Mas, independentemente da direção que você deseja seguir, recomendo começar com um simples aviso e depois adicionar detalhes extras, um por um, para ver como eles afetam a imagem. Comece com a descrição do assunto, pessoa, animal, paisagem, personagem fictício e assim por diante Gere sua primeira imagem e, em seguida, inclua detalhes ou contexto extras, como sua localização, informações sobre o ambiente e a iluminação, bem como emoções ou estados de espírito que você gostaria de apresentar Para esclarecer a ideia do que você deseja criar, é útil fazer uma série de perguntas a si mesmo. Aqui está uma lista de verificação que você pode usar. Decida se você quer uma foto ou uma ilustração. Qual é o seu assunto, pessoa, animal, paisagem, personagem fictício e assim por diante Pense em efeitos e detalhes específicos que você deseja incluir: movimentos artísticos, temas , técnicas, efeitos, materiais, conceitos , cores e tons, iluminação e composição. Vá além do básico e inclua descrições adicionais em sua solicitação que podem levar o processo criativo a uma direção completamente diferente ou adicionar mais sabor e nuances às suas imagens Aqui estão apenas alguns exemplos do que você pode adicionar. Tipo de fotografia, ambientes, emoções e estados de espírito, estilos de arte específicos, cinematográficos ou pictóricos. Experimentar esses tipos de descritores é uma das partes mais agradáveis de trabalhar com a geração de imagens do Gemini Pequenos acréscimos podem mudar drasticamente a sensação de uma imagem Preste atenção na ordem das palavras em seu prompt. As palavras no início têm mais peso do que as palavras no final. Portanto, se sua paisagem de neve é mais importante do que a cabine em primeiro plano, comece com a paisagem Tente reordenar o mesmo conjunto de palavras e, muitas vezes, você obterá resultados visivelmente diferentes Esteja atento aos direitos de terceiros. Gemini permite que você faça referência a artistas históricos e movimentos artísticos pelo nome Então, pedir um homem com qualidade ou estilo de Vang funciona perfeitamente No entanto, o EI bloqueará que solicitem estilos de vida ou artistas contemporâneos para proteger os criadores Também restringe personagens protegidos por direitos autorais e logotipos de marcas. Se você quiser a aparência de artista moderno ou de uma marca específica, descreva as qualidades visuais que você procura , em vez de nomeá-las diretamente Procure inspiração e exemplos ao criar suas próprias instruções Se você é novato geração de imagens de IA e não tem experiência em design, pode ser difícil escrever na geração de imagens de IA e não tem experiência em design, pode ser difícil escrever instruções descritivas detalhadas no início, e isso é completamente normal Uma ótima maneira de começar é navegar on-line pelas comunidades de imagens geradas pela I, encontrar imagens que você goste, ver as instruções por trás delas e começar a experimentar fazendo pequenas modificações Também é uma boa ideia criar um quadro de humor as imagens que você gosta e que talvez queira consultar mais tarde. Salve a imagem, o prompt usado e todas as notas de estilo ao lado dela. Isso se torna uma referência criativa muito útil ao longo do tempo. Por último, mas não menos importante, aproveite o processo. No início, pode parecer que a EI está fazendo todo o trabalho criativo. Mas sem suas ideias únicas, seus instintos sobre o que parece bom e sua curiosidade em experimentar, o EI não produziria nada interessante Portanto, seja você mesmo, divulgue suas ideias e divirta-se com elas. Para recapitular Aqui estão as sete dicas. Comece de forma simples e adicione detalhes um por um. Faça a si mesmo uma série de perguntas para esclarecer sua visão. Vá além do básico em descritores de ambiente, humor, estilo e A ordem das palavras é importante. O que vem primeiro tem mais peso. Esteja atento aos direitos de terceiros. Os estilos dos artistas são justos, mas evite personagens protegidos por direitos autorais e imagens de marcas Procure inspiração on-line e crie os painéis de humor como referência criativa. Divirta-se com isso. Como sempre, Alca no próximo vídeo. 29. mesclagem contextual, renovação iterativa e síntese visual: Bem-vindo de volta. Até agora, conhecemos a banana Banana e aprendemos a criar uma imagem do zero. Mas, na maioria dos casos, você não está apenas procurando imagens legais. Você está procurando ativos. Você precisa da imagem perfeita de herói para um site ou anúncio de mídia social que realmente interrompa a rolagem. Neste vídeo, vamos explorar como criar esses ativos. Obviamente, você pode começar do zero e perguntar a Gemini qual imagem você deseja Mas pense sobre isso. Descrever um ângulo de iluminação específico, uma textura única ou estrutura física complexa com apenas texto é difícil. Você pode passar 30 minutos escrevendo o prompt perfeito e ainda assim não entender o que está na sua cabeça. Mas se você mostrar a imagem de referência do Gemini, fornecerá um mapa instantâneo de suas expectativas Hoje, veremos como usar imagens para falar com a IA. Vamos começar com o desafio clássico de marketing. Você tem um produto, neste caso, frasco para a pele, e deseja que ele tenha uma aparência vibrante, fresca e premium Para isso, vamos usar a combinação contextual. Veja o que acontece quando eu carrego uma foto simples da garrafa ao lado da imagem de referência e, em seguida, guio Gemini para colocá-la em uma cena criativa completamente nova Em nossa primeira solicitação, não estamos apenas pedindo uma foto aleatória. Estamos dizendo à Gemini exatamente o que queremos, referenciando a imagem original e pedindo a substituição de partes dela, trocando a água por suco e a garrafa original por nossa marca de produtos para a Vamos começar com o modo rápido. Eu cliquei em Enviar e aqui está nossa imagem. O texto é nítido e a garrafa está perfeitamente abaixo da linha d'água Agora vamos fazer algumas mudanças. Em primeiro lugar, adicionarei essa frase ao prompt. Frases como foto de produto de comércio eletrônico, iluminação brilhante de estúdio ou fundo branco puro são os segredos profissionais que fazem uma imagem parecer um comercial real em vez de um experimento de IA Também vamos mudar para o modo de pensar aqui. Eu usei o mesmo aviso, mas de repente a garrafa está em cima do líquido. Por quê? Como o modelo está, na verdade, raciocinando por meio da física, ele sabe que o suco de laranja, ao contrário da água, não é transparente Ele acha que se eu mergulhar essa garrafa no suco, a metade inferior do rótulo desaparecerá Vamos tentar forçá-lo adicionando instruções meio submersas ao prompt. Resultados semelhantes. O modo de pensar é priorizar a lógica da fotografia do produto em vez de minhas instruções específicas de layout Ele pressupõe que uma boa foto mostre toda a marca, então corrige minha composição retirando o produto do suco Agora, vamos analisar o refinamento iterativo. É aqui que Gêmeos realmente brilha. Você não precisa tirar a foto perfeita de uma só vez. Em vez disso, você o direciona como um fotógrafo ajustando um elemento por vez até chegar exatamente onde deseja Para esta sacola de café Gemini Brew, vamos criar uma foto textual rica do produto passo a passo, começando com o posicionamento, depois refinando a composição, adicionando vazamento e profundidade e, finalmente, ajustando finalmente, Veja como cada solicitação aproxima a imagem dessa estética premium do elenco E, finalmente, vamos dar uma olhada na técnica que eu acho que é a mais impressionante de todas as sínteses visuais. Às vezes, você tem um kit de campanha inteiro, vários produtos, um modelo, uma roupa No passado, reunir isso exigia um grande resumo criativo e muitas idas e vindas Com o modo de pensamento do Gemini, nós apenas entregamos as peças e deixamos que ele resolvesse o resto Criar do zero tem a ver com direção, não apenas com descrição. Você viu como combinar contexto, refinar uma foto passo a passo e sintetizar vários elementos em uma única Mas o que acontece quando uma imagem está quase perfeita e precisa apenas de uma alteração específica. Em nosso próximo vídeo, entraremos na suíte de edição, onde usaremos o Gemini para corrigir, restaurar e editar imagens com precisão Você já tem Alca lá. 30. O Editing Suite: transformando esboços em protótipos e restauração de fotos: Todos, e bem-vindos de volta à série de palestras sobre criação de imagens com Gemini Neste vídeo, abordaremos os recursos de edição do Gemini Vou mostrar como usar a camada de pensamento Gemini para corrigir, restaurar e literalmente ler e depois ajustar as imagens que você já tem É aqui que deixamos de ser criadores e passamos a ser editores sofisticados Deixe-me abrir o Gemini para começar a demonstração. Geralmente começa em um guardanapo ou quadro branco. Você tem uma visão para um produto, mas não é designer. Aqui está o que vamos fazer. Estou enviando este esboço de um novo design de cadeira para a Não preciso ser artista. Eu poderia simplesmente dizer à Gemini interpretasse esse esboço em uma foto realista do produto porque estamos no modo de pensar Gemini usa as linhas como guia estrutural. Ele entende a perspectiva que eu pretendia e preenche os detalhes, eu mesmo não consegui desenhar Isso transforma seus rascunhos em protótipos em segundos. Vamos trocar o tecido da cadeira. Mas em vez de explicar a cor e a textura que eu quero, vou usar imagens de referência. Surpreendentemente, recebi essa imagem do livro porque usei a palavra capa em meu prompt. Vamos começar um novo bate-papo para corrigir a imagem. E, claro, podemos dar a essa participação um giro de 360 graus. Aqui tenho a imagem do cabelo e meu vídeo pmt. E também selecionei o vídeo no menu suspenso para garantir que Gemini entendesse minha tarefa corretamente Agora vamos dar uma olhada em um dos reparos mais poderosos que você pode fazer para a restauração. Todos nós temos aquelas fotos antigas de família desbotadas ou fotos digitais de baixa qualidade de anos atrás Em vez de apenas colorir, pedirei a Gemini que o restaure Usando sua camada de pensamento, Gemini analisa as texturas e o Ele remove os arranhões, torna os rostos mais nítidos e aplica cores naturais realistas como se a foto tivesse sido tirada Não é só o filtro. É o EI reconstruindo a qualidade que foi perdida ao longo do tempo. Vamos dar uma olhada. Mamãe. Oh, que sensação dançar no pedal perdida no ritmo do sol 31. O conjunto de edições: edições direcionadas com a ferramenta de marcação e anotações externas: Vamos seguir em frente. E se a imagem estiver ótima, mas você quiser mudar uma coisa específica. Vamos explorar como trabalhar com a ferramenta de marcação de imagem dedicada da Gemini e também sua alternativa Eu gostaria de editar essa imagem. Vou enviá-lo para o Gemini e abrir a ferramenta de marcação. Eu simplesmente clico na imagem. E aqui temos nosso espaço de trabalho de edição. O que vou fazer aqui é chamado de inspiração especial. Estou mostrando a Gemini exatamente onde eu quero a mudança e descrevendo qual deve ser a mudança Primeiro, vou escolher uma cor. Vamos com o vermelho. E eu circulo essa lareira. Em seguida, preciso explicar a intenção, então vou mudar para a ferramenta de texto e digitar Ed fire Observe que usei um verbo aqui. Você pode ser específico com ações como adicionar ou substituir, ou pode simplesmente descrever o objeto. Por exemplo, vamos adicionar duas xícaras de café nesta mesa lateral aqui. Se você cometeu um erro, você sempre pode apertar o botão de desfazer para voltar Estou clicando em Concluído quando acabei finalizar as anotações e vamos pressionar Enter sem fornecer nenhuma instrução, porque acabamos de criá-las nessa imagem E aqui está a nova imagem. Vemos que a Gemini incluiu com sucesso as mudanças. Vemos o fogo na lareira e vemos aqui duas xícaras de café. Ótimo trabalho. Ao abrir essa nova imagem, você notará que clicar nela não abrirá a ferramenta de marcação novamente. Portanto, essa ferramenta é específica para seus uploads iniciais. No entanto, você não está preso, você pode continuar refinando o resultado usando edições conversacionais Então, aqui está meu novo aviso. Gêmeos tem consciência contextual da imagem. Ele acabou de ser criado e continuará fazendo as alterações que você solicitou. E voltando às minhas anotações originais, observe que gosto de combinar a cor do texto com a cor do círculo, enquanto a círculo, enquanto a IA rastreia principalmente as coordenadas Essa é uma ótima prática recomendada para manter suas instruções organizadas. Você também pode trazer anotações de ferramentas externas, como Por exemplo, aqui, marquei esta foto do edifício Bursch Khalifa Eu quero que Gemini faça essas mudanças exatas. Quero que esse prédio seja removido e quero mudar as cores de algumas partes do prédio. Eu abri um novo chat e enviei essa imagem para o chat. Para tarefas complexas como essa, recomendo mudar para o modo de pensar. Isso aciona um modelo de raciocínio mais poderoso, que é muito melhor em seguir essas Também incluirei essas instruções, incluir esse aviso aqui é importante. Por exemplo, aqui está a imagem que obtive ao ajustar a mesma imagem sem fornecer nenhuma instrução ao Gemini Vemos que a Gemini fez a mudança com sucesso. No entanto, ainda vemos as anotações, e essa era minha imagem original sem nenhuma instrução fornecida Vamos voltar ao nosso bate-papo e pressionar Enter. Infelizmente, desta vez, ainda temos as instruções sobre a nova imagem e também vemos que a Gemini fez outras alterações com sucesso Não vemos o prédio aqui no lado direito e as novas cores foram aplicadas com sucesso. Vamos pedir ao Gemini que remova as instruções de anotação da imagem . E aqui vamos nós. A segunda tentativa foi bem-sucedida. Como você pode ver, os geminianos reconhecem o texto, removem o prédio e alteram as cores perfeitamente Em seguida, fornecemos a segunda instrução para remover as anotações. Tudo bem aqui. Por fim, vamos ver como os geminianos raciocinam sobre o mundo dentro de suas fotos Por exemplo, se você fizer upload de uma foto do horizonte de uma cidade, peça a Gemini que a anote, veja como ela identifica os pontos turísticos e adiciona rótulos Isso não é só desenho, é design da informação. É pegar um pota bruto e transformá-lo em um recurso educacional inteligente para uma apresentação ou manual E esse é realmente o tema de tudo o que abordamos neste vídeo, seja dando vida a um esboço, restaurando um fórum antigo, anotando uma imagem ou rotulando de forma inteligente uma cena complexa, Gemini lida com o trabalho de precisão, para que você não precise Em nosso próximo vídeo, reuniremos todas essas habilidades para criar sistemas visuais complexos, incluindo infográficos e visualizações de dados que transformam dados complexos em algo instantaneamente claro. Te vejo lá. 32. Visuais complexos: menus, diagramas e infográficos: Bem vindo de volta. Até agora, abordamos muitas coisas como criar do zero, editar com precisão e sintetizar cenas complexas Agora, vamos ver o que o Gemini pode fazer quando a tarefa fica ainda mais ambiciosa, criando ativos visuais de várias peças, como infográficos, diagramas e ativos que funcionam em diferentes plataformas e telas sociais Vamos começar. Eu quero que o Gemini crie uma página Menu de infográficos usando essas imagens de café. Eu queria identificar cada bebida e colocá-la em uma seção limpa com seu nome e uma breve descrição. Também vamos escolher criar imagens a partir da seleção de ferramentas. A partir da descrição de Pam aqui, não está muito claro se eu quero uma imagem ou um texto como saída final. Vamos começar. E aqui está nossa foto. Como o Gemini tem essa camada de ressonância profunda, ele vê a diferença entre as imagens que enviamos e pode identificar uma xícara de café com os cubos de gelo dentro versus aquela com a forma de leite morno Deixe-me pedir à Gemini que mude um pouco esse layout e também mude as cores para se adequar às cores da nossa marca Oh, esse é um ótimo design. Eu gosto mais dele do que da nossa primeira iteração. E vamos fazer mais uma mudança. Quero alterar o texto do menu de café para o nome da nossa marca. E aqui está nossa imagem. Eu gosto muito disso. A única coisa que eu quero mudar remover esses grãos de café para que o texto fique totalmente visível. Mas, em vez de fazer isso como uma série de instruções iterativas, vamos tentar usar outra técnica Vou usar a ferramenta de marcação que abordamos na demonstração anterior Deixe-me baixar esta imagem em tamanho real. Eu criei um novo chat, enviei nossa imagem que acabamos de gerar. Em seguida, abri a ferramenta de marcação e deixei destacar os grãos de café Eu adicionei a instrução ao Gemini para remover os grãos de café Vai ser um pouco complicado porque vemos os feijões junto com o texto Mas vamos tentar fazer com que funcione. Estou escolhendo o modelo de pensamento aqui e também seleciono e crio imagens. Então, minha primeira tentativa não teve sucesso. Você vê que as imagens OF ainda estão aqui dentro da imagem. Vamos tentar descrever a mudança que eu gostaria de fazer. E aqui está nossa imagem. É realmente incrível que o Gemini tenha se saído tão bem seguindo minhas instruções imediatas e removendo os grãos de café do canto superior direito do menu E agora podemos ver nosso texto claramente. Incrível. E vamos passar para a segunda demonstração aqui. Às vezes, você precisa explicar como é a viagem do grão à xícara no meu exemplo da marca de café Gemini Então, aqui está o processo de fabricação de cerveja exclusivo de nossa marca. Vou perguntar a Gêmeos o seguinte. Quero que a Gemini finalize esse processo de assinatura do Gemini Brew em cinco etapas em um fluxograma de arquitetura limpa Eu queria usar um layout minimalista e combinar as cores com as que usamos em nosso arquivo PDF Deixe-me escolher o modo de pensar. E para este exemplo, eu também vou escolher Criar imagens. E aqui está nosso diagrama. Gemini construiu a estrutura, criou os ícones e também rotulou cada etapa O que eu não gosto aqui são aqueles lances que definitivamente são desnecessários E esse texto que podemos ver em cada caixa. Vamos pedir a Gemini que remova isso. E aqui está a imagem mais limpa. E eu também gostaria de remover essa moldura. Vamos pedir a Gemini que faça isso. E essa é uma foto muito melhor. E eu quero fazer mais uma iteração para tornar essa imagem mais bonita Olha isso. Essa é uma estética completamente diferente. Deixe-me saber nas perguntas e respostas deste vídeo, qual você prefere E vamos seguir em frente com nossa demonstração. 33. Visuais complexos: adaptação de recursos em formatos e plataformas: Obviamente, você pode editar ainda mais essa imagem, se quiser, continuando solicitando melhorias ao Gemini diretamente aqui no chat, ou copiando essa imagem e seguindo as instruções ferramenta de marcação Mas deixe-me mostrar outro exemplo enquanto estamos aqui nesta imagem. Digamos que estamos planejando uma expansão internacional da marca Gemini Brew Portanto, precisamos que esse diagrama seja traduzido para outros idiomas. Então, vou pedir que mude a imagem para que os textos sejam mostrados no idioma chinês. E esse é o nosso diagrama traduzido. Observe que, em minha solicitação, digo explicitamente que quero que Gêmeos altere a imagem, não apenas mostre os textos em chinês, para que fique claro para Gêmeos que preciso de outra variação dessa imagem traduzida para o idioma chinês para Gêmeos que preciso de outra variação dessa imagem traduzida Tudo bem. E vamos dar um exemplo final. Digamos que precisamos de recursos para a campanha de marketing da Gemini Brew, que funcionará em qualquer lugar, desde histórias e postagens do Instagram até a imagem de um herói em nosso site Vamos tirar essa foto construímos anteriormente com a Gemini, e vou dizer à Gemini que esse é nosso principal ativo E agora eu preciso de uma versão para uma história vertical nas redes sociais, um post quadrado e um cabeçalho branco para o site da Gemini Brew Também anexei a imagem que eu quero que o Gemini modifique E aqui está a mensagem que recebi do Gemini quando testei esse prompt antes de gravar o tutorial Isso ocorre porque Gêmeos pode criar uma imagem no tempo. Embora o Gemini possa processar muitas imagens de referência ao mesmo tempo, seu objetivo é sempre sintetizá-las em uma composição final de alta Se você solicitar vários arquivos de imagem separados de uma só vez, como no meu exemplo aqui, ele não poderá prosseguir com sua solicitação. Portanto, sempre enquadre sua solicitação como um único projeto, como um infográfico, um menu ou uma foto de campanha em que todos os seus elementos estejam juntos em uma imagem Então, deixe-me mudar o prompt. Primeiro, gostaria de criar uma imagem de cabeçalho branco para o site da Gemini Brew Como sempre, estou selecionando o modo de pensamento e também vamos escolher Criar imagens para dar ao Gemini instruções claras de que espero ver a imagem nesse caso E aqui está nossa nova imagem de herói branco para o nosso site. Vemos que o Gemini não apenas estica nossa imagem original, mas também a pinta, adicionando mais detalhes a ela como aquelas máquinas de café antigas, bem como esses grãos de café no lado esquerdo e direito da imagem original, garantindo que nosso produto esteja sempre perfeitamente posicionado no centro da composição, independentemente do tamanho da tela Também vamos criar uma imagem em tamanho vertical e uma imagem em tamanho quadrado para nossas postagens no Instagram. 34. Além do bate-papo — pesquisa e construção aprofundados com o Gemini: introdução da seção: O que acontece quando você atribui Gemini uma tarefa de pesquisa que normalmente levaria meio dia É disso que trata esta seção e, em seguida, levamos essas descobertas a algum lugar que você talvez não espere. Vamos fazer isso usando um recurso do Gemini chamado pesquisa profunda, e trabalharemos três situações muito diferentes da vida real com ele Uma com a qual a maioria de nós lida toda semana, uma sobre tomar uma decisão de compra sem cair na toca do coelho de sites de avaliação e tópicos invadidos, e outra sobre como se atualizar sobre um assunto completamente novo Em cada caso, quero que você veja não apenas o que o Gemini produz, mas como solicitá-lo, para que o resultado seja realmente útil para você E então vamos dar um passo adiante usando o Canvas para transformar um desses resultados de pesquisa em um aplicativo interativo funcional criado a partir de uma conversa Nenhum código exige isso. Espero que você esteja pronto. Então pegue uma xícara de chá ou café e vamos começar. 35. Pesquisa aprofundada: respostas além do projeto: Levante a mão, se isso já aconteceu com você, você faz uma pergunta difícil e importante a um chatbot, algo como: “Eu quero levantar o financiamento da Série A Quais são os investidores mais ativos no meu espaço no momento? E ele responde com uma lista de opções, que é bastante superficial, e você também recebe várias recomendações de alto nível Por exemplo, você deveria pesquisar investidores ativos em sua categoria. Você deve criar uma lista de alvos. Você deve entrar em contato com sua rede para receber apresentações calorosas e assim por diante A equipe de produtos do Google tem um nome para isso. Eles chamam isso de um plano de resposta, um mapa de alto nível que diz o que procurar , deixando todo o trabalho real para você Você ainda está se afogando em 50 abas abertas do navegador, tentando separar o sinal útil do ruído pesquisa profunda da Gemini é o que pode ajudá-lo a superar o plano e obter algo muito abrangente no qual você possa agir imediatamente Pesquisas aprofundadas não são apenas um chatbot mais inteligente. É um sistema agente, o que significa que planeja, pesquisa motivos e sintetiza informações de forma autônoma pesquisa motivos e sintetiza em centenas de fontes em Pense nisso como ter um assistente de pesquisa de nível de doutorado em sua equipe que faz horas de investigação complexa em minutos e volta com um relatório refinado, não uma lista de tarefas Então, o que um assistente de pesquisa em nível de doutorado realmente faz por você na prática Deixe-me apresentar os três casos de uso mais poderosos. Primeiro, a compreensão do tópico, aprofundando assuntos complexos. Imagine que você é um gerente de RH tentando entender como a IA afetará a força de trabalho nos próximos três anos Você não quer apenas um resumo no nível da superfície. Você precisa entender a paisagem. Como a automação da IA se compara ao aumento da IA. Quais funções correm maior risco e quais estão evoluindo, o que outras empresas já estão fazendo? E o que a pesquisa diz versus o que apenas uma pesquisa exagerada mergulha em trabalhos acadêmicos, relatórios do setor, relatórios do setor comentários de especialistas e estudos de caso do mundo real simultaneamente Ele volta com uma análise estruturada que mapeia a paisagem, contrastando ideias concorrentes, as relações entre conceitos e explicando o porquê por trás de tudo Em segundo lugar, a devida diligência profissional. Pense em se preparar para uma reunião de vendas corporativas. Antes de entrar pela porta, você precisa entender os principais desafios comerciais dos clientes potenciais, os movimentos estratégicos recentes, a pressão competitiva que eles estão enfrentando e como seu produto se encaixa em tudo isso. Pesquisas aprofundadas investigam os produtos da empresa, descobrindo a história, equipe de liderança e o ambiente competitivo E isso é muito importante, mescla tudo isso com suas próprias notas internas sobre o relacionamento com o cliente. O que um analista júnior levaria um dia inteiro para compilar agora está pronto em minutos Então você entra na sala de reuniões sabendo mais sobre seus negócios do que eles poderiam esperar. Em terceiro lugar, altos riscos, decisões pessoais. Nem tudo gira em torno do trabalho, da compra de um carro, escolha de um bairro, da comparação das opções de seguro. Essas decisões são igualmente importantes, e a pesquisa Rabbit Hole é tão profunda quanto, em vez de um fim de semana perdido lendo postagens conflitantes no blog e tópicos invadidos, você recebe um relatório estruturado em torno de sua situação específica, dos prós, dos contras e das nuances que conselhos genéricos E aqui está o que torna todos esses três casos de uso possíveis na prática. Pesquisas aprofundadas não fornecem apenas uma lista de links. Ele produz um relatório abrangente de várias páginas, análises estruturadas, fontes citadas e até mesmo coisas como infográficos que dão vida aos dados Na próxima palestra, vamos colocar nossas mãos nela Mostrarei como iniciar uma pesquisa aprofundada, como criar o plano de pesquisa antes que ela comece, e analisaremos juntos um exemplo real para que você possa ver o processo completo, do aviso ao relatório final. Eu vou te encontrar lá. 36. Pesquisa aprofundada em ação — compreensão do tópico: Conforme prometido, vamos ver uma pesquisa profunda em ação. Vamos começar com o tópico Entendendo o caso de uso, e escolhi um exemplo com o qual acho que a maioria de nós pode se identificar pessoalmente. Vamos usar pesquisas aprofundadas para abordar um dos tópicos mais confusos da vida cotidiana. Café da manhã, nutrição, você conhece a sensação. Se você pesquisar RX no Google e obter dez respostas completamente diferentes, dependendo do artigo que você seguir. Junto com esta demonstração, você precisará de um plano Gemini pago Se você está atualmente em um plano gratuito e deseja fazer o upgrade, confira a palestra na seção introdutório do curso onde explico como fazer isso Ok, vamos. Para iniciar uma pesquisa profunda, abra um novo bate-papo e escolha pesquisa profunda na lista de ferramentas. Por padrão, o Gemini usa pesquisa do Google como fonte primária Mas você pode expandir isso. Por exemplo, você pode escolher seu Gmail ou Google Drive como fonte ou fazer upload de seus próprios arquivos É isso que torna a pesquisa profunda tão poderosa. Não se trata apenas de pesquisar na web. Ele pode mesclar informações públicas com seus próprios documentos privados Para esta demonstração, vamos simplificar e usar a pesquisa na web somente aqui está o prompt que vou usar. Observe o quão específico é esse prompt. Não estamos apenas perguntando: O que devo comer no café da manhã? Estamos oferecendo uma pesquisa profunda, uma agenda de pesquisa clara com três tarefas distintas. Quanto mais orientação você der de antemão, mais útil será a saída. Quanto à seleção do modelo aqui, a analogia do especialista que apresentamos anteriormente no curso permanece exatamente a mesma quando você ativa uma pesquisa profunda O modo selecionado determina como esse especialista se comporta durante o processo de pesquisa Fast continua sendo seu velocista, realizando uma ampla varredura rápida das fontes mais relevantes para fornecer um resumo rápido sem se aprofundar em todos os detalhes Pensar ainda é seu estrategista fingindo cruzar referências de várias fontes e resolver contradições para encontrar um ângulo mais lógico O Pro continua sendo seu especialista mergulhando profundamente em tudo, desde relatórios densos e PDFs técnicos até longos tópicos de e-mail, para oferecer uma síntese verdadeiramente abrangente Vou escolher pensar aqui. Agora vamos clicar em enviar e ver o que acontece primeiro. Essa é a etapa de decomposição da meta e é uma das minhas partes favoritas do processo Em vez de mergulhar direto na pesquisa, pesquisa profunda faz uma pausa e cria um plano de pesquisa personalizado em várias etapas com base em Você pode vê-lo mapeando exatamente o que pretende investigar. Se precisar, você pode editar esse plano antes que ele comece. Se você quiser direcioná-lo para um ângulo específico, adicionar um subtópico ou remover algo que não seja relevante para você, faça isso agora, antes que uma única pesquisa seja executada Para esta demonstração, estou feliz com o plano como está. Então, vamos aprová-lo e deixá-lo funcionar. E agora a busca começa. Gemini está trabalhando com fontes em tempo real, artigos acadêmicos, nutrição, diretrizes e publicações sobre saúde É decidir quais ameaças investigar em paralelo e quais precisam acontecer em sequência Você pode até clicar em qualquer um dos sites aqui se estiver curioso para saber quais fontes a Gemini está acessando À medida que a pesquisa profunda da Gemini lê cada fonte, ela não apenas coleta informações e segue em frente Ele pensa no que procurar em seguida. Está executando um processo contínuo de autocrítica, detectando contradições entre fontes, sinalizando afirmações vagas ou infundadas e reconhecendo que quando um dado simplesmente não se soma , você pode vê-lo ajustando suas direções de simplesmente não se soma , você pode vê-lo pesquisa em tempo real, à medida que novas informações chegam e, quando chega a um beco sem saída, digamos que um estudo está atrás de um acesso pago ou um site está fora do ar, digamos que um estudo está atrás de um acesso pago ou um site está fora não para. Ele redireciona e encontra outro caminho para a mesma resposta. Há mais uma coisa que torna isso possível em grande escala. pesquisa profunda funciona dentro de uma janela de contexto, os IIs, memória de trabalho. Em termos práticos, isso significa que o Gemini guarda na memória todas as fontes que leu durante toda a sessão Nada é perdido ou esquecido à medida que a pesquisa cresce. E é também por isso que as perguntas de acompanhamento posteriores são tão nítidas. Eu nunca perco a ameaça do que já foi investigado. E você já deve adivinhar que não precisa ficar sentado vendo tudo isso acontecer. Pesquisas aprofundadas são assíncronas. Você pode fechar a guia e voltar ao trabalho, e o Gemini avisará quando seu relatório estiver pronto Se você estiver no aplicativo da web, verá uma notificação ao lado do tópico de bate-papo na barra lateral E se você tiver o aplicativo móvel Gemini instalado, receberá uma notificação push diretamente no seu telefone E acabei de receber o meu. Nosso relatório está pronto. Então, vamos voltar para Gêmeos para dar uma olhada. É isso que uma pesquisa profunda oferece e observe o que não é. Não é uma lista de links. Não é um resumo com marcadores. É uma análise estruturada de várias páginas com fontes citadas, seções organizadas e conclusões reais. Você pode agir a tabela hierárquica de ingredientes que solicitamos que está aqui, nível um, nível dois e três, clara, acionável e baseada em E se você estiver curioso sobre alguma das fontes, cada afirmação tem links relevantes. Você mesmo pode clicar e ler a pesquisa original. Não sei sobre você, mas teria levado horas para ler todos esses recursos e compilar o relatório manualmente E é importante que uma pesquisa profunda não substitua seu julgamento. É fazer esse trabalho tedioso de base para que seu julgamento seja realmente Em nossa próxima palestra, faremos uma pesquisa profunda em um contexto pessoal e examinaremos mais alguns exemplos. Te vejo lá. 37. Pesquisa profunda em ação — decisões de compra: Nesta palestra, veremos mais dois casos de uso para pesquisas profundas que acho que você achará imediatamente úteis em sua própria vida A primeira é sobre como tomar uma decisão de compra segura, e vou usar um exemplo bem real. A segunda é sobre aprender um assunto completamente novo. Vou te mostrar algo que nunca mostrei antes. Como transformar um relatório de pesquisa aprofundado em um infográfico, um questionário e cartões de memória sem sair da interface de pesquisa profunda do Gemini. Vamos começar. Meu anel de rastreamento Aura quebrou recentemente. Eu gostaria de substituí-lo, mas não tenho certeza se devo comprar o anel mais recente da mesma marca ou usá-lo como uma chance de mudar para algo melhor. E há uma característica específica que eu queria há anos. Alarme silencioso com reconhecimento do ciclo de sono vibratório que realmente o acorda no momento certo do seu ciclo de sono, não apenas em um horário fixo Vamos usar uma pesquisa profunda como nosso assistente pessoal de compras para analisar avaliações e artigos on-line. Aqui está meu aviso. Observe algumas coisas sobre esse prompt. É pessoal. Eu dei a uma pesquisa profunda um contexto real sobre minha situação e o que estou procurando. Eu incluí o alarme vibratório, não apenas porque eu quero, mas para ver se o Gemini consegue filtrar as escolhas óbvias Na verdade, os anéis mais populares não têm modelos de vibração. Portanto, uma pesquisa básica pode me dar uma lista dos dez principais anéis que ignora esse requisito Pesquisas profundas devem descobrir isso. O prompt tem uma agenda de pesquisa clara com três tarefas e solicita um formato de saída específico no final, uma tabela de recursos, o que significa que o relatório poderá ser usado imediatamente, não apenas a parede de texto Vamos escolher uma pesquisa profunda em uma lista de ferramentas. Vou confiar na pesquisa aqui como fonte principal e vou escolher o modo de pensar. E vamos começar. Gemini preparou este plano de pesquisa para mim, e eu gostaria de fazer uma alteração aqui. Para isso, clique em Editar plano Em seguida, digitarei a alteração que quero que a Gemini faça no plano atual Quero que a Gemini também inclua uma marca específica em sua pesquisa Vemos que a lista de marcas foi atualizada. Agora estou bem com esse plano, então vou aprová-lo e começar a pesquisa E em alguns minutos, nosso relatório está pronto. Vamos analisar isso juntos. Você pode ver que uma pesquisa profunda identificou os três principais candidatos, os analisou exatamente de acordo com os critérios que solicitei, incluindo o sistema de alarme inteligente vibratório e produziu a tabela de comparação de recursos aqui Esse é o tipo de saída que normalmente exigiria pelo menos uma hora de troca de toques, tópicos prontos e análise de sites de avaliação conflitantes Eu o tenho estruturado em minutos minha situação e requisitos específicos. E aqui está a lista de recomendações estratégicas da Gemini Um aviso porque eu lhe dei um contexto pessoal com antecedência. As recomendações não são genéricas. Eles filtram isso de acordo com minhas prioridades reais. Custo-benefício, sem assinaturas pesadas e alarme de deslize, isso realmente funciona Esse é um ótimo exemplo do uso de pesquisas aprofundadas para tomar decisões de compra. Em vez de se afogar em opções, você sai com uma lista curta clara e fundamentada Na segunda parte deste tutorial, continuaremos explorando pesquisas aprofundadas para outro caso de uso, o ACA there. 38. Pesquisa profunda em ação — aprendendo um novo tema: Agora vamos ver algo um pouco diferente. Usando pesquisas aprofundadas para acelerar seu aprendizado quando você está entrando em um novo assunto. Recentemente, comecei a estudar investimento imobiliário. Assisti à minha primeira aula e fiz algumas anotações sobre os tópicos que abordamos lá. Agora, quero aprender mais sobre esses tópicos usando pesquisas aprofundadas. Posso enviar essa foto diretamente para o prompt. Gêmeos Vou ler minhas anotações manuscritas, extrair os principais tópicos e usá-los como base para um relatório de pesquisa Não preciso digitar nada novamente. Deixe-me mostrar como isso funciona. Antes de tudo, vamos escolher uma pesquisa profunda na lista de ferramentas. Vou mudar para o modo de pensar aqui, digitar meu prompt e anexar minhas anotações manuscritas O que eu adoro nessa abordagem é que a pesquisa está ancorada que eu já comecei a aprender Portanto, o relatório reforça e expande meu conhecimento existente, em vez de começar do zero Para isso, pedi especificamente a Gemini que se referisse aos temas-chave em minhas anotações, ao pesquisar e redigir E aqui está nosso plano de pesquisa. Todos parecem ótimos para mim, então vou começar a pesquisa. E nosso relatório está pronto. Você pode ver que ele pegou todos os principais tópicos das minhas anotações e construiu uma análise estruturada em torno deles. Definições, contexto, relações entre conceitos, implicações práticas. Podemos usar essas informações como um complemento de estudo, não apenas como um resumo. Mas é aqui que fica realmente interessante. Quando o relatório de pesquisa aprofundado estiver pronto, podemos transformar essa parede de texto em ferramentas ativas de aprendizado. Você notará criar um botão no canto superior direito do painel Canvas. Clique nele e você verá um menu suspenso com várias opções para transformar o relatório Primeiro, vamos dar uma olhada nos infográficos. A Gemini pega informações complexas como a diferença entre ativos residenciais e industriais, em nosso exemplo imobiliário e as transforma em um resumo visual Isso é perfeito para uma revisão rápida e de alto nível ou para compartilhar um pager com uma parte interessada Vamos retornar ao nosso relatório de tendências de investimento imobiliário para continuar a demonstração. Em seguida, para garantir que as informações realmente permaneçam, podemos gerar um questionário O Gemini cria perguntas interativas com base especificamente no relatório Conforme você responde, ele fornece feedback imediato, ajudando você a identificar exatamente onde sua compreensão de um novo tópico pode precisar de mais trabalho. I E, finalmente, temos cartões didáticos Você tem duas maneiras de usar isso. Você pode gerar um conjunto completo de flashcards para revisar cada termo-chave do relatório Mas se você acabou de terminar o questionário, como no nosso exemplo aqui, Gemini pode gerar cartões com base especificamente nos resultados do questionário Ele tem como alvo as áreas em que você lutou. Vamos fazer isso. Então, vemos um ciclo de aprendizado completo aqui, pesquisando, entendendo, testando a si mesmo e reforçando seu conhecimento em uma ferramenta . No próximo vídeo, vamos passar de pesquisa profunda e revisitá-la para que você já conheça, mas exploraremos seus casos de uso avançados, especificamente criando aplicativos de IA E, como aviso, usaremos as principais conclusões de um de nossos relatórios de pesquisa aprofundados como dados de entrada com os quais nossos relatórios de pesquisa aprofundados como dados de entrada com os nosso aplicativo será construído E mais sobre isso no próximo vídeo. 39. Além dos documentos: o que mais a tela pode fazer?: Bem-vindo de volta. Então, em nossa última palestra sobre Canvas, nos concentramos na elaboração de documentos Como o Canvas oferece um espaço de trabalho para refinar a escrita com gêmeos ao seu lado Mas a elaboração de documentos é, na verdade apenas o começo do que o Canvas pode fazer E você já viu algumas delas sem perceber Lembre-se de que o botão de criação que apareceu após seu relatório de pesquisa profunda era o rádio, os infográficos, o questionário, os cartões de memória, isso era o Deep Research entrega seu relatório diretamente no Canvas, é por isso que você pode transformá-lo em todos esses formatos sem precisar trocar de ferramenta. pesquisa profunda e o Canvas estão conectados por design. O Google os criou para fluírem um para o outro sem problemas Então, vamos ver a imagem completa do que o Canvas pode fazer. A primeira coisa que o Canvas pode criar além dos documentos são as páginas da web. E eu não quero dizer HTML simples com algum texto nele. Quero dizer páginas interativas estruturadas com cartões informativos, gráficos, layouts visuais e elementos clicáveis Pense na última vez em que você teve que compartilhar um relatório ou um resumo com alguém que não ia ler uma parede de texto. Com o Canvas, você pode pegar o mesmo conteúdo e dizer, transforme-o em uma página da web ou simplesmente clique no botão da página da web E em segundos, você tem algo que realmente parece uma página real. Você pode compartilhá-lo com o link. Nenhuma configuração de publicação ou hospedagem é necessária. Em seguida, estão os infográficos. Se você já tentou explicar algo complexo para uma parte interessada não técnica, um processo, uma comparação, uma estrutura de decisão, você conhece o desafio As palavras não podem fazer muito. Canvas pode pegar seu conteúdo bruto e reestruturá-lo em um formato visual Seções limpas, pedaços digeríveis, ícones, comparação E você pode continuar refinando isso no mesmo gráfico. Aumente a segunda seção, mude o tom para ser menos formal e ela a atualize em tempo real. Em terceiro lugar, o Canvas também pode gerar questionários interativos e cartões de memória flash a partir de qualquer conteúdo que você publique nele Isso é útil além de apenas estudar. Pense na integração do cliente, no treinamento da equipe, na verificação do conhecimento do produto. Você descreve o que deseja e o Canvas cria um questionário interativo funcional Sem ferramentas de terceiros, sem criador de formulários, sem etapas extras. Também existe um modo de áudio. Canvas pode transformar conteúdo escrito em uma visão geral de áudio no estilo podcast, conversa entre dois apresentadores de IA que discutem e resumem seu material É útil se você quiser um longo documento enquanto trabalha ou compartilhar descobertas com pessoas que preferem ouvir do que ler. Bem-vindo de volta ao Deep Dive. Hoje, estamos revelando uma visão que parece estar realmente mudando sob Estamos superando a velha ideia de um assistente inteligente que apenas ajusta temporizadores ou toca música Estamos analisando esse conceito de assistente universal. Um parceiro que realmente antecipa o que você precisa antes mesmo de você perguntar E depois há o grande problema que o Canvas pode criar aplicativos totalmente funcionais, softwares funcionais. Você descreve o que deseja, organizador de receitas, planejador de viagens, ferramenta de questionário ou rastreador de orçamento, e o Canvas gera o código e o executa para você organizador de receitas, planejador de viagens, ferramenta de questionário ou rastreador de orçamento, Canvas gera o código e o executa Ali mesmo na janela, você não vê o código. Você não precisa entender o código. Você acabou de ver um aplicativo interativo funcionando e ele não é estático. Você pode continuar conversando com Gemini para ajustá-lo. Isso é o que tem sido chamado de codificação vibe. Crie software descrevendo o que você quer em vez de escrever código linha por linha. Abordamos esse conceito na palestra sobre o impacto da implementação do Geni do curso E agora estamos prestes a ver sua vida. Aqui está o que eu mais amo no Canvas nesse contexto. Não é uma ferramenta de desenvolvedor separada. É o mesmo espaço de trabalho que você já usa para escrever documentos e esboços A mudança de rascunhar um documento para criar um aplicativo para mim é apenas uma conversa. Em nossa próxima palestra, faremos exatamente isso Vamos continuar exatamente de onde paramos. Usamos pesquisas profundas para finalmente obter uma resposta clara baseada em evidências sobre nutrição no café da manhã. E vamos transformar essa pesquisa em um aplicativo de receitas de café da manhã em família que sugere refeições rápidas e saudáveis para adultos e crianças. Vamos construir isso. 40. Acompanhe: como criar um aplicativo com a tela — da pesquisa ao aplicativo de corrida: Bem vindo de volta. Aqui estamos preparando um chef de café da manhã, refeições rápidas em menos de 20 minutos, família com fotos da refeição pronta. Tudo dentro do Gemini Canvas, sem código, sem necessidade de formação técnica. Apenas uma boa dica e um pouco de idas e vindas com Gêmeos. Vamos. Para manter nosso fluxo de trabalho organizado, seguiremos quatro etapas simples: identificar oito, criar, refinar e, finalmente, compartilhar E aqui está o primeiro passo, iDeD. Este é o nosso relatório de pesquisa aprofundado sobre nutrição no café da manhã. Vamos debater com a Gemini sobre a ideia por trás do amplificador e o que ele fará Tenho algumas ideias iniciais, mas quero expandi-las. Comecei descrevendo o propósito do aplicativo. Também disse que quero que o aplicativo use os resultados da pesquisa e fiz referência à e fiz referência estrutura abrangente do TireedGrocery do relatório para enfatizar que não preciso de relatório para enfatizar que não preciso uma lista aleatória Quero que o Gemini crie três recursos interessantes para o aplicativo e também sugiro uma aparência Aviall para o Coloquei algumas palavras descritivas aqui, como divertido, caloroso, acessível, para dar uma orientação aval para o que eu quero Estou procurando uma descrição detalhada do aplicativo. O conceito em que podemos começar a criar o aplicativo real. Vamos pressionar Enter. E aqui temos a descrição do nosso aplicativo. Vamos pedir a Gemini que faça algumas mudanças nesse conceito. O primeiro recurso, o cronômetro familiar do carregador frontal, parece ser bastante complexo, especialmente para a primeira versão do aplicativo Então, vamos pedir ao Gemini que o substitua por algo mais simples Pergunta simples sobre que tipo de refeição é preferida hoje. E também adiciono detalhes adicionais para garantir que toda vez que pedirmos uma receita, recebamos uma nova e que o aplicativo use estritamente os ingredientes recomendados em nosso relatório. Então, pressionarei Enter novamente e veremos como o Gemini incorporará essas mudanças E aqui temos a versão atualizada da descrição do aplicativo. Estou pronto para usar esse conceito, mas antes de passarmos para a segunda etapa, criar o aplicativo, precisamos verificar nossas configurações. Veja o seletor de modelos aqui Você pode se sentir tentado por P. Diz matemática e código avançados Então, parece a escolha mais poderosa. Mas aqui está o que descobri quando testei os dois ao criar este aplicativo de café da manhã antes. Na verdade, o Pro tornou o processo mais difícil. Foram necessárias mais idas e vindas para obter os resultados que eu queria, e eu gastei meus créditos P rapidamente, deixando-me esperando algumas horas antes de poder continuar. O modo de pensar me levou até lá mais rápido. Então, aqui está minha recomendação. Sempre comece pensando. Ele foi projetado para raciocinar passo a passo, que é exatamente o que a criação de aplicativos exige Trabalhando com lógica, estrutura e fluxo, economize para quando seu aplicativo precisar trabalhar com um grande volume de conteúdo de várias fontes, documentos, vídeos, imagens e muito mais. Vamos começar a segunda etapa, criando o aplicativo. Meus testes anteriores mostram que, se você enviar essa solicitação diretamente neste bate-papo, Gemini não iniciará o processo de criação, mas enviará a descrição do conceito do aplicativo mais uma vez Sim, foi o que aconteceu desta vez também. Você vê que, em vez de criar o aplicativo, Gemini apenas fez algumas alterações no próprio relatório, e não é disso que precisamos Portanto, para iniciar o processo de criação do software do aplicativo, não apenas a descrição textual, clique na seção Criar e descrever seu próprio aplicativo, escreva Crie um aplicativo com base na descrição acima. Você vê que o Gemini mostra esse comando na descrição do nosso aplicativo aqui e começa a criá-lo E enquanto a Gemini está criando o aplicativo, deixe-me responder a uma pergunta que você provavelmente está pensando agora E se eu não estiver partindo de um relatório de pesquisa aprofundado? E se eu quiser criar um aplicativo do zero? Nesse caso, comece abrindo um novo bate-papo. Mas antes de digitar qualquer coisa, mude primeiro para o modo Canvas. Aqui está o porquê. O Gemini só pode criar e executar aplicativos dentro do Canvas. É um espaço de trabalho dedicado projetado especificamente para isso Um bate-papo normal pode ajudá-lo a pensar em ideias, mas na verdade não pode criar um aplicativo funcional. Quando estiver no Canvas, faça um brainstorming de sua ideia de aplicativo com o Gemini Descreva o que você quer construir, para que serve e o que deve fazer. Quando estiver pronto para começar a construir, aperte o botão Criar, digite seu prompt e o Gemini começará a trabalhar Ok, de volta à nossa demonstração. E nosso aplicativo está pronto. Começamos selecionando como estamos nos sentindo hoje e que tipo de refeição preferiríamos. E os geminianos sugeririam uma refeição saudável. Assim, vemos aqui uma lista de ingredientes, seguida de instruções sobre como preparar a refeição. Temos uma ótima espuma que ilustra o que estamos prestes a comer E também podemos escolher o modo de chef infantil para que tenhamos uma lista de tarefas para nossos jovens ajudantes Muito fofo. Agora vamos para a terceira etapa, refinar Como você pode imaginar, ainda não terminamos aqui. Podemos continuar iterando e aprimorando nosso aplicativo. Digamos que eu queira ajustar algumas coisas. Vou digitar minhas solicitações no chat. Você acabou de me ver introduzindo várias mudanças em nosso aplicativo. Ao fazer isso, introduza uma alteração por vez, em vez de tentar incluir tudo em um único prompt. Deixe-me fazer várias outras alterações em nosso aplicativo. Aqui está a versão que eu tenho até agora. Decidi adicionar a possibilidade de incluir outros ingredientes além da lista predefinida E caso seja da categoria de nível três, será exibida uma mensagem relevante, mas a receita ainda será criada. Também adicionei a possibilidade salvar uma receita nos favoritos, que podem ser acessados aqui. E, finalmente, adicionei o botão de reset, caso queiramos começar tudo novo e escolher ingredientes diferentes. Como você pode ver, conseguimos fazer muitas mudanças apenas conversando casualmente com Gemini, sem a necessidade de codificação Estou feliz com nosso progresso atual e com a experiência do usuário que criamos. Na segunda parte deste tutorial, mostrarei outra maneira de fazer alterações em seu aplicativo usando a barra de ferramentas do Canvas E também daremos uma olhada em como compartilhá-lo com outras pessoas. Te vejo na segunda parte. 41. Acompanhe: como criar um aplicativo com tela — refinando e compartilhando: Todo mundo. Bem-vindo à segunda parte do tutorial, onde exploramos como criar um software funcional descrevendo o que queremos em vez de escrever código linha por linha, o processo conhecido como codificação vibe, conforme prometido Quero mostrar outra opção para fazer alterações em seu aplicativo como parte de nossa etapa refinada Observe esta barra de ferramentas do Gemini Canvas. Vamos explorar o que ele pode fazer por nós. Vamos começar com esse ícone de brilho. Este é o injetor de recursos de IA. Ele adiciona recursos de EI ao seu aplicativo. Quando você clica nele, o Gemini analisa a visualização atual do aplicativo e sugere componentes inteligentes, como uma barra de armazenamento de IA ou geração de texto e imagem, e então injeta esses elementos diretamente na lógica do seu aplicativo Vamos pedir à Gemini que adicione recursos de IA e veja como isso funciona. No bate-papo à esquerda, o Gemini fornece uma visão geral de quais recursos de IA foram adicionados ao aplicativo Podemos responder no chat e pedir à Gemini que faça alterações adicionais Mas primeiro, vamos experimentar esses novos recursos. Aqui está o recurso mágico número dois. Vemos que o Gemini I propôs mais ingredientes de saúde em vez do que acabei de selecionar, mas eu não o tenho no momento, então vou clicar em Cancelar e continuar com esses três Aqui está o cartão de sabedoria da EI, muito bom. E, claro, vamos experimentar como o narrador de áudio funciona Levante-se e brilhe. A missão de hoje é o lado ensolarado das nuvens de espinafre e abacate O espinafre rico em ferro combinado com as gorduras mono e saturadas do abacate fornece um impulso de energia limpa que mantém você ágil e revigorado Vamos fazer uma alteração em um dos recursos. Gemini confirma que a mudança foi feita, então vamos testá-la Respire fundo e vamos começar o dia. Sua receita de hoje é o Emerald Cloud Nest. A combinação de espinafre rico em ferro e gorduras monoinsaturadas do abacate garante uma liberação lenta de energia, mantendo você leve e arejado Wasson, acabamos de ver como Gemini seguiu nossas instruções, e sugiro que retornemos à barra de ferramentas do Gemini Canvas e a A próxima vez que consigo ouvir é a alça de arrasto. Ele é usado para mover o atolbr para não bloquear a navegação do seu aplicativo durante E também há um terceiro ícone, a ferramenta de refinamento, que diz ao Gemini modifique um elemento específico do seu aplicativo Você pode notar que não está visível aqui em nosso aplicativo Golden Hour. Na verdade, isso é intencional. Gemini reconhece que esse aplicativo passou por iterações suficientes, portanto, pequenas edições automatizadas Se ele tentar ajustar um elemento, mas interpretar mal o contexto, poderá quebrar outra coisa que depende dele Por isso, ele oculta o ícone como medida de proteção para demonstrar como a ferramenta de refinamento Vamos mudar para um aplicativo mais simples. Comecei a construir antes de gravar este tutorial. Eu fiz apenas algumas iterações lá, então o ícone está disponível Digamos que eu queira mudar a cor desse botão. Então, estou escolhendo selecionar e perguntar, destacar esse botão e digitar meu prompt, sugerir outra paleta de cores Percebo o que aconteceu aqui. Em vez de mudar apenas esse botão, a cor, o Gemini redesenhou todo o aplicativo. Por que isso? Acontece que a paleta de palavras é o problema aqui. Uma paleta de cores se refere a todo o conjunto de cores usado em seu aplicativo Então, Gemini interpreta isso literalmente e atualiza tudo para combinar Não está fazendo nada de errado. É só seguir suas instruções com precisão. Para alterar somente a cor desse botão, você precisa descrever claramente o escopo da alteração. Deixe-me mostrar como. Estou selecionando o botão novamente e digitando outro prompt Você vê que minha solicitação detalhada funcionou e, desta vez, Gemini I aplicou as alterações no elemento que indiquei por meio da ferramenta de refinamento Isso é algo muito útil de se ter em mente. Quanto mais específica for sua solicitação, mais preciso será o resultado. Vamos voltar ao nosso aplicativo Golden Hour. Agora que abordamos como refinar e ajustar seu aplicativo. Vamos falar sobre o que acontece quando você está feliz com isso. Passo quatro, compartilhe. Depois de terminar, você pode obter um link compartilhável e enviá-lo para qualquer pessoa Eles podem abrir e usar o aplicativo diretamente no navegador. Sem downloads, sem sinais, sem configuração técnica. Eles podem até mesmo remixá-lo. Esse é um dos recursos que o Google incorporou ao Canvas. Alguém pode pegar seu aplicativo, abri-lo e criar sua própria versão a partir dele. Tudo bem. E pronto , neste tutorial, compartilhe em quais aplicativos você está trabalhando na seção de perguntas e respostas deste Eu adoraria ver o que você está construindo.

Gemini Google AI: a única IA que cuida de tudo (imagens, vídeo e texto)

Anna Kolenkina, Product Builder, Entrepreneur

Assista a este curso e milhares de outros

Assista a este curso e milhares de outros

Aulas neste curso

1.

Sejam bem-vindos ao curso sobre IA do Google Gemini!

3:06

2.

O que é o Gemini? Como entender o ecossistema de IA do Google

5:57

3.

Conheça a família de modelos Gêmeos

4:38

4.

Configurando o Gemini e seu primeiro chat

4:53

5.

Promovendo o Gemini para obter melhores resultados: introdução da seção

1:39

6.

O que é um prompt? Prompts, engenharia de propostas, propostas pessoais x de produção

4:59

7.

Como falar com a IA do Google Gemini Os elementos de um prompt efetivo

7:57

8.

Criando respostas do Gemini: gerador iterativo

5:54

9.

Tornando Gêmeos verdadeiramente seu: personalização

7:14

10.

Como compartilhar arquivos e outros conteúdos com a IA do Google Gemini

9:20

11.

Usando exemplos nas suas propostas

10:37

12.

Especificando o formato de saída no Gemini

4:46

13.

Acompanhe o processo: escolher o modelo certo e fazer um brainstorming com o Gemini

9:43

14.

Acompanhe: receba feedback com a IA do Google Gemini

8:48

15.

mantendo a realidade: estratégias práticas para minimizar alucinações de IA

10:12

16.

Como trabalhar com tela Gemini e pedras preciosas: introdução da seção

1:38

17.

Boas-vindas à tela Gemini

3:39

18.

Acompanhe: como criar e editar documentos no Gemini Canvas (parte 1)

5:38

19.

Acompanhe: como criar e editar documentos no Gemini Canvas (parte 2)

5:42

20.

Acompanhe: transformando um esboço de Gemini em um PDF polido com o Gamma

9:29

21.

O que são joias gêmeas e por que precisamos delas?

5:34

22.

Acompanhe: criando uma joia de verificação de gramática

10:10

23.

Acompanhe: Criando uma joia do treinador de fitness (parte 1)

7:23

24.

Acompanhe: Criando uma joia do treinador de fitness (parte 2)

4:46

25.

Gemini para criação visual: introdução da seção

2:11