Transcrições
1. Sejam bem-vindos ao curso sobre IA do Google Gemini!: Todos, e bem-vindos ao
curso sobre o Google Gemini. Você sabia que o Google
Gemini
ultrapassou oficialmente 750 milhões de usuários ativos
mensais Isso é quase três quartos
de 1 bilhão de pessoas. Para colocar isso em perspectiva, crescimento da
Gemini está atualmente superando quase todos os outros chatbots de
IA do mercado,
fechando a lacuna com o ChatGPT mais rápido do que qualquer um previu Mas não se trata apenas números, porque
o Gemini
foi criado pelo Google Agora é o EI mais
integrado do mundo. Ele está dentro do seu Gmail, do Google Docs,
do navegador Chrome e do seu celular Isso representa a maior
mudança na forma como trabalhamos e criamos desde a
invenção da Internet Estamos nos movendo em direção a um mundo em que a EI não serve apenas para usá-la. É um colaborador que já
está onde você trabalha. Meu nome é Anna e eu serei sua instrutora neste curso Instrutor on-line
com meus outros cursos disponíveis aqui na plataforma, foco em
gerenciamento de produtos e IA generativa Ao participar deste curso, você terá acesso a mais de
4 horas de conteúdo HDVDo, tutoriais e
atividades
passo a passo destacando o mundo
real, aplicações
práticas
das ferramentas Gemini, resumos
em PDF para revisar
os principais insights do curso e muito, resumos
em PDF para revisar principais insights do Começaremos aprendendo do
que o Gemini é capaz, como se comunicar com ele, estruturar suas solicitações
e como fazer com que o Gemini
funcione melhor para A partir daí, analisaremos cenários
práticos usando o Gemini para debater ideias e
obter feedback profissional Construindo seus próprios sistemas EI
personalizados para tarefas específicas e
gerando imagens de alta qualidade Também abordaremos técnicas
avançadas, como pesquisas
aprofundadas para transformar tarefas
complexas em
relatórios detalhados e criar aplicativos
totalmente funcionais apenas
descrevendo o que você deseja. Sem necessidade de codificação. E
garantiremos que você saiba como identificar e evitar
respostas incorretas da IA, para que seu trabalho seja sempre preciso. E sim, você não precisa de
nenhuma formação técnica ou conhecimento prévio de IA para
começar o curso. Então, vamos começar Ilsa
no próximo vídeo.
2. O que é o Gemini? Como entender o ecossistema de IA do Google: Todos, e bem-vindos
à primeira palestra do curso. Pense em todos os filmes de
ficção científica que
você já viu. Sempre existe
aquele personagem, um assistente, que não espera
apenas por um comando, mas realmente entende
o mundo do herói. Ele antecipa os
problemas antes que eles aconteçam e atua como
um verdadeiro parceiro Durante anos, isso
foi apenas ficção. Mas com a Gemini, estamos
cada vez mais perto um futuro em que esse tipo de parceria está
se tornando realidade Então, o que é Gêmeos? Gosto de pensar nisso como
três camadas de uma casa, a base, o cérebro. Esses são os
próprios modelos Gemini construídos pelo Laboratório de
Pesquisa Deep Mind do Google Neste curso, usaremos a última geração
dos modelos Gemini Isso inclui modelos de raciocínio de alto
nível para lógica complexa, ferramentas
avançadas de geração de imagens para visuais fotorrealistas e modelos de vídeo de
próxima geração que podem gerar
cenas de alta definição Esses modelos são nativamente multimodais, o que significa que eles
não processam apenas texto Eles veem aqui e pensam em todos os meios ao
mesmo tempo, assim como nós. Voltando à analogia da
casa, o segundo nível é a
sala de estar, o assistente Essa é a base em que
passaremos a maior parte do tempo
no aplicativo em seu telefone e
no site
gemini.google.com É um espaço criativo
onde você pode conversar com códigos e usar ferramentas como o Jams para
personalizar o comportamento do EI E, finalmente, a terceira camada
é a infraestrutura. Este é o Gemini
morando no Gmail, no Google Docs, e a pesquisa é a
visão geral do EI que resume seus resultados de pesquisa ou o botão
ajude-me a escrever que Neste curso, nosso foco está nessa camada intermediária,
aquela GeminieIsIsTet A visão do Google
em relação a isso é centrada em três partes:
pessoal, proativa Vamos explorar o que isso significa. Primeiro, é pessoal. A maioria dos modelos de IA são generalistas. Eles sabem muito sobre o mundo, mas muito pouco sobre você. O Gemini foi projetado para ser
sua extensão pessoal. Com sua permissão,
ele pode se conectar ao seu
contexto pessoal, seus e-mails, seus arquivos e seu
histórico para fornecer ajuda que seja exclusivamente
relevante para sua vida Em segundo lugar, é proativo. Hoje, a maior parte da IA é reativa. Você pergunta as respostas. O futuro de Gêmeos é ver
o que está por vir. Se você tiver uma
apresentação para um grande cliente na sexta-feira, Gemini não deve apenas
lembrá-lo de que ela está chegando Ele deve examinar seu calendário
uma semana antes e dizer: Percebi que sua reunião estratégica com a empresa A será na sexta-feira, base na proposta
em sua campanha e na última
ameaça por e-mail com a equipe. Aqui está o resumo da preparação e três perguntas
que você provavelmente enfrentará. Em terceiro lugar, é poderoso. Com os últimos
avanços do Gemini, estamos indo além da simples geração de texto para pensar que coisas existem, esteja você criando um site inteiro a partir de
um único prompt ou criando
um vídeo
cinematográfico para O poder que costumava exigir uma equipe inteira de especialistas agora
está ao seu alcance Mas ter todo esse poder
não significa que eu esteja no comando. É importante lembrar que mesmo quando o geminiano está
sendo proativo, está sempre assumindo sua liderança Não tem sua própria
agenda secreta ou conjunto de crenças. Ele foi projetado para
seguir as ordens. Você o fornece por meio de suas
instruções e preferências. Portanto, seja atuando
como pesquisador, programador ou colaborador
criativo, você está sempre no banco
do motorista Produtividade não é a
EI fazendo suas próprias coisas. É o EI
antecipando o que você precisa porque você
já definiu a meta Agora que exploramos a visão e a arquitetura, é hora de passar da
teoria à prática Na próxima palestra, examinaremos mais de perto os diferentes modelos
especializados raciocínio, imagens e vídeo E também mostrarei como
configurar sua conta no Gemini.
Te vejo lá.
3. Conheça a família de modelos Gêmeos: Na última palestra,
falamos sobre Gêmeos como uma casa de três camadas,
o cérebro, o assistente
e o motor integrado Agora vamos aprofundar um nível
mais profundo nesse cérebro. A maioria dos modelos EI mais antigos
foram treinados
primeiro em texto e depois tiveram outros
recursos em camadas O Gemini foi construído
de forma diferente do zero
para ser multimodal Isso significa que ele não lê
apenas a descrição
de um vídeo, eu realmente
entendo o vídeo, o áudio, as imagens e o texto, tudo ao
mesmo tempo. Se você estiver fazendo upload de
1.000 páginas em PDF, um vídeo de uma hora ou
uma enorme base de código, Gemini processa tudo
em um espaço unificado Não é traduzir secretamente imagens em texto nos
bastidores, é vê-las Ao abrir o Gemini
em geminiggle.com, você Pense neles como modos
diferentes, cada um direcionando você para um modelo
subjacente diferente que o Google otimizou para
um tipo específico de tarefa A
família completa do Google Model é vasta, mas para o uso diário, esses são os que você mais
procurará. Antes de examiná-los, uma nota rápida sobre o que
realmente é um modelo . Pense
nisso como um especialista, você está contratando para um emprego. Cada modelo foi
treinado de forma diferente, alimentado com diferentes tipos de dados e otimizado para
diferentes pontos fortes. Quando você escolhe um modo em Gêmeos, você está basicamente
escolhendo a qual especialista entregar sua tarefa Rápido é nosso velocista
rápido e comunicativo. Esse é o especialista que
você procura quando precisa de
uma resposta instantânea. Um resumo rápido ou ajuda na
redação de uma mensagem rápida. Ele é otimizado para velocidade e lida com um grande
volume de solicitações. Só não exagere
em nada que exija um raciocínio profundo em várias
etapas Pensar é nosso estrategista. Esse especialista faz uma pausa
antes de responder, mapeando sua lógica antes de
dar uma Se você tiver um problema complexo, plano de
várias etapas para
resolver ou uma pergunta
diferenciada em que uma
resposta rápida possa errar É aquele que
pensa antes de falar. Pro é nosso especialista. Você faz isso quando a tarefa
é complexa, pesquisa profunda, análise de um documento grande, redação
avançada que
precisa ter o tom exato. Pro usa o modelo
subjacente mais capaz da família, que significa que ele pode armazenar
mais informações de
uma vez e captar mais nuances que os outros
modelos possam perder. A desvantagem é
que ele é mais lento e tem limites de
uso diário mais baixos Portanto, guarde-o para
as tarefas realmente necessárias. Esses três modelos de raciocínio rápido e profissional são os modelos da linguagem Gemini Eles são o que
impulsiona a conversa. Mas a família Gemini
não para por aí. Ele também inclui modelos
dedicados para geração de imagem e vídeo, e você os aciona simplesmente usando os
comandos de geração de imagem ou geração de vídeo diretamente no bate-papo ou na interface do
Gemini Ao fazer isso, a Gemini
discretamente entrega a tarefa ao
especialista certo nos bastidores,
e nos encontraremos com esses especialistas
posteriormente no curso Agora, depois de descobrirmos com
quais modelos
vamos trabalhar, deixe-me explicar como ter acesso
ao Gemini
4. Configurando o Gemini e seu primeiro chat: Acesse gemini dot Google forward slash
assinaturas para ver planos atuais e, apenas avise,
os preços e a disponibilidade
variam Então, o que você vê na
tela pode parecer um pouco diferente do
que estou mostrando aqui. O plano gratuito oferece acesso
diário ao Gemini. É um bom ponto de partida e não
requer nada
mais do que uma conta do Google. O Google AI plus
oferece mais acesso
aos modelos e recursos mais capazes, incluindo geração aprimorada de imagens
e vídeos, e você teria acesso
ao Gemini no Gmail, bem
como ao Google O Google AI Pro aumenta
ainda mais com maiores limites de uso do
Gemini em seu Gmail, Google MIT Docs, além slides e dois terabytes E, finalmente, o Google AI
ultra é o melhor. Ele oferece os maiores limites
de uso, além de acesso antecipado exclusivo
aos novos recursos do Google. Minha recomendação aqui
seria continuar com Google AI, desde que ele
ofereça um teste gratuito, que significa que você pode
acompanhar tudo o que eu demonstro aqui no curso sem nenhum
custo, durante o primeiro mês. E depois desse mês de teste gratuito, você pode decidir se deseja
continuar com sua
assinatura ou se deseja downgrade para o Google plus ou retornar
à assinatura gratuita Para começar, selecione
seu plano de associação e clique em Começar. Em seguida, você precisa fornecer uma
forma de pagamento para o teste, mas você não será
cobrado se cancelar
ou fazer o downgrade antes
do fim do mês Depois de fazer login, isso é o que você vê no canto
superior direito, você vê seu plano de associação Pro, caso você
decida se
inscrever como membro do AI pro
ou, além disso, se decidir seguir em frente com
esse plano no centro
da tela, sua
entrada principal de bate-papo abaixo da barra de entrada, você notará uma fileira
de botões de início rápido. Esses são apenas atalhos para você
começar rapidamente. Você também verá
um seletor de modo. Atualmente, ele é exibido rapidamente. Este é o seletor de modelos sobre o qual
acabamos de falar. Clique nele para alternar entre rápido, inteligente ou profissional,
dependendo do que você precisa. No lado esquerdo, ao clicar no ícone do menu, abre sua barra lateral, onde
você encontrará seu histórico de conversas Você também pode iniciar um
novo bate-papo aqui. Vamos tentar fazer isso. Eu o mantenho no
modo rápido neste bate-papo, pois vou fazer uma pergunta
direta Estou começando o curso sobre
Gêmeos com base na data de hoje. Quais são as três atualizações principais mais
recentes o Google lançou para
o ecossistema Gemini Solicito que o Gemini
pesquise na web para verificá-los e resumi-los para
mim. Vamos clicar em Enviar. Observe que Gêmeos não responde
apenas de memória. Ele sai e pesquisa na
web em tempo real e depois me
traz os resultados relevantes para hoje quando eu
gravo este tutorial. Aqui estão as três mudanças mais
recentes que Gemini introduziu
no mês passado E, claro, vamos
falar sobre eles
aqui no curso. Na próxima seção,
pegamos tudo o que
acabamos de configurar aqui
e o colocamos em prática, começando com a forma de escrever um ótimo prompt.
Te vejo lá.
5. Promovendo o Gemini para obter melhores resultados: introdução da seção: Bem-vindo à nova seção
sobre engenharia rápida. Essa é a parte do curso que você aprende uma
habilidade que torna cada ferramenta de IA mais
útil: como redigir instruções que sempre
oferecem excelentes resultados Começaremos com as
definições do que é uma solicitação, o que significa uma solicitação e como engenharia
rápida se
encaixa no panorama geral Em seguida, veremos dois modos. Não há solicitações
no chat e na produção quando você
cria
solicitações para serem reutilizadas. Depois disso, mostrarei uma fórmula simples
de solicitação Você pode usar para quase tudo. Você também praticará a solicitação
iterativa, como aproveitar as respostas
anteriores e melhorar a
produção passo a passo Você aprenderá a
orientar com exemplos, a solicitar o formato
de saída exato desejado e a trabalhar com
arquivos e anexos E, claro,
usaremos a solicitação multimodal. Man e seu prompt podem
incluir texto e documentos, imagens de
captura de tela e links Ao final desta seção, você se sentirá confiante em
usar essas habilidades de estímulo em tarefas reais de trabalho ou projetos
pessoais. Vamos começar
6. O que é um prompt? Prompts, engenharia de propostas, propostas pessoais x de produção: Todo mundo. Pense na última vez que você fez uma pergunta a alguém. A maneira como você formulou
essa pergunta provavelmente influenciou a
resposta que você recebeu Isso é exatamente o que estamos vendo hoje no mundo da IA. Começaremos detalhando
três termos-chave que são essenciais para a comunicação
com sistemas de IA O que exatamente é um prompt? O que queremos dizer com “inspirar”? E como a engenharia
rápida reúne tudo isso? Também exploraremos essa
distinção entre chat e
solicitação corporativa. Vamos começar. Um prompt é a entrada
que você fornece a uma IA, sua instrução, o que você quer e o contexto que você fornece. Texto, arquivos, imagens,
links, exemplos ou dados. Pense nisso como o que
impulsiona a resposta dos EIs. Solicitar é o ato de
escrever essas instruções. É a
atividade geral de
interagir e dar
instruções aos modelos de IA Esse é o processo de
comunicação com o modelo. A engenharia imediata é uma abordagem
mais especializada e
sistemática para criar e
refinar solicitações Envolve entender
como o modelo raciocina, testar e iterar as instruções e
considerar os casos Pense nisso como cozinhar. Um aviso é como
uma única receita. Promptin é como
cozinhar em geral, e engenharia rápida é como ser um chef
profissional que desenvolve e testa
receitas
sistematicamente ,
considerando ingredientes,
equipamentos, preferências do usuário e assim por diante Agora, existem dois tipos principais de solicitação que você
precisa conhecer
: a solicitação pessoal e a solicitação de produção ou
empresarial A solicitação pessoal é o que a
maioria das pessoas faz em um bate-papo. Você escreve uma solicitação,
a IA responde e pode continuar
refinando-a por meio É flexível e informal. Se sua primeira mensagem não for
perfeita, não é grande coisa. Basta acompanhar,
esclarecer e iterar. Por exemplo, pedir à N
AI para ajudá-lo a escrever um e-mail, debater ideias ou resumir um documento
na interface de bate-papo Essa é uma inspiração pessoal. A
solicitação de produção ou empresa, por outro lado,
ocorre quando você cria solicitações
para serem reutilizadas por você,
por uma equipe ou dentro de um
produto ou fluxo O objetivo não é apenas
uma boa resposta uma vez, mas resultados consistentes em
várias execuções e muitas entradas Por exemplo, imagine um assistente de suporte
ao cliente no site de uma empresa. Ele precisa responder a milhares de
perguntas de clientes de forma confiável,
incluindo informações do MC, como erros de digitação, solicitações
pouco claras Nesse cenário, os prompts
precisam ser mais estruturados, mais previsíveis
e mais confiáveis É por isso que os prompts de produção geralmente incluem regras claras, formato de saída mais
rígido e
mais barreiras de proteção, pois eles foram
feitos para funcionar repetidamente,
não apenas uma vez feitos para funcionar repetidamente,
não apenas Em outras palavras, a solicitação
pessoal
ou a solicitação por chat ajudam você a obter ótimos resultados primeiro e solicitação
de produção ajuda a
obter resultados confiáveis repetidamente Por que falamos tanto
sobre essa distinção entre inspiração pessoal
e inspiração de produção Porque a maneira como você
escreve e refina os prompts muda
dependendo da configuração Se você pesquisar
materiais extras na solicitação, geralmente
encontrará conselhos projetados para uso em
produção, avisos que precisam funcionar de
forma confiável para muitos usuários, muitas entradas e
muitos casos extremos Isso é muito útil
quando você está criando fluxos de trabalho
repetíveis ou
integrando a EI Mas se seu principal caso de
uso for apenas usar uma IA em um bate-papo para
obter ajuda no momento, você não precisa complicar demais então lembre-se dessa
distinção Neste curso, vamos nos
concentrar principalmente na solicitação
pessoal
em uma interface de bate-papo Agora que estamos na mesma página com
a terminologia, vamos mergulhar no
lado prático da inspiração pessoal Allca na próxima palestra.
7. Como falar com a IA do Google Gemini Os elementos de um prompt efetivo: Todo mundo. Bem-vindo à nossa primeira
palestra sobre solicitação de bate-papo Aqui, você aprenderá
como
criar e refinar solicitações que podem ser usadas
na interface de bate-papo Vamos começar. Ao conversar com um amigo, você não usa modelos rígidos
ou estruturas formais Você tem uma conversa
fluida natural. O mesmo princípio se aplica à solicitação de
bate-papo com modelos de IA No entanto, há
momentos em que um pouco de
estrutura pode nos ajudar a obter melhores resultados e tornar um prompt mais
eficaz do que outro. Então, vamos abordar os
principais ingredientes de um aviso eficaz. A parte central de cada solicitação é a intenção ou tarefa
principal Isso pode assumir a
forma de instruções, como escrever um e-mail de cinco
parágrafos para apresentar um novo
aplicativo de produtividade aos proprietários de pequenas empresas, com foco em seus recursos de
economia de tempo. Pense nas instruções como a tarefa que você deseja que o
modelo execute. Outra forma que a intenção pode
assumir é uma pergunta como: quais etapas devo seguir para criar um perfil atraente no
Linkin Ou como faço para estruturar um
plano de negócios para uma ideia de startup? Ao escrever uma tarefa, seu objetivo é ser claro e específico sobre o que você
gostaria de alcançar. Escrever algo como me ajude com a apresentação
não será suficiente para obter um
documento de alta qualidade que você possa apresentar
com confiança
ao seu chefe, colegas ou investidores Como regra geral,
lembre-se de que qualquer pessoa sem conhecimento
específico do
assunto deve ser capaz de entender sua
solicitação e executá-la Se eles ficarem confusos sobre como seguir
suas instruções, o sistema EI também
ficará confuso. Não presuma que ele tenha alguma informação contextual
sobre sua tarefa, como como os
resultados serão usados, quem é o público-alvo Qual é
a
aparência da conclusão bem-sucedida da tarefa ou uma lista de pontos
que você não abordará. Você mesmo precisa fornecer
esses detalhes do contexto ou da tarefa. Por exemplo, se você quiser
criar uma apresentação, inclua informações sobre
o número de slides, a finalidade da apresentação os principais tópicos a serem abordados. Aqui está um exemplo de
um prompt bem elaborado. Crie uma apresentação de sete
slides sobre o tema da marca
pessoal Inclua o que é, medidores de largura, principais componentes e etapas
para desenvolver sua marca. Ou outro exemplo,
explique como
escrever um e-mail convincente
em cinco etapas fáceis As instruções devem abranger elaboração e o engajamento da linha de
assunto, a
estruturação clara do e-mail e o uso de um tom profissional Torne o processo simples
o suficiente para qualquer pessoa seguir, mesmo sem
experiência prévia em redação formal. Você pode fornecer contexto, não apenas para a tarefa em si, mas também para o tom
que você gostaria de usar. Por exemplo, use um tom de
conversa que equilibre profissionalismo Você também pode especificar regras ou restrições que o
sistema EI deve Por exemplo, na solicitação do guia de
redação de e-mails que acabamos de abordar, você pode adicionar: Quando sua solicitação envolve
afirmações factuais, como estatísticas, eventos
atuais, características
do produto, informações
legais ou médicas ou qualquer coisa em que a precisão
realmente importe, existem dois ingredientes extras que podem
melhorar significativamente o resultado A primeira é a
verificação da realidade, também chamada de aterramento. É quando você
está contando ao EI. Não pareça apenas
confiante, seja verificável. Portanto, você pode adicionar uma
regra como, se
fizer afirmações factuais,
citar fontes e me dizer sobre o que não tem
certeza, segundo ingrediente
é
o raciocínio Muitos tópicos
mudam rapidamente: ferramentas, recursos
de preços,
políticas e melhores práticas. Por isso, ajuda dizer ao EI
qual janela de tempo usar. Por exemplo, use fontes
dos últimos 12 meses, a menos que todos
os recursos sejam necessários. Aqui está o que acontece
quando você adiciona os dois a um prompt. Essas duas adições
são especialmente úteis quando você usa a IA para
pesquisa ou tomada de decisões, não apenas para escrever,
porque elas incentivam a resposta a ser clara
sobre o que está comprovado, o que é atual e
o que é incerto Outra forma de aprimorar
sua solicitação é
atribuir uma função específica
ao executar uma tarefa. Isso também é conhecido
como solicitação de função. A dramatização ajuda os modelos de
IA
a adotar as nuances de perspectivas
específicas, melhorando a relevância e a
qualidade de suas respostas. Por exemplo, atue como assistente executivo experiente com mais de 15 anos de experiência no
gerenciamento de correspondência
comercial de alto nível ou finja ser um redator
profissional que
virou consultor de redação de e-mails Você pode levar a função
um passo adiante,
fornecendo contexto ao público,
além da
função. Por exemplo, observe como o EI adapta
os exemplos de
prós e contras para torná-los
identificáveis para identificáveis É muito incrível. E se você está se sentindo sobrecarregado com a ideia de criar um aviso tão
detalhado, não se preocupe A vantagem de trabalhar em uma interface de bate-papo
é que você não precisa criar um prompt perfeitamente pensado para
iniciar a conversa. Você pode começar com uma pergunta ou tarefa
ampla e refiná-la por meio do
diálogo com o modelo EI Essa abordagem iterativa
permite que você esclareça suas necessidades e melhore as respostas
recebidas ao longo do tempo Falaremos mais sobre a solicitação interativa
em nosso próximo vídeo
e, por enquanto, vamos resumir o que falamos
nesta palestra
8. Criando respostas do Gemini: gerador iterativo: Todos, bem-vindos de volta. Se, depois de assistir à palestra
anterior, você achar que criar um bom
prompt é uma tarefa árdua e precisa se transformar em um engenheiro rápido para
ter sucesso nesse Aqui está um segredo
que os especialistas usam. Pense na solicitação como
uma conversa ou um processo de
várias etapas,
não uma pergunta única.
Assim como você pode esclarecer as
direções em uma nova
cidade com um morador uma conversa ou um processo de
várias etapas, não uma pergunta única Assim como você pode esclarecer local, você pode refinar suas solicitações com
base nas Vamos dar uma olhada em um exemplo
real de solicitação iterativa
para ver como ela funciona Digamos que gostaríamos que
o EI nos ajudasse a criar uma proposta comercial para um serviço
móvel de tratamento de cães Primeiro passo, a solicitação inicial pode ser bastante ampla, como criar um esboço para uma proposta
comercial para um serviço móvel de cuidados com
cães Na segunda etapa,
restringimos ou refinamos nossa solicitação inicial
dizendo algo como:
pegue o esboço, crie e expanda a seção de análise de
mercado, crie e expanda a seção de análise de
mercado, concentre-se nos dados demográficos e na
concorrência em Na terceira etapa, solicitamos detalhes específicos. Por exemplo, agora desenvolva a seção de
projeções financeiras, inclua custos iniciais, despesas operacionais
mensais e previsões de receita
para o primeiro ano Podemos repetir as etapas dois
e três várias vezes, dependendo de quão satisfeitos estamos
com as respostas. Às vezes, a solicitação iterativa
é ainda mais poderosa quando você está trabalhando em algo que
precisa ser preciso, não apenas bem escrito Por exemplo, primeiro
passo, comece de forma ampla. Dê-me uma visão geral
do mercado móveis
para cães
em áreas urbanas Segundo passo, peça
suposições e evidências. Liste as principais suposições
que você está fazendo. Se você mencionar fatos ou números, diga-me de onde eles vêm e sinalize qualquer coisa sobre a qual
você não tenha certeza. Etapa três, verificação cruzada. Agora, sanidade, verifique
sua própria resposta. Quais partes têm maior probabilidade de
estar erradas ou desatualizadas? O que você verificaria primeiro? Dessa forma, você não está apenas
aprimorando o texto, mas melhorando a confiabilidade
do conteúdo à medida que Observe que, assim como
um gerente de projeto qualificado se baseia em
discussões e decisões anteriores, IA baseada em
bate-papo mantém o contexto
de sua conversa Isso significa que você pode consultar
partes anteriores
do bate-papo e desenvolvê-las em vez de repetir
tudo do zero Então, você pode perguntar
algo como, com base
na estratégia de marketing que
discutimos anteriormente neste bate-papo, vamos nos basear nela, mas focar em famílias
suburbanas em áreas
com opções limitadas de cuidados pessoais Obviamente, se você acha que sua conversa não está
indo na direção certa, você sempre tem a
opção de
recomeçar e reformular
a primeira pergunta A etapa final do processo
iterativo geralmente envolve pedir
à IA que aperfeiçoe a resposta Como alternativa, você pode pedir feedback sobre todo o conteúdo. Nesse caso, a proposta
comercial, com foco em como ela pode
ser melhorada ainda mais. Em seguida, você pode incluir essas alterações na
versão final do documento. Essa
abordagem passo a passo permite que você
revise e refine a
saída em cada estágio, faça ajustes com
base nos resultados intermediários, mantenha o controle sobre
o produto final e aumente a complexidade gradualmente Pense nisso como esculpir. Você começa com a forma básica e depois
refina gradualmente os detalhes até conseguir
exatamente o que deseja E isso é tudo para o vídeo. Vamos resumir os pontos-chave
que acabamos de abordar.
9. Tornando Gêmeos verdadeiramente seu: personalização: Olá a todos, e bem-vindos de volta. Às vezes, quando você está
conversando com um assistente de IA, parece que você está começando do zero
todas as vezes. Você pode escrever o prompt perfeito e ainda obter uma resposta genérica porque o Gemini não tem ideia de quem você é e como
trabalha. Neste vídeo, veremos como
fazer o Gemini funcionar
da maneira que você Há três níveis de personalização que você pode usar
para personalizar sua experiência O nível um são as instruções básicas
personalizadas. Você diz a Gêmeos como você queria se comportar
todas as vezes. Seja sempre profissional, sempre formate as respostas como marcadores O que quer que funcione para você, evita que você
se repita em cada solicitação O nível dois é a memória de
bate-papo intermediária. É aqui que o Gemini
começa a se lembrar dos fatos e preferências de suas conversas
anteriores, para que você possa continuar exatamente de
onde parou E o nível três é a inteligência
pessoal mais avançada. Isso permite que o Gemini
conecte os pontos em todo o seu ecossistema
do Google, seu GML, suas fotos, YouTube e até mesmo seu Imagine em vez de passar
horas jogando uma viagem de fim de semana. Você acabou de dizer que os geminianos planejam uma viagem para este sábado
com base no meu hobby favorito Personal Intelligence encontra sua recente compra de equipamento de caminhada em Jimel, extrai suas fotos
de trilhas favoritas do Google Fotos, verifica seu
histórico de exibição no YouTube em busca de guias locais e sugere uma trilha específica, sabendo exatamente qual nível de
dificuldade é adequado Uma coisa que vale a pena observar
antes de começarmos inteligência
pessoal ainda
está sendo implementada, então vamos nos concentrar nos dois
primeiros níveis hoje. Além disso, esses recursos
de personalização fazem parte da assinatura do Google
AI Pro Se você ainda não fez o upgrade, confira nossa palestra em que
mostrei como obter
acesso gratuito Vamos entrar na demonstração. Começaremos acessando o aplicativo web Gemini em gemini.google.com Eu já entrei
na minha conta P. Em seguida, olhe para o canto inferior esquerdo da tela e clique
no ícone de engrenagem de Configurações. Nesse menu, selecione contexto
pessoal. A primeira configuração é chamada de
seus melhores chapéus com Gêmeos. Quando está ligado,
como na minha tela aqui, Gêmeos aprende com sua história para entendê-lo
melhor com o tempo Quando acabei de ativar
essa configuração, aqui está o que Gemini
sugeriu para mim. Ele resumiu corretamente
todas as coisas que venho
trabalhando recentemente E, a propósito, se
você quiser ter uma conversa privada que
não esteja armazenada no histórico de bate-papo, você pode usar o bate-papo temporário. Você vê que ele está
disponível aqui
no canto superior esquerdo da
tela. Então, vamos clicar nele. Vemos a mesma interface com a qual
você já está familiarizado. Deixe-me perguntar uma coisa. Estou usando um modelo rápido , pois essa é apenas uma pergunta
muito rápida. Então, aqui estão as sugestões. Eles são muito bons. E já que estávamos experimentando
o bate-papo temporário, deixe-me dar uma olhada no meu histórico de bate-papo Você vê que não temos nada relacionado a
um branco liso aqui. Deixe-me tentar atualizar a
página para garantir que esse bate-papo temporário não seja
salvo no histórico do bate-papo Sim, tudo bem. Mas,
ao mesmo tempo, também perdemos essa
conversa. Tudo bem, vamos voltar às configurações,
ao contexto pessoal O segundo Google aqui se
chama Your Instructions
for Gemini Vemos que eles também estão ativos por padrão para adicionar
uma nova instrução, um clique no AD. E aqui podemos incluir qualquer informação
sobre seu comportamento, estilo de comunicação
pessoal, quaisquer preferências que você
queira compartilhar com a Gemini Então, aqui está meu aviso. Então, eu gostaria de dividir as
instruções em duas partes. Primeiro, eu digo ao EI o que eu faço. Você vê aqui que eu
compartilhei meu papel como educador e também
como consultor, fornecendo um
pouco de contexto sobre o que eu faço em ambas
as funções E em segundo lugar, expliquei
como gosto de trabalhar. Vamos salvar essas instruções clicando no botão Enviar. Tudo bem. E, finalmente, para ver tudo o que o
Gemini armazenou, retorne às configurações e, a partir
daqui, clique em Atividade Esta é a lista de
todas as atividades que você
teve recentemente com o aplicativo Gemini Você pode excluir manualmente bate-papos
específicos
caso não precise deles
por determinados motivos, e também pode configurar
um cronograma de exclusão Portanto, seus dados são
apagados a cada poucos meses. Por exemplo, eu posso
escolher uma duração aqui. Vivo 18 meses, o que é um período de
tempo razoável para me livrar das conversas
antigas, e clico em Avançar. Perfeito. E isso é
tudo para este tutorial. Agora você já sabe como personalizar o gemini para funcionar exatamente
do jeito que você quiser E Alca no próximo vídeo.
10. Como compartilhar arquivos e outros conteúdos com a IA do Google Gemini: Olá a todos, e bem-vindos de volta. Nas palestras anteriores
sobre engenharia rápida, falamos muito
sobre como estruturar suas instruções e quais
informações incluir Mas, além das instruções, às vezes você também
precisa fornecer ao EI materiais de origem,
como documentos,
planilhas, capturas de tela ou PDFs, para que ele possa revisá-los e
analisá-los Vamos ver como isso funciona. Você pode fornecer
informações de documentos e imagens para o Gemini de duas
maneiras principais colando o
texto diretamente
no bate-papo ou
anexando o arquivo inteiro
à Portanto, a primeira opção de colar
o texto funciona bem quando você só precisa de ajuda com um
fragmento específico do seu Por exemplo, aqui está meu currículo, e eu quero feedback sobre apenas
uma seção do documento, para que eu possa simplesmente copiá-lo, colá-lo no chat e depois dar as
instruções ao Gemini Então eu disse que isso é um
fragmento do meu currículo e perguntei à Gemini se essas habilidades são relevantes para cargo
de chefe de produto de
uma startup de fintech E aqui está a resposta. Mas, muitas vezes, você quer que Gemini trabalhe com
o documento inteiro, como um PDF longo ou uma O Gemini pode lidar com praticamente
qualquer tipo
de arquivo comum , desde documentos do Word até arquivos CSV, fotos e até Para anexar o arquivo, clique no ícone de adição no lado esquerdo
da barra de bate-papo. Você pode escolher um arquivo
do seu dispositivo, do seu Google Drive, do
seu Google Fotos. Então, vamos dar um exemplo. Preciso de algumas ideias sobre
o que cozinhar para o jantar. O que vou
fazer é enviar várias fotos dos ingredientes que
tenho na minha geladeira. Esses são os
ingredientes que eu tenho. Vou perguntar a Gemini, quais são
as três receitas simples de jantar que posso fazer em menos de 20 minutos. E aqui estão as recomendações
que a Gemini forneceu. Você vê que ele
identificou com sucesso os ingredientes
com base nas fotos. Aqui vemos a capacidade de Gêmeos de
reconhecer objetos e
aplicar a Frisonina criativa Em seguida, vamos experimentar o documento. Digamos que você tenha recebido um documento
complexo de fatura de serviços públicos. Assim, você pode enviar este
PDF para o Gemini e perguntar se ele pode resumir as principais
cobranças. Vamos experimentar isso. Voltarei ao mesmo bate-papo, clicarei no ícone de adição e seguida, escolherei os arquivos
do meu Drive local. E aqui está meu aviso. Vamos usar o modelo rápido aqui porque deve ser uma solicitação bem
direta e vamos ver qual resposta
receberemos Sim, um ótimo
resumo correto das cobranças, bem
como do meu
uso de dados. Tudo bem aqui. Tudo bem, vamos tentar outra
coisa e enviar diferentes tipos de documentos para o Gemini para ver se ele realmente funciona
com arquivos diferentes Tenho um PDF com meu itinerário de voo para minha
próxima viagem a Phuket E aqui eu tenho um guia de viagem com algumas informações
sobre os passeios. Isso eu posso fazer lá
enquanto estou em Phuket. Tudo bem. Essa demonstração
demora um pouco. Então, o que eu
vou fazer é parar com essa resposta. Vou copiar esse aviso
e abrir um novo bate-papo. Eu incluí o mesmo aviso
e, aqui, vamos
começar a pensar. Porque eu tenho um documento PDF bastante
complexo aqui. Também tenho imagens com datas
concretas que Gemini precisa analisar e comparar com as datas deste
documento Então, talvez seja melhor
mudar para um modelo mais inteligente Vamos experimentar isso. Agora obtivemos o resultado
quase imediatamente. Então, vamos ler o que
Gêmeos nos diz. Ele reconhece todas
as informações nos documentos
que forneci e também descobriu uma
boa recomendação sobre o que posso fazer logo após
chegar ao meu destino É aqui que vemos o
Gemini atuando como nosso
cardinador pessoal conectando pontos em diferentes E lembre-se de que,
embora o Gemini possa ler e analisar esses arquivos
para gerar resumos, tabelas ou
recomendações, ele não alterará o arquivo
original Tudo bem,
continuando com nossa demonstração, digamos que eu tenha um arquivo de áudio que eu
quero que o Gemini analise, como sempre clicando
no botão Mais Em seguida, seleciono meu arquivo de áudio e aqui está meu prompt. Você pode resumir os
pontos principais desse áudio? Vou continuar usando modo de
pensamento aqui porque essa é uma tarefa mais complexa do que apenas fazer
uma pergunta rápida. E aqui está o resumo. Este é o resumo correto
fornecido pela Gemini. Posso confirmar isso, pois esta é a gravação que eu
mesmo preparei para meu outro curso. Ótimo trabalho, Gêmeos. E deixe-me também demonstrar
como ele pode funcionar com vídeos. Eu tenho este link para a
apresentação principal do Google. E como agora estou
trabalhando no curso Gemini,
quero que o Gemini me ajude a
encontrar todos os
momentos em que os palestrantes falam sobre o aplicativo
Gemini, Vamos pressionar Enter e ver
o que o Gemini vai sugerir. Aqui está a
análise detalhada deste vídeo. E o que eu realmente
gosto aqui é que ele incluiu os códigos de tempo. Por exemplo, vemos aqui que Gemini mencionou sobre o contexto
pessoal e incluiu esse código de
tempo específico em que um
dos palestrantes estava falando
sobre essa funcionalidade Então, se eu quiser
revisar essa conversa, posso simplesmente
clicar nesse código de tempo. Eu serei redirecionado para esta
parte da apresentação. E isso é tudo para esta palestra. Vamos resumir brevemente
o que aprendemos aqui. A maioria dos modelos modernos de IA
aceita formatos de arquivo comuns, incluindo PDFs, documentos do Word, arquivos
do Excel, CSVs,
imagens e arquivos de texto Os arquivos podem ser enviados usando um botão de upload ou ícone de
anexo
na interface de bate-papo Você precisa dar
instruções claras sobre o que deseja que
a IA faça com os arquivos. Ser específico
com suas solicitações leva a melhores resultados. Você pode fazer upload de
vários arquivos e pedir ao modelo de IA que os compare
ou analise juntos. A IA geralmente não
edita seu arquivo diretamente, mas pode gerar conteúdo
aprimorado. Você pode copiar de
volta para o seu documento. Tudo bem, e nos
vemos na próxima palestra.
11. Usando exemplos nas suas propostas: Todos, e bem-vindos de volta
à nova palestra, onde
continuamos falando sobre como se comunicar com sistemas de
EI e o que
incluir em sua solicitação Até agora, abordamos vários componentes que podem
ser incluídos em um prompt, uma tarefa ou o que você
gostaria de alcançar, seguidos por detalhes específicos ou contexto e regras necessárias para realizar a tarefa
ou responder a uma pergunta. Em seguida, está o contexto da função, uma função específica que o
EI desempenhará ao
realizar uma tarefa. Opcionalmente, você também pode apresentar o
público-alvo da sua tarefa Por fim, mencionamos
que você pode compartilhar conteúdo
adicional
anexando documentos à sua conversa ou
incluindo o texto como dados de
entrada diretamente
no bate-papo e em relação à ordem dos
componentes em sua solicitação A ordem é importante
para alguns elementos, mas não para outros. Por exemplo, é
recomendável incluir
o contexto de RL anteriormente
no prompt,
embora os dados de entrada possam não ser necessários
dependendo da tarefa, e sua ordenação também
seja flexível Mas, em geral, se você seguir
a ordem mostrada nos slides da apresentação do
curso, será um ótimo começo
para uma solicitação eficaz Ok, vamos apresentar outro
elemento de alerta. Exemplos. Exemplos também conhecidos como
fotos funcionam como demonstrações que orientam o modelo
generativo de IA sobre o tipo de saída que
você está procurando, incluindo o formato da resposta
e o que você deseja evitar Talvez você
já tenha ouvido falar de termos como um tiro ou alguns disparos. Eles se referem ao uso um ou vários exemplos em
sua descrição rápida. Para solicitações de bate-papo, os exemplos
geralmente demonstram o tom. Por exemplo, formal
versus informal, sério versus cronograma, empático versus
fato
e estilo, como tamanho da frase, padrões de
formato, marcadores
versus parágrafos, nível de detalhes
técnicos, terminologia
básica versus avançada Vamos examinar alguns exemplos
concretos. Primeiro, vou pedir ao Gemini um e-mail simples sem
dar nenhum exemplo Então, aqui está meu aviso. Para esta demonstração,
vou usar o modelo
Fest. Vamos executá-lo. Este e-mail é bom, mas também é bastante genérico. Agora, vamos torná-lo muito
mais específico, mostrando um exemplo do tom e da
estrutura que queremos. Então, aqui está meu outro aviso. Então, eu tenho a mesma
instrução no início
e, em seguida, forneci um exemplo como referência de estilo que
menciona o tom, o comprimento da
frase
e a estrutura que eu gostaria que o Gemini usasse Vamos executar essa segunda versão. Agora, se compararmos essa nova resposta com
a versão inicial, vemos que ela parece mais humana. As frases são mais curtas
e a estrutura está mais próxima do que
mostramos no exemplo. E enquanto estamos aqui
no exemplo de e-mail, deixe-me mostrar
rapidamente o que o Gemini pode fazer com esse e-mail a seguir Descobriu-se que você
não precisa copiar e colar o e-mail
na sua caixa de entrada Se você olhar logo
abaixo da resposta, verá mais ícones. Vamos clicar nele. E aqui você verá o rascunho na opção Gmail Se você clicar nele, o Gemini
abrirá uma nova janela e colocará esse texto exato em
um rascunho real do Gmail, que você poderá editar posteriormente e eventualmente, enviá-lo
ao destinatário Então, vamos tentar fazer isso. Gemini está redigindo um e-mail. Vamos dar uma olhada. Vou
clicar em Abrir o Gmail Vemos que ele foi escolhido
corretamente no assunto do e-mail. Esse é o texto exato
que vimos no chat. Vamos tentar algo
um pouco mais avançado. Até agora, usamos exemplos para
fixar o tom e o
estilo de resposta. Mas você também pode usar exemplos
para definir uma estrutura mental. A estrutura mental não
muda apenas as palavras que Gêmeos usa. Isso muda a lógica
usada para resolver seu problema. Então, em vez de escrever uma
longa lista de regras, como ser prático ou não
ser muito acadêmico, você pode simplesmente
mostrar a Gêmeos uma foto ou um exemplo da perspectiva
que você queria adotar Então, vamos passo a passo. Em primeiro lugar, vou
abrir um novo chat. E aqui, eu gostaria de
mudar para um modelo profissional. E só para avisar que, se
você estiver em um plano gratuito, ainda terá
acesso ao modelo profissional. Veja, estou usando
minha conta gratuita e ainda posso
selecionar esse modelo. Mas seus limites de uso podem ser
menores do que nos planos pagos. Então, estou voltando à minha conta que
uso para esta demonstração. Primeiro, vamos ver como o Gemini lida com solicitações
sem nenhum enquadramento Vou perguntar sobre um
tópico popular: marca pessoal. Quero aprender sobre marca
pessoal. Como devo começar?
Vamos pressionar Enter. Se estivermos interessados, podemos analisar o processo de
pensamento de Gêmeos Veja, essas são
as etapas necessárias para nos dar essa
recomendação. Tudo está correto, mas
é muito teórico. Parece uma longa lista de tarefas antes mesmo de
você começar. Agora vamos usar um exemplo
único para mudar a lógica para uma
estrutura mental prática. Quero que Gemini
aja como um treinador que valoriza pequenas
vitórias imediatas em vez de grandes teorias Então, aqui está meu novo aviso, além da minha instrução
original. Também incluí um exemplo
de lógica prática. Vamos entrar e ver
o que Jimmy e eu
sugeriríamos aqui. Está vendo isso? Como eu classifiquei a
lógica como prática e mostrei a Gemini o exemplo do
olá mundo, ela não está mais me dando uma lista de
leitura Ele literalmente me diz
as recomendações práticas, coisas que eu posso fazer agora. Então, agora, Gêmeos está refletindo
a maneira de pensar, não apenas o tom e o estilo, como em nosso primeiro Tudo bem. E vamos dar mais
um exemplo rápido. Isso é especialmente útil
quando você está fazendo pesquisas. Digamos que você queira que o Gemini não apenas responda à pergunta, mas também mostre de onde vêm as
informações Você pode incluir um exemplo que demonstre o
formato Por exemplo, você pode escrever
um prompt completo como esse. E o que é importante, eu também
forneci regras para Gêmeos. Para os casos, não consegue encontrar uma
fonte confiável para uma reclamação. Vamos executá-lo. Esse
tipo de exemplo torna a saída muito mais
estruturada e fácil confiar porque você está
mostrando o formato exato que
deseja como
evidência. Tudo bem. Além da solicitação de uma ou
algumas fotos, existe outra técnica que
usa exemplos interativos Os exemplos interativos diferem dos exemplos
regulares
porque criam uma
experiência de aprendizado dinâmica, de ida e
volta, em que experiência de aprendizado dinâmica, de ida e
volta, em que cada exemplo se baseia entendimento
ou feedback
anteriores, enquanto os exemplos regulares
são demonstrações de estudos Exemplos
interativos envolvem participação ativa
e iteração. Veja como os
exemplos interativos funcionam. Você fornece um exemplo de
versão inicial. A IA fornece
feedback e sugestões específicos. Você cria uma versão aprimorada
com base nesse feedback. A IA analisa as melhorias e sugere mais
refinamentos Você itera novamente, se necessário. A chave é que cada
iteração se baseie no feedback
da versão anterior, criando um processo de melhoria colaborativo Ok, ótimo. E pronto
, neste vídeo, vamos abordar rapidamente o que
aprendemos aqui. E
nos vemos no próximo vídeo onde abordaremos
mais uma técnica de solicitação
12. Especificando o formato de saída no Gemini: Cada um. Estamos quase terminando abordar os principais ingredientes
de um bom aviso. Há ainda outro componente que você pode
achar que vale a pena incluir em suas informações imediatas sobre o formato que você deseja que a resposta da
IA assuma. Vamos falar sobre isso agora. Lembre-se de que em nossa primeira
palestra sobre inspiração, dissemos que é importante
incluir informações sobre o
esboço básico ou a lista Você não o abordará como
contexto para sua tarefa. Acontece que você também
pode especificar suas preferências de formatação
para a resposta, o que pode ajudar a organizar
as informações com mais eficiência Essas informações podem não ser necessárias dependendo da tarefa, mas se você as incluir,
é
melhor colocá-las
no final da solicitação do que no início Vamos ver alguns exemplos de formatação que você pode solicitar Você pode solicitar estilos de
formatação específicos. Por exemplo, se precisar um relatório comercial,
você pode dizer: Formate isso como um relatório
profissional com cabeçalhos, subtítulos e parágrafos curtos
e claros IA estruturará as
informações adequadamente, preparando-as para uso
profissional. Ao trabalhar com
dados ou análises, você pode solicitar tabelas
ou layouts específicos Em vez de uma parede de
texto, você pode dizer, apresente a comparação
desses três produtos em um formato de tabela claro com
recursos na coluna da esquerda. Isso facilita a compreensão e o uso de informações
complexas . E aqui estão mais alguns formatos e padrões que são especialmente úteis para pesquisas ou tomadas de
decisão. Tabela de comparação. Forneça uma tabela de comparação dessas opções com
colunas para os principais recursos, prós, contras e as quatro melhores. Mapeamento de fontes, liste as
fontes que você usou e explique
brevemente o que cada
fonte suporta em sua resposta. Fatos versus interpretações. Separe sua resposta
em duas seções, fatos, declarações
verificáveis
e interpretações,
seu raciocínio, suposições Você pode solicitar uma formatação de
markdown específica. A IA pode usar texto em negrito, itálico, cabeçalhos e
marcadores Basta pedir pontos-chave em negrito ou
termos importantes em itálico, e a
resposta será formatada conforme solicitado Você pode organizar suas dicas usando marcadores para a dica principal do
Claridm, apoio
e outros detalhes Por fim, lembre-se de que
você sempre pode pedir para reformatar a resposta se a primeira versão não for
exatamente o que você precisava É perfeitamente normal dizer: Você
poderia reorganizar essas
informações como uma lista numerada Ou, por favor, divida isso em parágrafos
mais curtos para facilitar a leitura
do clima Ok, e isso é tudo para
esta breve palestra. Vamos recapitular os pontos principais que
acabamos de abordar. Sempre especifique o formato
desejado antecedência para obter a resposta
mais útil Você pode solicitar estruturas
específicas como relatórios, tabelas ou listas. As tabelas de comparação são
ótimas para a tomada de decisões. Você pode solicitar uma tabela
estruturada com prós, contras e a melhor forma. Para tarefas de pesquisa, você
pode solicitar fontes e até mesmo separar fatos de
interpretações para maior clareza Um modelo de IA pode adaptar
seu estilo de escrita para atender às suas necessidades, do
casual ao profissional. formatação Markdown ajuda a destacar informações
importantes Você pode solicitar a reformatação se a primeira resposta
não estiver correta. Instruções claras de formatação levam a respostas mais úteis e
acionáveis E isso é tudo neste vídeo
e, como sempre, AlCa
no próximo
13. Acompanhe o processo: escolher o modelo certo e fazer um brainstorming com o Gemini: Todo mundo. Até agora, exploramos
Brampton em partes isoladas É hora de reunir essas peças em um fluxo de trabalho completo de
ponta a ponta. Ao longo do caminho, mostrarei alguns pacotes de produtividade disponíveis no Gemini, como
verificar a
precisão das respostas e exportá-las
diretamente para o Google Vamos explorar dois
cenários que são, de longe, um dos meus favoritos quando
se trata de trabalhar com a Gemini Eles estão discutindo ideias
e obtendo feedback. Mas antes de começarmos com
nosso primeiro cenário, vamos falar um pouco sobre como
escolher seu modelo de IA. Você me viu alternando entre eles ao longo
desta seção de demonstrações e pode estar se perguntando:
então, qual modelo você deve escolher? E quando sua escolha
depende do seu plano de assinatura. Se você é um usuário pago, sugiro que faça do pensamento
sua escolha padrão. Seu poder de raciocínio lida com quase tudo,
mude para o rápido, apenas para tarefas de baixo risco,
como verificações gramaticais
rápidas ou perguntas rápidas, e mude para profissional quando você está lidando
com documentos longos, pesquisas
aprofundadas ou
qualquer coisa que exija foco
constante
em uma grande quantidade de conteúdo e é aí que
ele Trabalho com o Gemini
há algum tempo e esse é o
melhor fluxo de trabalho que
criei depois de
muitas experiências Se você é um usuário gratuito, mantenha-se rápido como
padrão, pois os modelos mais avançados têm
cotas diárias limitadas no plano gratuito, então você precisa ser
estratégico e guardar esses créditos para quando realmente
precisar deles Passe a pensar
quando uma tarefa exigir lógica
profunda ou
raciocínio em várias etapas e mude para profissional quando estiver trabalhando com conteúdo
grande ou precisar desse alto nível de
nuance Agora, com isso em mente, vamos entrar em nosso primeiro cenário de acompanhamento do
processo de
brainstorming Quero que você imagine que é o gerente de marketing de uma startup
de tecnologia do sono muito ambiciosa e
criativa
chamada Snooze Estamos prestes a lançar
o Snooze One, o primeiro
piloto automático do mundo Como você pode ver em
nosso briefing interno,
este colchão tem tudo, este colchão tem tudo desde tecnologia de zoneamento climático, análise de sincronização de
sonhos e
o mecanismo de história Vibe Preciso criar uma campanha de lançamento
nas redes sociais que faça com que o sono inteligente
pareça essencial. Então, vamos abrir o Gemini
para começar a demonstração. Estou selecionando o
modelo de pensamento porque precisamos um estrategista criativo
que possa lidar com nuances E vamos começar
nosso brainstorming. Aqui está o primeiro prompt
que vou usar. Você vê que eu primeiro apresento o papel que
eu quero que Gêmeos assuma Em seguida, incluí um pouco de contexto em termos do que
estamos prestes a lançar. Nosso público-alvo. E então eu dei
a tarefa à Gemini de sugerir temas de conteúdo de
tendas para
nossa janela de lançamento de 30 dias E deixe-me também incluir
o arquivo PDF que você acabou de ver para fornecer ainda
mais contexto ao Gemini E vamos pressionar Enter , então aqui estão os dez temas
que Gemini sugeriu Eu gosto mais desse tema. Então, vamos pedir a Gemini que se aprofunde nesse tema
específico Então, aqui está meu segundo aviso. E deixe-me
especificar que quero dez ideias de custo. Vamos pressionar Enter. Ótimas sugestões. E caso você não
goste de algumas delas, pode sempre pedir a Gemini
que sugira outras dez ideias Então, vamos fazer isso. Percebo que
quando você faz isso várias vezes, você pode dar
ótimas sugestões. Então, por favor, tente fazer
isso e não
use apenas a primeira lista de ideias
que a Gemini fornece Vamos fazer mais uma iteração. Dei alguns comentários à Gemini sobre a lista de
ideias que ela forneceu Bom. Vejo que podemos continuar trabalhando
com algumas das ideias. Mas antes de começarmos a fazer os roteiros reais para
nossa postagem ou vídeos, deixe-me fazer
outra pergunta ao Gemini Antes de prosseguirmos, quero saber quais são
as tendências atuais de conteúdo de
mídia social para lançamentos de produtos de tecnologia, como no nosso caso. Aqui estão as tendências. Você vê que ele
retomou corretamente o ano atual. E aqui está meu próximo aviso. Vou pedir à
Gemini que sugira dez IDs de roteiro de vídeo em formato curto
para a série Vibe Check
Storytelling Digamos que eu gostaria o
Instagram fosse nossa
plataforma preferida. E observe que eu também
incluí este PDF com as ideias de ganchos virais que eu quero que o Gemini use
ao preparar a resposta Isso é
chamado de aterramento. Então, estou ancorando
a resposta dos EIs em nosso estilo de marca específico para que os scripts
não pareçam genéricos Em seguida, eu também forneci
a estrutura para o script e pronto. Vamos pressionar Enter. Tudo bem, vemos que o Gemini incluiu
alguns espaços reservados, e eu realmente quero
ter um roteiro completo pronto para o teleprompter para que
possamos gravar possamos Então, ao fazer um brainstorming,
começo pedindo a Gemini que explore uma
ampla variedade de ideias e, em
seguida, posso repetir
essas E então eu geralmente seleciono uma
ideia de que gosto e peço a
Gemini
que se restrinja a esse tópico e, digamos, crie uma postagem ou uma história relacionada à
ideia de minha escolha Tudo bem, nosso roteiro está pronto. Posso continuar conversando
com Gemini e pedir para ajustar esse roteiro ou adotar
outra ideia para expandir Mas digamos que eu esteja
bem com isso. Na verdade, posso exportar esse script
diretamente para o Google Doc. Você vê três pontos que eu posso ouvir. Se eu clicar nele, posso
escolher exportar dois cães e vamos ver o que acontece. Gemini me diz que o
novo documento foi criado. Vamos clicar em Abrir. Muito bom. Temos até uma tabela
com códigos de tempo e texto
exato que
precisamos dizer muito legal. E você também vê
aqui brincadeiras de Gêmeos
para exportar essa
tabela Vamos tentar fazer isso também. Pessoalmente, gosto de exportar para o Google Docs
nesse cenário Acho que funciona melhor
para esse tipo de documento, mas você entendeu. Isso é tudo para este tutorial
e Alca para o próximo.
14. Acompanhe: receba feedback com a IA do Google Gemini: Todo mundo. Bem-vindo ao
segundo vídeo de acompanhamento. Vamos explorar a obtenção de
feedback do Gemini. Esse caso de uso é um
dos primeiros com os quais comecei. Ao usar o assistente EI. Eu costumava enviar meus documentos como apresentações,
relatórios, currículo, e pedir feedback à EI para que eu
pudesse obter uma segunda opinião sobre o assunto
e fazer melhorias Mas
o Gemini levou esse processo para um nível totalmente novo,
pois é nativamente multimodal, que significa que ele pode processar
não apenas textos mas outros tipos de Agora você pode obter feedback
personalizado sobre seu desempenho real, não apenas sobre o que você escreveu. A razão pela qual Gêmeos é tão dominante aqui é sua enorme janela de
contexto Essa é a primeira vez
que estamos usando esse termo. Então, vamos apresentá-lo. A janela de contexto é essencialmente a memória de
curto prazo do IIS. É a quantidade de
dados que o modelo pode armazenar em seu cérebro ao mesmo tempo
para entender a solicitação. Enquanto outros modelos
podem ter dificuldade em
lembrar mais do que
alguns minutos de filmagem, Gemini pode processar
até 1 milhão de tokens Para se ter uma
ideia, é cerca de uma hora de vídeo ou milhares de páginas
de texto de uma só vez. Essa memória enorme
é exatamente o motivo pelo qual vemos tantos usuários migrando para o
Gemini para análise de vídeo Mas não acredite apenas na minha palavra
. Vamos verificar isso. Vou usar o
modo de raciocínio para verificar a reclamação. E esse é o prompt que
vou usar primeiro. Deixe-me pressionar Enter. A razão pela qual comecei com
essa pergunta é porque
quero mostrar a você a função de
verificação dupla de resposta. E aqui está a resposta com os detalhes sobre
por que os profissionais estão migrando para o Gemini Para acessar a função de
verificação dupla de resposta, clique no ícone de três pontos na parte inferior
da E aqui você verá a resposta de verificação
dupla. Esse recurso usa a
pesquisa do Google para encontrar conteúdo um pouco semelhante ou diferente das declarações
geradas pelo Gemini E observe que
esse recurso foi criado especificamente para
verificar afirmações factuais Ele não aparecerá para coisas
como escrita criativa, código ou tarefas similares. Gemini começou a avaliar
as declarações E aqui vemos os destaques
verdes
confirmando as afirmações
que E podemos até expandir
essa janela para ver o artigo detalhado que a Gemini usou para
validar essa afirmação Esse é um recurso bastante
conveniente. E agora vamos ser técnicos. Gravei um vídeo meu durante uma entrevista na Zoom para
a função de chefe de produto. Esta é uma gravação de 1 hora, que é uma
quantidade enorme de informações. E por causa disso, vou
escolher o modelo profissional. Mas primeiro, vamos
começar um novo bate-papo. Aqui vou
escolher P. O modelo Pro foi
projetado com um teto de inteligência muito
maior e é superior em manter um entendimento coerente durante toda a hora de Então, deixe-me anexar
a filmagem primeiro. Tenho dez fragmentos de
vídeo diferentes aqui e também envio
minhas instruções Comecei dando a Gemini papel
de coach de
liderança executiva Eu forneci o contexto em
termos do vídeo, o que estou fazendo aqui,
e essa é minha tarefa. Com as perguntas específicas que eu quero que Gemini
responda Minha expectativa da Gemini é me
fornecer informações
em termos de minha presença, comunicação,
estilo e clareza, minha força e áreas
de melhoria E também pedi à Gemini que
fornecesse os registros de
data e hora específicos para
suas observações, para que eu possa encontrar rapidamente o fragmento ao qual Gêmeos se refere Veja como a Gemini processa
essas informações. E aqui está o feedback. Essas são ótimas observações e coisas que eu
definitivamente poderia melhorar. E agora vamos pegar esse feedback e transformá-lo em
algo útil. Vou pedir à Gemini reescreva meu roteiro de “Fale-me
sobre você para que seja mais
contundente e mais relevante para a função de chefe de
produto para a qual
vou me candidatar Quando você trabalha com o Pmdel,
como no nosso exemplo atual, a geração de respostas leva
muito mais tempo,
portanto, esteja ciente disso E, finalmente, aqui está
a versão reescrita da minha introdução Tell me About
Yourself, parece muito boa Mas é claro que, se eu o
usasse em uma
conversa real na próxima vez, preferiria
mudar algumas coisas para garantir
que soasse mais como eu. Ótimo trabalho, Gêmeos. E assim, você transformou Gemini
em seu treinador pessoal Eu posso imaginar muitos
casos de uso para esse tipo
de feedback em vídeo. Imagine que você está fazendo um desafio de ioga de
28 dias e precisa de feedback diário
sobre se está melhorando ou se tem
medo de falar em público, para que possa gravar a si mesmo, enviar o vídeo para o Gemini, junto com os
slides da apresentação, junto com os
slides da apresentação e perguntar o que
funcionou e o que não
funcionou. O que notei quando comecei a fazer isso regularmente é um
efeito colateral positivo que eu não tinha. esperar. O fato de você estar gravando si mesmo o torna
mais autoconsciente. Mesmo antes de Gêmeos
dizer qualquer coisa, você começa a prestar mais atenção ao que está fazendo
e como está fazendo Mas é isso, e
isso é importante. Aceite o feedback da IA com
cautela. Esses modelos são
incrivelmente poderosos, mas cometem erros. Por exemplo, no
exemplo que acabamos de ver, Gêmeos me disse que eu estava sentado o tempo todo enquanto estava em
pé Portanto, use os insights
como ponto de partida, mas sempre confie em si mesmo
para o julgamento final. Informe-me
nas perguntas e respostas deste vídeo quais cenários
você experimentará com Alcia no próximo
15. mantendo a realidade: estratégias práticas para minimizar alucinações de IA: Todos, imaginem
perguntar ao assistente de IA sobre um evento noticioso recente e ele citar com segurança um artigo detalhado que na verdade
não
existe ou perguntar sobre figuras públicas e
obter respostas que
misturam fatos reais com detalhes
completamente inventados Não são bugs ou falhas. Eles são o que chamamos de
alucinações em IA. E eles são um
dos maiores desafios ao trabalhar com grandes modelos de
linguagem. Vamos explorar por que
essas alucinações acontecem, como identificá-las
e, o mais importante,
técnicas práticas que você pode usar imediatamente para obter respostas mais
precisas Para entender por que
esses erros acontecem, precisamos ver como
esses modelos são construídos Ao contrário de um humano que realmente
entende um tópico, modelo de
linguagem funciona prevendo a
próxima palavra mais provável em uma sequência
com base em padrões estatísticos ,
porque eles são projetados para
serem o mais úteis possível Eles geralmente priorizam
fornecer uma resposta completa e
fluente em vez de admitir que são
inseguro Quando um modelo atinge uma lacuna nas informações em
que foi treinado ou quando encontra
uma solicitação ambígua, ele pode preencher as lacunas
adivinhando o som mais provável em adivinhando o Não é uma falha. É
um efeito colateral da IA priorizar uma
conversa tranquila em vez da verdade verificada Agora que entendemos
por que as alucinações ocorrem, vamos explorar como
identificá-las Pense nisso como desenvolver
suas habilidades de verificação de fatos de IA. Depois de conhecer os sinais de alerta, eles se tornam muito
mais fáceis de detectar. Aqui estão os principais
sinais de alerta a serem observados. Detalhes excessivamente específicos. Quando o modelo de IA fornece detalhes
muito específicos, especialmente sobre
eventos ou estatísticas recentes, isso deve desencadear
um exame mais minucioso Por exemplo, se ele
fornece números ou
estatísticas exatas para eventos de nicho
ou que mudam rapidamente, sem citar uma fonte ao vivo, isso é uma bandeira vermelha Nesses casos, a IA
pode estar generalizando a partir de padrões históricos
semelhantes, em vez relatar o
evento específico sobre o qual você perguntou Citações,
exemplos ou estatísticas com som perfeito. Se você notar uma resposta
que parece muito perfeita, esse é um bom motivo para
verificar as informações. E acredite,
quanto mais experiência você tiver trabalhando
com ferramentas de EI, melhor você estará exportando esses dois bons momentos para
serem verdadeiros Você desenvolverá um
instinto para reconhecer quando algo parece
errado ou excessivamente E essa é a sua
dica para se aprofundar, verificar fatos ou
cruzar fontes Confie, mas verifique. Essa é a regra de ouro ao trabalhar com conteúdo
gerado por EI. Respostas inconsistentes. Se você fizer a mesma
pergunta várias vezes e obtiver detalhes
específicos diferentes a cada vez, isso é um forte indicador
de alucinação Declarações excessivamente definitivas. Quando a IA faz declarações muito
definitivas sobre tópicos que deveriam
ter alguma incerteza, especialmente em relação a eventos
futuros ou tópicos complexos, seja cauteloso Saber por que as
alucinações acontecem e como identificá-las
é um Mas como podemos realmente
evitá-los? Vamos analisar quatro estratégias
úteis que ajudarão você a
obter respostas sempre mais confiáveis e
precisas. Estratégia um. Seja explícito
sobre a incerteza Em vez de fazer
uma pergunta direta que force a IA a adivinhar, esclareça pedindo que ela priorize
a precisão em
vez Por exemplo,
em vez de escrever, quais foram as principais conclusões do
relatório de Johnson? Experimente isso. Se você verificou
o acesso ao relatório da Johnson, compartilhe suas principais descobertas. Se você não tiver 100% de
certeza sobre nenhum detalhe, indique explicitamente quais
partes você não pode verificar Ou, em vez de listar todas as empresas que
usam essa tecnologia, experimente com base nos
dados nos quais você foi treinado. Você pode listar exemplos verificados de empresas que usam
essa tecnologia? Forneça as fontes
ou o contexto
específicos para cada exemplo e indique se algum
desses casos é especulativo
em vez de confirmado Em vez de qual é
o tamanho do mercado de AIChatBDS no
momento Você pode fornecer as estimativas mais
recentes do tamanho do mercado para AIChatBDs a partir Especifique o período de
tempo exato para todos os dados que você compartilha e me avise se você não tiver acesso
aos números mais recentes. Observe como cada
solicitação revisada dá
permissão explícita para reconhecer
incertezas e limitações Essa simples mudança pode melhorar
drasticamente a
confiabilidade das respostas. Estratégia dois, exija citações baseadas em
evidências. Ao pedir fontes, não procure apenas
uma lista de links. Às vezes, a IA pode gerar citações
perfeitas para artigos ou sites
que não existem. Em vez disso,
instrua o modelo a citar a frase específica
da fonte que apóia
sua conclusão Ao forçar o EI a combinar sua afirmação palavra a palavra
com um texto existente, você
reduz significativamente sua capacidade inventar detalhes no meio Estratégia três: use formatos de saída
estruturados. Solicitar resultados estruturados pode ajudar a minimizar as alucinações forçando o modelo de IA pode ajudar a minimizar as alucinações
, forçando o modelo de IA a organizar as informações de forma mais sistemática. Por exemplo, analise esses dados de vendas usando a seguinte estrutura, pontos de dados
verificados, números
diretos
do documento, métricas
calculadas, mostre seus cálculos,
interpretações, claramente
identificados como interpretações,
e incertezas, áreas em dados Estratégia quatro. Implemente etapas de verificação. Inclua etapas de verificação
diretamente em suas solicitações para aprimorar a precisão e a
confiabilidade das respostas Por exemplo, você pode pedir uma lista todas as suposições feitas
durante a análise, destacar áreas nas quais ela tem menor confiança
ou certeza Recomende
informações adicionais que possam ajudar a validar
suas conclusões Essa abordagem garante saída
mais completa e
transparente, facilitando a avaliação
da qualidade da resposta. Agora que você tem todas as informações
sobre alucinações de IA, reserve um momento para revisar uma
de suas Como você pode modificá-lo usando as estratégias que
acabamos de abordar? Lembre-se de que o objetivo não é eliminar completamente
as alucinações, mas criar um
fluxo de trabalho em que elas tenham menos
probabilidade de
impactar seus resultados Compartilhe sua solicitação original
e revisada na
seção de perguntas e respostas deste vídeo E, como sempre, vamos
recapitular brevemente os pontos-chave
desta palestra alucinações de IA acontecem quando modelos de
linguagem geram falsas, mas
plausíveis alucinações acontecem
porque a IA é uma contadora de histórias confiante que prioriza uma
conversa tranquila em vez de comparar seu trabalho com um livro didático ou
fatos Os sinais de alerta de alucinações incluem detalhes excessivamente específicos, citações com som
perfeito, respostas
inconsistentes e declarações excessivamente definitivas incluem detalhes excessivamente específicos, citações com som
perfeito, respostas
inconsistentes e declarações excessivamente definitivas. Seja explícito sobre a
incerteza nas instruções para incentivar a IA a
reconhecer suas limitações Solicite citações e
raciocínios para verificar os resultados da
IA e Use
formatos de saída estruturados para minimizar as alucinações organizando
as informações de forma sistemática Incorpore
etapas de verificação nas solicitações, como destacar incertezas Tudo bem. E é
isso para esta palestra, e
nos vemos no próximo vídeo
16. Como trabalhar com tela Gemini e pedras preciosas: introdução da seção: Bem-vindo à próxima seção. Até agora, você deve ter um bom entendimento de
como falar com geminianos Embora continuemos desenvolvendo
esses fundamentos, é
hora de subir de nível. Estamos indo além das instruções
básicas de ida e volta
para explorar o Canvas e os jams Começaremos com o
Canvas, um espaço de trabalho
lado a lado onde
você pode editar texto, comparar versões e
repetir seu Não comece do zero
toda vez e faça muito mais. Então, aprenderemos geleias. Eles são como
especialistas personalizados que se lembram de
suas regras específicas, para que você não
precise repeti-las. Vamos construir
dois deles juntos, gramatical e ortográfico Este jam atua como um editor profissional
para lucrar com sua escrita mantendo sua voz inalterada e um preparador físico de
IA, pode assistir
seus vídeos de exercícios, verificar sua segurança em seu formulário e até mesmo criar fundo motivacionais
personalizados para Ao final desta seção, você não estará apenas
enviando solicitações. Você criará
sua própria equipe pessoal de especialistas para transformar suas ideias rápidas
em trabalhos
finalizados ou para automatizar
suas rotinas Vamos começar.
17. Boas-vindas à tela Gemini: Todo mundo. Bem-vindo de volta à primeira palestra
desta seção Até agora, vimos a interface de bate-papo
padrão do Gemini, como aquelas com as quais estamos acostumados a trabalhar em
diferentes mensageiros É ótimo para fazer uma pergunta rápida, receber feedback
ou fazer um brainstorming Mas pode parecer um
pouco limitado quando você está trabalhando em um documento
totalmente novo. Ou um conteúdo que
precisa de várias revisões. Isso ocorre porque, quando você está
redigindo algo complexo, você precisa de mais do que uma conversa de ida
e volta Você precisa de um espaço de trabalho com
várias ferramentas de edição. É aí que entra o Gemini
Canvas. Pense no Gemini Canvas como
um espaço de trabalho colaborativo. Em um bate-papo padrão, o EIS fornece uma resposta
e, se você quiser
alterar uma frase, geralmente precisará
pedir que tudo seja reescrito No Canvas, o Gemini abre
uma janela lado a lado. À esquerda, você tem seu bate-papo. À direita, você tem
um documento vivo. Não é mais apenas um chatbot , é um editor sentado ao seu
lado Você pode clicar no texto,
alterar as palavras sozinho ou destacar um
parágrafo específico e contar a Gemini Faça apenas esta punção parcial. Se isso soa bem, espere até ouvir isso. O Canvas não serve apenas para escrever, é também para construir. Direto do menu da interface, você pode gerar páginas da web, infográficos
visuais
para dados complexos
e até mesmo ferramentas de estudo, como
questionários Para quem prefere ouvir. Há
visões gerais em áudio que criam resumos
de suas descobertas no estilo
podcast Talvez o mais impressionante seja que você possa gerar miniaplicativos
funcionais Basta descrever uma ferramenta como
um organizador de receitas para a família ou um calendário pessoal e o Canvas criará e executará o
código para você em tempo real Você não precisa
saber programar. Você só precisa descrever
o que a ferramenta deve fazer em um processo agora
conhecido como codificação vibe Agora, como o Canvas
é tão poderoso, pode ser tentador começar
a criar
aplicativos e jogos No entanto, vamos dar
um passo de cada vez. Por enquanto, nesta
seção do curso, vamos nos concentrar inteiramente
na elaboração de documentos Usando uma
empresa imaginária de colchões de IA como nosso exemplo, veremos como usar o espaço de trabalho do
Canvas para refinar uma narrativa e gerar
suporte e recursos visuais Depois de dominarmos a criação de
documentos, passaremos para os recursos mais
avançados, como criação de aplicativos
interativos e prototipagem
rápida, posteriormente
no curso Na próxima lição, mostrarei como
abrir a interface do Canvas e começaremos nosso
primeiro rascunho colaborativo Te vejo na próxima.
18. Acompanhe: como criar e editar documentos no Gemini Canvas (parte 1): Conforme prometido neste vídeo, vamos colocar a mão na massa. Exploraremos como
navegar na área de trabalho do Canvas, como fazer edições direcionadas
usando o recurso ask Gemini, alteraremos partes específicas do documento sem
reescrever todo
o Também daremos uma
olhada nas ações rápidas para alterar coisas como tom e tamanho do
documento. Finalmente, vamos nos tornar multimodais. Daremos vida à
marca com logotipos
e imagens de produtos gerados pela
EI. Vamos mudar para o
Gemini para a demonstração. Vamos começar mudando
para o modo Canvas. Para isso, estou clicando em Ferramentas e escolho Canvas
na janela pop-up. Vamos também mudar o
modelo para o pensamento. E vou começar com um
amplo prompt de conversação. Aqui está o que vou digitar. Eu dei a Gemini um pouco de contexto em termos do que estou prestes a fazer Eu forneci a tarefa. Eu disse que preciso de uma breve
descrição da empresa e do novo produto que essa
empresa está prestes a lançar. Também forneci detalhes
sobre o estilo. Eu quero que Gemini atenda. Vamos pressionar Enter e ver
o que Gemini escreverá. Ele está abrindo a
área de trabalho do Canvas com o bate-papo no lado esquerdo e com o texto no lado direito Vemos aqui que ele criou a descrição da empresa,
incluindo nome ,
motor e uma breve visão geral do que a empresa está fazendo. seguir, temos as informações
sobre o produto, incluindo as principais
características do colchão, e ele até sugeriu alguns objetivos de brainstorming
para minha Perfeito. Vamos explorar
esse espaço de trabalho no lado direito No topo da área de trabalho, você pode
ver primeiro algumas ferramentas de edição Por exemplo, você pode alterar o estilo do
título do seu texto. Você pode adicionar uma lista com marcadores
ou um número na lista, ou até mesmo algumas fórmulas aqui Se quiser, você pode
imprimir esta página. um documento PDF, e há outras funções
aqui que
exploraremos um pouco mais tarde
neste e nos seguintes tutoriais A verdadeira mágica nesse espaço de trabalho é o recurso ask Gemini Digamos que você
queira fazer uma alteração em uma parte do seu texto. E em vez de pedir um rascunho
totalmente novo no chat, você pode simplesmente destacar
a parte que deseja editar e depois escrever
sua solicitação para o Gemini Por exemplo, eu gostaria de
mudar a localização do escritório
da empresa. Então, o que vou fazer é destacar este texto e incluir apenas minhas instruções para a mudança
que quero que o Gemini faça Veja, a Gemini fez a alteração e incluiu esse novo texto diretamente
no documento E na barra lateral esquerda, vemos que ela incluía o texto informativo e até mesmo alguma descrição
dessa alteração Deixe-me folhear este
texto e ver que tipo de edições eu gostaria de
fazer além da localização
do escritório M Posso continuar trabalhando nesse documento
e indo e voltando, incluindo as mudanças,
até o
momento em que ficarei totalmente
satisfeito com o texto. Francamente, eu uso o Canvas para criação de
documentos por causa
desse recurso ask Gemini Como na maioria dos casos, preciso ajustar uma parte muito
específica de um documento. No entanto, aqui está o que
descobri após semanas
de experiências com ele Como o Gemini está se concentrando nessa parte específica
de um documento, às
vezes perde
o panorama geral Percebi casos em que ele repete frases usadas
em outras partes
do documento ou traz termos que não são
introduzidos até mais tarde Então, definitivamente, faça
uma revisão rápida do seu trabalho para
garantir que tudo se encaixe. E isso é tudo na primeira
parte deste tutorial. E
nos vemos na segunda.
19. Acompanhe: como criar e editar documentos no Gemini Canvas (parte 2): Bem-vindo à segunda
parte do tutorial,
onde exploramos o Gemini
Canvas para criação de documentos Além de perguntar a Gemini, existem
ações rápidas que você pode achar úteis para fazer
alterações em seu texto A primeira ação rápida
é alterar o comprimento. Isso é ótimo se você precisar expandir
rapidamente uma seção com mais detalhes ou
reduzi-la a um resumo detalhado. Digamos que queremos alterar
o tamanho do nosso texto, eu estou clicando nesse botão
e, em seguida, preciso
escolher o tamanho que eu gostaria
para o meu novo texto. Digamos que eu queira que seja
mais longo do que o atual e vamos aguardar as mudanças. E Gemini
expandiu esse texto. Você vê que ele destacou o novo texto na cor azul aqui. Vamos voltar aos botões de ação da
semana. E o segundo é
para mudar o tom. Portanto, caso você queira parecer mais profissional ou
, por outro lado, um pouco mais falador, esse é o botão que o
ajudaria a mudar o clima de sua escrita com
literalmente apenas um Vamos selecionar a mudança de tom, e eu posso ir do formal ao muito formal ou casual
e muito casual. Francamente, estou bem com o tom
atual do texto,
mas, por exemplo,
vamos torná-lo um pouco mais formal para o
propósito desta demonstração Vemos que Gemini
mudou quase todo o fragmento do
texto aqui. Eu preferiria voltar
para a versão anterior. Mas acho que você entendeu
o que
essa opção de mudança de tom pode fazer. Então, estou retornando à
versão anterior do documento. E, por fim, também há a
função de sugerir edições. É como ter
um corpo de escrita. O Gemini lhe dará feedback
e mostrará maneiras de melhorar sua escrita sem alterar o
texto original imediatamente. Vamos tentar essa função
também. Tudo bem, ótimo Vemos que o Gemini incluiu algumas mudanças
nas informações sobre o
motivo dessa mudança Se eu estiver bem com
todas essas mudanças, posso aplicá-las todas. Se você não gostar da
sugestão do Gemini e quiser retornar
à versão anterior
do documento, você pode dizer isso ao Gemini
diretamente aqui no chat Legal. Então, vamos
clicar em Aplicar para as sugestões restantes para que
possamos mantê-las na nova
versão do documento. Tudo bem. Vamos
continuar a demonstração. E, na próxima etapa, quero criar alguns
recursos visuais para mostrar capacidades multimodais
do Teremos uma seção
dedicada à criação de conteúdo
visual
posteriormente no curso. Então, por enquanto, vou
digitar um prompt
direto muito curto E deixe-me pressionar Andrew
para ver os resultados. E aqui está a primeira imagem. É incrível que a Gemini
tenha até incluído o nome do produto aqui em
um lado do colchão Gemini também
me diz que ele só pode gerar uma imagem por vez Está me perguntando se eu gostaria de continuar
com o logotipo da empresa. O Gemini está ficando muito bom em incluir textos
nas imagens E vamos pedir vários
recursos visuais . Ótimo. E você vê por que é
importante criar imagens
nesse mesmo bate-papo em que
criamos o texto original. Gemini usa o contexto
das conversas anteriores
para criar a imagem Você vê que foram necessárias informações sobre um ângulo de
três graus, embora esse ângulo pareça um pouco maior para mim.
Mas tudo bem. Podemos ajustar isso por meio iterações trabalhando
nessa imagem Também incluiu o nome do
colchão aqui. Vamos criar a quarta
imagem. Isso é incrível. Você vê que, na descrição, temos a informação de
que esse recurso cria uma
cúpula de ar limpo sobre as travessas, e é exatamente isso que
vemos aqui na
foto. Incrível. E vamos verificar o texto. Umidade ideal, qualidade do ar. Sim, e o texto está correto. Não vejo nenhum erro aqui. Tudo bem, vamos
terminar este tutorial antes que fique muito longo. Continuaremos
trabalhando com o texto e as imagens em nosso próximo vídeo.
20. Acompanhe: transformando um esboço de Gemini em um PDF polido com o Gamma: Agora temos a história de fundo
da nossa marca, características
do produto e as imagens
organizadas no Gemini Pense nisso como nosso estúdio
de desenho. O espaço para o
pensamento e a escrita fundamentais. No entanto, nosso rascunho de trabalho não
está concluído. Se você precisar apresentar isso a um gerente ou cliente como
um relatório profissional, precisamos mover
esse conteúdo para uma ferramenta de design dedicada,
como o Canva ou o Gamma App Você pode pensar:
não posso simplesmente pedir ao Gemini que gere o PDF
para mim? Boa pergunta. E sim, essa também era minha
intenção quando recebi
a tarefa de criar o PDF final. Veja como o Gemini lida com isso. Se você tentar criar
PDF no Canvas, não obterá o documento
final. A ferramenta Canvas foi criada para edição e colaboração
ao vivo,
não para publicação. Como ele opera em
um espaço de trabalho privado, ele não pode ver seus arquivos de imagem
locais para incluí-los no documento Se você tentar exportar daqui, verá um arquivo com espaços reservados
vazios onde
suas imagens deveriam estar Claro, você também pode tentar
um bate-papo normal. É mais funcional. Ele pode gerar arquivos em segundo plano para
fornecer um PDF para download No entanto, ele carece do controle de
layout e polimento necessários para uma apresentação
profissional. Aqui está o PDF que o Gemini
criou para mim. É um bom começo, mas exigiu uma
formatação manual
significativa para ter a aparência correta Então, para deixar nossa apresentação
pronta, em que o texto flua corretamente em torno das imagens
e a marca seja consistente, passamos do estúdio de desenho para um
estúdio de design No próximo tutorial, usarei o aplicativo Gamma
para demonstrar isso É minha principal
ferramenta há quase um ano e é o que eu uso em
quase todo o meu trabalho de design. No entanto, os mesmos
princípios se aplicam a outras plataformas semelhantes,
como Canva ou Adobe Vamos voltar para Gêmeos e preparar nosso
conteúdo para a mudança Vamos transferir nossos ativos,
texto e imagens para o aplicativo Gamma. Vou começar copiando o texto. Para isso, clicarei no botão
Compartilhar e Exportar. E a partir daqui, vou
escolher Copiar conteúdo. E eu já baixei as quatro imagens que geramos
no tutorial anterior Então, tudo está pronto
para mudarmos para o Gamma. Vamos abrir o aplicativo Gamma. Aqui está a página principal do Gamma. A parte central é
a grade de conteúdo. Essa área exibe nossos
projetos, também chamados de Gammas. A barra superior aqui é para
criar novos documentos. No lado esquerdo,
temos modelos. Aqui, podemos acessar layouts
predefinidos para iniciar nosso design de
apresentação Temos
coisas úteis como imagens MAI. Onde podemos visualizar e
usar imagens que
geramos usando a ferramenta de imagem EI
integrada Gammas Também podemos criar pastas
para separar nossos materiais por
temas ou tópicos específicos. Então, vamos direto para a
criação de um arquivo PDF. Vou escolher Criar novo com IA. E aqui temos opções
diferentes. Como já temos um texto, que copiei do Gemini, vou escolher essa opção de
colar no texto E aqui vou incluir
o texto de Gêmeos. A seguir, temos
várias opções sobre o que o aplicativo Gamma pode
fazer com nosso conteúdo E é importante que
escolhamos preservar esse texto exato. O que significa que a Gamma não
fará nenhuma modificação
em nosso rascunho Esse é o método mais
eficaz para nosso exemplo, pois nos
permite usar o Gemini
para o trabalho pesado de pensar e redigir
e, em seguida, usar Gamma para lidar com a formatação e
o embelezamento Vou selecionar continuar
para solicitar o editor aqui. Aqui podemos escolher
temas diferentes para nossa apresentação. Vamos escolher esse
e clicar em Selecionar tema. Antes de clicarmos em Gerar, observe os dois modos na parte superior, formato
livre e cartão por cartão. Deixe-me explicar rapidamente
a diferença. Quando você escolhe cartão por cartão, Gamma
divide automaticamente seu conteúdo em slides numerados separados Uma ideia por cartão, mas você ainda pode reorganizar
os cartões ou adicionar novos. É perfeito para apresentações. O Reform mantém tudo como um documento de fluxo contínuo, mais parecido com um relatório
do que com uma apresentação de slides Mesmo conteúdo, mas
é lido de cima para baixo sem desgostos
entre as seções Isso lhe dá mais controle
sobre o layout e o fluxo. É ótimo para
documentos ou relatórios. Para nossa demonstração,
escolherei o formato livre porque
quero que nosso texto e imagens
fluam juntos naturalmente E vamos clicar em gerar. O Gamma começa a
criar nossos slides. Em primeiro lugar, o que eu costumo fazer é pedir ao Gamma que sugira
vários outros layouts para que eu possa comparar o layout padrão com
outras Então, para isso, clico no botão
Editar com agente
e, a partir daqui,
escolho Testar novo layout. Vamos dar mais uma volta
para ver se há algo melhor do que nossa
primeira opção padrão. Acho que vou
escolher esse. Eu gosto dessa
imagem de fundo aqui. Vamos para o próximo slide. Incluirei a
imagem do nosso logotipo em vez desta. Para mudar a imagem,
vou clicar nessa. Em seguida, vou para Editar imagem. E a partir daqui, estou escolhendo o upload
da imagem ou o URL. Eu tenho minhas imagens no meu
Drive local. E aqui vamos nós. Essa é nossa primeira imagem. Vamos anexá-lo. Perfeito.
Vamos para o terceiro slide. Tudo bem, estamos prontos para ir. Vamos fazer a verificação final e dar uma olhada rápida em
todos os nossos slides. Para exportar esse arquivo, clicamos no ícone de três pontos. Aqui escolhemos Exportar e eu vou exportar para PDF. Vamos abrir o arquivo
imediatamente
e vamos lá. Parece legal. Portanto, essa é minha
maneira favorita de trabalhar quando
se trata de criar novos documentos. Deixei que a Gemini fizesse a parte do pensamento
criativo
e depois deixei minha ferramenta de
design preferida, e depois deixei minha ferramenta de
design preferida como a Gamma, fazer com
que parecesse uma boa Espero que você
tenha gostado desse tutorial
e, como sempre, nos
vemos no próximo.
21. O que são joias gêmeas e por que precisamos delas?: Todos, quando vocês começam a
usar o Gemini regularmente, percebem rapidamente
que há certas coisas para as quais o usam
repetidamente, seja para fazer um brainstorming, obter feedback ou
gerar novos conteúdos Vocês podem se pegar digitando mesmas instruções e fornecendo
o mesmo contexto repetidamente,
o
que pode começar a
parecer um pouco repetitivo, que pode começar a
parecer um pouco repetitivo percebem rapidamente
que há
certas coisas para as quais o usam
repetidamente,
seja para fazer um brainstorming,
obter feedback ou
gerar novos conteúdos.
Vocês podem se pegar digitando as mesmas instruções e fornecendo
o mesmo contexto repetidamente,
o
que pode começar a
parecer um pouco repetitivo, como o seu próprio digital
versão do dia da marmota. Bem, hoje estamos
encerrando esse ciclo. Vamos explorar um recurso que
permite empacotar essas
instruções repetitivas e
transformá-las em sua equipe de especialistas em IA
ou assistentes pessoais Eles são chamados de Gemini Gems. E, não, não estamos
falando de diamantes aqui. Porém, quando você vê
quanto tempo eles economizam,
você pode pensar que eles são
igualmente valiosos. Então, o que exatamente é um Pense neles como versões
personalizadas do Gemini criadas para ajudá-lo a lidar com tarefas
repetitivas ou obter profundo
conhecimento em áreas específicas Quando você conversa com Jam, Gemini se lembra
automaticamente de suas
metas e diretrizes , evitando que você se
repita
em Portanto, enquanto um geminiano padrão
é como um bibliotecário, que sabe onde está tudo, uma joia é como um especialista
dedicado Ele não
sabe apenas sobre um tópico. Ele segue suas regras específicas
para realizar trabalhos para você. Existem três tipos
de geleias, geleias pré-fabricadas. Essas são
ferramentas prontas para uso criadas pelo Google. Você não pode ver ou editar
sua lógica subjacente. Você só pode fixá-los
na barra lateral para acesso rápido. Eles geralmente têm
interfaces exclusivas, como o layout do livro de histórias de dez páginas que os jams regulares
simplesmente não conseguem imitar Geléias personalizadas. Esse é o foco dos nossos próximos tutoriais, porque
você mesmo os cria. Você fornece as
instruções e pode carregar até dez arquivos pessoais para atuar como base de
conhecimento do Jams É a diferença entre
um assistente geral e um especialista dedicado, adaptado especificamente aos seus
dados e às suas metas. Geléias em Opal. O Ople é um projeto experimental que leva a IA além de
simples janelas de bate-papo Esses tambores são miniaplicativos
interativos que seguem um fluxo de trabalho específico Seu recurso de destaque é
a capacidade de remixá-los. Você pode usar uma
ferramenta pré-construída, como um estilista de moda e modificar suas etapas internas
para criar algo novo Eles são altamente visuais
e podem gerar texto, imagens e vídeos simultaneamente. Vamos explorar essas barragens nas
seções posteriores do curso. Agora, como já
trabalhamos com o Canvas, agora
você pode ter uma pergunta
lógica. Como um Jam é realmente diferente? A chave é pensar no Canvas
como seu espaço de trabalho compartilhado. É a
mesa colaborativa onde você e o EI trabalham lado a lado em documentos ou códigos
longos Gems, por outro lado, são seus especialistas táticos Você usa um tambor para produzir
o rascunho inicial, como gerar uma primeira versão
especializada com base nos dados enviados, e depois transfere esse trabalho para o Canvas
para refiná-lo e aprimorá-lo Um é o especialista, você solicita a saída inicial. A outra é a mesa onde
o projeto é concluído. Obviamente, você
também pode usar a bateria sozinha
para determinadas tarefas, e isso nos leva à nossa
próxima palestra subsequente Mas antes de começarmos a
trabalhar com bateria, vamos recapitular brevemente o que
aprendemos aqui Tudo bem E isso é
tudo para este vídeo. Te encontro na próxima.
22. Acompanhe: criando uma joia de verificação de gramática: Todos, e bem-vindos ao nosso primeiro tutorial
sobre Gemini Gems Hoje, vou
mostrar como criar
um especialista personalizado para revisar sua redação,
seja
redigindo páginas de destino, descrições de
produtos, e-mails
rápidos ou qualquer outro É como ter um
segundo par de olhos que lhe dá total confiança
em cada palavra que você compartilha. Vamos abrir o Gemini
para criar esse Jam. Vamos começar
clicando em Jams. Na barra lateral, acessamos o Jam Manager aqui, a seção em que
criamos gemas personalizadas E aqui eu vou clicar em New Jam. Vamos começar
fornecendo o nome do nosso Jam. Aqui está a descrição
da minha gema. Em seguida, incluí
minhas instruções. Essa é, de longe, a parte mais
importante da sua joia. Incluí a descrição da função, dizendo que você é
especialista em verificar gramática, ortografia e pontuação em textos em inglês e
corrigi-los se encontrar
algum erro.
Em seguida, forneço uma descrição do
público-alvo Se você acompanhar e
criar o mesmo tipo de joia, poderá alterar o
público-alvo para algo que seja
mais relevante para seu caso de
uso Em seguida, temos as regras básicas
seguidas pelas informações sobre a saída que estamos
procurando e também temos
um prompt inicial Você vê que eu estou usando hash
tags no texto da instrução. Eles funcionam como divisores de seção que criam um esqueleto limpo
para suas instruções Eles tornam o cérebro de Gems
mais organizado para que a IA saiba onde uma regra
termina e a próxima começa Agora vamos voltar ao conjunto
de regras e discuti-las. Como eu realmente
crio essa lista? É altamente recomendável realizar a
tarefa que você deseja automatizar três a cinco vezes manualmente antes mesmo de
tentar criar o congestionamento Se você seguir
direto as instruções, pode
parecer intimidante Cada regra nessa lista existe porque é uma preferência
específica. Descobri ao longo de semanas solicitando
manualmente a IA. Você também pode notar que estou
usando palavras no registro de copos, como por exemplo, aqui. Não há
requisitos técnicos para usá-los. Gêmeos é muito sofisticado. Ele entende letras minúsculas, assim como letras maiúsculas. Mas descobri que
usá-los ainda é útil. Pense nessas palavras
como palavras poderosas. Podemos usá-los para destacar
as regras não negociáveis, para que a IA saiba exatamente o que
é obrigatório versus talvez Tudo bem, vamos seguir em frente. Por enquanto, estou bem com essas
instruções, embora sempre possamos
voltar a essa lista depois de criarmos essa jam
e editá-la posteriormente. Também podemos escolher
uma ferramenta padrão. Essa ferramenta será
selecionada quando você iniciar a nova conversa
com o Jam. Vou escolher o Canvas
como a ferramenta padrão. Em vez de uma conversa confusa no
bate-papo, seu texto direcionado
deslizará para fora em um painel lateral limpo, perfeitamente formatado e pronto
para copiá-lo Você também pode incluir arquivos
na base de conhecimento se quiser que seu jam faça referência a
qualquer fonte externa. Ao preparar a resposta, você vê que podemos fazer upload de
arquivos de diferentes
fontes aqui. Mas para esse exemplo específico, vou deixá-lo vazio. E estamos prontos. Então, vamos salvar a mãe. Estou clicando no botão Salvar. E podemos começar nosso novo bate-papo. Aqui está o texto que eu
quero que Gemini verifique. Eu cometi vários
erros gramaticais aqui de propósito. Então, vamos ver se ele será capaz encontrá-los e
corrigir esse rascunho. Está abrindo uma tela
com nosso novo texto. Parece ótimo para mim. E lembre-se de que você pode usar essa interface do Canvas para fazer algumas edições rápidas
nesse texto, caso queira
introduzir algumas alterações aqui,
por exemplo, vamos destacar
reconciliar e pedir para encontrar uma
alternativa. E se concordarmos com essas edições, podemos clicar em
Compartilhar e exportar, escolher copiar conteúdo ou podemos optar por exportar esse texto diretamente
para o nosso Google Docs. Deixe-me voltar ao
nosso JAM, você vê que o
temos na lista de joias aqui na barra lateral esquerda Uma coisa que notei não
há como
iniciar uma conversa aqui Então, quando abri
essa interface, não está muito claro para
mim o que devo fazer aqui? Eu fiz algumas pesquisas e encontrei este artigo com
exatamente a mesma pergunta. Descobriu-se que esses
iniciadores de conversa não são suportados por gemas no momento Também há uma
solução alternativa que podemos tentar. O artigo diz que você pode simular instruções iniciais como essa, incluindo uma
descrição adicional em Certo, vamos tentar
incluir um exemplo de um iniciador de conversa
para ver se isso vai ajudar Estou voltando para o meu Jam. Se eu clicar nos
três pontos, CN, posso escolher a opção Editar e podemos fazer
as alterações aqui que quisermos Deixe-me incluir este exemplo abaixo da versão atual
das instruções. E o que também podemos fazer aqui, além de incluir um
exemplo de nosso prompt inicial, podemos usar esse botão
mágico para que Gemini reescreva nossas
instruções e as aprimore Vamos experimentar isso. Talvez isso ajudasse. Vejo que o Gemini removeu nosso exemplo do prompt
inicial. O que decidi fazer incluir a regra número seis, pedindo aos geminianos que sempre iniciassem a conversa com o
seguinte prompt inicial Vamos ver se isso vai funcionar. Então, vou atualizar
minhas instruções de gemas, salvá-las e vamos testar. Quando abri meu Jam atualizado, ainda não tinha nenhuma
conversa para iniciar uma conversa aqui Infelizmente, todos os meus
outros experimentos com instruções
definidas de Jams para adicionar o iniciador de conversa não tiveram
sucesso. Diante disso, vamos definir a descrição do
jam para fornecer informações sobre o que um usuário precisa fazer para iniciar
a conversa. Para isso, vamos retornar à interface de edição
do JAMS. Incluí enviar seu
texto para começar. Texto no final
da descrição do Jam, vou atualizá-lo e vamos testá-lo novamente. Nossa instrução está aqui, e vamos enviar
outra coisa para variar. Eu tenho esse fragmento. Vamos ver como Gemini
vai lidar com isso. Perfeito. E se eu estiver de acordo com essa jam e quiser compartilhá-la com
meus amigos ou colegas, posso clicar no
botão Compartilhar e escolher Compartilhar. Jim e eu criaremos um link. Eu posso copiá-lo e
depois enviá-lo. Deixo o link para essa
confusão nos recursos deste vídeo, caso
você queira testá-lo. E eu vou te encontrar
no próximo tutorial onde vamos construir
o personal coach Jam
23. Acompanhe: Criando uma joia do treinador de fitness (parte 1): Agora vamos criar uma jam
que funcione com vídeo. Digamos que eu esteja fazendo um desafio de
treino online de 28 dias no aplicativo e quero saber se estou
realmente melhorando a cada dia. Vou me gravar fazendo os exercícios diários e pedir
feedback ao meu preparador físico de IA como uma palavra de cautela, como já discutimos, embora a IA seja uma boa parceira para monitorar seu
movimento e forma, ela não é um especialista médico. Sempre consulte
o
profissional de saúde antes de iniciar
o novo programa de condicionamento físico. Essa ferramenta é para treinamento e progresso, não para aconselhamento
médico Ok, vamos abrir o Gemini
para começar a demonstração. Vamos criar um novo Jem. Estou expandindo esse menu. Vá até Jams. Aqui vemos geleias feitas por laboratórios. Estou rolando
para baixo até Jam Manager. Eu já tenho a revisão gramatical
e ortográfica Jam visível aqui na lista
das minhas E, por enquanto, deixe-me
criar um novo. Estou clicando em New Gem. Vamos fornecer o nome,
a descrição e
as instruções para nosso treinador de IA personalizado Jam. Eu incluí essa descrição. Essa jam analisa
seus vídeos de treino para fornecer feedback detalhado sobre o
desempenho e cria fundos de
telefone motivacionais
verticais personalizados fundos de
telefone motivacionais
verticais para manter você inspirado E aqui estão minhas instruções. Então, como sempre, comecei
descrevendo o papel. Quero que essa música toque. No nosso caso, eu queria ser preparador físico
profissional. Em seguida, incluí uma
tarefa para essa geléia. Estamos pedindo à Gemini que
analise nossos vídeos de treino, procurando dicas de engajamento
e segurança,
como Cin ou Domin, e eu também descrevi que quero que a
Gemini crie uma imagem vertical com
uma Também incluí os prompts iniciais, embora tenhamos visto que prompts iniciais não estão funcionando
bem Mesmo assim, vamos verificar o que
acontecerá dessa vez. E para tornar esse
drama verdadeiramente pessoal, vou enviar uma imagem
para a base de conhecimento que
representa a vibração da imagem motivacional que
eu quero que
a Gemini Estou clicando no botão Mais. Eu tenho meu
arquivo de referência no meu Drive local, então vou escolher Enviar arquivos. Esta é minha pasta, e essa é a citação motivacional
que eu selecionei Obviamente, você também pode incluir outros arquivos
aqui, por exemplo, caso tenha
um trabalho de pesquisa que queira que esse
jam analise ao fornecer as recomendações
e não apenas usar seu conhecimento geral,
sempre poderá fazer o upload desse arquivo aqui. E em termos
de ferramenta padrão, para esse jam, não vou
escolher nada aqui. Isso ocorre porque
nosso preparador físico está fazendo duas coisas muito
diferentes. Ele nos dá feedback em texto e cria uma imagem de alta
resolução. Portanto, ao permitir que a Gemini escolha
a melhor ferramenta para cada tarefa, garantimos que os planos de
fundo do telefone tenham uma aparência nítida e nosso feedback seja entregue
sem problemas técnicos Tudo está bem aqui.
Estamos prontos para clicar em Seguro. A propósito,
observe que
também há essa janela de visualização que você pode usar para testar suas instruções
antes de salvá-las. Mas no meu caso, eu já fiz o primeiro teste antes de começar a
gravar esse tutorial, então estou pronto para começar. Vou clicar em Seguro
e começar nosso bate-papo. Enviei meu primeiro vídeo do primeiro dia do meu treino e vamos esperar um pouco até que
o Gemini o processe Nosso vídeo foi enviado
e, antes de pressionarmos Enter, vamos falar sobre a seleção de
modelos aqui. Então, como esse congestionamento envolve análise
multimodal, exibição de
vídeos, verificação de filas de segurança e fornecimento de feedback
estruturado, escolherei um modelo de
pensamento que priorize E estamos todos prontos aqui, e eu vou apertar Enter. E aqui estão as
recomendações da Gemini. Em primeiro lugar,
gosto muito que nos diga que essas informações são apenas para fins
informativos E para
aconselhamento médico ou diagnóstico, devemos consultar
o profissional. Isso é totalmente verdade. Observe que ele
identificou com sucesso que esta é minha sessão de treino
do primeiro
dia . Por causa do nome relevante desse arquivo, havia um
treino do primeiro dia no nome. Aqui está o scorecard, o que eu acertei em cheio e
uma coisa Eu posso concordar com isso. E
depois, há uma pergunta. Você gostaria que eu
criasse seu plano de fundo personalizado de motivação
diária para
telefone, com base no seu progresso no primeiro dia? Sim, definitivamente, sim.
Então, vamos responder. Sim. E aqui vamos nós. Temos essa citação perfeita, mas há um problema
com essa imagem. Se a compararmos com minha imagem de referência
original, descobriremos que
elas não são iguais. Aqui está uma imagem que
pedi que Gemini criasse. Você vê que o plano de fundo
é completamente diferente. Então, vamos voltar à nossa tarefa
e trabalhar com o
Gemini para ver se podemos mudar isso e
garantir que ele crie imagens com fundo
semelhante ao nosso arquivo de referência
24. Acompanhe: Criando uma joia do treinador de fitness (parte 2): Bem vindo de volta. Na primeira
parte deste tutorial, configuramos a lógica central do nosso
preparador físico Jam. Mas nos
deparamos com uma limitação. Embora tenhamos enviado uma imagem de referência para
a base de conhecimento que gerava
motivação diária, os planos de fundo não se pareciam em nada
com a nossa imagem original Vamos corrigir isso
entendendo como o sistema realmente processa esses diferentes tipos de dados. Já mencionei antes que
Gêmeos é multimodal. Ele pode ver, ler e ouvir tudo ao mesmo tempo. Tudo isso é verdade. No entanto, há uma diferença
técnica em como uma gem lê um arquivo e
como ela cria uma imagem. Quando aplaudimos uma referência
à base de conhecimento, o Gemini usa sua capacidade de visão
para analisar o arquivo e resumi-lo em dados baseados em
texto para sua memória de longo prazo Mas quando o am
gera uma nova imagem, ele aciona um modelo de geração de
imagem separado De acordo com a documentação
técnica da Gemini, esse modelo de geração
não pode
ver diretamente os pixels brutos dos arquivos da sua base de
conhecimento Ele recebe apenas um prompt baseado em
texto. Se suas instruções simplesmente disserem que correspondem ao estilo
na base de conhecimento, a IA está trabalhando
a partir de um resumo, não da fonte original, e o
estilo original se perde. Para resolver isso, passamos da
referência para a especificação. Em vez de mostrar
ao jam um arquivo e esperar que ele interprete
o estilo corretamente, vamos escrever uma especificação visual
diretamente nas instruções Isso garante que toda vez que
a jam criar uma imagem, ela siga suas regras exatas
sem qualquer suposição Veja como fazemos isso. Acesse sua lista de Jams, encontre aquela que você gostaria de
editar e clique no ícone de edição E a partir daqui, siga
suas instruções. Na seção de motivação, vamos remover essa instrução
vaga Em seguida, adicionaremos uma descrição para nossa imagem para criá-la, abriremos um bate-papo separado, aplaudiremos sua imagem de referência e usaremos esse prompt Eu sugiro mudar para o modelo de
pensamento aqui
de acordo com os resultados. Depois de ter a descrição da
imagem, cole-a diretamente nas instruções
do Jams Aqui está a descrição que
tenho para minha imagem de referência. Isso define o layout, os telefones e a atmosfera. Portanto, o modelo tem um
conjunto claro de grades de proteção. Depois de fazer isso, podemos clicar
em Atualizar para salvar as alterações. Deixe-me começar um novo gráfico para testar as mudanças
que acabamos de fazer. R
Você vê que
nossa nova imagem e a de
referência não
são iguais, mas muito
semelhantes em seu layout, hierarquia
visual e estética
geral, um livro didático de vidro fosco sobre
uma paisagem urbana em tons pastel ao entardecer. Você vê que nossa nova imagem e a de
referência não
são iguais, mas muito
semelhantes em seu layout, hierarquia
visual e estética
geral, hierarquia
visual e estética
geral livro didático de vidro fosco sobre
uma paisagem urbana em tons pastel E isso é tudo para este tutorial. Por favor, escreva nos comentários deste vídeo em que jam você
está planejando trabalhar. E eu vou ver no vídeo a
seguir.
25. Gemini para criação visual: introdução da seção: Bem-vindo a esta nova
seção do curso. Você já me
viu criando algumas imagens com o Gemini no
início do curso e agora é hora de
entrar nos detalhes Vamos usar as ferramentas de
imagem e vídeo da Gemini para um test drive adequado E eu acho que essa é uma
das partes mais visuais
de todo o curso. Começaremos com a geração de
imagens e
não apenas com o básico. Eu vou te mostrar como usar
técnicas como mesclagem
contextual Onde você combina imagens de
referência para criar algo completamente
novo e um refinamento iterativo, onde você direciona gêmeos
como um fotógrafo ajustando um elemento vez até obter
exatamente a foto desejada Também analisaremos a
síntese visual, na qual você entrega
vários ingredientes ao Gemini e o
deixará criar uma única cena
perfeita A partir daí,
entraremos no que
chamo de suíte de edição, onde usaremos o Gemini para trabalhar com imagens que
você já tem pense em restaurar fotos antigas,
transformar esboços em fotos de produtos e
fazer edições precisas usando a ferramenta de marcação de construção da
Gemini Em seguida, analisaremos a criação sistemas visuais
completos, infográficos, fluxogramas e ativos adaptados para diferentes
plataformas e tamanhos de tela Concluiremos esta seção com o tutorial sobre criação de vídeos. E, claro, também
compartilharei minhas principais dicas e recomendações práticas que
desenvolvi
trabalhando com
o Gemini,
outro software de geração de imagens e vídeos de IA que ajudarão você a
obter melhores resultados Tudo bem. Vamos ser criativos.
26. O que é uma nanobanana? Principais características explicadas: Você deve ter notado um pequeno moja de banana
estranho
aparecendo em seu aplicativo Gemini Não é apenas um ícone fofo. É uma pequena pista de uma história engraçada de nomenclatura
por trás desse modelo Antes do lançamento
oficial desse modelo, Google o submeteu para testes
anônimos em uma
plataforma chamada ALM Arena, um site público em que
as pessoas comparam dois modelos de IA lado
a lado e votam no resultado
que preferem sem saber
qual modelo é qual
é a forma como os laboratórios de IA coletam feedback do mundo
real
antes de um lançamento completo O modelo precisava de um nome de
espaço reservado, algo que
não sugerisse que fosse um produto do Google para
enviá-lo ao site da LM Arena Às 2:30 da manhã, a gerente de produto
do Google chamada
Nina digitou Nano Pensando que era apenas
um marcador de espaço reservado que ninguém fora da
plataforma de teste jamais veria Mas o modelo teve um desempenho
tão bom que as pessoas no X ficaram obcecadas
com essa misteriosa poderosa Nano Banana, especulando sobre qual
laboratório a havia construído,
se era um projeto
secreto do Google ou se era
algo totalmente Em vez de
corrigir discretamente o registro, o
Google se inclinou Eles adicionaram a imagem da banana
ou o aplicativo Gemini e
até criaram uma edição limitada de mercadorias com tema de
banana O motivo pelo qual a banana
se tornou viral não foi apenas
o nome do cavalo. Era um
recurso específico que as ferramentas de imagem de
EI estavam
errando antes, consistência de
caracteres
no passado Se você carregasse uma foto e pedisse a uma
IA que a reimaginasse, obteria algo que se
parecesse vagamente com
você O que as pessoas começaram a chamar de
seu primo distante da IA, Nano Banana, mudou o fato de
você enviar uma
foto sua, que preserva
sua imagem real cenários completamente
diferentes Você pode se
transformar em Personalizado em cartão ou em cerâmica, e é reconhecidamente
você em cada um Você pode se transportar
para lugares diferentes, roupas
diferentes, décadas
diferentes O rosto continua sendo seu. Você pode até mesmo adicionar movimento transformando retrato
estético em um
pequeno vídeo em que o sujeito vira a cabeça ou
muda de expressão Veremos isso
com mais detalhes quando visualizarmos o modelo de vídeo de
Gemini Mas a consistência do personagem
é apenas uma parte disso. Deixe-me explicar outras coisas que fazem com que valha a pena entender
esse modelo. A mesclagem de cenas permite fazer upload duas fotos separadas e
fundi-las em uma única imagem
coerente Você pode colocar você e uma figura
histórica
na mesma mesa ou criar uma foto de grupo de pessoas que nunca
estiveram no mesmo lugar. O Gemini lida com a iluminação,
os ângulos e o contexto. Portanto, o resultado
parece uma imagem em
vez de algo que
parece costurado edição multiturna transforma
sua conversa em uma tela viva Você não precisa acertar tudo na primeira
solicitação. Você pode começar com uma sala vazia e fazê-la existir, pintar as paredes,
adicionar um sofá de couro, colocar uma xícara de
café fumegante na mesa Cada prompt se baseia no último. Uma coisa importante a lembrar é que
o bate-papo mantém o contexto
em todas as suas edições Portanto, se você quiser iniciar um projeto
completamente separado, abra um novo bate-papo em
vez de continuar
no mesmo tópico. mistura de design consiste em
pegar a textura ou a linguagem visual de
uma coisa e mapeá-la em outra coisa —
inteiramente o padrão de uma asa de borboleta se tornando
um vestido de alta moda A textura de um
ladrilho de mármore envolvendo
um par de tênis tem menos a ver com a edição de
uma foto e mais com a fusão de dois mundos que
normalmente não se encaixam Agora, uma coisa importante a entender sobre como tudo
isso se encaixa próprio
Gemini é um
modelo de raciocínio e linguagem em sua essência Os
recursos de imagem e vídeo vêm de modelos especializados
dedicados que Gemini chama de bastidores
para obter imagens Isso é Nano Banana. Oficialmente chamada Gemini
2.5 flash Image, embora ninguém a chame assim Para vídeo, é um
modelo chamado VO. Pense neles como a equipe criativa da
Gemini disponível mediante solicitação Quando você pede ao Gemini que
gere ou edite uma imagem, ele entrega a tarefa
ao Nano Banana Quando você pede um
vídeo, ele chama VO. A conversa
permanece em Gêmeos. O trabalho especializado acontece abaixo. Na próxima palestra,
abriremos o Gemini e tentaremos criar nossas primeiras imagens.
Eu vou te encontrar lá.
27. Criando sua primeira imagem com o Gemini: Agora que você viu a prévia das capacidades visuais do Gemini, vamos colocar a mão na massa
e criar nossa primeira imagem A criação de imagens está
disponível em todos os planos. Vamos abrir o Gemini
e começar a trabalhar. Para criar uma imagem,
você tem duas opções. Opção 1: crie uma imagem
em seu bate-papo existente em que você faça perguntas ou trabalhe na criação de um
novo conteúdo, como em nossa última
palestra, quando trabalhamos no resumo do produto para
uma empresa de colchões de IA A segunda opção é
começar do zero. Isso é o que eu vou
fazer desta vez. Vou começar com um
simples prompt. Um gato laranja fofo
dormindo em um sofá. Para dizer ao Gemini que
vamos criar uma imagem, vamos escolher a imagem
na lista de ferramentas Dessa forma, a Gemini sabe que
estamos esperando uma
imagem como saída, então não precisamos digitar essas instruções verbais
no prompt A próxima etapa antes de gerar uma imagem é escolher um modelo de geração de
imagem, seja ele de raciocínio rápido ou profissional. Vou escolher rápido desta vez. Uma forma alternativa de criar
uma imagem seria
digitar create a image of
diretamente em seu prompt. E, nesse caso, não
precisamos
selecionar Criar imagem
na lista de ferramentas. Essa é minha forma preferida
de trabalhar com a Gemini. Mas para esta demonstração, vamos continuar com a opção
Criar imagem selecionada. Nossa imagem está pronta, muito boa, considerando o
quão curta
é nossa solicitação e que é apenas
nossa primeira iteração. Você pode compartilhar, copiar ou
baixar essa imagem ou continuar ajustando a imagem apenas conversando
com
o Gemini e adicionando mais detalhes à sua solicitação
original Você vê que o Gemini modifica
o prompt da imagem adicionando mais detalhes enquanto mantém todo o
contexto anterior no Mas caso você
queira recomeçar com uma de suas iterações
anteriores, clique em mais e escolha a
ramificação em Novo bate-papo Em seguida, você pode dar a
solicitação ao Gemini
e, nesse caso, o Gemini
mudará a imagem selecionada Obviamente, você pode dar Gemini o
aviso inteiro imediatamente
ou, em vez de descrever
os detalhes você mesmo,
escolher um estilo ou, em vez de descrever
os detalhes você mesmo, escolher Por exemplo, em vez
de descrever luz
que queremos
ter em nossa imagem, vamos escolher o cinema na
lista aqui Você me viu selecionando entre o modo
rápido e o modo de pensamento. No aplicativo Gemini, esses modos representam
quanto poder de processamento e raciocínio a IA usa
para criar sua imagem, enquanto os
nomes de modelos específicos,
como nana Banana, evoluem rapidamente na forma como esses Permanece constante. Eu sempre recomendo verificar as páginas oficiais de
suporte do Gemini para ver os nomes das versões mais recentes Mas aqui está a melhor maneira de
pensar sobre seu fluxo de trabalho. Pense no modo rápido como
uma camada interativa. Ele foi desenvolvido para oferecer velocidade
e iteração rápida. Se você estiver mudando a cor da camisa, experimentando um novo penteado, trocando um plano de fundo ou
gerando muitas variações,
mantenha-o no modo de pensamento rápido, a camada de raciocínio. Isso leva mais tempo porque é mais
cuidadoso antes de Use-o quando precisar
de precisão, como texto limpo e legível para atribuir fotos
consistentes do produto
ou cenas complexas em que
os detalhes realmente importam Você pode me perguntar, mas Anna, por que eu não usaria pensamento o tempo todo
se é mais poderoso. É uma pergunta justa, mas há duas
vantagens práticas. O primeiro é o tempo. O primeiro modo
é a ferramenta de velocidade de pensamento. O modo de pensamento requer um período de
espera enquanto o EI pensa
no prompt. Em segundo lugar, são os limites de uso, porque modo de
pensar é mais caro do ponto de vista
computacional. Geralmente, tem
limites diários mais restritos do que o modo rápido. Meu
processo recomendado usa o modo rápido para explorar e gerar opções
aproximadas rapidamente. E depois de encontrar
seu conceito de herói, mude para o modo de pensar para obter o acabamento final de alta
fidelidade. Comece com o
modo de pensar imediatamente, somente para tarefas de alta
complexidade, como visualizar fluxos de processos ou criar imagens com
textos localizados específicos Tudo bem. Agora você tem
uma ideia inicial de como fazer com que o Gemini
crie imagens No próximo vídeo, vamos nos
aprofundar um pouco e aprender como criar um bom prompt
LCR no próximo
28. Sete dicas inspiradoras para criar imagens melhores: Olá, pessoal, e
bem-vindos de volta à palestra. Como esta seção do curso trata da geração de imagens, não
podemos ignorar
um tópico tão importante quanto a criação
dessas instruções No próximo vídeo, compartilharei minhas
sete principais recomendações sobre como criar
prompts eficazes. Vamos começar. Às vezes, você
verá saídas sólidas com instruções abertas simples, especialmente se estiver
aberto a No entanto, quando você tem uma visão
específica em mente, descrever vários detalhes pode ajudar a levá-lo à perfeição. Mas, independentemente da
direção que você deseja seguir, recomendo começar com um simples aviso e depois adicionar detalhes
extras, um por um, para ver como eles
afetam a imagem. Comece com a descrição
do assunto,
pessoa, animal,
paisagem, personagem fictício e assim por diante Gere sua primeira
imagem e, em seguida, inclua detalhes ou contexto
extras,
como sua localização, informações sobre o
ambiente e a iluminação, bem
como emoções ou estados de espírito que
você gostaria de apresentar Para esclarecer a ideia do
que você deseja criar, é útil fazer
uma série de perguntas a si mesmo. Aqui está uma lista de verificação
que você pode usar. Decida se você quer uma
foto ou uma ilustração. Qual é o seu
assunto, pessoa, animal, paisagem,
personagem fictício e assim por diante Pense em
efeitos e detalhes específicos que você deseja incluir:
movimentos artísticos, temas ,
técnicas, efeitos,
materiais, conceitos ,
cores e tons, iluminação
e composição. Vá além do básico e inclua descrições
adicionais em
sua solicitação que podem levar o processo criativo a uma
direção completamente diferente ou adicionar mais sabor e
nuances às suas imagens Aqui estão apenas alguns exemplos
do que você pode adicionar. Tipo de fotografia,
ambientes, emoções e estados de espírito, estilos de arte
específicos, cinematográficos ou pictóricos. Experimentar esses tipos
de descritores é uma das partes mais agradáveis de trabalhar com
a geração de imagens do Gemini Pequenos acréscimos podem
mudar drasticamente a sensação de uma imagem Preste atenção na ordem
das palavras em seu prompt. As palavras no início têm mais peso do que as
palavras no final. Portanto, se sua paisagem de neve é mais importante do que a
cabine em primeiro plano, comece com
a paisagem Tente reordenar o
mesmo conjunto de palavras
e, muitas vezes, você obterá resultados
visivelmente diferentes Esteja atento aos direitos de
terceiros. Gemini permite que você faça
referência a artistas históricos
e movimentos artísticos pelo nome Então, pedir um homem com qualidade ou estilo de Vang
funciona perfeitamente No entanto, o EI bloqueará que
solicitem estilos
de vida ou
artistas contemporâneos para proteger os criadores Também restringe
personagens protegidos por direitos autorais e logotipos de marcas. Se você quiser a aparência de artista
moderno ou de
uma marca específica, descreva as
qualidades visuais que você
procura , em vez de
nomeá-las diretamente Procure inspiração e exemplos ao criar
suas próprias instruções Se você é
novato geração de imagens de
IA e não
tem experiência em design, pode ser difícil
escrever na geração de imagens de
IA e não
tem experiência em design,
pode ser difícil
escrever instruções descritivas detalhadas no início, e isso é completamente normal Uma ótima maneira de
começar é navegar on-line pelas
comunidades de imagens geradas pela
I, encontrar imagens que você goste, ver as instruções
por trás delas e começar a experimentar
fazendo pequenas modificações Também é uma boa ideia
criar um quadro de humor as imagens que você gosta e
que talvez queira consultar mais tarde. Salve a imagem, o prompt usado e todas as notas de estilo
ao lado dela. Isso se torna uma
referência criativa muito útil ao longo do tempo. Por último, mas não menos importante,
aproveite o processo. No início, pode parecer que a EI está fazendo todo
o trabalho criativo. Mas sem suas ideias únicas, seus instintos sobre o que parece bom e sua curiosidade em
experimentar, o EI não produziria
nada interessante Portanto, seja você mesmo, divulgue
suas ideias e divirta-se com elas. Para recapitular Aqui estão as sete dicas. Comece de forma simples e adicione
detalhes um por um. Faça a si mesmo uma série de perguntas para esclarecer
sua visão. Vá além do básico em
descritores de ambiente,
humor, estilo e A ordem das palavras é importante. O que vem primeiro
tem mais peso. Esteja atento aos direitos de
terceiros. Os estilos dos artistas são justos, mas evite
personagens protegidos por direitos autorais e imagens de marcas Procure inspiração
on-line e crie os painéis de humor como
referência criativa. Divirta-se com isso. Como sempre, Alca
no próximo vídeo.
29. mesclagem contextual, renovação iterativa e síntese visual: Bem-vindo de volta. Até agora, conhecemos a banana Banana e aprendemos a criar
uma imagem do zero. Mas, na maioria dos casos, você não está apenas
procurando imagens legais. Você está procurando ativos. Você precisa da imagem perfeita de
herói para um site ou anúncio de mídia social que realmente interrompa a rolagem. Neste vídeo, vamos
explorar como
criar esses ativos. Obviamente, você pode começar do zero
e perguntar a
Gemini qual imagem você deseja Mas pense sobre isso. Descrever um ângulo de
iluminação específico, uma textura única ou estrutura física
complexa
com apenas texto é difícil. Você pode passar 30 minutos escrevendo o prompt perfeito e ainda assim
não entender o que está na sua cabeça. Mas se você mostrar a imagem de
referência do Gemini, fornecerá um
mapa instantâneo de suas expectativas Hoje, veremos
como
usar imagens para falar com a IA. Vamos começar com o desafio clássico
de marketing. Você tem um produto,
neste caso, frasco
para a
pele, e deseja que ele tenha uma aparência vibrante,
fresca e premium Para isso, vamos
usar a combinação contextual. Veja o que acontece quando eu carrego uma foto simples da garrafa
ao lado da imagem de referência
e, em seguida, guio Gemini para colocá-la em uma cena criativa
completamente nova Em nossa primeira solicitação, não
estamos apenas
pedindo uma foto aleatória. Estamos dizendo à Gemini
exatamente o que queremos,
referenciando a imagem original e pedindo a
substituição de partes dela, trocando a água por suco e a garrafa original por nossa marca de produtos para
a Vamos começar com o modo rápido. Eu cliquei em Enviar e
aqui está nossa imagem. O texto é nítido e a garrafa está perfeitamente
abaixo da linha d'água Agora vamos fazer algumas mudanças. Em primeiro lugar, adicionarei
essa frase ao prompt. Frases como foto de
produto de comércio eletrônico, iluminação
brilhante de estúdio ou fundo branco
puro
são os segredos profissionais que fazem uma imagem parecer um comercial real em
vez de um experimento de IA Também vamos mudar para o modo de
pensar aqui. Eu usei o mesmo aviso, mas de repente a garrafa está
em cima do líquido. Por quê? Como o modelo está, na verdade, raciocinando
por meio da física, ele sabe que o suco de laranja, ao contrário da água, não é transparente Ele acha que se eu mergulhar
essa garrafa no suco, a metade inferior do
rótulo desaparecerá Vamos tentar forçá-lo
adicionando instruções meio submersas ao prompt. Resultados semelhantes. O modo de pensar é priorizar a lógica da fotografia
do produto em vez de minhas instruções específicas de layout Ele pressupõe que uma boa foto
mostre toda a marca, então corrige minha composição retirando o produto
do suco Agora, vamos analisar o refinamento
iterativo. É aqui que Gêmeos
realmente brilha. Você não precisa tirar a foto
perfeita de uma só vez. Em vez disso, você o direciona como
um fotógrafo ajustando um elemento por vez até chegar exatamente
onde deseja Para esta sacola de café Gemini Brew, vamos criar uma
foto textual rica do produto passo a passo, começando com o posicionamento, depois
refinando a composição, adicionando vazamento e profundidade e, finalmente,
ajustando finalmente, Veja como cada solicitação
aproxima a imagem dessa estética premium do
elenco E, finalmente, vamos dar uma
olhada na técnica que eu acho que é a mais impressionante
de todas as sínteses visuais. Às vezes, você tem um kit de campanha
inteiro, vários produtos,
um modelo, uma roupa No passado, reunir
isso exigia um grande resumo criativo e
muitas idas e vindas Com o modo de pensamento do Gemini, nós apenas entregamos as peças e
deixamos que ele resolvesse o resto Criar do zero tem a ver com direção, não apenas com descrição. Você viu como
combinar contexto, refinar uma foto passo a passo e sintetizar vários
elementos em uma única Mas o que acontece
quando uma imagem está quase perfeita e
precisa apenas de uma alteração específica. Em nosso próximo vídeo, entraremos na suíte de
edição, onde
usaremos o Gemini para corrigir, restaurar
e editar imagens com precisão Você já tem Alca lá.
30. O Editing Suite: transformando esboços em protótipos e restauração de fotos: Todos, e bem-vindos de
volta à série de palestras sobre criação de
imagens com Gemini Neste vídeo, abordaremos
os recursos de edição
do Gemini Vou mostrar como usar a camada de pensamento
Gemini para corrigir, restaurar e literalmente ler e depois ajustar as imagens
que você já tem É aqui que deixamos de ser
criadores e passamos a ser editores
sofisticados Deixe-me abrir o Gemini
para começar a demonstração. Geralmente começa em um
guardanapo ou quadro branco. Você tem uma visão para um produto, mas não é designer. Aqui está o que vamos fazer. Estou enviando este esboço de
um novo design de cadeira para a Não preciso ser artista. Eu poderia simplesmente dizer à Gemini interpretasse esse esboço em uma foto realista do produto porque estamos
no modo de pensar Gemini usa as linhas
como guia estrutural. Ele entende a perspectiva que eu pretendia e
preenche os detalhes, eu mesmo não consegui desenhar Isso transforma seus rascunhos
em protótipos em segundos. Vamos trocar o tecido da cadeira. Mas em vez de explicar a
cor e a textura que eu quero, vou usar imagens de referência. Surpreendentemente, recebi
essa imagem do livro porque usei a palavra
capa em meu prompt. Vamos começar um novo bate-papo
para corrigir a imagem. E, claro, podemos dar a
essa participação um giro de 360 graus. Aqui tenho a
imagem do cabelo e meu vídeo pmt. E também selecionei o vídeo
no menu suspenso para garantir que Gemini entendesse
minha tarefa corretamente Agora vamos dar uma olhada em um dos reparos mais poderosos que você
pode fazer para a restauração. Todos nós temos aquelas fotos antigas de família
desbotadas
ou
fotos digitais de baixa qualidade de anos atrás Em vez de apenas colorir, pedirei a Gemini que o restaure Usando sua camada de pensamento, Gemini analisa as texturas
e o Ele remove os arranhões, torna
os rostos mais nítidos e aplica cores naturais
realistas como se a foto
tivesse sido tirada Não é só o filtro. É o EI reconstruindo a qualidade que foi perdida
ao longo do tempo. Vamos dar uma olhada. Mamãe. Oh, que sensação dançar no pedal perdida
no ritmo do sol
31. O conjunto de edições: edições direcionadas com a ferramenta de marcação e anotações externas: Vamos seguir em frente. E se
a imagem estiver ótima, mas você quiser mudar
uma coisa específica. Vamos explorar como trabalhar com a ferramenta de marcação de
imagem dedicada da
Gemini e também sua alternativa Eu gostaria de editar essa imagem. Vou enviá-lo para o Gemini e
abrir a ferramenta de marcação. Eu simplesmente clico na imagem. E aqui temos nosso espaço
de trabalho de edição. O que vou fazer aqui é
chamado de inspiração especial. Estou mostrando a Gemini
exatamente onde eu quero a mudança e descrevendo
qual deve ser a mudança Primeiro, vou escolher uma cor. Vamos com o vermelho. E eu circulo essa lareira. Em seguida, preciso
explicar a intenção, então vou mudar para a
ferramenta de texto e digitar Ed fire Observe que usei um verbo aqui. Você pode ser específico com
ações como adicionar ou substituir, ou pode simplesmente
descrever o objeto. Por exemplo, vamos adicionar duas xícaras de café
nesta mesa lateral aqui. Se você cometeu um erro, você sempre pode apertar o botão de
desfazer para voltar Estou clicando em Concluído quando acabei finalizar as
anotações e vamos pressionar Enter sem fornecer nenhuma instrução, porque
acabamos de criá-las nessa imagem E aqui está a nova imagem. Vemos que a Gemini incluiu
com sucesso as mudanças. Vemos o fogo
na lareira e
vemos aqui duas xícaras de
café. Ótimo trabalho. Ao abrir essa nova imagem, você notará
que clicar nela não abrirá a ferramenta de
marcação novamente. Portanto, essa ferramenta é específica
para seus uploads iniciais. No entanto, você não está preso, você pode continuar refinando o resultado usando edições
conversacionais Então, aqui está meu novo aviso. Gêmeos tem
consciência contextual da imagem. Ele acabou de ser criado e
continuará fazendo as alterações
que você solicitou. E voltando às minhas anotações
originais, observe que gosto de
combinar a cor do texto com a cor do círculo, enquanto
a círculo, enquanto
a IA
rastreia principalmente
as coordenadas Essa é uma ótima prática recomendada para manter suas
instruções organizadas. Você também pode trazer anotações
de ferramentas externas, como Por exemplo, aqui,
marquei esta foto do edifício Bursch
Khalifa Eu quero que Gemini faça
essas mudanças exatas. Quero que esse prédio
seja removido e quero mudar as cores de algumas partes
do prédio. Eu abri um novo chat e enviei essa
imagem para o chat. Para tarefas complexas como essa, recomendo mudar
para o modo de pensar. Isso aciona um modelo de raciocínio mais
poderoso, que é muito melhor em seguir essas Também incluirei
essas instruções, incluir esse aviso
aqui é importante. Por exemplo, aqui está a imagem
que obtive ao ajustar a mesma imagem sem fornecer nenhuma
instrução ao Gemini Vemos que a Gemini fez a mudança
com sucesso. No entanto, ainda
vemos as anotações, e essa era minha imagem original sem nenhuma
instrução fornecida Vamos voltar ao nosso
bate-papo e pressionar Enter. Infelizmente, desta
vez, ainda
temos as instruções
sobre a nova imagem e também vemos que a Gemini fez outras alterações com sucesso Não vemos o prédio
aqui no lado direito
e as novas cores
foram aplicadas com sucesso. Vamos pedir ao Gemini que remova as instruções de
anotação da
imagem . E aqui vamos nós. A segunda tentativa
foi bem-sucedida. Como você pode ver, os geminianos
reconhecem o texto, removem o prédio e
alteram as cores perfeitamente Em seguida, fornecemos a segunda instrução para remover as anotações.
Tudo bem aqui. Por fim, vamos
ver como os geminianos raciocinam sobre o mundo
dentro de suas fotos Por exemplo, se você fizer upload de
uma foto do horizonte de uma cidade, peça a Gemini
que
a anote,
veja como ela identifica
os pontos turísticos e adiciona rótulos Isso não é só desenho,
é design da informação. É pegar um pota bruto
e transformá-lo em um recurso educacional inteligente para
uma apresentação ou manual E esse é realmente o tema de tudo o que
abordamos neste vídeo, seja dando vida a
um esboço,
restaurando um fórum antigo, anotando uma imagem ou
rotulando de forma inteligente uma cena complexa, Gemini lida com o
trabalho de precisão, para que você não precise Em nosso próximo vídeo, reuniremos
todas essas habilidades para criar sistemas visuais
complexos, incluindo infográficos e visualizações de
dados que transformam dados complexos em algo instantaneamente claro.
Te vejo lá.
32. Visuais complexos: menus, diagramas e infográficos: Bem vindo de volta. Até agora, abordamos muitas
coisas como criar do zero, editar com precisão e
sintetizar cenas complexas Agora, vamos ver
o que o Gemini pode fazer quando a tarefa fica
ainda mais ambiciosa, criando ativos
visuais de várias peças, como infográficos, diagramas
e ativos que funcionam em diferentes plataformas e telas sociais Vamos começar. Eu quero que o
Gemini crie uma página Menu de infográficos usando
essas imagens de café. Eu queria identificar cada
bebida e colocá-la em uma seção limpa com seu nome
e uma breve descrição. Também vamos escolher criar imagens a partir da
seleção de ferramentas. A partir da
descrição de Pam aqui, não está muito claro
se eu quero uma imagem ou um texto como
saída final. Vamos começar. E aqui está nossa foto. Como o Gemini tem essa camada de ressonância
profunda, ele vê a diferença entre
as imagens que enviamos
e pode identificar uma xícara de café com os cubos de gelo dentro versus aquela
com a forma de leite morno Deixe-me pedir à Gemini que
mude
um pouco esse layout e também mude as cores
para se adequar às cores da nossa marca Oh, esse é um ótimo design. Eu gosto mais dele do que da
nossa primeira iteração. E vamos fazer mais uma mudança. Quero alterar o texto do
menu de café para o nome da nossa marca. E aqui está nossa imagem. Eu gosto muito disso. A única coisa que
eu quero mudar remover
esses grãos de café para que
o texto fique totalmente visível. Mas, em vez de fazer isso como uma série de instruções iterativas, vamos tentar usar
outra técnica Vou usar a ferramenta de marcação que abordamos
na demonstração anterior Deixe-me baixar esta imagem em
tamanho real. Eu criei um novo chat, enviei nossa imagem que
acabamos de gerar. Em seguida, abri a ferramenta de marcação e deixei destacar
os grãos de café Eu adicionei a instrução ao Gemini para remover
os grãos de café Vai ser um
pouco complicado porque
vemos os feijões junto
com o texto Mas vamos tentar fazer com que funcione. Estou escolhendo o modelo de
pensamento aqui e também seleciono e crio imagens. Então, minha primeira tentativa não
teve sucesso. Você vê que as imagens OF ainda
estão aqui dentro da imagem. Vamos tentar descrever a mudança que eu
gostaria de fazer. E aqui está nossa imagem. É realmente incrível que o
Gemini tenha se saído tão bem seguindo minhas instruções imediatas
e removendo os grãos de café do canto
superior direito do menu E agora podemos ver
nosso texto claramente. Incrível. E vamos passar
para a segunda demonstração aqui. Às vezes, você precisa explicar como é
a viagem
do grão à xícara no meu exemplo da marca de café
Gemini Então, aqui está o processo de fabricação de cerveja
exclusivo de nossa marca. Vou perguntar a
Gêmeos o seguinte. Quero que a Gemini finalize esse processo de assinatura do Gemini
Brew em cinco etapas
em um fluxograma de arquitetura
limpa Eu queria usar um
layout minimalista e combinar as cores com as que
usamos em nosso arquivo PDF Deixe-me escolher o modo de pensar. E para este exemplo, eu também vou
escolher Criar imagens. E aqui está nosso diagrama. Gemini construiu a estrutura, criou os ícones e
também rotulou cada etapa O que eu não gosto aqui são aqueles lances que
definitivamente são desnecessários E esse texto que
podemos ver em cada caixa. Vamos pedir a Gemini que remova isso. E aqui está a imagem mais limpa. E eu também gostaria de
remover essa moldura. Vamos pedir a Gemini que faça isso. E essa é uma foto muito
melhor. E eu quero fazer mais
uma iteração para tornar essa imagem
mais bonita Olha isso. Essa é uma estética
completamente diferente. Deixe-me saber nas
perguntas e respostas deste vídeo, qual você prefere E vamos
seguir em frente com nossa demonstração.
33. Visuais complexos: adaptação de recursos em formatos e plataformas: Obviamente, você pode
editar ainda mais essa imagem, se quiser, continuando solicitando melhorias ao Gemini
diretamente aqui no chat, ou copiando
essa imagem e seguindo as instruções ferramenta de marcação Mas deixe-me mostrar
outro exemplo enquanto estamos aqui nesta imagem. Digamos que estamos planejando uma expansão internacional
da marca Gemini Brew Portanto, precisamos que esse diagrama seja traduzido para
outros idiomas. Então, vou pedir que
mude a imagem para que os textos sejam mostrados
no idioma chinês. E esse é o nosso diagrama
traduzido. Observe que, em minha solicitação, digo explicitamente que quero que
Gêmeos altere a imagem, não apenas mostre os textos em chinês, para que fique
claro
para Gêmeos que preciso de
outra variação dessa imagem
traduzida para o idioma chinês para Gêmeos que preciso de
outra variação dessa imagem traduzida Tudo bem. E vamos
dar um exemplo final. Digamos que
precisamos de recursos para a
campanha de marketing da Gemini Brew, que funcionará em qualquer lugar, desde histórias
e postagens do
Instagram até a
imagem de um herói em nosso site Vamos tirar essa foto construímos anteriormente com a Gemini, e vou dizer à Gemini que esse é
nosso principal ativo E agora eu preciso de uma versão para uma história vertical nas redes sociais, um post quadrado e um cabeçalho branco para o site da
Gemini Brew Também anexei a imagem que eu quero que o Gemini modifique E aqui está a mensagem
que recebi do Gemini quando testei esse prompt antes de
gravar o tutorial Isso ocorre porque Gêmeos pode
criar uma imagem no tempo. Embora o Gemini possa processar muitas imagens de
referência ao mesmo tempo, seu objetivo é sempre
sintetizá-las em uma composição final de alta Se você solicitar vários arquivos de imagem
separados de uma só vez, como no meu exemplo aqui, ele não poderá
prosseguir com sua solicitação. Portanto, sempre enquadre sua solicitação como um único projeto, como um
infográfico, um menu ou uma foto de campanha em que todos os seus elementos estejam
juntos em uma imagem Então, deixe-me mudar o prompt. Primeiro, gostaria de criar uma imagem de cabeçalho branco para
o site da Gemini Brew Como sempre, estou selecionando o modo de
pensamento e também vamos escolher
Criar imagens para dar ao Gemini instruções claras de que espero ver a
imagem nesse caso E aqui está nossa nova imagem de
herói branco para o nosso site. Vemos que o Gemini não apenas estica nossa
imagem original, mas
também a pinta, adicionando mais detalhes a ela como aquelas máquinas de café antigas, bem
como esses grãos de café no lado esquerdo e direito
da imagem original,
garantindo que nosso produto esteja sempre perfeitamente posicionado no
centro da composição,
independentemente do tamanho da tela Também vamos criar uma imagem em tamanho
vertical
e uma imagem em tamanho quadrado
para nossas postagens no Instagram.
34. Além do bate-papo — pesquisa e construção aprofundados com o Gemini: introdução da seção: O que acontece quando você atribui Gemini uma tarefa de pesquisa que normalmente
levaria meio dia É disso que trata esta
seção
e, em seguida, levamos essas descobertas a algum lugar
que você talvez não espere. Vamos fazer isso usando um recurso do Gemini
chamado pesquisa profunda, e trabalharemos três situações muito diferentes
da vida real com ele Uma
com a qual a maioria de nós lida toda semana, uma sobre tomar uma
decisão de compra sem
cair na toca do coelho de
sites de avaliação e tópicos invadidos, e outra sobre como se
atualizar sobre um assunto completamente
novo Em cada caso, quero que você veja não apenas o que o Gemini produz, mas como solicitá-lo, para que o resultado seja
realmente útil para você E então
vamos dar um passo adiante usando o Canvas para transformar um desses resultados de
pesquisa em um aplicativo interativo funcional
criado a partir de uma conversa Nenhum código exige isso.
Espero que você esteja pronto. Então pegue uma xícara
de chá ou café e vamos começar.
35. Pesquisa aprofundada: respostas além do projeto: Levante a mão, se isso
já aconteceu com você,
você faz uma pergunta difícil e
importante a um chatbot, algo como: “Eu quero
levantar o financiamento da Série A Quais são os
investidores mais ativos no meu espaço no momento? E ele responde com
uma lista de opções, que é bastante superficial, e você também recebe várias recomendações de
alto nível Por exemplo, você deveria pesquisar investidores
ativos
em sua categoria. Você deve criar uma lista de alvos. Você deve entrar em
contato com sua rede para receber apresentações calorosas
e assim por diante A equipe de produtos do Google
tem um nome para isso. Eles chamam isso de um plano de resposta, um mapa de alto nível que
diz o que
procurar , deixando todo
o trabalho real para você Você ainda está se afogando
em 50 abas abertas do navegador, tentando separar o
sinal útil do ruído pesquisa profunda da Gemini é o que
pode ajudá-lo a superar o plano e obter algo muito abrangente no qual você
possa agir imediatamente Pesquisas aprofundadas não são
apenas um chatbot mais inteligente. É um sistema agente, o
que significa que planeja, pesquisa motivos e sintetiza
informações de forma autônoma pesquisa motivos e sintetiza em centenas
de fontes em Pense nisso como ter
um assistente de pesquisa de nível de doutorado em sua equipe que faz horas de investigação
complexa
em minutos e volta com um
relatório refinado, não uma lista de tarefas Então, o que um assistente de
pesquisa em nível de doutorado realmente faz por você na prática Deixe-me apresentar os três casos de uso
mais poderosos. Primeiro, a compreensão do tópico, aprofundando assuntos complexos. Imagine que você é um gerente de
RH tentando entender como a IA afetará a força de trabalho
nos próximos três anos Você não quer apenas um resumo no nível
da superfície. Você precisa entender
a paisagem. Como a automação da IA
se compara ao aumento da IA. Quais funções correm maior
risco e quais estão evoluindo, o que outras
empresas já estão fazendo? E o que a
pesquisa diz versus o que apenas uma pesquisa exagerada
mergulha em trabalhos acadêmicos, relatórios do
setor, relatórios do
setor comentários de
especialistas e estudos de caso
do mundo real simultaneamente Ele volta com uma análise
estruturada que mapeia a paisagem, contrastando ideias concorrentes, as relações
entre conceitos e explicando o
porquê por trás de tudo Em segundo lugar, a
devida diligência profissional. Pense em se preparar para uma reunião de vendas
corporativas. Antes de entrar pela porta, você precisa entender os principais desafios
comerciais dos clientes potenciais,
os movimentos estratégicos recentes, a pressão competitiva
que eles estão enfrentando e como seu produto
se encaixa em tudo isso. Pesquisas aprofundadas investigam
os produtos da empresa, descobrindo a história, equipe de
liderança e o ambiente
competitivo E isso é muito importante, mescla tudo isso com suas
próprias notas internas sobre o relacionamento com o cliente.
O que
um analista júnior levaria um dia inteiro para compilar agora está
pronto em minutos Então você entra na sala de
reuniões sabendo mais sobre seus negócios
do que eles poderiam esperar. Em terceiro lugar, altos riscos, decisões
pessoais. Nem tudo gira em torno do
trabalho, da compra de um carro, escolha de um bairro, da
comparação das opções de seguro. Essas decisões são igualmente
importantes,
e a pesquisa Rabbit Hole
é tão profunda quanto, em vez de
um fim de semana perdido lendo postagens
conflitantes no blog
e tópicos invadidos, você recebe um relatório estruturado
em torno de sua situação específica, dos prós, dos contras e das nuances que conselhos genéricos E aqui está o que torna todos esses três casos
de uso
possíveis na prática. Pesquisas aprofundadas não
fornecem apenas uma lista de links. Ele produz um relatório abrangente de
várias páginas, análises
estruturadas, fontes
citadas e até mesmo coisas como infográficos que dão vida
aos dados Na próxima palestra, vamos colocar
nossas mãos nela Mostrarei como
iniciar uma pesquisa aprofundada, como criar o
plano de pesquisa antes que ela comece, e analisaremos juntos
um exemplo real
para que você possa ver o processo completo, do aviso ao relatório final.
Eu vou te encontrar lá.
36. Pesquisa aprofundada em ação — compreensão do tópico: Conforme prometido, vamos ver
uma pesquisa profunda em ação. Vamos começar com o tópico Entendendo o caso de
uso, e escolhi um exemplo com o qual
acho que a maioria de nós pode
se identificar pessoalmente. Vamos usar
pesquisas aprofundadas para abordar um
dos tópicos mais confusos da vida cotidiana. Café da manhã, nutrição,
você conhece a sensação. Se você pesquisar RX no Google e obter dez
respostas completamente diferentes, dependendo do artigo
que você
seguir. Junto com esta demonstração, você precisará de um plano Gemini
pago Se você está atualmente em um
plano gratuito e deseja fazer o upgrade, confira a palestra
na seção introdutório do curso onde explico
como fazer isso Ok, vamos. Para iniciar uma pesquisa profunda, abra um novo bate-papo e escolha pesquisa
profunda
na lista de ferramentas. Por padrão, o Gemini usa pesquisa
do Google como
fonte primária Mas você pode expandir isso. Por exemplo, você pode
escolher seu Gmail ou Google Drive como fonte
ou fazer upload de seus próprios arquivos É isso que torna a
pesquisa profunda tão poderosa. Não se trata apenas de pesquisar na web. Ele pode mesclar informações públicas com seus próprios documentos privados Para esta demonstração, vamos simplificar
e usar a pesquisa na web somente aqui está o prompt que
vou usar. Observe o quão específico é
esse prompt. Não estamos apenas perguntando: O que devo comer no café da manhã? Estamos oferecendo uma pesquisa profunda, uma agenda de pesquisa clara
com três tarefas distintas. Quanto mais orientação
você der de antemão, mais útil será a saída. Quanto à seleção do modelo aqui, a analogia do especialista
que apresentamos anteriormente
no curso permanece exatamente a mesma quando você ativa uma pesquisa
profunda O modo selecionado
determina como esse especialista se comporta durante
o processo de pesquisa Fast continua sendo seu velocista, realizando uma ampla varredura rápida das fontes mais relevantes para fornecer
um resumo rápido sem se
aprofundar em todos os detalhes Pensar ainda é seu
estrategista fingindo cruzar referências de várias fontes e resolver contradições para
encontrar um ângulo mais lógico O Pro continua sendo seu especialista mergulhando
profundamente em tudo,
desde relatórios densos e PDFs técnicos até longos tópicos de e-mail, para
oferecer uma síntese verdadeiramente
abrangente Vou escolher pensar aqui. Agora vamos clicar em enviar e
ver o que acontece primeiro. Essa é a etapa de
decomposição da meta e é uma das minhas
partes favoritas do processo Em vez de mergulhar
direto na pesquisa, pesquisa
profunda faz uma pausa e cria um plano de pesquisa personalizado em várias
etapas com base em Você pode vê-lo mapeando exatamente o que
pretende investigar. Se precisar, você pode editar
esse plano antes que ele comece. Se você quiser direcioná-lo para um ângulo específico,
adicionar um subtópico ou remover algo que
não seja relevante para você,
faça isso agora, antes que uma
única pesquisa seja executada Para esta demonstração, estou feliz
com o plano como está. Então, vamos
aprová-lo e deixá-lo funcionar. E agora a busca começa. Gemini está trabalhando com
fontes em tempo real, artigos
acadêmicos, nutrição, diretrizes e publicações sobre saúde É decidir quais
ameaças investigar em paralelo e quais
precisam acontecer em sequência Você pode até clicar em qualquer um
dos sites aqui se
estiver curioso para saber quais fontes a
Gemini está acessando À medida que a pesquisa profunda da Gemini
lê cada fonte, ela não apenas coleta
informações e segue em frente Ele pensa no que
procurar em seguida. Está executando um processo contínuo de
autocrítica, detectando contradições
entre fontes, sinalizando afirmações vagas ou
infundadas e reconhecendo que quando
um dado
simplesmente não se soma
, você pode vê-lo
ajustando suas
direções de simplesmente não se soma
, você pode vê-lo pesquisa em tempo real, à
medida que novas informações chegam
e, quando chega a um beco sem saída, digamos que um estudo está atrás de um acesso pago ou um site está fora do ar, digamos que um estudo está atrás de um acesso pago ou um site está fora não para. Ele redireciona e encontra outro
caminho para a mesma resposta. Há mais uma coisa que torna isso possível em grande escala. pesquisa profunda funciona
dentro de uma janela de contexto, os IIs, memória de trabalho. Em termos práticos, isso
significa que o Gemini guarda na memória todas as fontes que leu durante toda a sessão Nada é perdido ou esquecido
à medida que a pesquisa cresce. E é também por isso que as
perguntas de acompanhamento posteriores são tão nítidas. Eu nunca perco a ameaça do
que já foi investigado. E você já deve
adivinhar que não
precisa ficar sentado vendo
tudo isso acontecer. Pesquisas aprofundadas são assíncronas. Você pode fechar a guia e
voltar ao trabalho, e o Gemini avisará
quando seu relatório estiver pronto Se você estiver no aplicativo da web, verá uma
notificação
ao lado do tópico de bate-papo
na barra lateral E se você tiver o aplicativo
móvel Gemini instalado, receberá uma notificação push
diretamente no seu telefone E acabei de receber o meu. Nosso relatório está pronto. Então, vamos voltar para
Gêmeos para dar uma olhada. É isso que uma pesquisa profunda oferece e observe
o que não é. Não é uma lista de links. Não é um resumo com
marcadores. É uma análise estruturada de
várias páginas com fontes
citadas, seções organizadas e conclusões reais.
Você pode agir a tabela hierárquica de ingredientes que solicitamos que está aqui, nível um, nível dois
e três,
clara, acionável e
baseada em E se você estiver curioso
sobre alguma das fontes, cada afirmação tem links relevantes. Você mesmo pode clicar e ler a
pesquisa original. Não sei sobre você, mas teria levado
horas para ler todos esses recursos e
compilar o relatório manualmente E é importante que uma pesquisa profunda não
substitua seu julgamento. É fazer esse
trabalho tedioso de base para que seu julgamento seja
realmente Em nossa próxima palestra, faremos uma pesquisa profunda em um contexto pessoal e
examinaremos mais alguns exemplos.
Te vejo lá.
37. Pesquisa profunda em ação — decisões de compra: Nesta palestra, veremos mais dois casos de uso para pesquisas
profundas que
acho que você
achará imediatamente úteis
em sua própria vida A primeira é sobre como tomar uma decisão de
compra segura, e vou usar um exemplo
bem real. A segunda é sobre aprender
um assunto completamente novo. Vou te mostrar algo que nunca
mostrei antes. Como transformar um
relatório de pesquisa aprofundado em um infográfico, um questionário e cartões de memória sem sair
da
interface de pesquisa profunda do Gemini.
Vamos começar. Meu
anel de rastreamento Aura quebrou recentemente. Eu gostaria de substituí-lo, mas não tenho certeza se
devo comprar
o anel mais recente
da mesma marca ou usá-lo como uma chance de mudar
para algo melhor. E há uma característica
específica que
eu queria há anos. Alarme silencioso com
reconhecimento do ciclo de sono vibratório que realmente o acorda no momento certo
do
seu ciclo de sono, não apenas em um horário fixo Vamos usar uma pesquisa profunda como nosso
assistente pessoal de compras
para analisar
avaliações e artigos on-line. Aqui está meu aviso. Observe algumas coisas sobre
esse prompt. É pessoal. Eu dei a uma
pesquisa profunda um contexto real sobre minha situação e
o que estou procurando. Eu incluí o alarme vibratório, não apenas porque eu quero,
mas para ver se o Gemini consegue
filtrar as escolhas óbvias Na verdade, os anéis mais populares
não têm modelos de vibração. Portanto, uma pesquisa básica
pode me dar uma lista dos dez principais anéis que
ignora esse requisito Pesquisas profundas devem descobrir isso. O prompt tem uma
agenda de pesquisa clara com três tarefas e solicita um formato de
saída específico no final, uma tabela de recursos, o que significa que o relatório poderá ser usado
imediatamente, não apenas a parede de texto Vamos escolher uma pesquisa
profunda em uma lista de ferramentas. Vou confiar na pesquisa
aqui como fonte principal e vou escolher o
modo de pensar. E vamos começar. Gemini preparou este plano de
pesquisa para mim, e eu gostaria de
fazer uma alteração aqui. Para isso, clique em Editar plano Em seguida, digitarei
a alteração que
quero que a Gemini faça
no plano atual Quero que a Gemini também inclua uma marca específica
em sua pesquisa Vemos que a lista de
marcas foi atualizada. Agora estou bem com esse plano, então vou aprová-lo
e começar a pesquisa E em alguns minutos, nosso relatório está pronto. Vamos analisar isso juntos. Você pode ver que uma pesquisa
profunda
identificou os
três principais candidatos, os analisou exatamente de acordo com
os critérios que solicitei, incluindo o sistema de alarme
inteligente vibratório e produziu a tabela de
comparação de recursos aqui Esse é o tipo de saída
que normalmente
exigiria pelo menos uma
hora de troca de toques, tópicos
prontos e análise de sites de
avaliação conflitantes Eu o tenho
estruturado em minutos minha
situação e requisitos específicos. E aqui está a lista de recomendações
estratégicas
da Gemini Um aviso porque eu lhe dei um contexto
pessoal com antecedência. As recomendações
não são genéricas. Eles filtram isso de acordo com
minhas prioridades reais. Custo-benefício, sem assinaturas
pesadas e alarme de deslize, isso
realmente funciona Esse é um ótimo exemplo do uso de pesquisas
aprofundadas para tomar decisões
de compra. Em vez de se afogar em opções, você sai com uma lista curta clara e
fundamentada Na segunda parte
deste tutorial, continuaremos explorando pesquisas
aprofundadas para outro caso de
uso, o ACA there.
38. Pesquisa profunda em ação — aprendendo um novo tema: Agora vamos ver algo
um pouco diferente. Usando pesquisas aprofundadas para acelerar seu aprendizado quando você está
entrando em um novo assunto. Recentemente, comecei a estudar investimento
imobiliário. Assisti à minha primeira
aula e fiz algumas anotações sobre os tópicos
que abordamos lá. Agora, quero aprender mais sobre esses tópicos
usando pesquisas aprofundadas. Posso enviar essa foto
diretamente para o prompt. Gêmeos Vou ler minhas anotações
manuscritas, extrair os principais tópicos e usá-los como base
para um relatório de pesquisa Não preciso digitar nada novamente. Deixe-me mostrar como isso funciona. Antes de tudo, vamos escolher uma pesquisa profunda
na lista de ferramentas. Vou mudar para o modo de
pensar aqui, digitar meu prompt e anexar
minhas anotações manuscritas O que eu adoro
nessa abordagem é que a pesquisa está ancorada que eu já
comecei a aprender Portanto, o relatório reforça
e expande
meu conhecimento existente, em vez de começar
do zero Para isso,
pedi especificamente a Gemini que se referisse aos
temas-chave em minhas anotações, ao pesquisar e
redigir E aqui está nosso
plano de pesquisa. Todos parecem ótimos para mim, então vou começar a pesquisa. E nosso relatório está pronto. Você pode ver que ele pegou
todos os principais tópicos das minhas anotações e construiu uma
análise estruturada em torno deles. Definições, contexto, relações entre conceitos, implicações
práticas. Podemos usar essas informações
como um complemento de estudo, não apenas como um resumo. Mas é aqui que
fica realmente interessante. Quando o
relatório de pesquisa aprofundado estiver pronto, podemos transformar essa parede de texto em ferramentas ativas de aprendizado. Você notará
criar um botão
no canto superior direito
do painel Canvas. Clique nele e você verá
um menu suspenso com várias opções para
transformar o relatório Primeiro, vamos dar uma olhada
nos infográficos. A Gemini pega informações
complexas como a diferença entre ativos
residenciais e
industriais, em nosso exemplo imobiliário e as transforma em
um resumo visual Isso é perfeito para uma revisão rápida e
de alto nível ou para compartilhar um pager
com uma parte interessada Vamos retornar ao nosso
relatório de tendências de investimento
imobiliário para continuar a demonstração. Em seguida, para garantir que as
informações realmente permaneçam, podemos gerar um questionário O Gemini cria perguntas
interativas com
base especificamente no relatório Conforme você responde, ele fornece feedback
imediato, ajudando você a identificar
exatamente onde sua compreensão de um novo
tópico pode precisar de mais trabalho. I E, finalmente, temos cartões didáticos Você tem duas maneiras de usar isso. Você pode gerar um conjunto completo de flashcards para revisar cada
termo-chave do relatório Mas se você acabou de
terminar o questionário, como no nosso exemplo aqui, Gemini pode gerar cartões com base especificamente nos resultados
do questionário Ele tem como alvo as áreas em
que você lutou. Vamos fazer isso. Então, vemos um ciclo de
aprendizado completo aqui, pesquisando, entendendo,
testando a si mesmo e reforçando seu conhecimento
em uma ferramenta . No próximo vídeo, vamos passar de pesquisa
profunda e
revisitá-la para que você já conheça, mas exploraremos seus casos de uso
avançados, especificamente criando aplicativos de
IA E, como aviso, usaremos as
principais conclusões de um de
nossos relatórios de pesquisa aprofundados
como dados de entrada com os quais nossos relatórios de pesquisa aprofundados
como dados de entrada com os nosso aplicativo será construído E mais sobre isso
no próximo vídeo.
39. Além dos documentos: o que mais a tela pode fazer?: Bem-vindo de volta. Então, em nossa
última palestra sobre Canvas, nos concentramos na elaboração de documentos Como o Canvas oferece
um espaço de trabalho para refinar a escrita com
gêmeos ao seu lado Mas a elaboração de documentos é, na verdade apenas o começo do
que o Canvas pode fazer E você já viu algumas delas sem perceber Lembre-se de que o
botão de criação que apareceu após seu
relatório de pesquisa profunda era o rádio, os infográficos, o questionário, os cartões de memória, isso era
o Deep Research entrega seu
relatório diretamente no Canvas, é por isso que você pode
transformá-lo em todos esses formatos sem
precisar trocar de ferramenta. pesquisa profunda e o
Canvas estão conectados por design. O Google os criou para fluírem um para o
outro sem problemas Então, vamos ver a
imagem completa do que o Canvas pode fazer. A primeira coisa que o Canvas pode criar além dos documentos são as páginas da web. E eu não quero dizer
HTML simples com algum texto nele. Quero dizer páginas
interativas estruturadas com cartões
informativos, gráficos, layouts visuais
e elementos clicáveis Pense na última vez em que
você teve que compartilhar um relatório ou um resumo com alguém que não ia ler
uma parede de texto. Com o Canvas, você pode pegar
o mesmo conteúdo e dizer, transforme-o em uma página da web ou simplesmente clique no botão
da página da web E em segundos, você tem algo que realmente
parece uma página real. Você pode compartilhá-lo com o link. Nenhuma configuração de publicação ou
hospedagem é necessária. Em seguida, estão os infográficos. Se você já
tentou explicar
algo complexo para uma parte interessada não
técnica,
um processo, uma comparação, uma estrutura de
decisão, você
conhece o desafio As palavras não podem fazer muito. Canvas pode pegar seu conteúdo bruto e reestruturá-lo
em um formato visual Seções limpas, pedaços
digeríveis,
ícones, comparação E você pode continuar refinando
isso no mesmo gráfico. Aumente a segunda seção, mude o tom para
ser menos formal e ela a atualize em tempo real. Em terceiro lugar, o Canvas também pode gerar questionários
interativos
e cartões de memória flash a partir de qualquer conteúdo
que você publique nele Isso é útil além de
apenas estudar. Pense na integração do cliente, no treinamento
da equipe, na verificação do
conhecimento do produto. Você descreve o que
deseja e o Canvas cria um questionário
interativo funcional Sem ferramentas de terceiros, sem criador de formulários, sem etapas extras. Também existe um modo de áudio. Canvas pode
transformar conteúdo
escrito em uma visão geral de
áudio no estilo podcast, conversa entre
dois apresentadores de IA que discutem e
resumem seu material É útil se você quiser um
longo
documento enquanto trabalha ou compartilhar descobertas
com pessoas que
preferem ouvir do que ler.
Bem-vindo de volta ao Deep Dive. Hoje, estamos revelando uma
visão que
parece estar realmente mudando
sob Estamos
superando a velha ideia de um assistente inteligente que apenas
ajusta temporizadores ou toca música Estamos analisando esse conceito
de assistente universal. Um parceiro que
realmente antecipa o que você precisa antes mesmo de
você perguntar E depois há o
grande problema que o Canvas pode criar
aplicativos totalmente funcionais, softwares funcionais. Você descreve o que deseja, organizador de
receitas, planejador de viagens, ferramenta de questionário
ou rastreador de orçamento, e o Canvas gera o
código
e o executa para você organizador de
receitas, planejador de viagens, ferramenta de questionário
ou rastreador de orçamento, Canvas gera o
código
e o executa Ali mesmo na janela, você não vê o código. Você não precisa
entender o código. Você acabou de ver um aplicativo
interativo funcionando e ele não é estático. Você pode continuar conversando
com Gemini para ajustá-lo. Isso é o que tem sido
chamado de codificação vibe. Crie software
descrevendo o que você quer em vez de escrever
código linha por linha. Abordamos esse conceito na palestra sobre o
impacto da implementação do Geni do curso E agora estamos prestes
a ver sua vida. Aqui está o que eu mais
amo no Canvas nesse contexto. Não é uma ferramenta de
desenvolvedor separada. É o mesmo espaço de trabalho
que você já usa para escrever
documentos e esboços A mudança de
rascunhar um documento para criar um aplicativo para mim é
apenas uma conversa. Em nossa próxima palestra, faremos exatamente isso Vamos continuar
exatamente de onde paramos. Usamos pesquisas profundas
para finalmente obter uma resposta clara baseada em evidências sobre nutrição
no café da manhã. E vamos
transformar essa pesquisa em um aplicativo de
receitas de café da manhã em família que sugere refeições rápidas e saudáveis
para adultos e crianças. Vamos construir isso.
40. Acompanhe: como criar um aplicativo com a tela — da pesquisa ao aplicativo de corrida: Bem vindo de volta. Aqui estamos
preparando um chef de café da manhã, refeições
rápidas em menos de 20 minutos, família com fotos
da refeição pronta. Tudo dentro do Gemini Canvas, sem código, sem necessidade de
formação técnica. Apenas uma boa dica e um pouco de idas e
vindas com
Gêmeos. Vamos. Para manter nosso fluxo de trabalho organizado, seguiremos
quatro etapas simples:
identificar oito, criar, refinar
e, finalmente, compartilhar E aqui está o primeiro passo, iDeD. Este é o nosso
relatório de pesquisa aprofundado sobre nutrição no café da manhã. Vamos debater com a Gemini sobre a ideia por trás do amplificador
e o que ele fará Tenho algumas ideias iniciais, mas quero expandi-las. Comecei descrevendo
o propósito do aplicativo. Também disse que quero que o aplicativo use os resultados da
pesquisa
e fiz referência à e fiz referência estrutura abrangente
do
TireedGrocery do relatório para enfatizar
que não preciso de relatório para enfatizar
que não preciso uma lista aleatória Quero que o Gemini
crie três
recursos interessantes para o aplicativo e também sugiro uma
aparência Aviall para o Coloquei algumas
palavras descritivas aqui, como divertido, caloroso,
acessível, para dar uma orientação aval
para
o que eu quero Estou procurando uma
descrição detalhada do aplicativo. O conceito em que podemos começar a
criar o aplicativo real. Vamos pressionar Enter. E aqui temos a descrição do nosso
aplicativo. Vamos pedir a Gemini que faça algumas
mudanças nesse conceito. O primeiro recurso, o cronômetro familiar do carregador
frontal, parece ser bastante complexo, especialmente para a primeira
versão do aplicativo Então, vamos pedir ao Gemini
que o
substitua por algo mais
simples Pergunta simples sobre que tipo
de refeição é preferida hoje. E também adiciono
detalhes adicionais para
garantir que toda vez que
pedirmos uma receita, recebamos uma nova e
que o aplicativo use estritamente os ingredientes
recomendados em nosso relatório. Então, pressionarei Enter
novamente e
veremos como o Gemini
incorporará essas mudanças E aqui temos
a versão atualizada da descrição do aplicativo. Estou pronto
para usar esse conceito, mas antes de passarmos para a segunda etapa, criar o aplicativo, precisamos verificar nossas configurações. Veja o seletor de
modelos aqui Você pode se sentir tentado por P. Diz matemática e código avançados Então, parece a escolha
mais poderosa. Mas aqui está o que
descobri quando testei os dois ao criar este aplicativo de
café da manhã antes. Na verdade, o Pro tornou
o processo mais difícil. Foram necessárias mais idas e vindas
para obter os resultados que eu queria, e eu gastei
meus créditos P rapidamente, deixando-me esperando algumas horas
antes de poder continuar. O modo de pensar
me levou até lá mais rápido. Então, aqui está minha recomendação. Sempre comece pensando. Ele foi projetado para raciocinar
passo a passo, que é exatamente o que a criação de
aplicativos exige Trabalhando com lógica,
estrutura e fluxo, economize para quando seu
aplicativo precisar trabalhar com um grande volume de conteúdo
de várias fontes, documentos, vídeos,
imagens e muito mais. Vamos começar a
segunda etapa, criando o aplicativo. Meus testes anteriores
mostram que, se você enviar essa solicitação diretamente
neste bate-papo, Gemini não iniciará
o processo de criação, mas enviará a
descrição do conceito do aplicativo mais uma vez Sim, foi o que aconteceu
desta vez também. Você vê que, em vez
de criar o aplicativo, Gemini apenas fez algumas alterações
no próprio relatório, e não é disso que precisamos Portanto, para iniciar o processo de criação do
software do aplicativo, não apenas a descrição textual, clique na
seção Criar e descrever seu próprio aplicativo, escreva Crie um aplicativo com base
na descrição acima. Você vê que o Gemini mostra esse comando na descrição do nosso
aplicativo aqui e começa a criá-lo E enquanto a Gemini está
criando o aplicativo, deixe-me responder a uma pergunta que você provavelmente
está pensando agora E se eu não estiver partindo
de um relatório de pesquisa aprofundado? E se eu quiser
criar um aplicativo do zero? Nesse caso, comece
abrindo um novo bate-papo. Mas antes de digitar qualquer coisa, mude
primeiro para o modo Canvas. Aqui está o porquê. O Gemini só pode criar e
executar aplicativos dentro do Canvas. É um espaço de trabalho dedicado projetado especificamente para isso Um bate-papo normal pode
ajudá-lo a pensar em ideias, mas na verdade não pode
criar um aplicativo funcional. Quando estiver no Canvas, faça um brainstorming de sua
ideia de aplicativo com o Gemini Descreva o
que você quer construir, para
que serve e o que deve fazer. Quando estiver pronto
para começar a construir, aperte o botão Criar, digite seu prompt e o Gemini começará a trabalhar Ok, de volta à nossa demonstração. E nosso aplicativo está pronto. Começamos selecionando como estamos nos sentindo hoje e que tipo
de refeição preferiríamos. E os geminianos
sugeririam uma refeição saudável. Assim, vemos aqui
uma lista de ingredientes, seguida de instruções sobre
como preparar a refeição. Temos uma ótima espuma que
ilustra o que
estamos prestes a comer E também podemos escolher o modo
de chef infantil para que tenhamos uma lista de tarefas
para nossos jovens ajudantes Muito fofo. Agora vamos
para a terceira etapa, refinar Como você pode imaginar, ainda não
terminamos aqui. Podemos continuar iterando
e aprimorando nosso aplicativo. Digamos que eu queira
ajustar algumas coisas. Vou digitar minhas solicitações
no chat. Você acabou de me ver introduzindo
várias mudanças em nosso aplicativo. Ao fazer isso, introduza
uma alteração por vez, em vez de tentar incluir tudo em
um único prompt. Deixe-me fazer várias outras
alterações em nosso aplicativo. Aqui está a versão
que eu tenho até agora. Decidi adicionar a
possibilidade de incluir outros ingredientes além
da lista predefinida E caso
seja da categoria de nível
três, será exibida uma mensagem
relevante, mas a receita ainda
será criada. Também adicionei a possibilidade salvar uma receita
nos favoritos, que podem ser acessados aqui. E, finalmente, adicionei o botão de
reset, caso
queiramos começar tudo novo e escolher ingredientes
diferentes. Como você pode ver,
conseguimos fazer muitas
mudanças apenas conversando casualmente com Gemini, sem a necessidade de codificação Estou feliz com nosso progresso
atual e com a experiência do usuário que
criamos. Na segunda parte
deste tutorial, mostrarei outra
maneira de fazer alterações em seu aplicativo usando a barra de ferramentas
do Canvas E também daremos uma olhada em como compartilhá-lo com outras pessoas. Te vejo na segunda parte.
41. Acompanhe: como criar um aplicativo com tela — refinando e compartilhando: Todo mundo. Bem-vindo à
segunda parte do tutorial, onde exploramos como
criar um software funcional descrevendo o que queremos em vez de escrever
código linha por linha, o processo conhecido como
codificação vibe, conforme prometido Quero mostrar
outra opção para fazer alterações em seu aplicativo como
parte de nossa etapa refinada Observe esta barra de ferramentas do Gemini
Canvas. Vamos explorar o que
ele pode fazer por nós. Vamos começar com
esse ícone de brilho. Este é o injetor de recursos de IA. Ele adiciona recursos de EI
ao seu aplicativo. Quando você clica nele, o
Gemini analisa a visualização atual do aplicativo e
sugere componentes inteligentes, como uma
barra de armazenamento de IA ou geração de texto e imagem, e então injeta esses elementos
diretamente na lógica do seu aplicativo Vamos pedir à Gemini que adicione
recursos de IA e veja como isso funciona. No bate-papo à esquerda, o Gemini fornece uma visão geral de quais recursos de IA foram
adicionados ao aplicativo Podemos responder no chat
e pedir à Gemini que faça alterações
adicionais Mas primeiro, vamos
experimentar esses novos recursos. Aqui está o
recurso mágico número dois. Vemos que o Gemini I propôs mais
ingredientes de saúde em vez
do que acabei de selecionar, mas eu não o tenho no momento, então vou clicar em Cancelar e
continuar com esses três Aqui está o
cartão de sabedoria da EI, muito bom. E, claro, vamos
experimentar como o
narrador de áudio funciona Levante-se e brilhe.
A missão de hoje é o lado ensolarado das nuvens de espinafre
e abacate O espinafre rico em ferro combinado com as gorduras mono e
saturadas do abacate fornece um impulso de energia
limpa que mantém você
ágil e revigorado Vamos fazer uma alteração em
um dos recursos. Gemini confirma que a
mudança foi feita, então vamos testá-la Respire fundo e
vamos começar o dia. Sua receita de hoje é
o Emerald Cloud Nest. A combinação de
espinafre rico em ferro e
gorduras monoinsaturadas do abacate garante
uma liberação lenta de energia, mantendo você leve e arejado Wasson, acabamos de ver como Gemini seguiu
nossas instruções, e sugiro que retornemos à barra de ferramentas
do Gemini Canvas e a A próxima vez que consigo ouvir
é a alça de arrasto. Ele é usado para mover
o atolbr para
não bloquear a navegação do seu aplicativo durante E também há um terceiro
ícone, a ferramenta de refinamento, que diz ao Gemini modifique um
elemento específico do seu aplicativo Você pode notar que não
está visível aqui em nosso aplicativo Golden Hour. Na verdade, isso é intencional. Gemini reconhece que esse aplicativo passou por iterações
suficientes,
portanto, pequenas
edições automatizadas Se ele tentar ajustar um elemento, mas
interpretar mal o contexto, poderá quebrar
outra coisa que depende
dele Por isso, ele oculta o ícone como medida de
proteção
para demonstrar como a ferramenta de refinamento Vamos mudar para um aplicativo mais simples. Comecei a construir antes
de gravar este tutorial. Eu fiz apenas
algumas iterações lá, então o ícone está disponível Digamos que eu queira mudar
a cor desse botão. Então, estou escolhendo selecionar e perguntar, destacar esse botão
e digitar meu prompt, sugerir outra paleta de cores Percebo o que aconteceu aqui. Em vez de mudar
apenas esse botão, a
cor, o Gemini redesenhou todo
o aplicativo. Por que isso? Acontece que a
paleta de palavras é o problema aqui. Uma paleta de cores se refere a todo o conjunto de cores
usado em seu aplicativo Então, Gemini interpreta isso literalmente e atualiza
tudo para combinar Não está fazendo nada de errado. É só seguir suas
instruções com precisão. Para alterar somente a
cor desse botão, você precisa descrever claramente o escopo da alteração.
Deixe-me mostrar como. Estou selecionando o botão novamente e digitando outro prompt Você vê que minha solicitação detalhada funcionou e, desta vez, Gemini I aplicou as alterações
no elemento que indiquei
por meio da ferramenta de refinamento Isso é
algo muito útil de se ter em mente. Quanto mais específica for sua solicitação, mais preciso será o resultado. Vamos voltar ao
nosso aplicativo Golden Hour. Agora que abordamos como
refinar e ajustar seu aplicativo. Vamos falar sobre o que acontece
quando você está feliz com isso. Passo quatro, compartilhe. Depois de terminar, você pode obter um link compartilhável e
enviá-lo para qualquer pessoa Eles podem abrir e usar o
aplicativo diretamente no navegador. Sem downloads, sem sinais, sem configuração técnica. Eles podem até mesmo remixá-lo. Esse é um dos recursos que o
Google incorporou ao Canvas. Alguém pode pegar
seu aplicativo, abri-lo e criar sua própria
versão a partir dele. Tudo bem. E pronto
, neste tutorial, compartilhe em quais
aplicativos você está trabalhando na seção
de perguntas e respostas deste Eu adoraria ver
o que você está construindo.