Transcrições
1. Introdução à lição 2: Olá, obrigado por clicar neste
curso de gerenciamento de produtos A0. Meu nome é Kristin. Trabalho em
TI há quase dez anos e em ciência de dados e visão
computacional, quase cinco. Olá, sou a Lizzie e
bem-vinda ao curso. Também participei do desenvolvimento de produtos de
IA
nos últimos três anos trabalhei na automatização do processo de
verificação com aprendizado de
máquina e, especificamente,
com visão computacional. Neste curso,
aprofundaremos o desenvolvimento de
produtos de IA. Discutiremos as
diferenças entre uma mentalidade de desenvolvimento de software
e uma mentalidade de
desenvolvimento de produtos de IA. Além disso, veremos
por que os produtos de IA demoram tanto para manutenção e por que
se degradam com o tempo. Por último, examinaremos as três etapas que
você precisa
ter certeza e começar a pensar ao criar
seu primeiro projeto de IA. Obrigada
2. Mudança de mentalidade no desenvolvimento de IA: Na
lição anterior, falamos sobre o fato de que
existe a
capacidade do computador de realizar tarefas que geralmente são
feitas por pessoas. A maioria dos aplicativos de IA funciona
com tarefas realmente específicas. de desenvolvimento de IA e
desenvolvimento de software processos de desenvolvimento de IA e
desenvolvimento de software
são muito diferentes. discutiremos isso mais profundidade nesta
lição. Falamos sobre os requisitos dos
produtos de IA e do que eles dependem. E falamos sobre produtos de IA e que tipo de IA
hoje realmente inclui. tópico de hoje é em que tipo
de trabalho realmente viver. Em termos de dados. Às vezes é
bom vivermos em um mundo onde tudo
está destinado a existir, ou em um mundo onde criamos seu próprio futuro com
nossas próprias decisões. Entendemos que
existem tarefas que levam a um resultado específico e há
decisões que levam a uma surpresa ou a um resultado
inesperado. Esse mundo pode ser descrito como um mundo determinístico e
probabilístico. O termo
mundo determinístico significa que
sabemos o que acontecerá
se você fizer uma coisa, outra coisa
definitivamente acontecerá. Os problemas clássicos
de engenharia de software são exatamente assim. Determinístico. Se você clicar em um botão, ele fará algo para o qual
está programado. Quero dizer, claro,
a menos que haja um bug. Mas quando falamos sobre produtos de
IA ou
funcionalidade NEA, estamos nos inclinando mais
para o mundo não determinístico, também chamado de probabilístico. Isso significa que não podemos ter
certeza do que o modelo fará. É especialmente
importante
entender isso quando as mães são colocadas em uma situação desconhecida. Por exemplo, quando
os dados de entrada são ligeiramente diferentes
da norma normal. Na visão computacional, isso
significaria que a imagem inclui objetos ou ambientes quais o modelo não está acostumado. Então, vamos explicar
isso com mais detalhes. Se alguma atividade
acontecer, por exemplo, pressionar um botão ou inserir uma consulta ou receber
dados em um formulário. Sempre há algum tipo de função
concreta
relacionada a isso. Você clica em um botão, a
próxima página é aberta ou a consulta é inserida
e, em seguida, o resultado é
pesquisado no banco de dados. Ou terceiro exemplo, os dados são recebidos e
salvos automaticamente no banco de dados. Embora as coisas
sejam determinísticas. Mas então o clique
aconteceu. O clique é igual verdadeiro e, em seguida, algo
predefinido é feito. Mas e o mundo
probabilístico? Há um equilíbrio entre
estatísticas e suposições. Portanto, não temos certeza de que
algo vai acontecer, mas podemos prever isso com
base em padrões anteriores. Por exemplo, se você vir um som de latido de um jogador de
cães, ou na detecção de fraude, se parecer, ou campos que o
usuário X enviou estranhamente,
envie-o para uma inspeção
mais aprofundada. A principal diferença com mundo
determinístico
é que temos
100% de certeza de que algo
aconteceu ou acontecerá. Não é como pode haver, o que é um clique de um botão, vamos enviar os dados de qualquer maneira. Mas nossos algoritmos de IA, determinísticos ou probabilísticos,
podemos dizer que são,
são determinísticos
no sentido
que seguem o
algoritmo ou o modelo, mas probabilísticos no sentido de criar esse algoritmo. Então, quando estamos treinando um modelo, ele usa estatísticas para prever o resultado, o que significa
que é probabilístico. Mas quando esse
modelo de trem é então colocado em uso em um produto, ele prevê exatamente
pelas regras ou pelo, ou o algoritmo
é treinado para fazer. Também podemos dar
uma olhada rápida em dados determinísticos
e probabilísticos. probabilísticos são
dados
baseados em eventos comportamentais,
como visualizações de página, tempo gasto na página
são cliques. Esse tipo de dado pode ser
usado para modelos de predição. Por exemplo, ele pode ser
usado para agrupamento. Os usuários estão sugerindo
itens para seu cliente. Os dados determinísticos estão vinculados a algo que
identifica o usuário, como um endereço de e-mail
ou um ID de ideia de cookie ,
e provavelmente são 100% verdadeiros. Isso pode ser considerado um fato ou uma
característica de um usuário. Por exemplo, se um
usuário se inscrever alguma plataforma e informar
sua idade atual, é fato
que no
ano seguinte o cliente
será um ano mais velho. Mas, mas se o mesmo usuário usar a
plataforma dez vezes menos, não
podemos ter certeza se ele ou ela usará a mesma
plataforma no próximo ano, 1110 ou nove vezes. Embora possamos fazer isso, é
agrupar e analisar muitos usuários
com comportamento semelhante no ano passado e fazer uma suposição ou previsão de como ele
poderá atuar no próximo ano. Mas não temos certeza disso. Então, quando falamos
sobre mentalidade, ao criar nossos produtos, precisamos entender que o mundo real
não é determinístico. mundo real não é
preto e branco. É, podemos dizer, Cinquenta Tons de Cinza. Então, partimos em um
mundo probabilístico e temos que fazer todas essas
previsões com base nisso, IA está resolvendo desafios
probabilísticos. Quando é um ótimo dia ou produtos, precisamos entender o
mundo probabilístico e estruturá-lo em dados que descrevam o mundo ao nosso redor de uma
forma que faça sentido para a IA. Na última lição, discutimos
a diferença de processos entre engenharia de software
e desenvolvimento de produtos. Mas como esse mundo
probabilístico
influencia o desenvolvimento com mais detalhes? Portanto, para produtos de
engenharia de software, há uma grande probabilidade
de conhecer o resultado. O tempo de desenvolvimento pode ser
estimado muito bem. As pessoas usam
processos Scrum e outras coisas para estimar melhor. O objetivo pode ser descrito
por maquetes, análise de especificações. Existem as
melhores práticas estabelecidas do processo de engenharia. E os problemas do produto
realmente não mudam com tanta frequência. E quando o recurso está pronto
, na maioria das vezes, ele provavelmente permanece assim por muito tempo. Mas quando estamos falando
sobre produtos de IA, não
podemos realmente ter certeza
de nada. Havia uma esperança de um resultado. Você quer que o modelo
faça alguma coisa, mas não tem certeza se
ele realmente fará isso. Você não pode realmente estimar, mas pode cronometrar as tarefas. Portanto, é mais ou menos desconhecido quanto tempo será
necessário para reinventar a bicicleta. Então, há muitas
suposições acontecendo. O objetivo do
modelo é descrito por meio de exemplos de dados
e métricas. Ainda não existem
melhores práticas estabelecidas para gerenciar o processo
diário de desenvolvimento de IA. Então, podemos dizer que é
um pouco bagunçado. E o ambiente em que
os dados, os modelos ou os recursos de IA
usam a mudança com
muita frequência. O
modelo é incrível. Custa atualizações constantes. Teríamos que
mantê-los por muito tempo.
3. Manutenção consistente - por quê? (novo): E a manutenção do sistema e
por que ela é realmente necessária para produtos de
IA dependem, na verdade, de onde o
produto é aplicado. Quais são os ambientes
aos quais ele é aplicado. Porque se você aplicar o modelo um local diferente para o qual
ele não foi treinado, haverá uma mudança ambiental e você precisará fazer
atualizações para ele. Além disso, quando o ambiente
ao nosso redor muda
, os dados e
os padrões também mudam. Se a vida mudar,
então, basicamente,
precisamos mudar o modelo, o produto com ele. Vamos dar um exemplo de corona. Quando a Corona começou, as pessoas
começaram a usar máscaras faciais. Se você tivesse um modelo de detecção facial que tentasse detectar rostos. Agora, o ambiente
muda, mudou. Se você teve muitas pessoas
com máscaras faciais antes, você terá
basicamente qualquer pessoa com máscaras
faciais. Novos clientes. Se você estiver em um local onde você aplica seu modelo a diferentes clientes, ambientes
diferentes. Por exemplo, primeiro você
tem um cliente em nós, depois você tem um cliente na Europa. existem diferentes
padrões de comportamento humano no meio ambiente e
a aparência de como
tudo funciona. Portanto, há uma mudança
de dados com isso. Além disso, estamos fazendo
manutenção constante porque aprendizado
de máquina está se
movendo muito rápido. Está crescendo ano a ano. E algumas outras
coisas que você pode não estar, então não puderam ser vendidas no ano passado. Você pode resolver este
ano e, portanto, você só precisa voltar
para aplicar novos métodos. Quando você cria um produto
de software, o ambiente em que você
resolve o problema
geralmente é muito
mais estável do que para produtos de IA. Pelo menos isso não aparece tão facilmente quando você
cria um site, você geralmente, por exemplo, entende quem
são os principais clientes? É para idosos, é para crianças? Você provavelmente fará algumas mudanças
dependendo de quem esse produto destina a enganar os desenvolvimentos de
produtos de IA. Sim, você também está pensando
que isso se aplica, mas há muitos outros fatores
diferentes que
influenciam o desempenho
desses modelos. Os desenvolvimentos de ar estão
otimizando especificamente apenas um
conjunto de problemas
realmente pequenos se os problemas e as mudanças no desempenho também
mudarem. Vamos dar um exemplo. Então, algoritmo
de detecção de animais florestais, o objetivo é detectar animais e classificar
qual animal é. Então, aqui você pode ver o
exemplo. É rápido. Dizemos que é coelho. Se tem a ver com a
escada e dizer o que é. Agora, estamos no norte da Europa. É aqui que estamos
construindo nossos animais, mas há 20
animais aqui no total. Então, o que vamos
focar primeiro ao tentar criar um bom modelo de
aprendizado de máquina é pegar o maior
grupo que pudermos fazer. O maior grupo hoje em dia é que eles são tão grossos que
estão corretos. Podemos detectar sete
animais após 20. próximo depois disso nasce. Portanto, temos quatro pranchas e,
se as
detectarmos corretamente, já podemos
viciar em mais animais. Depois disso, há raposas. Então podemos pegar três
pessoas é incrível. Então, isso é meio que a
distribuição do meio ambiente. Com esse ambiente
e com esse modelo, pegamos 70% dos animais. Então, com a detecção de
carne de veado, as caixas de seleção, com o ditado por enquanto, temos a mudança de que
alguém decidiu que
deveríamos colocar o mesmo modelo e
usá-lo na floresta tropical. Então, o que faremos é que
haja um novo ambiente. Temos exatamente o mesmo modelo. Então, tudo é o mesmo. Mas para que o
otimizamos é diferente. Então, primeiro vamos ver, querida, oh, só há um lá. Então, pegamos apenas um animal. Que outra coisa
aprendemos a usar no baralho? Então eles eram o conselho, então temos três pranchas. Eles tomam a dose também
porque são poros. Em seguida, detectamos raposas, pelo
menos foi
o modelo que aprendi. Não foram detectadas caixas. Então, perdemos completamente essa
aula. Então, aqui você pode ver a
mudança de ambiente. Muito claramente. Mudamos onde estamos usando o ER e o pronto-socorro
não entende. Então, na floresta tropical, o algoritmo captura 20%
dos animais em geral. Portanto, não podemos afirmar que
o algoritmo é ruim. É mais do que onde o estamos aplicando e o
que deveria ser. Essa é uma
mudança realmente drástica na vida real. Muitas vezes não
temos mudanças tão drásticas. Mas há mudanças de até
10% e mudanças ainda menores, mas elas trazem à tona o problema
de justiça e preconceito. Então, somos todos a favor do aprendizado
de máquina.
4. Desenvolvimento de produtos AI: Vamos entrar na parte de
desenvolvimento de produtos. Então, o primeiro são os três pilares a serem pensados antes de começar a
trabalhar em nossas previsões. Então, realmente tenho
que pensar nisso, porque senão você não conseguirá
resolver o problema
ou criar o produto. Então, primeiro, qual problema
você está tentando resolver? Quais são as coisas
que você está tentando resolver? Quais são as coisas que
estamos consertando aqui que
estão melhorando? Em segundo lugar, com quais métricas
você se importa? Realmente, quais são as
coisas que lhe interessam? E entraremos em mais detalhes. Você verá os exemplos. E em terceiro lugar, onde
você obtém os dados? No curso anterior, examinamos os animais. Você viu que os dados são realmente
importantes e você deve
ter em mente
onde os obtemos? Porque os dados obtidos realmente
determinam o
desempenho de você nas métricas
que lhe interessam. Existem dois tipos de
problemas ou superação. Basicamente, tudo se resume
ao aprendizado de máquina. Um está automatizando o processo, outro está estimando
um resultado. Ao automatizar o processo, queremos dizer basicamente
automatizar o trabalho humano, o trabalho
na fábrica, os clientes relatam o trabalho. Realmente hoje, um trabalho que
é realmente repetitivo. Somos bons em
IA restrita hoje no mundo, não com ARE geral. Assim, podemos automatizar pequenas tarefas. Estimar um resultado
também é algo que é feito. É, por exemplo,
quando você quer
estimar o que as pessoas
gostam, como marketing. Ou você quer estimar
quanto tempo leva para ir de um lugar para
outro e amanhã, porque amanhã é segunda-feira. Então, algo assim. Estimativa e automação,
o objetivo delas é diferente, mas os métodos por trás são os mesmos. Automação.
A automação é, como eu disse, como exemplo,
uma fábrica que orienta tarefas
repetitivas. Como entender qual
tarefa cumprir. Também pode haver tarefas
muito difíceis que são feitas em fatores
ou derivadas. Alguns deles poderiam ser, ensinar uma criança a ler. São tarefas repetitivas. Os professores estão fazendo
isso o tempo todo, mas são tarefas difíceis. Mas o que o aprendizado de máquina
pode fazer no pronto-socorro é mais tarefas pequenas, tarefas de
1 segundo. Então comece a pensar no seu
problema como tarefas de 1 segundo. Quais são as coisas que você
pode fazer em 1 segundo? E essa é uma tarefa. Esse é um problema a ser resolvido. Se você tiver um problema maior, você pode dividi-lo em
diferentes tarefas de 1 segundo. Por exemplo, se você quiser ir a
um robô que encontra
lixo e o joga fora
, primeiro é dar uma olhada. Em segundo lugar, detecte o lixo. Em terceiro lugar, chegue perto do lixo. Quatro. Pegue-o, vá em frente
e depois jogue fora. Então você pode ver que são tarefas
muito pequenas. Você não pode ter uma tarefa de
limpar a sala. Porém, mais fácil de executar, maior
a probabilidade de
isso ser feito. Então, todos nós entendemos isso. E também aqueles que controlam são uma espécie de orientação para
entender quais são as coisas que podem ser feitas
ou como devem ser divididas? Se a tarefa for basicamente muito
pequena, se for muito fácil, é muito fácil resolvê-la se houver muitos detalhes da tarefa e muitas coisas a ter em
mente para desempenhar funções. Há muito mais dificuldade. Então, coisas
muito, muito simples que
podemos fazer hoje em dia. E seu objetivo como
gerente de produto deve ser pensar tarefas para que elas
não sejam o atlas T2. Isso significa que é mais fácil
para você resolvê-lo. Estimativas, tarefa de estimativa
é como as pessoas são,
gostariam de estimar isso, hum, e isso é basicamente que hoje é usado principalmente para fins de marketing. E basicamente do lado do
consumidor, do consumidor. Em segundo lugar, com que tipo de
métricas você se importa? A grande coisa
aqui é esquecer estar sempre 100% correto. Você nunca pode estar 100% correto. As pessoas nunca podem
ser 100% corretas. Nem a IA. Hoje é, como eu disse, uma vez, para resolver coisas muito
pequenas. Então, a maior pergunta
a ser respondida é quais erros você está
disposto a cometer água e fazer coisas que não há
problema em errar? Vejamos alguns exemplos. Por exemplo, condição rara em uma loja. Então, estamos em um show. É basicamente a estimativa
que você tentou entender. Pessoas assim. Ou o que você pode fazer é mostrar
os comprimentos dos clientes. Isso é muito bom.
Não mostre brilho. O cliente não mente. O que significa que você não mostra
coisas que eles não gostam. São coisas muito
boas de se fazer. Uma das coisas que você pode fazer que
seu programa brilha e
os clientes não gostam. Isso significa que você mostra aos clientes coisas que,
para eles, são lixo. Eles veem algo com
que não se importam. Ou também o que você
pode fazer por engano é não mostrar roupas
que o cliente goste. Isso significa que você não mostra as coisas
que eles realmente gostam. E você, como profissional de marketing,
perderá receita porque não vende apertos
que o cliente compraria. Além disso, outro exemplo é bom. Então, boas tarifas, você sabe, são uma recomendação para livros. Então, aqui estão as recomendações feitas e algumas
das coisas,
talvez, como coisas de Salton. Não. Em quarto lugar, o recomendado é que uma pessoa que gosta de
livros não mente e, com força, não recomenda que
uma pessoa que goste de livros. Então, esses são os dois erros
que você pode cometer hoje. Então, se você
não mostra livros, as pessoas gostam, ou você basicamente mostra
coisas que elas não restringem. Olhando para esse sistema hoje. Provavelmente, se você
obtivesse muitos livros que são
recomendados para você, mas não gosta deles
, não
usará mais esse serviço porque percebe que a
recomendação é inútil. Além disso, bom.
O que é mais bom? Não está recomendando uma
explosão nos livros. As pessoas gostam de recomendar a
maioria delas. Então, aqui você pode ver por que
o primeiro não está bem. Mas a segunda é porque quando a primeira coisa
acontecia o tempo todo
, o cliente
não usava o serviço. Mas se o segundo acontecer, provavelmente as pessoas da Pip ainda
estarão na fila para o serviço. Eles simplesmente não.
Receberemos todos os livros que seriam recomendados
ou bons para eles. Outro exemplo nos aviões. Os aviões têm muita manutenção. Eles precisam de muitos
reparos e
precisam seguir muitos
requisitos para voar. Além disso, terroristas, basicamente
cálculos semelhantes por trás disso. Declare falsamente que uma peça
do avião não está bem. Ou afirme falsamente que
a peça está bem. Então, se formos os
primeiros e dissermos falsamente que um
equipamento não está bem. Nós apenas usamos mais tempo
para consertar o avião. Usamos mais dinheiro para
consertar o avião. Mas nada de ruim acontece. Se quatro quintos afirmarem
que uma peça está bem. Isso significa que afirmamos falsamente que essa peça é seu
k e deixamos o avião voar, teremos um avião com defeito. Então, hoje, nesse caso, isso não é uma coisa boa. Algo ruim pode acontecer com um avião quando o deixamos voar. Portanto, você pode ver
antes que todas essas coisas
dependem do caso de uso. Vamos ver que
tipo de dados você tem. Esses dados de
renovação foram restaurados de forma rígida. Primeiro, você sempre
precisa ter algumas coisas, mas isso é uma coisa clara. É muito, muito, muito difícil começar de um tópico
completo. Mas que tipo de dados você
precisa também deve ser questionado. E isso agora
depende do problema que você escreveu. Você precisa de dados
o mais próximo
possível dos dados
que você tem na vida real. melhor seria que você
tivesse dados de realmente, realmente ao vivo, onde
você os usaria. Voltando ao
exemplo da floresta com animais, se você usar o
detector de animais na floresta tropical, é melhor ter a floresta tropical da
sala de dados, não de algum outro
tipo de floresta. Então, na verdade, dados exatamente de onde você usará
e do produto. Vamos dar um exemplo
de detector de carro. Você quer que a IA saiba o que
é um carro e o que não é. Então, a pergunta
que aprendemos é o que é, é um carro? Então, o lado esquerdo, é o lado direito. Não é, é uma rodada do Googler. Em busca de carros, você verá muitos carros
diferentes ao redor. O que você pode ver aqui é a
primeira cor diferente. Alguns estão em fundo branco,
alguns estão dirigindo, alguns estão em fundo
acinzentado Lakish. Isso é totalmente
lateral. Isso está mais no topo e
não completamente no topo. Isso é da frente. Então, se você fizer um detector de carro, que lado você
quer ver o carro? E está no fundo branco ou preto
ou nos elementos? Ou é na vida real, perto da praia
ou na rua? Você precisa
detectar carros aqui? Essas fotos são
realmente diferentes, as que tínhamos
no slide anterior. Ou você quer ver
e detectar carros de cima? Não tínhamos as fotos de qualquer
custo acima e a imagem acima
é completamente diferente. Então, você realmente precisa pensar de qual ângulo você também
deseja detectá-los. Porque se você treinar um modelo para detectar os carros de lado,
mas, na realidade, a câmera de
onde você no futuro com carros
detectores está
olhando de cima, o modelo não funcionará,
AN falhará. aqui. Portanto, os dados devem ser tão semelhantes
ao caso de uso que você tem na vida real de vista geográfico dos
raios. Então nos sentamos em um quarto escuro, sala
iluminada, em termos de tempo. Tenho carros de 50 anos. Carros agora, ruas há 50 anos ou hoje. Talvez. As coisas não mudam
muito ultimamente e você não tem tantas fotos
dos anos cinquenta. Mas, basicamente, vez em quando há
coisas novas acontecendo. Portanto, o tempo é muito
importante para obter os dados, os
pontos de vista e os ângulos mais recentes. Portanto,
certifique-se de olhar para
os objetos da
mesma forma que você no futuro. Um para ter o caso de uso.
5. Conclusão: Para mim, como afirmado acima, o
desempenho do produto
de IA depende muito
dos dados disponíveis que você tem. Porque os dados que chegam são basicamente o desempenho
que sai. Então, o que você está
coletando é obtido também dos dados do
cliente ou de você real, onde você está usando os dados. Isso é basicamente
determinado quanto ao desempenho
desse modelo, pois isso depende de onde
ele é aplicado. Então, onde está o verdadeiro caso de uso? E é extremamente importante
que os dados que você tem no uso diminuam
os dados e os dados
disponíveis que você tem durante o treinamento ou da forma mais
semelhante possível. Concluindo, para o curso de
hoje, verbos de
desenvolvimento junto
com desenvolvimento de software, não
há nada
que separa esses 28. O desenvolvimento é mais arriscado, conhecido, desconhecido,
muito desconhecido do que então, para o desenvolvimento
, porque é pesquisa e desenvolvimento. E também há
muitas dependências de como você vai
usar esse modelo. O desenvolvimento é dependente. Dados sobre crianças. Eles poderiam dizer isso
ou doloridos, prontos. Os dados, o que você está
usando para treinamento, como devem ser realmente semelhantes a onde você os
usará no futuro. Assim como os dados determinam também
como você atuará. Eu prefiro
formulários é uma grande ligação com
o meio ambiente. Então, dados e ambiente. Eles mereceram Kiki, obrigado. Obrigado por ouvir hoje. vejo na próxima vez.