Transcrições
1. MLFirstLecture: OIR é aprendizado de máquina. É algum tipo de programa de computador onde escrevemos todos os cenários possíveis? Ajustar todas as variáveis incluídas são que é apenas um monte de dados. Nosso que apresentava extravagante Visualize não é O que é isso? É apenas um monte de funções matemáticas? Jogando junto com os dados junto com o programa de computador são É apenas um robô. O que é isso? É apenas um milagre que aconteceu com as máquinas? O que exatamente é aprendizado de máquina? Para entender este realista um passo para trás a menos que entender o que é o programa clássico? Então, o que é programação clássica? Programação clássica em Watts algoritmo sobre as variáveis e usando esses algoritmos e as variáveis v direita programas clássicos em que V incluem são uma espécie de
cenários possíveis . Estes algoritmos podem ser mantidos em qualquer linguagem de programação. Pode ser C, C mais Beytin. E quando incluímos todos os cenários possíveis através das variáveis, essa é a nossa programação clássica. Agora adicione dados a esta mistura. Agora estamos escrevendo um programa de computador, incluindo variáveis, mas desta vez temos dados. Então isso significa que podemos entender o comportamento fora dos dados em. Podemos fazer algo com nossa programação e dados. Agora não estamos escrevendo algoritmos sobre as variáveis cujo valor não sabemos. Nós já temos alguns dados, e estamos escrevendo programas de computador baseados nesses dados,
e isso é chamado de mineração de dados. Então estamos extraindo os dados existentes para tentar entender seu comportamento. E se combinarmos seus dados com todas as suas características? Tudo é recursos, e então nós tentamos entender os padrões por trás do comportamento por trás dos dados. O que mais pode ser derivado desses dados? Todo o discernimento, inteligência, todo tipo de comportamento. O que mais pode ser previsto com base no estado? Nosso trabalho de ciência de dados dos anos 30? Hesite atribui sobre o que é Masilela Ning. Aprendizagem de máquina é basicamente combinação fora de todo este aprendizado de máquina em paredes de dados programas de
computador sobre os recursos após os dados. Então, bem-vindo ao mundo da Masilela Knee. Vai ser divertido aprender a explorá-lo juntos.
2. Termos de ML: Olá lá Antes de começar e dar um mergulho mais profundo no aprendizado de máquina mais recente
Entenda alguns dos termos em algumas das palavras-chave usadas no mundo do aprendizado de máquina. Estes outros termos que também usarei durante as palestras é melhor. Agora,
Andi, Andi, tenha o mesmo entendimento quando usei aqueles tocos. E esses doadores consideram que isso é um dado que você pegou para sua Masilela. Alguma análise nestes dados? Todos os valores aqui são chamados de observações. Quando vemos observações estavam falando sobre os valores valores de dados na próxima parte hitter aqui. Quando você diz quarto banheiro Dane, abordar a identidade fora desenvolve. Esses são chamados rótulos porque este é apenas um dado tabular. Você tem um rótulo. Se este foi algum outro tipo depois de difícil, por exemplo, se esta é uma imagem de foto, você não terá rótulos que você terá observações sobre. Você tem que entender, com base nas observações, o que exatamente ela representa. Não há rótulos nesses casos. Ok, o último, os rótulos vitória apresentam variáveis independentes. Por exemplo. Neste caso, se eu disser a você analisar esses dados e prever o preço do apartamento com essas características quantos quartos ele tem, quantos banheiros já foi. E acrescentou longitude e latitude. Mas basicamente a localização, então todos esses rótulos, todos esses valores se tornam variáveis independentes, também chamadas como preditores e recursos sobre o preço se tornam variáveis alvo também chamadas previsões. Portanto, estes são termos muito importantes quando se trata de aprendizagem supervisionada na
aterrissagem Super White , haverá rótulos. Haverá variáveis independentes e elas serão alvo. Muito pilares. Essas variáveis são agrupadas em dois tipos diferentes. Se é algo como endereço, que tem valores fixos como dentro de uma cidade, há endereços fixos em que não são números, que são isso correto nós, certo? Eles são chamados de variáveis categóricas. Eles seguem certas categorias em. Se é um número contínuo como quarto, banheiro, pode
haver qualquer número de veteranos. Pode haver qualquer número de casas de banho. Qualquer atualização de número no apartamento não é um número fixo. Essas são chamadas variáveis numéricas. Por enquanto, é isso. Estes são termos importantes. Você deve se lembrar sobre quando usamos esses termos mais abaixo as palestras, você deve ser capaz de relacioná-lo. Está bem, Incrível. Vemo-nos na próxima. Mais tarde
3. Diferentes de aprendizagem de máquina: Olá, chegará a esta palestra neste reitor. Vou levar-te através de diferentes tipos de algoritmo de aprendizagem muscular. Então vamos começar em um nível muito alto. Os algoritmos de aprendizagem Maciel podem ser segregados, são agrupados em três categorias separadas. O 1º 1 é supervisionado, depois não supervisionado e, em seguida, três aplicação. Então vamos entender. O que são esses algoritmo supervisionado é seguido. Os dados de vídeo podem caber em um mulá distante. Se você colocar esses dados em sua fórmula, você pode prever os próximos dados set off próximos oito off atos que é supervisionado sem supervisão dele quando você não pode ter qualquer fórmula em seus dados, sua data eu não rotulado. Você não pode ter nenhuma fórmula. Por exemplo, dados pai imediata
considerados não tem qualquer rótulo anexado a ele e isso não é supervisionado assim em um nível muito alto. Essa diferença entre supervisionado e não supervisionado, eu diria, é uma. Ele pode ser formulado que não pode ser formulado em outros se seus dados têm o rótulo . Então isso é um básico diferente. Reforço é basicamente tentativa e erro fez. A lógica é derivada com base em tentativa e erro, então você continua fazendo algumas coisas com os dados e com base no resultado, você decide que o próximo acesso supervisionado pode ser classificado ainda mais em classificações e
técnicas de reboque e regressão técnica. Técnicas de regressão são onde você prevê o próximo valor real. Pode ser qualquer coisa, pode ser lucro e perda. Está a prever que pode ser a sua taxa de acidentes. Você pode prever carro quilometragem, qualquer coisa onde você preveja uma morte valor real era que o crescente vem em imagem. Você vai aprender sobre rebatizado linear em diferentes fazendas, pedidos
lineares e simples,
linear, linear, imprudente e múltipla genética. Ouça um polinômio. Rebatizado muito brando fora do curso. Você vai saber muito mais sobre isso quando você vai aprender essas técnicas e você vai ter mãos em projetos durante este curso. Da mesma forma em classificações. E você tem logística, disses
rebatizado, entrada de apoio vetor máquina de lixo noturno que vizinho mais próximo e floresta aleatória. As classificações são basicamente o que você prevê é sim, não
são nenhum tipo de coisa Binária. Ou você está prevendo sim ou não, mas você tem um conjunto de valores e você está prevendo qual desses valores vai acontecer. Assim, as classificações e é como classificar seus dados em seu resultado em certos bolsos , a máquina Vector suporte, vizinho mais próximo
homossexual e floresta aleatória. Eles podem ser usados para classificações como villas. Rebatizar. Vamos para não supervisionado sem supervisão. Não tem dados de rótulo,
portanto, você pode agrupá-los em clusters diferentes. E há algoritmos de agrupamento como um meio de que você pode seguir um tipo prio de algoritmos, associados e algoritmos. Reforço, como eu disse, é um tipo de tentativa e erro. Lógica são as execuções do algoritmo com base no resultado do sotaque anterior. Então também é chamado Marco Decision Process. Esse é um dos algoritmos que você pode usar. Então está tudo ligado. Vamos dar um mergulho mais profundo em cada um desses algoritmos em futuras palestras. Incrível. Vemo-nos no próximo Lecter.
4. Jupyterinstallation: Como você vai usar Júpiter? Caderno neste tribunal? Jupiter Notebook é notebook baseado em navegador com muito off bons recursos, que você vai explorar durante o curso neste reitor, você está indo para instalar. Faça o download em um caderno de Júpiter começar. Vamos começar antes que você comece a baixar para Peter. Você precisa do dedo do pé. Confirme se você tem um sistema operacional de 64 bits. São 32 sistema operacional bit no Windows Plate de Isto é como você pode confirmar em ou aqui eu tenho 64 bit Simple Way é Goto Google e procurar por download Anaconda em Ele vai levá-lo para www dot anaconda dot com. Faz com que você clique no sistema operacional Windows, Minha querida em, mesmo que eu tenha 64 sistema operacional bit, o bit mais seguro é instalar 32 bit 32 bit funcionará no sistema operacional 32 bits também. Um sistema operacional de 64 bits. Às vezes, mesmo com o sistema operacional 64 bits, você pode ter problema se você instalou 64 Wheat Anaconda. Então é por isso que eu estou com 32 bits que eles estão de acordo. Certifique-se de que você sabe muito claramente, começando e clique em uma estrela Vai demorar alguns segundos. Talvez um minuto ou dois. Depende do seu computador. O cuspe aqui está instalado. E agora vá para programas e você verá bem ali. Anaconda. Quando a anaconda abrir, você verá suas operações de caderno Júpiter, e eles são apenas clicar no almoço. Incrível. Então este é você, caderno do
Peter. Está processando todos os combates contra outros diretores. Eu tenho. Mas eu fiz. Se você está começando de novo, uh, isso vai parecer em branco para você. Você não vai ver nenhum dia. Só ali. Outra maneira. dedo do pé aberto para Peter caderno é que você pode ir para os nossos programas. Anaconda em frente. Bem ali. Você encontra os policiais do caderno de Júpiter e clique nele abriria o mesmo notável. Então, desta forma, você não precisa abrir um acordeão. Vá para Júpiter. Você pode abrir diretamente. Derrotado. Parece muito bom. Você está tudo pronto. Você tem seu caderno de Júpiter baixado, e está funcionando. Vejo-te na próxima carta
5. Numpy único: Olá lá vai chegar a este mais rico neste diretor, Eu vou levá-lo através de dormente. Número a ser é uma biblioteca de combate sobre isso é difícil fora de qualquer ciência de dados? O Massie Learning é um projeto? Se você inspirar a se tornar dados, os cientistas são profissionais de aprendizado de máquina. Você não pode ignorar Lumpy. Então vamos falar. Vamos chamá-lo de demonstração MP e é uma biblioteca Pitre para importar numpty e é C s vazio. Então isso vai importar essa biblioteca em seu caderno e você pode usar t importtered em funções off numpty em seu programa antes de eu começar. Há poucas coisas que eu quero que você entenda para que você e eu estejamos na mesma plataforma tia ter o mesmo entendimento desses sistemas. Então, primeiro, um, é Deus, é assassino. É assassino significa que se você tem valores como um dedo como valores individuais, eles são chamados de matar,
certo ? E há outro termo chamado Victor. Então Victor é muito solteira Esnal, Ari assim. Então, se é um único centavo é Ellery com valores, ele também é chamado Victor. E então meus truques são multidimensionais. Isso significa que tem mais de um centavo instantâneo como tem linhas e colunas, certo? Como este. Um dedo do pé, depois 34 bronzeado, 56 Então este é um exemplo da Matics. Ok? Eu poderia usar a distância. Como Victor é um métrico ou multi diamondstein. Hillary é intercambiável. Maior. Então vamos começar agora. A primeira coisa que vamos fazer é levar-vos através de algumas funções de saída. Certo? Ok. Então numb P não é apenas sobre Ari e métricas, você pode executar funções numpty apenas para retornar um único valor. Por exemplo, eu posso apenas pintar um número aleatório. Como se eu disser MP dardo dardo aleatório e eu m t e comida, por exemplo 17 aqui ele vai me devolver qualquer interior? Menos de 17. Muito bom. Então aqui está devolvendo 16. Agora. Se eu rodar de novo, vai 10 3 reboque. Vai sentir 15. Assim, assim ele vai continuar me devolvendo um indígena diferente, mas tudo em tedioso, menos de 17 em Como o que fez isso Outra função chamada aleatória. Não no final, Deon. E isso me dará números aleatórios. Como se eu continuar executando isso, ele vai continuar me dando números aleatórios. Como agora ele está dando menos 1.2163 aqui. Portanto, existem tais funções disponíveis em é modelo assassino. Também como A e P pode ser usado para retornar um único. Bem, agora é hora do nosso “e ver”. Ah, demônios. Não. Pronto. Também chamado Victor sobre isso é onde o uso real fora número ele começa em ciência de dados e mundo
de aprendizado de máquina. Antes de qualquer atraso, vamos em frente e criar a nossa primeira dimensão única. Vou chamar DNP Victors para criá-la. Ari, você só tem que dizer, n p dot r a e fornecer sua lista aqui. Então eu vou para o Presidente Oneto três por cinco, seis e sete. É isso. Minha matriz é realmente, realmente eu posso apenas imprimir esta área aqui como DNP Victor. O que? E eu fiz. Minha área é realmente É tão simples de criar um que se eu já tenho uma lista em fightin, Você pode ter um mínimo certo e menos off valores. Certo? 10 11 12 13 14 15. Esta é a minha lista, não é o Ari, pois não? E o estoque? Duas coisas diferentes. Mas eu quero criar uma maneira com esta lista que somos fáceis menos é a palavra-chave. Então vamos pelo menos um ok Agora, eu posso facilmente criar a matriz com esta lista. Eu posso dizer e p dot i d em registro. Basta colocar esta lista usada para uma. É isso. Tenho a minha área e posso nomear esta área. O que? Eu o que eu quero eu posso ver DNP Victor também. Se esse cara e, em seguida, imprimir D e B vitoriosos para e esta é Mary. E não só isso, posso fazer o contrário. Além disso, eu posso converter este array para lista no caminho para fazer isso é apenas colocar isso aqui e, em seguida, chamar a luta e função chamada para listar e é isso. A área foi convertida na lista. Agora esta é uma lista para que você possa trocar entre o nosso A e o Leste muito facilmente sem muitos problemas. Próxima função, eu estou indo para o pé. Então você está acontecendo. E se eu quiser upend mais um valor para o meu vencedor são minha única vez é Ellery DNP Victor um muito fácil. Basta dizer ni GNP tart upend. Andi, basta colocar o seu Você está aqui? Coloque o valor que você deseja aumentar. Por exemplo, se eu quiser ter sido 100 não há problema. Eu tenho 100. Eu fiz com meu DNP Victor corrida. Se eu atribui isto ao meu DNP Victor, então imprima o meu DNP melhor. I circuito que 100 dias aviso caça este 100 tribunal anexado no final do que se eu quiser adicionar este 100 a este ritmo FIC produzindo dentro da área em pelo caminho, quando eu chamá-lo produzindo é chamado Índice e o número do índice que ele começa com Zero. O índice partidário para um é zero. Então este é um índice partidário para o índice 20 é e três na experiência e quatro em diferentes. Você pode indexar cinco woodies e seis e em usos desesperados. Você faria desde as sete. Então é assim que a indexação vai. Vamos ver se eu quero inserir dedo do pé então eu vou ver e ser inserir dardo e, em seguida, meu mel e, em seguida eu quero inserir no producen Ouça, árvore sobre. Quero inserir o valor 10. Então diz-me que vamos mesmo. Isto é zero. Este é um isto é para este é três. Então o 10 deve ser adicionado após o número três aqui. Muito bom. Sim. Então, em seguida, é adicionado em Indyk número três, que está aqui em. Se eu quiser mudar minha área, eu posso apenas atribuir esta nova inserção e, em seguida, se eu quiser imprimir, por que DNP vencedor um? Eu vou pegar 10 agora mesmo. Até agora,
tudo bem. Eu não acho que você deve ter qualquer problema em seguir até agora. Parece fácil, certo? Muito bom. Olhe para esses valores. Eles não começaram. Queria cuidar. E por cinco E se eu quiser resolver isso muito fácil de dizer em P Dar Saad e passou o A D e B D e P Victor um dia Lefty aqui. Curso Arctic Latest atribuiu o vencedor ao nosso vencedor. Certo, e agora vamos trazer esse cara. Está devidamente ordenado. E se eu quiser apagar um deste? Sem problema. Você pode fazer isso. Basta dizer mp dot Dealpe D e B, Victor um. E se eu quiser excluir o valor no índice um acabou de passar esse índice. Então, qual será que você acha que vai ser excluído? Este é o índice de corpos e zero. Isto não é explosões e uma também deve ser apagada, certo? Vamos fazer isso. Digamos que D e B Victor um é igual e então brilhante DNP Victor correr. Aqui vamos nós, para Deus dilatado. Há mais um funks muito interessantes e concatenação de carros. Então, por exemplo, eu tenho outro vencedor DNP Victor três. Quando há 11 há 200 ou três. Eu quero isso, Victor, Toby adicionado com o DNP Victor um e criar um novo ator estão juntos. Então eu digo que o MP Victor quatro equivale np arma dardo que o d net e B melhor um em DNP. Então aqui novamente, protetor um na DNP Victor T. E junto com isso, também
temos que significar e o acesso de acesso é igual a zero. E eu vou explicar esse acesso para você quando falamos sobre os multi diamantes. Não, esse seria o momento certo para falar sobre isso por enquanto. Basta colocar o excesso chamado 20. Então vamos imprimir D e B Victor quatro. Aqui você vai o e diretor para é comunistas e oferecer DNP Victor três e DNP Victor um. Certo. Então é assim que eles não podem entrar em seu, hum, trabalho de
função. Este é um pequeno vencedor. Isso é muito pequeno no início de projetos da vida real. Você vai ficar longe com milhares off registros em se você quiser encontrar índice fora de um determinado valor em que milhares off registro seu comum para isso e que é a função impedir aqui fora. Então você vai ver em p dot que estamos em. Em seguida, você verá o seu nome vencedor D e B Victor quatro,
e, em seguida, colocar o valor que você está definindo para. Por exemplo, eu estou definindo para 101 Isso vai me retornar o índice off 101 ano atrás. Ele está dizendo que está no índice que SolarCity 012345678101 existem no índice ainda e o tipo de dados fora esse valor é I nt bons informadores e direito até agora criamos o nosso a nossa auto onda. Estávamos brincando com isso, mas há outras maneiras de criar um e isso vai ser muito útil para EUA Basicamente, quando você cria uma idéia visual desde então vamos ver, é um DNB on recebe um e B dardo um alcance Andi, em seguida, onde ele tinha apenas dizer um para o dedo 10 e dois. O que vai acontecer? Ele criará automaticamente o Ari. Vamos ver um “D “e “B “. O quê? Aqui está. Então ele criou você é um fora valores interiores entre um e 10 com o intervalo fora para que significa que realmente começar com um e, em seguida, ele vai passar por também. Então 13579 e o último valor nunca é incluído. Assim, todos os valores começarão com o primeiro valor no intervalo e serão menores do que o último valor no aluguel. No espaço entre esses valores será o número que você tem orgulho como começar em três seria dedo do pé Aaron impressionante. Estes ar útil. E se eu quiser criar uma matriz de todos os zeros? Então vamos dizer D e B. Tzeitel, é realmente apenas cmp dot zeros. E quantos você quer se eu quiser 10 por isso vai criar um dia com 10 zeros. O NPC Aqui vai você. Ele criou matriz com todos os zeros. Ele criou um rebite 10 valores e todos eles são zero. Lá azedado vai da mesma forma. Posso criar com todos aqui. Se você está se perguntando onde você vai usar esse tipo de recursos. Ele será usado principalmente ao criar com o mais leve desde. Ok, vamos continuar na próxima função que vamos falar. E esta é uma função muito importante está deitado no espaço. Vamos ver o que ele faz. Então D e b deitado Seu ritmo é igual à linha escura MP esta peça em, Digamos que eu quero imprimir de 1 a 5. É 20. Escapar em Sprinted. Aqui vai ele, o que conseguimos? Ele está imprimindo valores entre um e cinco. Ambos estão incluídos que são 20 valores entre um e cinco e eles são todos igualmente distanciados. Então, cada um deles é separado com a mesma distância 0.20 É assim que o espaço de luz funciona. E se eu quiser filmar o valor máximo na minha área? Ou seja, ele acabou de dizer DNP. Você pode apenas dizer Max em você vai obter o valor máximo Então valor Max é 5.0. Correto? Da mesma forma. Se você quiser mínimo, você só tem que dizer média d e B nove pontos SB eu quero dizer sobre o valor mínimo é um. E se eu quiser saber o índice fora máximo e mínimo Bem, em vez de Mac, você vai dizer ar T max. E isso lhe dará o índice depois faz número aqui em se você quiser o mínimo
mais uma vez . Mesma coisa. Mas aqui, você diz nervoso. Aqui vamos nós. É zero ligado. E se eu quiser saber o tamanho da minha área? Isso também não é tão difícil. Se d e B nove colheres de chá e apenas um tamanho. Aqui está. O lado desta corrida, 20. Claro que não se desenvolve, certo? Esqueci-me de te dizer a coisa mais importante e mais fácil de fazer. Se eu quiser encontrar o valor em um índice específico, isso é fácil. Linha DNP. Vamos ser se eu quiser encontrar o valor Por exemplo, que o índice 55 ele mostraria o valor do índice cinco. E se eu quiser o valor para o intervalo fora do índice? Como se eu quiser valor de 1 a 5, Então DNP linha SB. Eu quero muito de 1 a 5. O Diego. Ele lhe dará valores de 1 a 5. É assim que você vai encontrar os valores em um salário de diamante. Acho que cobrimos tudo o que precisamos para cobrir em uma dimensionalidade. Em seguida, eu vou levá-lo através de matriz multidimensional
6. Numpy multidimensional: Vamos falar do meu Ari bidimensional. Agora vamos ver as minhas exigências “D”. Não, mas ele também chamou médicos. Vamos primeiro criar um ari multidimensional com números aleatórios. Então digamos que DNP aleatório. Ele está no dardo FY ponto aleatório vanned on. Vamos criar uma matriz multidimensional de cinco por quatro que perdeu cinco linhas e quatro colunas. Dirija por quatro D e P. Benda. Muito bom. Então esta é a nossa exigência do Monte agora em Lembre-se de falar sobre excesso. Então, todas as linhas aqui são consideradas em excesso. Zero colunas são consideradas como excesso um. Pelo contrário. Começa no caminho. Isto é 00 Isso foi zero linha zero coluna. Este é o 10 que ganha a primeira regra. VERO COLUNA Isto é 20 que quando segunda linha zero coluna. Da mesma forma, este é 01 que com zero linha primeira coluna, a linha vem primeiro e depois chamá-lo. Por exemplo, se eu quiser saber o valor em andro grosso e primeira coluna D e B aleatório, eles controlam a primeira coluna e morte desenvolver. Jiro Um dedo do pé, segunda linha 01 1ª coluna. Este é o valor, mesma coisa. Posso ir um pouco diferente. Eu poderia dizer que DNP voltou para casa em um. Ele vai retornar a mesma coisa que eu posso colocar linha e coluna em colchetes separados são que eu posso
mantê-los no mesmo registro com vírgula. E se eu quiser descobrir um intervalo como o 1º 1 aqui é para a linha 2 aqui é para a coluna e eu posso mencionar o intervalo para que eu possa dizer D e B Vande um eu quero ver da linha um para a linha três e quatro colunas. Eu fui da coluna segundo dedo do pé chamando para eles ver e isso é chateado. Eu tenho a linha 10 e 103 012 árvores desta estrada desta estrada para esta sala. Certo? E chame-o de Toto. 401 dedo do pé fazer e quatro Lembre-se, Os quatro não estão incluídos. Então foi dois e três. Então, dois e três daqui até aqui. E 213 Então isso significa esses valores, certo? Portanto, 31 não está incluído. Então será um e dois. Ninguém escreveu e chamá-lo dois e três porque a frente o lateralmente não está incluído. Tão idiota que eu faço aqui. Este está ligado. Ouça, então é assim que funciona. Como se você quiser obter uma correção de espaço perturbar o salário multi-diamante. É assim que você quer. Você deveria chorar. Desenvolvido. Peguei-o. Está bem. O que faz o tamanho fora do meu ar e? E se eu quiser saber o tamanho? É aí que a justiça fácil. Sip on. É isso. Diz o sape das suas matrizes. Cinco e quatro. Até agora,
tudo bem. E se eu quiser saber os tipos de dados fora da minha área? Muito bom. Diga “D”. E é isso. Os dados mergulham. Todos os valores nesta área são frutos. Acho que é tudo sobre o Ari multidimensional. Vamos passar por algumas das nossas prisões. Você pode para formado nessas áreas. Isso pode acontecer na dimensionalidade do cantor são multi-dimensionalidade. Mas estes são alguns interessante nossa presença que você pode realizar. Vamos fazer isso. Vamos ver nossos presentes. E vamos ver que tipo de nossas prisões podemos fazer em nossa NPR. Vou definir o meu próprio Ari. Eu não vou me apresentar. São presentes neste número aleatório. Multi dimensionalidade. Então vamos criar meu próprio ary DNP i n t Medics em n p dot buddy eu vou criar uma
multi-dimensionalidade . Você tem que quebrar seus recordes de coro para criar valores multidimensionais de Eddie . Crescimento no interior é registros de cartão. Um para três, depois 456 789 10 11 12 15 15 15 15 e eles gastam esse cara D e B e os médicos. Ok, então esta é a minha área multidimensional. Eu vou fazer muito fora da nossa presença nisso, o 1º 1 que eu gosto. É alguns que eu posso ver alguns, e isso vai me dar o total de todos os valores nesta área aqui 120 Então esse é o total de todos os valores nesta cidade. E se eu quiser saber quais desses valores são criados? Os bons pagos falam bem. Por exemplo, eu quero ver Veach desses valores são maiores do que sete D e B. É copiar isso e maior do que em breve. Aqui você vai, para todos os valores onde não foi maior do que 78 reimpressão cai e os valores que são maiores do que, digamos, um, ele vai imprimir verdadeiro interessante, certo? E se eu quiser criar um R e com os valores a partir disso? Muito. Mas os valores que são maiores do que, digamos um, por exemplo, aquela cidade apenas diz que é um 2º 1 em. Ah, não se esqueça que é bastante discos. E então este disco, e então eu vou dizer, conectou esse teto em um menos imprimi-lo. Então não é ari para converter isso em um dia. Por que você tem que fazer é dizer o Ari original dentro que você colocou esse cara. Ok, agora, veja, você tem essa subsidiária. O nosso David valoriza mais do que sete. Este comando é obsoleto ID. Mas eu só queria que você pudesse fazer isso. E se eu quiser mudar todos esses valores? Então, em vez de alguém para Bem, eu quero atribuir 100 Por exemplo, isso é chamado de radiodifusão. Tudo o que eu tenho que fazer é dizer, aqui e depois eu preciso saber de qual é o seguinte que eu estou falando. Então lembre-se, 012 e três. Estou falando da regra número três. Então isso significa a regra número três. Seria que ele é bastante discos. Regra número três e depois de qual Collins eu estou falando de 0012 como de zero para. Então, o que vou colocar aqui? Zero até o último. Bem, aqui estão no aluguel. O segundo valor não entra em contato. Então eu diria que três ok, é igual a 100 e, em seguida, menos impresso. Está bem. Aqui está. Que mudou 200. Essa é a radiodifusão. É assim que você pode mudar os valores em Larry multidimensional. E se eu quiser adicionar 50 dedos todos esses valores apenas em 52 que também é fácil. Basta ver isso em 50. É como se qualquer outro fosse persistente. Basta dizer adicionar 50 como este no impresso novamente. Aqui está. Cinquenta anos, bem desenvolvido.
7. Funções estatístico de Numpy: Como a próxima parte desta divertida Jenny fora explodindo Numpty nós vamos explorar algumas funções
estatísticas. Isso é testículo funk? Já que você pode atuar nas 21h , já
te vendi o próximo que vou dar. Então você é. É macio, desonesto. E então você só diz impedir a arte, DST e passar seu nome nela calculará um padrão desonesto e em seu santo. Então, para isso são um desvio padrão é 37,31 Da mesma forma, você pode executar várias outras funções estatísticas. Por exemplo, se eu quiser ver a rota Esquire fora de cada um deste valor, Eu posso dizer MP dardo Sim,
Q rt e, em seguida, passatempo nome fora do papai aqui ele vai dar a sua calma escreveu fora cada um desses valores. Da mesma forma, você pode fazer log. Então, a propósito, se você não entende muito sobre os detalhes por trás, quais são suas tenras TVs e o que é log ? Não se preocupe. Vamos cobrir isso nas futuras eleições, por enquanto. Basta lembrar que estas são as funções estatísticas MP que você pode fazer usando M. P. M. P s biblioteca de luta lavou potencial, e este colocar Insel está aumentando a cada dia. Quando você continuar, faça o projeto em tempo real como um profissional de aprendizado de máquina. Peço-lhe que se mantenha atualizado com o que está acontecendo nas bibliotecas como o MP Kaylan Banda Matt trouxe vivo Be on Seaborn estas cinco bibliotecas Air que vão
ser a sua vida. Portanto, mantenha-se a par dessas bibliotecas e mantenha-se informado sobre o que elas eram. Novas melhorias acontecendo nessas bibliotecas. Quaisquer funções estão sendo depreciadas, quaisquer novas funções que estão sendo adicionadas. Artem, você está farto de idiota. Vejo-te na próxima palestra.
8. Pandas: Olá aí. Agora que você instalou o notebook Júpiter, vamos fazer duas coisas juntos. Vamos criar um novo caderno de Júpiter em que vamos explorar uma biblioteca de aprendizado de máquina muito importante beytin chamada Wanda. Aqui está o seu caderno de Júpiter. Vá para o novo e clique em Lutar. E três. É assim que Jupiter Notebook parece. Isso se chama venda. Você pode adicionar quantos quiser. Você pode excluir se não quiser. A Andi. A primeira coisa que faremos é escrever sobre o que se trata. Vamos dizer pacote, Andi, ir para velejar tipo célula e torná-lo Marta Markdown é como comentários sobre ele será útil quando você imprimir o caderno completo. Arvin Terminates está olhando para este caderno Mark aqui embaixo. Você pode ver batendo. Leia esta mensagem. Isso é bom. E agora vamos importar a biblioteca Pandas para a polícia ao mesmo tempo, vamos importar uma biblioteca muito importante, Numpty, se você é novo para comprar itens, apenas entenda. Estas são bibliotecas muito importantes que você vai usar no aprendizado de máquina. Então nos encontrou em particular é o que você está indo explorar nesta palestra que você vai gastar algum momento neste dedão vitorioso. Entender o quê? É a Biblioteca dos Fundadores. O que você pode fazer? Usando esta biblioteca você importou as bibliotecas importantes Próximo, menos à direita. Um pequeno tribunal. Nós vamos criar um quadro de dados pandas que é como criar uma tabela no aprendizado de máquina como entrada fez citações que vai ser e agora vai para as áreas, por exemplo, As cidades é um número muito simples, muito off para seis, depois nove e faz você começar aqui perto. O tempo deste ano vai ser um professor. Até agora, tudo bem. Vimos uma pausa. Chegue aqui, então, pelo menos, as colunas Problemas vão ser simples. Mantenha-o simples por enquanto. Vamos construir este tribunal muito simples sobre Você está pronto para correr. Você pode terminá-lo agora clique sobre isso. Ele vai perguntar a você CEO Arias, Você quer reiniciar o cardeal? Porque aqui você vê que não há números porque o coronel caderno ainda não começou. Então truque sobre isso nele vai começar isso. E aqui você tem os números bem aqui. Oh, você quer um e dois agora que isso faz parte do país? Isso faz parte do caderno agora. Condições normais. O primeiro detector e isto. Vamos lá. E este comando neste é o nosso quadro de dados. Isto é exatamente o que nós demos neste ano. 123456789 Nas colunas ABC sobre isso aqui é chamado Índice. Vamos brincar com esta carta, mas por enquanto,
entenda, entenda, acabamos de criar um quadro de dados tosse um dia de folga. Agora vamos criar outros dados de e isso vai ser um pouco diferente do que é agora. Então, na nova venda, bem, aqui se você for, você tem mais opções. Eles inserem, inserem venda, evoluem são inseridos abaixo dele. Então eu vou inseri-lo abaixo. E então aqui eles têm dois iguais BD em que sair do seu país do tempo e escuro. Hoje também vai ser este. Digamos que busca ultimamente não esquecer Syntex. Ok, e escute, vamos dizer que vai ser e nós moramos em onde então? 15 14 15 19 15 15 15 Sobre ele disse mais uma regra 19 Don t Muito bom aqui. Então, isto é o fim. Desta vez vamos a mais uma coisa importante. Vamos nomear o nosso Índice do Texas igual a eles não. 1234 linhas. Preciso de quatro em Nexis. Ele que Andi gosta antes de precisarmos do dedo do pé. Coluna Neymar Mantenha o nome da coluna parecer uma tia B. Eu vejo. Parece bom. Sim, muitas coisas que eu não sei. Oh, sim, temos mais do que o necessário no Texas. Existem 1234 regras. Então B Q R s para ok agora comícios. E aqui vamos nós. Temos o novo quadro de dados. Indique um quadro. Os índices são assírios chamado BQ Arias. Não são números numéricos. É baseado no que nomeamos eu fiz antes de nós mais vamos seguir alguma coisa boa. Citando padrão em inserções para cima, alguns marcaram alguns comentários que serão úteis. Carta, dizem que no terceiro selo envolve aqui. Vamos ver 15 State of James, este aqui temos que ir à venda e dizer que está marcado com o Padre Mark nas vendas. Não há números. Somente os tribunais do tribunal de serviço têm os números porque eles têm que seguir certas execuções em sequência. Bom trabalho. Até à data, os afegãos criaram dois conjuntos de dados. DF Andi tem que jogar para baixo, Andi, o próximo Venha é o Se você acabou de executar este comando, você verá todas as colunas como ABC e tipo de dados tipo de todas essas colunas com objeto com PTSD de colunas 30 de duas colunas. Ele será ajudado em como Qual índice? Se você diz o índice, você vê, é o seu intervalo de dias 0 a 3 e os passos um que este é apenas um novo índice médico são criados. Começa zero nele, incrementa por um. Que tal se eu ficar muito escuro lá dentro? Quem está aqui? Tem nomes indexados, BQ, arias e, claro, tipo de
dados com objeto. A verdadeira diversão começa agora quando vamos cortar e cortar esses dados, sentar-se usando Panda. O que vamos fazer agora ele cortando Faça isso em um Mas nós temos a ver com isso. Isto é apenas um comentário. Tivemos um bom tipo de celular de venda no Dr. e não há números. Mais uma vez, basta clicar sobre isso e diretamente abaixo. Ok, aqui. É uma coisa muito importante que você vai usar em Masilela. E se eu quiser espaço? Ligue para ele. Se você é índices são numéricos como este, você pode apenas dizer o f apertado. Eu olho para eles um que nós explicamos esta parte em lutadores índices. Eles começam zero. Então, se você salvar um, ele vai imprimir o segundo quarto. Agora o primeiro vamos ver que clique contra E aqui você vai imprimir 456 Porque nós demos um. E se eu disser que olho? Zero, vai ser o 1º 123 E se eu só quiser Tokyu? nome do meu índice, não o número do índice. Nesse caso, você verá DF muito baixo em. Por exemplo. Eu só quero estar pagando meu quarto P. Nesse caso, você vai dizer loc local não eu loc em não Index Loc. Você vai dizer sua Lucy e você vai dar o nome do índice. By the way, você pode def clique no controle. Entre em seu mantê-lo em você para fazer a mesma coisa que você faz com a cor surround
aqui . ABC 10 11 12 em que é o Speedo. Desta forma, você pode obter diretamente um grupo de freak velocidade. Até agora,
tudo bem. Agora você sabe como fazer amizade com uma fileira de alto-falantes. Que tal eu querer um subconjunto desses dados, por exemplo? Só quero esta parte. 10 11 13 14 16 17 Apenas esta parte. Quero criar um subconjunto dele. É ele. Ok, vamos em frente. Eu tinha um celular novo. Agora vamos criar um subconjunto. Depois que você for, vamos para a qualidade de três. O comando é demasiado obscuro que eu estaria nisto. Há dois argumentos. O primeiro argumento contém o número após aqueles que você deseja neste transtorno. Comece com zero em seus nomes. Árvore faz o mesmo Você quer apenas duas colunas zero e faz você tem como aqui você começa um
e e b lembrar, ser um. Sim, é
este palco? 10 11 13 14 e 16 17 três colunas Faz e faz agora apenas sendo 50. E você criou um subsídio fora do F dois e você dá o nome do fundo não pára aqui. Há muitos desses comandos para explodir antes dos meus sentimentos. Esta cereja em cubos depois de seus ativos que lhe explicamos mais um aspecto que você vai usar em Massillon. Que tal se eu disser, vocês quatro em e o F para que eu olhar? Então eu digo, OK, 0 a 3. Mas aqui eu disse que eles foram queridos pelo que aconteceu Santee neste comando. Estou dizendo para não incluir a última coluna dizendo meu ninho. Estou vendo para não incluir este aqui. Se eu acho que menos dois não incluem as duas últimas colunas. B e C. Eles fazem isso? Sim, ele só tem Carlo fresco. E se eu só ver menos um? O único príncipe, o último? Vamos lá, se eu ver o último estudo da coluna, se eu disser menos um, isso significa que eu não sou um começando com zero para menos um. Só estou dizendo menos um. Basta colocar menos um. Isso significa que só levará a coluna grande. Ver 1 3 portas 12 15 18 a 15. 18. Mas na última cor. Estas são algumas das maneiras divertidas usando você pode criar sub set off o conjunto de dados maior em. Isto é o que você vai usar em Massillon. Nós não terminamos. É o mais importante na parte crítica fora Panda, que você vai usar em Wasilla. Joelho é o que eu daria para o último em que é ler as lutas. Então vamos colocar o mercado aqui. Cartão ligado. Veja, isso vai ser para baixo. Você acha? Fonda Você poderia ler qualquer tipo de luta que você pode namorar dois anos. Nós finalmente convertido do site. Você pode thtml cinco, uh, para a cidade facilmente. Você acabou de dar em DVD dot Tetat es três. Dooney e nós estamos aqui para lutar no Eu tenho See sou eu neste link. E é aqui que o arquivo CSC é armazenado. Este é o único comando que você precisa ler lá. Vê isso? Só estou muito bagunçado. E aqui está. Você vê? Isso é sim, nós arquivamos sobre isso. Temos o lado apenas com um. Vamos lá. O arquivo completo está aqui nesse arquivo está neste conjunto de dados. Você o buscou? É isso. Agora todo o quadro de dados da juventude CS 35 Banda chamado o If on. Seja lá o que for a presidência realizada aqui, você pode executar no se ele d se ele se seus dados para jogar por aí agora e você vai ser Faça todo esse corte, cubos,
indexação em todas essas coisas fazendo Massillon em esse tipo de dados. Então, em que você estava indo dedo do pé ler uma briga com um monte de dados usando panda em. Então, depois disso, você vai fazer é motoristas de trem e cortar e cortar todos esses tipos de análise fora são que você pode ver todos esses tipos de operações sobre os dados usando Panda, lumpy e outras bibliotecas. Mas o panda é a biblioteca mais importante quando se trata de ler o arquivo sobre instruir, cortar e cortar os dados maiores. Vejo-te na próxima palestra. Tchau tchau. Mas não vá a lugar nenhum, Head. A parte mais importante da Brenda que guardei pela última vez foi ler os cinco. Quando você está fazendo aprendizado de máquina, você tem que primeiro ler os dados sobre isso. A primeira coisa que você vai usar Fonda. Então vamos em frente enquanto lidera os dados. Você lê os dados e transfere você para eles para uma fama de dados. Você já sabe sobre ele. Então o se são os meus dados a partir de agora o comando para ler. O arquivo é BT dot Reid, vou ler o arquivo CS três. Então vai ser a porta da polícia para ver se você está lendo aceito, seria aceito. Então, assim, existem comandos para ler várias lutas. Você pode obter excelente qualidade como você pode detectar. Arquivo. Você poderia comer ovos. Esmeralda. Você pode obter qualquer tipo de arquivo lá. Vamos lá para isso. Se chegarmos aqui,
este é um tipo de fonte aberta de dados. Se chegarmos aqui, Nunca para você. Você pode quase imediato. Então, eu vou ler este ano que arquivamos nessa data. Eu vou ser dito nesta fama de dados. E eu disse, você não tem que fazer nada. Vamos muito estado a sentar-se em abundância aqui. Você tem os dados no quadro de dados? D Se estiver ligado agora, seja qual for a nossa presença que você realizar aqui no quadro de dados, você pode executar o mesmo tipo de nossa presença nos dados deste é o primeiro passo em qualquer aprendizado de máquina. Primeiro você tem que ler os dados. Então você começa a cortar
, cortar e analisar os dados. Ok? Estamos quase terminando essa palestra. Já exploramos detalhes suficientes em Panda em. Nosso arquivo está pronto. É hora de dizer a luta. Então vá aqui. Lutar. Sue está no ar. Então aqui você pode obter o nome. Disseram que isso se torna minha luta. Há várias coisas boas em coisas muito úteis sobre você, Peter. Mas vou falar sobre eles no devido tempo. Uma coisa muito importante que eu quero dizer-lhe agora é que você pode baixar todo este arquivo Shtml como um pdf são qualquer coisa, por exemplo. Eu posso baixar este sht, etc. Se eu abrir. É assim que os lutadores agora eu posso ver nesta luta para qualquer um em David. Eu tenho dia todos os comentários. Gold argumentou que a corrida a frio está bem ali. Mas este é o seu caderno completo. Você pode dizer com qualquer um que você pode, de fato, dar boa esperança. Faremos isso no devido tempo. Essa é uma beleza de Júpiter. Então isso é tudo sobre Panda em Júpiter em. Vejo-te nas próximas palestras.
9. SEaborn2 de DataExploration 2: Como é que eu estou sentado em um restaurante e eu estou pensando, se eu tenho um dados de clientes fora desta retórica e o quanto eles estão sendo na conta sobre o quanto eles têm dor como uma dica. Algumas informações sobre esses clientes como seu gênero, se eles são fumantes ou não, ciência fora do tamanho do partido, Quantos clientes comem juntos? Posso encontrar um padrão? E posso dizer quem paga mais com fumantes, pagar mais ou não fumantes pagar mais sobre o que o servidor gosta? Os garçons ficam mais profundos. Vai encontrar algum tipo de percepção de que eles estão indo para o mundo fora da data que eu marquei não é exploração de
dados é um dos passos mais importantes para qualquer cientista de dados? A menos que você entenda seus dados, você não pode fazer muito com eles e morder e noivas. Várias bibliotecas para exploração de dados Matt Part e See Bon são a que é
mais usada neste mais rico. Vou levar-te através da Biblioteca Seaborn. Digamos que atacaram a prisão usando as bibliotecas Go on Lição 40. Claro, a primeira biblioteca vai ser fundo beleza Terra na importação Si bon SNP Vamos importar dumpy como e ser três principais bibliotecas é o nosso pão e manteiga fora de qualquer cientista de dados. Em seguida, vamos importar o conjunto de dados principalmente todas as bibliotecas, como ver um como uma biblioteca como um mordedor. Passeio na biblioteca. Seu próprio conjunto de dados para fins de degustação foi que nós importamos cartões detestados mergulhos da costa. Há as pontas iguais a sim, neste escuro. Seus dados dizem, no conjunto de dados. O nome é dicas. Próximo. Vamos criar o quadro de dados do Fonda para estes dados. Você já sabe, , creme e colocaram dipsy. Vamos ver lá primeiro. Poucos papéis após os dados estavam prontos. Até agora,
tudo bem. Ok, vamos executá-lo. Sua doença. Oh. Sim. Isso seria uma doença. Ok, então aqui está. Estes são os dados dizem que vamos trabalhar em um banco de dados muito simples. Ele viu o montante total pago profunda conta seis homens ou mulheres sobre se a pessoa que pagou este montante total será e restaurante Table Mountain era um fumante ou não. Que data foi essa? É um dia morto. E que horas foi? Foi um jantar de almoço? que horas estava em. Qual é o tamanho da festa? 2345 Ok, então muito simples Data é isso. Vamos ver quantos dados há nesses dados? Sente-se para o Dr. See, ele vai para Sue s detestado para suas 44 linhas. E, claro, há sete colunas. Não muito grande. Agora temos esses dados. Isso é muito fácil de entender. Que tipo de detritos? Mas quando você era um cientista de dados em você vai predizer dica Então não é apenas olhar para esses dados. Andi, pense bem, agora eu entendo que você precisa entender o comportamento fora dos dados que isso também foi suficiente. Os dados sobre o quão profundo é afetado pelo total Billy bounder por um fumante são por dia após V carro por tempo, muito almoço ou jantar. Nosso lado do partido, Estas coisas que você tem que entender e esta compreensão desses aspectos depois que é chamado exploração de
dados em. É aí que Seaborn vem a calhar. Então, muito primeiro, você precisa fazer em tais casos é entender a distribuição fora dos dados. E para fazer isso, você precisa traçar o gráfico de distribuição. Apenas diga “sim”. Ennis Dart Dist! Blot em def! O DF. Então vamos considerar todo o objeto. Você fora desses exercícios, queremos prever o fundo baseado em certas outras variáveis. Então nossa variável alvo é profunda e há certas características variáveis dependentes como Billy meu próprio sexo falou. Sim, eu sei que data é hora e tamanho. Então a primeira coisa que eu vou fazer é entender que essas duas pessoas após dica neste
conjunto de dados se é distribuição normal, são não é normal. Distribui. Vamos executar este comando. Aqui está. Este é o distrito não estava fora de dados profundos sobre ele parece uma distribuição normal. Se você ver uma curva de sino como esta, é uma distribuição normal, mais ou menos. Ok, então vamos mais a seguir. Eu vou entender Veach fora deste mundo, afetar a fita ao redor mais. E entender que a melhor coisa é o que é chamado de mapa de calor. No próximo vamos desenhar mapa hit. Mas antes de desenharmos o mapa de calor, temos o dedo primeiro, certificar-nos de que estas coisas estão coordenadas. Então vamos lá, para isso é coordenadas métricas Equus d se escuro poderia relacioná-lo. Em seguida, vamos dedão. Criar mapa de calor sobre isso. Métrica correlacionada. Certo, acerte o mapa. Médicos centrais nisso. Então este é um assassino. Não está parecendo muito informante porque está faltando os números aqui para adicionar o número que você diz uma arte que custou através aqui rio. Agora tem números. Olhe para a ponta e aqui em baixo. Você vê, é
claro, ponta a ponta será um lá Darvill três para o outro. Mas entre a conta total e o tamanho, você pode ver que o valor total da conta afeta a ponta mais em seguida lado sobre. Por que não conseguimos outras variáveis como esta? É fumante durante o dia e tudo porque estes são variáveis categóricas. Quando você faz a análise do cientista de dados sobre esses dados, a primeira coisa que você vai fazer é converter essa variável categórica em quaisquer
variáveis médicas . Quando você realmente faz esse tipo de análises sobre esses dados, toda essa coluna será números. É por isso que eles não vêm aqui. Mas o ponto é o novo para a análise do mapa de calor. Você vai entender que sua variável alvo é mais afetada pela característica do trigo. Quando você pode dizer variável independente em. Neste caso, parece que o total realmente está afetando mais do que o site. Consegui. Temos de informar o Merson sobre os nossos dados. Até agora, essa é a distribuição normal no total. Realmente quantidade são fixos, o profundo mais do que o tamanho da peça. Muito bom. Até agora,
tudo bem. Vamos criar mais essência de visualização que nos dará mais dentro através dos dados. Então, ao lado de visualizar é e nós vamos criar é um enredo. Acho que o ponto da morte é parte? E aqui, vamos nos orgulhar. Nosso eixo X vai ser a conta total. Porque é que os exs vão estar nos nossos dados. DF é muito simples, ok. E ou aqui? Muito bom. Então, tiramos o enredo. O total da conta foi tão íngreme, mas não está muito claro. Quero dizer, não
é muito informativo. Vamos adicionar mais alguns critérios para obter uma informação adequada. Vamos adicionar tempo de cor. Ok, vamos ver. Aqui vamos nós agora. Temos duas parcelas com base no tempo. Bem, é hora de almoço ou jantar. Bom. Vamos trabalhar um pouco. Não. Diga quem é fumante, teremos mais informantes. E com base em onde a pessoa foi fumante ou não. Ok, agora temos cores diferentes baseadas em um fumante. Sim ou não. Vemos um padrão. Vejo um padrão linear aqui em ambos os casos. Até agora, tudo bem. Vamos adicionar tamanho. Também o tamanho deste dardos. Aqui será maior são os menores com base na próxima rachadura diária. Cada menção aqui nós convencemos no tamanho dos critérios. Temos uma coluna aqui, certo? Baseado no tamanho da festa Visy, os diferentes tamanhos fora do médico. E aqui está. Quanto maior o tamanho da festa, maiores
os cães aqui. Então, com base neste gráfico agora, eu entendo que é um padrão linear à medida que a vontade total aumenta, a quantidade de tenda aumenta. E há alguns Parton relacionados com as oportunidades, fumante ou não. Mas nós não poderíamos fazer muito aqui para entender que em parte na mão no dia para criar linha
regressiva com base nos critérios, se era uma fumaça ou não. E assim faça. Digamos que um mais fino está aqui,
um, um, trazido e mais uma vez realmente começar com X é tortura conta. Muito bom. Por que é igual a profundo? Andi fez, uh quest. Você tem uma regressão linear que já sabíamos, certo? Precisamos de mais informações. Isto não é? Adicione essas criterias contra o tempo igual. Então vamos ter que gráficos agora com base no tempo livre, no dia ou aqui. Ok, temos dois gráficos emprestados no jantar. De novo. É sempre o mesmo comportamento, seja para o almoço ou jantar Itália perto rebatizado. Eu quero entender se há uma diferença de comportamento com base em se a pessoa Wasit fumante ou não, Vamos adicionar isso. Ha ha! Agora eu entendo. Vamos ver isso. Então o comprovado é uma pessoa fumante na origem ah aqui é não fumante e há um padrão A pessoa que fumamos Se o valor da conta é menor, ele dá re literalmente motivo. Mas eu perguntei a quantidade de Billy aumenta o kun profundo pelo fumante que o Radi usa comparado com a pessoa com o Artie fumando. Então agora temos uma visão muito boa sobre esses dados com base em se a pessoa é um fumante ou não até agora, nós entendemos normal esses dois seios, a quantidade de gorjeta é mais baseada na vontade total agora. Entendemos que, se o valor da conta é alto, é melhor para não fumante. Se você está procurando uma boa dica, vamos mais. Vamos adicionar um pouco mais com suas idéias. E desta vez vamos desenhar algo chamado enredo do gato. Entendemos que há uma diferença de comportamento. Existe uma diferença de comportamento na quantidade de tenda com base no dia da semana? Para entender isso, vamos desenhar um tipo diferente fora do chat. Dizem que X é igual hoje. Andi, uh, por que é igual a profundo e dados é igual ao querido Lester e isso não está terminado, mas menos Renate ou aqui temos algo. Não é muito limpo. Então, vamos colocar tipo Então, nesse piso, coloque um papel muito importante para aqui. Eu vou dizer amável um pouco. Fazer. Você vê um melhor agora? Isso me diz que na sexta-feira fez um número de lista de pessoas comunhão Onda ponta em Monte. Não tão alto, mas na quinta-feira a gama de pessoas que são dadas ao dólar T, por exemplo, que é alto no sábado, que aconchegante pouco, mas a quantidade profunda aumenta como talvez um monte de pessoas estão vindo Saídas de sábado e domingo. Muita gente vindo, mais
uma consideração interna. Estas são as análises tipo off que podemos obter dependendo de diferentes tipos fora do gráfico. Como eu disse, o enredo do gato deste tipo aqui desempenha um papel muito importante. Eu posso mudar o tipo de dedo Wilen, por exemplo, aqui vai parecer diferente. Oh, aqui. O mesmo tipo de informação, mas é um cofre diferente. Mas da mesma forma, eu não posso mudar a barra do dedo do pé sobre ele vai. Então, um tipo de bar diferente de Ted Sieben é uma biblioteca muito boa de quando se trata de
exploração de data . Existem vários desses assuntos de rótulos usando os quais você pode visualizar seus dados e você pode obter insights sobre eles. Então, antes de começar a aplicar algoritmo no treinamento, seu modelo e tudo isso ajuda você a entender os dados antes de eu terminar. Se você apenas ir no Google aqui, uh, veja, luta de
títulos e biblioteca. Este é o site para essa biblioteca em alguns dos exemplos que eu tenho logo aqui foi do site e você pode ir e explorar mais longe que têm muito bons exemplos aqui. Era sobre a biblioteca Seaborn. E como você pode explorar seus dados usando isso? Uma biblioteca. Vejo-te na próxima palestra.
10. Préprocessamento de dados: após a experiência de dados, e a próxima face é o pré-processamento de dados. Lembre-se, os dados que você está olhando são lidos para você como um ser humano. Mas quando você envia esses dados para Messina e você tem que torná-los legíveis sob estável por uma máquina na máquina, apenas coisas em termos de números não entendem variáveis categóricas, variáveis como tínhamos em nosso conjunto de dados anterior, como a hora do almoço feminino do sexo masculino da hora do jantar, esse tipo de variáveis categóricas que não entende. Então, na parte do pré-processamento, você tem que convertê-lo em números. Mas isso é apenas um pedaço de pré-processamento. Você tem que fazer outras coisas como parte do pré-processamento de seus dados antes de
passá-los para algoritmos de aprendizado de máquina. Então vamos começar. Começaremos importando bibliotecas muito importantes. 1º 1 é claro, é idiota como o MP, e então não se esqueça lagoa nós como PD em Vamos importar Savon Muito bom. Agora que você importou todas as bibliotecas importantes até agora, vamos primeiro no forte. Nossos dados sobre ele vai ser a mesma cidade de dados em que você está na palestra anterior. Os presentes fizeram-nos isso da Biblioteca de Ténis. É ali. Sim. Então eu começo a carregar na escola. Fiz isso no nome do conjunto de dados. É aprofundado. Em seguida, vamos criar Banda Data Frame sobre os dados se encaixa dardo OPD Did, uh, livre em, é
claro, Basta colocar dicas aqui que ele tem um nome. Deixei a cabeça fora dos discos de batedor. Então, cartões Hayderi unidos fora do amigo de dados para que tenhamos campo que temos a
família de dados . Vamos fazer esse ótimo trabalho, não é? Está pronto como parte do pré-processamento. A primeira coisa que fazemos é certificar-se de que não há valores nulos como não há
valores vazios em qualquer um desses recursos são variáveis alvo fazer isso? É um D dos dados de vídeo de Nome é Não. Então será sim e não. Então ele diz 000 Isso significa que não há registros indicam um quadro que não tem valores, então todos eles têm algum valor. Muito bom. Se existe uma coluna que não tem nenhum valor, você tem que tomar uma decisão. Como você se sente essa coluna como se você colocar um número vermelho é você apenas ignorar o
cartão deles . Depende do caso a caso. Normalmente, não
é estatística que você ignore esse registro, mas alguns casos não é sugerido que você popular com o valor médio. Então você tem que estudar os dados durante o seu imposto progressivo em, em
seguida, decidir. Como se sente que falta de dados? E faremos isso para eles no nosso projeto. Por agora. Basta lembrar, não deve
haver nada. Não, vamos mais. Próximo rosto é dedo do pé, entende de que tipo? Depois disso, você descreveu seus dados e aqui ele irá. Então você a análise estatística de seus dados como quantos existem para 44 linhas? Há a média fora da data? Eu padrão ateísmo em todos os outros detalhes. Gênero. Você dentro 1.3 que com a data do motor os detalhes fecham por não muito longe um do outro. Isto é apenas manter a direita que o valor médio fora da BP de 2,99, mas você pode obter o mesmo tipo de análise. A análise estatística para todas as variáveis profundas é a sua variável alvo, Mas você também pode obter essas entidades para cada variável cada feições, cada variável alvo neste quadro de dados. E para fazer isso, diga sua fama de dados e, em seguida, descreva e aqui você trabalha. Dá-lhe a análise estatística de todos os novos médicos correu muito bem. Vamos seguir em frente, meu amigo. Aí vem a verdadeira diversão. Os dados reais processam um começo com um cartão de biblioteca ainda dimensionando de, uh, então é K um ponto ser processado a partir desta biblioteca sentar-se fora. Você importa o fundo desde que você precisa, então a primeira coisa que você precisa fazer é converter todas essas variáveis
categóricas em números. E para isso é rótulo em trimestres. Vamos ver o que ele faz. Sim, certo. Ok. Etiqueta Gorder o F é igual à ordem de serviço. Certo, temos a distância e agora menos no tribunal. As características Vamos começar com sexo. Aqui você vê macho feminino. Vamos convertê-lo em um número numérico, que é chamado incluindo assim por diante. O comum para isso é o trabalho. No trimestre na discoteca Teoh, Dark fit sublinhou transformar em DF no mesmo. Então de of Sex coluna vai ser transformado usando rótulo em trimestre. Vamos fazer isso e ficar de fora para o ponto F. E aqui está. Mudou de fêmea masculina. Tornou-se zero e um ligado. Com base nisso, você pode dizer que substituiu a fêmea por zero e enviá-lo um. Agora o algoritmo de aprendizagem deve ver pode entender esta coluna. Da mesma forma, nós contêm todas as outras variáveis. Vamos fazer isso. Um fumante é mais, não é dia? Eu entendo. Se você é bom em lutar, você vai entender isso para aquilo. Em vez disso, depois de escrever ET individualmente, eu poderia usar um loop e eu poderia fazê-lo facilmente em apenas uma linha vindo. Mas eu não quero que você se complique com isso. Quão melhor você pode fazer com Martin? Eu não o considero como uma luta um perito neste momento. É por isso que estou focando mais no que você pode fazer em aprendizado de máquina com
comandos muito simples . Mesmo que seja mais do que uma noite de folga, você pode honestamente melhorá-lo para o em sua vida real usando a luta em nossas
ferramentas prisioneiras como azul e tudo mais. Claro, ele teve que aprender morder, mas para se tornar um cientista de dados, você não precisa ser especialista depois de lutar, então ouça um. Oh, aqui. Muito bom. Agora, você vê, todas essas variáveis são substituídas por valores numéricos. Ainda é quadro de dados ainda estado Banda fora dele e ele ainda detém a mesma estrutura. Apenas que os valores, as variáveis categóricas do Ártico colocado com números. E agora seu algoritmo de máquina vai entender esse tipo de pré-processamento que você tem
que fazer antes de decidir. Gravado no Richter anterior quando estávamos falando sobre mapa de calor, vimos que o mapa de sucesso considerado apenas algumas colunas, como total de fitas construir fundo total e tamanho sobre ele não considerou as variáveis categóricas . Agora nós convertemos essas variáveis categóricas em reboque. Os números numéricos menos criam o mesmo mapa de calor agora, e vamos ver o que acontece. Ok, então alguém desta vez que vamos criar nossa quantidade de hit man é sublinhado. Minha placa, este é Cornelius e métricas eram segurança porque o DF dardo Cory, ouça e é criar o mapa de calor e dados, claro. Sinta nossos médicos. Não, porque e aqui está. Agora ele tem todos os recursos que está certo. Tem tudo. E neste ponto, se você olhar para isso,
você vê, você vê, para gorjetas total conta tem o número mais alto. Assim, a dica ainda é mais afetada pela filha. William parece lógico para mim, porque se você for torturado, quantidade de
vontade é alta. Seu valor será alto em por que ele é afetado negativamente pelo dia e hora na conta
total total total, a próxima variabilidade afetada mais é o tamanho. É afetado por seis e um fumante também positivamente. Mas o fumante é aquele que está afetando Itália compensação Você vai dividir seus dados dentro de valores
em destaque e variável alvo Aqui. A variável de destino é a ponta dos pés recebe um nome de variável de destino. Por que você está indo dedo do pé tem mergulhos nestes alvo variável de renda branca impressão y ponto hit E aqui você vai Todas as dicas estão lá em repouso fora do campo Você vai colocar como um recurso como tão x em apenas ADF em seu dedo bom. Solte a variável alvo ativa. É um que com você Considere todos aqueles Você está apenas deixando um fora do campo e que é profundo e descanso após quadro de dados. Você está atribuindo como o futuro que apenas entender isso e esta impressão o seu ponto extra hit Muito bom. Quando este Incrível. Agora você tem o seu ex. Tens o teu porquê? Na próxima, você vai dividir seus dados completos no reboque. Dados de treinamento em dados testados treinamento que eu vou ser usado por seus dados modernos do dedo do pé do trem em si para que ele possa decidir o melhor coeficiente são baseados em moderno para você. E uma vez que tenha decidido melhor modelo para usar com base no trem melhor ele usará
os dados de teste toe Experimente esse modelo se você estiver ficando confuso, não se preocupe, ficará claro quando fizermos o projeto. Mas, por enquanto, entende? Eu disse que as pessoas de dados avaliando os passos que você está indo dividir seus dados em dados de treinamento e testá-los. Então vamos fazer isso até agora é dividir o rotador no reboque? Namoro. Entra no testado. Você ia importar uma aula da biblioteca “Sim, Assassino “de novo? Sim. Skillon Dark assassinato a vítima importar Dean, eu apenas respeito em você vai dizer que você 16 escolhas Apenas por que você por quê? Dist solicita Mancha dist! Está bem na bota. Ou aqui. Você vai dizer que tamanho desta como fora tamanho de dados muitas vezes completa. Quanto você quer colocar para testar quanto você quer colocar o treinamento do dedo do pé? Cabe a você e está sujeito aos dados. Mas normalmente, como uma queda, vê-se que as pessoas seguem 80 20. Eles colocam 80% de dados para o conjunto de treinamento e 20% de dados. Pai para os testículos. Então, vamos encontrar dois muito bons menos impressos nesta primavera. As fitas dizem que você não precisa trazer a completa. Você não vem aqui. Então é um dos grandes. São 240 fotos, certo? Vamos imprimir o bule Data Street. Ok, eu acho que eles são bons o suficiente Morte, sério? Ele capaz é bastante dados em dados de teste e Tren, por exemplo, o extra e ganhou 95 linhas e colunas seguras. Claro, há um tem então 123456 E são 1 95 linhas divididas em 44 linhas em 1 95 indo para o
treinamento do dedo do pé e 49 indo para o teste. Da mesma forma, para a guarnição branca, ele colocou 1 95 linhas de treinamento do dedo do pé e 49 para Então isso é praticamente o que você faz no
processamento de dados pré ? Existem mais complicações como o rótulo incluído não será suficiente. Você tem que rebocar usar um coração em quarto. Porque se você usar o rótulo em um trimestre só então ele nos dá números tipo fora. O que podemos olhar de maneiras diferentes, certo? Se for zero e um, você também pode dizer que zero tem preferência maior do que uma que não está correta, certo? Da mesma forma pode haver outros dados. Então dedo do pé, superar esse tipo de análise fora tendenciosa são complica é qual aprendizado de máquina são ótimos do meu dedo do pé de treinamento. Você vai fazer um coração em trimestre, embora certas coisas que vamos fazer nosso durante o projeto. Não quero complicar as coisas neste momento. Estes são o processamento de dados básicos. Você faz por mais coisas. Projeto de aprendizado de máquina. Por enquanto, este é o processamento de dados pré em aprendizado de máquina para você. Oh, antes que eu vá deixar entrar o nome aqui com o relâmpago. Fiz, uh três. Este é ele incrível. Vejo-te em eclética
11. Explicação de SimpleLinearRegressionExplanation: Olá aí. Agora é o momento certo para falar sobre um tipo diferente de algoritmo de aprendizado de máquina quando falamos sobre algoritmos de aprendizado de máquina. O 1º 1 para começar é uma simples diminuição linear. O que está regredindo? Você classifica primeiro, entende o significado de regressivo. Se você olhar no dicionário Inglês, o significado de regressão. O significado estatístico off regressivo é uma medida após a relação entre o valor
médio uma variável em valores correspondentes fora de outras variáveis. Então vamos nos ater a isso. É uma relação com o valor médio de uma variável, com o valor correspondente fora de outro vídeo. Vamos mais ainda nos eleitores anteriores, você passou pela exploração de dados no pré-processamento de dados. Em que ele viu este gráfico fora. Por que a ex dele era uma conspiração dispersa? No caso dos dados do Tibbs, deVivo passos em torno de um dilema total ex waas. O próximo passo no algoritmo de aprendizado de máquina é toe. Prever um comportamento baseado nesses pontos na nave. Você tem que prever o que aconteceu a seguir. A maneira como este ponto parece parece que ele vai ser um crescente re linear. Então, se eu traçar uma linha, podemos ser capazes de prever tendência. Essa coisa toda vai seguir. O ponto crítico aqui é entender a linha Veach é uma linha correta. Neste caso, a linha pode ser ou esta linha. É possível com esta linha ou pode. Com esta terra, é sempre linha reta. Tudo isso parece correto. Como sabemos que um ritual é o ideal? Qual é a melhor linha? Qual deles está processando a tendência? A maneira mais ideal de descobrir que há algo chamado matemático menos Esquire . Isso significa que você pega uma dessas linhas e então você desenha linhas verticais de sua linha de tendência para que o vencedor real seja como o seu mais amplo em. Então você pode limpar essa diferença e pegar um escudeiro após diferença. Para cada um desses pontos e tomar um total de que. O total de desconto que é coro após diferença. companhias aéreas de vídeo tem o menor total que tem menos Esquire. Aproximado não é qualquer linha, pelo
menos total é a linha correta e a luz mais ideal. Então é assim que eu descrevo em palavras quando se trata de aprendizado de máquina, você tem que formulá-lo, e esta é a fórmula por trás que você tem que encontrar os coeficientes esta linha ocupada, este V zero e Beavan é o que você tinha que encontrar dedo do pé desenhar a luz ideal sobre isso é a fórmula
matemática para achar que bizarro e até mesmo na descrição do seletor, você encontrará o link. Muito você pode ir e ler os detalhes por trás de como este piloto matemático de Fórmula 1. Mas para este reitor, vamos entender que esta é uma fórmula matemática. Você tem que se alimentar para o seu dedo do pé de aprendizagem muscular. Ser capaz de calcular os coeficientes bizarro e Beaven em, em
seguida, troted off para malign. Como é que fizemos? Estarei quites? É sim, x y viés xx Qual é a sua maneira sexual? Sim, X Y é o poderoso Bricusse. E depois da diferença entre XX é e por que exes fora de sua linha de tendência um ponto real? Sim, exceto que é Esquire da diferença fora do valor X entre a linha de trem e o ponto real . E esse é o seu Beaven. Uma vez que você obtém o Beaven, o B zero é fácil de ocupar. Levante y menos B um para ele. Você vai entender isso em termos de mais três anos quando vamos direita por 10 programa com esta fórmula em. Vamos usar isso para morder programa para desenhar a linha de trem para o mesmo estado de dados fora total conta e penhascos quantidade. Vejo-te na próxima palestra.
12. Programa de SimpleLinearRegressionProgram: Olá aí. Bem-vindos a esta palestra. Agora que você entende o que é regressão linear simples em fórmulas matemáticas envolvendo isso, Vamos escrever nossa primeira luta e programa, que vai ser implementando algoritmo de regressão linear simples sobre isso. Vamos direto do zero. Vamos escrever o algoritmo completo em nossa luta e programa. Como cientista de dados, você normalmente não precisa fazer isso porque não são feitas em bibliotecas de nível. Você só tem que ligar para a biblioteca, e nós faremos isso. Vá. Mas vamos passar por esta palestra sobre Deixe-nos fazer isso por conta própria para que você entenda e
aprecie as complexidades, bem como você vai entender um lutador lance up. Então, vamos começar o primeiro título, é
claro. Escreva o que quiser continuar, então. Próximo passo. Você já sabe. Sim, você está certo. Importar a biblioteca de ser um Tempe sob PT Matt Block e eu d Não ser um em Dft em importação pessoas em seu em um atordoado, certo? Próximas oito instruções sobre a primeira função que vamos escrever é encontrar os penhascos. É aquele bizarro e Beaven. E aqui está o nosso primeiro Fox e encontrar Griff, ele vai passar X e escrever. Com esta função, ele vai nos deter rápido e de acordo com pode ser maldito tamanho. Este comando vai nos dar o tamanho do conjunto de dados. Em seguida, você vai encontrar o valor médio Victor. Estender caminho. Isso tem comandos GNB normais que você já aprendeu é quando estávamos falando sobre normal e as bibliotecas. Então eu não tenho dedo deliberado sobre isso novamente. Você já sabe que essas coisas impedem a arte significa bastante sobre. Em seguida, vamos dedo do pé, calculamos o sim XX e sim, x Y Lembro-me que o B é igual. Faça s x y por como xx e aqui vamos calcular Sim, x y e sim, XX s ex esposa. Vamos dizer que vai ser e Pete são alguns off X em y menos e e que é o tamanho aqui em média X em média direita sobre. Da mesma forma s XX vai ser MP cão polegar fora. Se X e X menos ienes em I dizer off x dois, quero dizer off e agora é hora de calcular o coeficiente. Ótima. Então, qual é o tal? B um é igual a s ex esposa por S. XX em ocupado. Quem vai ser igual? Quero dizer por quê? Menos mesmo em X médio? Lembra-se da definição de Grayson livre? Volte e verifique o que depois de David já está regredindo o suficiente e você entenderá o que estamos fazendo aqui. Ok? Em sua função esta vai nos retornar B zero. A Andi. Muito bom. Temos o coeficiente. Então, a próxima função vai ser conspirar muito seus arrependimentos na vida. Ok, vamos escrever o nosso enredo constante do dedo do pé. Muito cristão, então vamos chamar um BLT. Sublinhado regredindo nessa pontuação aqui. Vamos passar por X. Por quê? E b b a área que vai ajudar visitante e ser capaz de festa alinhado A linha regressiva que você precisa definir valor X set off. Por quê? Valores e os coeficientes B zero e ser par. Estes são todos presos. Estes não são valores individuais. Culpado é gado. Então você está indo para o sangue. O está sendo bloqueado. Primeiro prato X. Por que cor? Vamos o é M. Ok em, então marcadores. Vamos ver se a nossa família favorita em então tamanho do Marcus deixou sua técnica bem e então eu prevejo, certo? Este é o valor previsto desligado. Por quê? Porque na sua linha de trem, os valores de
Divi são valores preditos, certo? Então por que previu coeficiente b zero b mais Beavan em seus queremos e depois X E agora é hora de traçar E Grayson, você tem X. Você tem y poéticas e foram valores preditos. E você tem bizarro e ser quando você é rápido desde agora você pode bloquear o plano teeter ano tiro trança X y e é uma cor Sua na base foram entregues lança vizinhos Tito foram cartão morto em barbudo são por isso que você tem direito. E então, assim, o produto para então você só tem que ver construiu. Então muito bom Vídeo para funções Quer calcular coeficiente em outros Para desenhar os arrependimentos na vida Estamos feitos agora só temos que escrever a função principal e chamar esse pedágio. É muito fácil. Agora vamos escrever o oh, fez aquele subtítulo lutando para hash aqui. Está bem. E eles vêem Margo muito bom em é hora de chamar a função principal Muito bom. Isso é certo. A função principal. Não aguento mais minha excitação. Certo
, vamos usar as mesmas dicas. Conjunto de dados. Eu sei que você está muito animado com isso. Então vamos em frente. Vamos terminá-lo, Senhor, Ele disse mergulhos na Índia. Polícia freqüente. Não, eu fiz creme profundo. Isso é um grande mergulho. Suas gorjetas e vamos trazer a cabeça para sabermos que acertamos. Está bem. seguir estão as razões que escolhem o F Então, o que é X? Porque esta é uma regressão linear simples. Podemos ter apenas uma variável independente ou aqui vamos dizer filha Bill sobre por que ele vai ser DF. E a seguir vamos ligar para a nossa estimada esposa, que é isso? Vá aqui. Encontrar rápido para ser igual. Encontre túmulo em Jim Path X e à direita. Em seguida, bloqueou o lugar na fila. E nós estamos aqui. Vamos chamar a nossa cerveja D de função rigorosa e de linha. Cópia baseada em Andi X Y. e temos o nosso ser agora que normal. Se isso me fechou bem, acabamos. Vamos executá-lo agora. E aqui vamos nós. digressão da hora. E nove. Então é isso que é preciso. Reboque criar algoritmo no dedo do pé de combate. Tenha seus arrependimentos simples da liga na vida. Eu sei o que você está pensando. Você deve estar pensando. Mas eu disse que você não tem. Lutamos com um dedo do pé especialista, tornamo-nos cientistas de dados. Massie está aprendendo? Profissional? Na verdade, eu estava certo. Você não precisa escrever esse algoritmo do zero. Estes já estão esperando por você. Existem bibliotecas de combate que já estão retidas que já têm este algoritmo construção. Você só tem que ligar para a biblioteca. Vou levar-te através de uma tal biblioteca. Na verdade, você já viu a biblioteca quando estávamos falando sobre economizar. Existem várias dessas bibliotecas. Mas vamos dar uma olhada neste. Este é o meu favorito. Este é persa acreditava rebatizado linear nele é fornecido por Sieben. É o que dizem no ano. Kristen, você vê o peão C esta noite, querida ou aqui, você só tem que montar um. Vamos lá, você precisa escrever apenas um simples Vamos lá. Vamos tirar o mesmo dia que faz aqui. Ok, desta vez há um grande DF no comando simples para fazer todas essas coisas é a dissonância. Comece um membro, o disco do bloco ex
, cerveja total. E por que ir a um encontro profundo? Eu podia pisar o telefone. Apenas este 19 Vamos lá e você vai ficar o mesmo duro. Aqui está. Exatamente a mesma linha de regressão linear. A linha simples, mas apenas um comando e que é a beleza fora de construção, luta e biblioteca durante este curso muito foram possíveis. Nós vamos usar a construção já ou nível de combate bibliotecas para você. Andi, é
isso. É o fim desta palestra. Próximo. Mais tarde, vamos usar alguma coisa. Você pode se relacionar com o mundo real melhor do que essas dicas banco de dados em. Você vai usar linear simples rebatizado nesse exemplo do mundo real? Dados do mundo real são sentados. E depois disso, vamos passar para diferentes algoritmos e brincar com diferentes lutas e bibliotecas são então eu vou vê-lo na próxima palestra.
13. Regressão linear simples de prostituta este1 em passo: Olá. Chegará a esta palestra neste Lecter. Vamos implementar regressão linear simples. Mas desta vez vamos usar a biblioteca fornecida pelo Fightin. Não vamos escrever o nosso próprio algoritmo. Vamos usar mordida e biblioteca fornecida, e vamos medir a pontuação. A pontuação de performances para esse modelo para garantir que ele está funcionando. Vamos começar. A primeira fita, como você sabe, é definir o que vamos fazer. Então, vamos aqui mesmo. O título. Simples em você, Chris. E você fez? E sim, eu sei o que eu ia fazer. Isso na próxima. Menos importação de bibliotecas. Não, B hey pode ser importado. Fonda tem piedade na importação. Si bon como na Terra e perguntou, mas não menos importante. Importar enredo louco aqui. Ivy, não seja assim. Pureza de sangue grande. Agora nos adaptamos, temos nosso conjunto de dados. Dados alimentares Mercado do Estado Bloquear a fonte após dia. Faz isso? Você vai encontrar na descrição desta palestra. Basta baixar esses dados. Sente-se em algum lugar no seu computador e então você perdoa este comando para o quadro de dados pandas para ler essa luta, ele vai ser arquivo de texto e d dot Mesmo que seja um arquivo de texto, você ainda vai dizer sublinhado de Billy Darcy CS três eles são e coloque a parte onde você contou o arquivo O nome do arquivo é Bill DJ histórias, não txt. Entregar comedores. Você deveria colocar como meu estresse central. Sim, e mais e feche. É isso. Na cabeça Deif desesperada para se certificar de que está lá no tohave a menos que alugá-lo muito bom. Então eles morrem lá são basicamente os dados de construção de alturas ou histórias sensíveis esses outros anos em DA Este é apenas um coleta dados suficientes E este é o conjunto de dados que eles
criaram por vários anos. Você vê como Maney optou razões que lá d depois de ovelhas 60. Então há 60 observações que eles têm Ah, certo. De 9 19 anos noventa a vários outros anos, eles têm realmente criminalizado altura fora dos edifícios eram histórias sexy. Qual é a primeira coisa que você Jake na exploração de dados? Tomar seguro também é parte após regra fiscal não é assim. Nós já começamos. Detectar piso explodiu. Ok, então agora estamos em ditado Explicitamente Passo. Já verifiquei o cofre e sei que há 60 observações. Em seguida, vamos verificar se há algum valor nulo. E vamos lá para que é DF não é tão incrível. Existem valores normais. O Hyatt, alguma história? Os dados que vamos jogar já são dados numéricos. Então nós não temos dedo codificar isso. Isso é um ist. Se não precisarmos fazer a seguir, vamos ver que tipo de vegetais e tem. Ele deve ter distribuições normais e para nós usar Lini recria um algoritmo e comando para isso é que você já sabe. Sim, o suficiente para ser Eban dist trouxe sobre ele. T h t e, em seguida, ser um médico. Muito bom. Aqui está. Parece muito distribuições normais. Há algumas anomalias aqui, mas podemos ignorá-las por enquanto. Então, o que é? Aparências, distribuição
normal. Boas notícias. Agora que sabemos que é um Wilson normalizado, vamos verificar o tipo de relação entre altura, alguma história? Macaco mais fresco que é para desenhar. Eu disperso produtos eram bons. Digamos que ponto ou assim. E aqui vamos nós a relação dispersa. Parece que uma diminuição linear normal e
simples na altura aumenta junto com suas histórias para que possamos
brincar e usar regressão linear simples. Acho que temos informação suficiente sobre dados. Agora podemos passar para a próxima face. Isso é pré-processamento de dados. Eles processam duramente. Talvez sejamos marcados. Mas após o processamento pré foram primeiro ir dedo do pé orar os dados de dados em ovo E por que nós
estamos indo para prever o número de andares que número fora de histórias que o edifício pode ter com base em sua altura. Então a variável X vai ser oculto. E então por que vai ser o número de andares? Você até agora, tão bom Você pegou o X e Y antes de seguirmos em frente e antes de dividirmos este X e esposa está lá para treinar e data data data como temos que convertê-los em NPR A. Neste ponto, eles estão em Banda State. Um quadro para você ser capaz de usar s Kaylan algoritmo de regressão linear simples. Você precisa convertê-los no dedo do pé. É muito fácil apenas o dedo do pé fechar este ano e, em seguida, dizer valores. Eu faço a mesma coisa para o outro cruzeiro e digo valores. Até agora,
tudo bem. Em seguida, vamos explorar o conjunto de dados em dados de trem e teste Como estão, a dor e
o gosto impedem de sua seleção de modelo Kalen Dart. Importação de grãos servidos e agora escolhe 10 x Apenas por que a dor? Porque é que vai ser o Dean. Gosto desesperado X e por prato para salvar Ele vai ser 0.2 em um estado aleatório vai ser zero nesta escolha impressa Cadeia X. Just Why Team? Por que só nesta jornada? Muito bom. Então temos os dados aqui. É bom. Então, em vez de alugar tudo, poderíamos ter sido decididos alfabetização estatal da mídia. Não, si 48 eram 48. Bem, incrível. Até agora, tão bom próximo a ser indo para fazer modelo de seleção de dados pré processamento é sua vez. É hora de selecionar o moderno, e é aqui que a parte crítica da seleção atual álcool Itália estrelas com base no que temos visto até agora é uma distribuição simples. E há uma relação linear rebatizada entre a pele. Qualquer história. Se um aumenta o valor de outro também aumenta, então é uma genética simples, realmente, vez que então vamos usar um modelo de regressão linear simples. E o modelo de regressão linear simples está indo do SK. Aprender com Eskil, Então escuro, anos
magros Mordor ele se mudou e no ar, Grécia, aqui. Eles ainda estão aqui. Clique que ele fecha no entanto o motivo. Ok, então agora a próxima coisa é drenar o moderno em argamassa. Por que precisamos tratar na argamassa? Alguma ideia? Pense sobre isso. É algo religião para calcular o coeficiente e branco enganoso.
14. Regressão linear simples que de regressiva 2 de demonstração Steps2: Por que precisamos fornecer dados de treinamento? Estabeleça esse modelo? Pense sobre isso. Sim, você conseguiu. O algoritmo está lá, mas cada simples, qualquer arrependimento e tem seus próprios coeficientes. Por que interceptar e seu próprio Beaven? O Ruby ocupado quando estávamos falando sobre a direita em que ocupado árabe ainda pode ser calculado apenas com base nos dados. É por isso que você fornece dados de treinamento, disse toe que modelo para que ele possa calcular os pecados graves para seus dados. Nós vamos trazer para aqueles Griff e vamos fazer aquele peixe preso desde aplicar interceptação
no comum para que é interceptar pontos lineares em seguida, o próximo é Print Griff e vamos ver grave oficiante mesmo em você pode obter o conselho Ingley quase doente, não desistir se túmulo na escola. Vamos ver aqui nós temos os valores ladrões que eu intercepto neste caso é menos 2,5 na tenda
penhascos é 0,7 ele então seu modelo está pronto. Sua biblioteca beytin tensionou ele vai com seus dados e ele retornou o coeficiente em interessados. Isso significa que tem essa diminuição aqui y é igual a menos 2.55 65 mais zero. Você está assumindo isso por morte extra, Equis. E ele derivou para seus dados. Em seguida, vamos testar estes coeficientes, modelos lineares, teste
tonto e fornecendo o testado é que é por isso que nós dividimos o conjunto de dados do trem foi para treinar o modelo para que ele possa calcular os coeficientes e provar como é para testá-lo . Se esse coeficiente que o meu intercepto que calculou, está lhe dando os valores corretos à esquerda. Com isso, vamos prever valores y. Por que o pão solicitar o no ano zik dot Prever em X dissed. Temos que ver a pergunta Agora estamos fornecendo dados X aqui e ele vai nos dar o Y sobre isso. Por quê? Nós nos chamaremos. Por que prever Licitra e então seremos capazes de comparar essa habilidade. O dardo está nos espalhando. Eles se espalham em Próximo nós estamos indo toe plotar a linha regressiva com X apenas e por que jogou bem e assim isso Vamos executá-lo a partir daqui Go! Dizem que a cor é igual a vermelho Agora temos os valores preditos brancos Esta linha vermelha é baseada no porquê dos valores previstos e parece muito bem, certo? Está entrando entre os dardos dispersos. Parece que é capaz de prever o comportamento. Se não é muito claro com um gráfico, nós estamos indo para o pé, comparar os valores. Vamos comparar os valores preditos por que com os valores de teste branco. E então saberemos. Ok, então vamos dizer que o F vai ser dardo BD fez, uh, tema. Vamos ter valores reais, é por isso que testar e que vamos comparar com o valor preditivo previsto
vai ser. Por que sublinhado previu aqui pret em. Agora vamos trazer para este querido telefone e vamos comparar 70 para 69 fora que grande era Teddy queria 2130 54 55. É bem perto. Os valores preditivos são muito próximos dos valores reais. Você sabe o que isso fazer separado gráfico que vai nos tornar que iria dar-lhe uma mais clareza, então eu teria que igual ao F um ponto cabeça tem 15 portas nesta trama. Se eles não têm que traçar tipo é bar em. Então são os números. Cinco é 16 10 no próximo basta colocar a medida e menor obter linhas para a mesma coisa para as linhas
menores. Para linhas menores. Sim, uma mina. Está aqui, Andi. Uma espécie aqui. Agora você pode comparar. Está muito limpo agora. Você pode ver o real abaixo. Os azuis são valores reais. E o nosso qualquer um não é previsível. Sim, muito bom, também. Parece que nosso modelo está funcionando. Ele é capaz de prever as histórias fora do edifício com base em sua altura, mas isso é apenas os 15 pontos de dados estavam comparando. Como podemos ter certeza de que todo o moderno para as 60 60 observações recorde é muito eficaz e vai predizer corretamente para dados futuros. Então, como podemos tranquilizar você que o modelo de dados que criamos os coeficientes e o porquê interceptar tornou-se dele e os segredos e nós viemos dele realmente está funcionando bem para
todos os dados set off 60 observação. Então, para fazer isso, há algo chamado métricas. Você sempre pode calcular o desempenho do seu modelo para Matic. Você vai importar, a métrica admitiu. Então, se matar, você vai importar médicos de matar os artistas modernos. Estávamos falando sobre o carro dele estar no núcleo. Também é chamado de modelo Score que vamos usar são para a escola de seus médicos matadores. É matar guarda importação são dois pontos sublinhados. Vamos fazer com que as suas poucas coisas significem significados absolutos posteriores. Mais silencioso. Eles devem escoltar. Vamos imprimir er para marcar primeiro. O sprint é feito com a escola, eo comum para isso é o nosso para sublinhar pontuação em então, ou aqui você colocar o branco apenas um valor. E então por que previu? Bem, muito bom. Menos impressos. A pontuação da artéria é de 84%. Nada mal. Não é acidente. Você sempre pode melhorar isso, mas 84% da pontuação decente. E também depende do tipo de dados. Se você falar com um cientista de dados, há uma opinião dividida sobre isso. Alguns fora dos dados. Os cientistas acreditam que quando se trata de regressão linear, modelo não é apenas arte com tribunal, que na verdade fonte o desempenho fora do seu modelo. Você também tem que olhar para os significados mais silenciosos e raiz significa É uma grande lista. Calcule isso no próprio para calcular que é, você só vai chamar este início métrico significa descanso absoluto e orgulho de l montado. Por que desprezou no caminho? Quero dizer, mais tarde é 4.1. Ok, seguir vamos imprimir o dedo do pé. Quero dizer, está quieto. Outro em Mais uma vez ele vai ser feito seis pontos significa que ele adquiriu If Why dist no caminho um pouco. Quero dizer, qualidade
é 31 a seguir, quando é rude dizer que é quieto. A inquietação em PDR escreveu fora o que significa líder de esquadrão. Então, estas são a métrica pela qual você pode salvar o interior. O desempenho moderno é bom ou não. Estes são todos em termos estatísticos e eu vou colocar eleitoral colocar um planejamento de produto detalhado cada um depois oh antes do mais Não vamos esquecer de salvar o caderno com os
nomes próprios . A propósito, você confinou cada um desses cadernos, o que quer que eu esteja escrevendo aqui, todos esses cadernos de Júpiter estão lá na minha esperança. Eu também vou colocar o link dedo do pé a levantar-se na descrição fora de algumas das palestras. Muito bom. Te vejo na próxima palestra.
15. Introdução em múltiplos regression linear: Olá aí. Bem-vindos à regressão linear múltipla. Parabéns por terminar. Simples. Liderando regredir e moderno em modelo de regressão linear simples. Você entendeu que o é disperso de dados. A variável independente na variável dependente pode ser relacionada por uma equação Muito dependente . Variável é igual dedo do pé. Por que interceptar mais coeficiente em variável independente? É uma fórmula muito simples para caber nos dados sobre se o seu projeto nosso estudo de caso em que você está trabalhando tem apenas uma variável independente em você está prevendo nossa variável dependente com base apenas em que uma variável independente na questão parece linear. Então você está com sorte. Você pode fazer rebatizado linear simples e obter o seu assistente NL. Obtenha suas previsões sob, mas geralmente você pode acabar em projetos como este. Estou tomando exemplo fora do preço da casa aqui, então o preço da casa depende de várias características. Um dos futuros pode ser a renda familiar. Qual é a renda familiar das pessoas que saem nessa localidade? À medida que a renda familiar aumenta, a acessibilidade aumenta para que o preço da habitação possa ser alto nessa localidade. A renda familiar média é alta, então os preços podem ser escondidos. Essa é a sabedoria Maravilha. Segundo recurso. Pode depender das comodidades dele. Se houver muito boas comodidades de trabalho, então sim, os preços da habitação podem subir. Da mesma forma. Crime que se a taxa de crime é alta nessa localidade do que os preços das casas vai para baixo agora, Considerado isso agora você tem uma variável dependente em três independentes, muito capaz de jogar em torno que é chamado rechristen linear múltipla. Como você vai prever o porquê Agora Você tem que ter uma fórmula em que você pode caber toda essa variável
independente através de sua fórmula. Você virá dela uma linha reta que realmente leva em conta toda essa
variável independente e a fórmula pode parecer algo como isso. Por que a variável dependente é igual a ser zero o y interceptar em, em seguida, aquele que é coeficiente para a variável um recurso um na característica Manuel Coeficiente distante para e característica para valor coeficiente para a característica três e destaque três valor. Então isso é um crescente de linearidade múltipla. É o suficiente extensões de regressão linear simples. Mas a regressão linear simples tinha apenas um dedo variável em torno de uma variável independente . Em caso de regressão linear múltipla, você terá mais de uma variável independente para brincar, mas ainda é um modelo linear. É ainda números contínuos e ainda é um linear, regredir e moderno no mundo real. Você pode ter algo assim. Você pode obter um gráfico de dispersão fora. Por que, você burros x Há pontos é pontos dispersos com base em diferentes valores de feição. Então você vai obter um dado com um monte de recursos em. Com base nesse recurso, você tem que prever variável dependente, e então você tem que vir dele. É fórmula através de seus dados de treinamento, Você vai calcular este bizarro B um b dois b três, os coeficientes dessas características e, em seguida, você vai derivar esta fórmula. Depois de ter derivado a fórmula com base nos dados de treinamento, então você é bom para ir tão sobre o nosso fluxo. O mesmo. Mas a única diferença é oriental fora de uma variável independente uma característica. Bem, você tem vários recursos? Bem, se o dedo do pé brincar, então você terá coeficiente múltiplo. Espero que você tenha uma distinção clara entre regressão linear simples e múltipla sobre como a regressão linear
múltipla e funciona. Vamos seguir em frente e vamos fazer um pouco de Hanson e então você vai obter o exportador de acordo com esta regressão linear
múltipla. Vejo-te na próxima palestra
16. Udemy Steps1 de MLR: Olá aí. Bem-vindo do pé Esta palestra sobre coalescência concreta você está fazendo um progresso muito bom. Estou muito feliz por você. Agora que você entende a regressão linear simples, será
fácil para você correlacionar as coisas e entender vários pedidos lineares após nosso é apenas mais algumas variáveis independentes. Certo? São tão boas. Então, vamos começar. Você já sabe? Sim. Importar biblioteca. Então vamos fazer isso. Muito primeira importação numpty como MP eu poderia preciso erraticamente passeado. Mas eu como com você para que você siga isso e você digita na mesma velocidade que eu estou digitando. Eu quero que você siga cada passo, e eu quero estar com você. É por isso que não estou copiando e colando coisas aqui. Estou escrevendo junto com você. Está bem, amigo, vamos a isso. Você colocou nos vínculo como importação de beleza Beeban como uma sentença sobre importação de sangue Matt I B B A sangue como beleza. Vamos executá-lo para ter certeza que eu não recebi nenhum tipo de Ok. Parece bom. Em seguida, você está indo toe importar o conjunto de dados no Director anterior, você já entende Onde estão os dados sentados e como obtê-lo. Uma vez que você tem que o conjunto de dados é informado em seu computador, você pode lê-lo em um estado panda. Um quadro de música? Sim. Leia. Sublinhado. CSP deixou com isso, a ética para a polícia Dark Beat sublinhou CS que conhecemos aqui, coloque a nossa. Colocar a estrutura completa do diretório, incluindo o nome do arquivo ou aqui definir é arto impedido? Nossos dados neste arquivo não estão ocultos. Então você vai escrever um odiador de comando igual a nenhum. O medidor diário vai ser para trás. Slash s e mais escrever cartas. Executa isto. Quero mostrar-te uma coisa. Ouça, Andy, se não for atingido, o que você ganha? Você pega os dados. Mas o cabeçalho. Olha para isto. Aqui diz 012345 Se você quiser manter o nome desse odiador, você pode dar aqui mesmo. Jessalyn nomeia Comando em. Ponham seus nomes aqui. Os nomes vão ser o 1º 1 é o meu esporão. Cilindros galões O próximo é o deslocamento. Esta colocação em, em seguida, nos hospital. Nosso próximo é peso. Cada vez que eu realmente ouvi mais no ano que Martin aqui na auditoria, mas em seguida o nome do cartão. Acho que terminamos. Está pronto para outra vez. Estamos bem agora. Temos todos os nomes, certo? Incrível. Então isso é algo novo que você aprendeu comparado com o diretor anterior que ponderou sobre isso depois dele. Você pode colocar o rebatedor como nenhum se você não tiver ido em seu conjunto de dados. E então você poderia orgulhar os nomes desses cabeçalhos usando os nomes. Vamos lá. Bom. Este aqui, WAAS Data Import. O que No estado começamos agora. Exploração de dados. Você tem isso. Data extra show. Não é a primeira coisa que vamos fazer é descobrir a forma dos dados sobre isso, não
é? Há 3 98 registros em nove colunas, 88 feições e um alvo. Então, totalmente, se você olhar para este cavalo de potência. Oh, desculpe. Enganei-me um espírito. Deixe recorrente este sábio Haverá confuso. Tão bom. Agora nós conseguimos. Vamos abrir os dados. E quando você abre os dados e você olha para esses dados, você verá alguns fora dos valores de potência têm pontos de interrogação. A primeira coisa é se livrar desses valores mais tarde que existem diferentes estratégias. Toe, se
livrar deste tipo depois que eles são ou dedo deletados são para substituir esses pontos de interrogação com o valor médio nossa média. Bem, há maneiras diferentes de fazer isso. Mas para esta palestra sobre apenas para compreensão, eu vou removê-lo e vamos brincar com o conjunto restante de dados. Vamos remover isso. Vamos executar este comando. Nosso quadro de dados DF é igual a dois DF ponto drop porque vamos soltar algumas observações. Claro que sim. Então DF você tem o dardo pergunta de poder cavalo no mais próximo de ouvir Liberace fez bem em menos bonito de cabeça escura. Ele não gostava de alguns Usando dados de objeto não tem nenhum atributo. Dura, Bob. Mas ainda tenho no Haas. Mas tudo bem, vamos fazer de novo. Veículo. Então nos livramos das bacias posteriores, que tem ponto de interrogação no poder passado. Vamos ver o cofre de novo. De Deus agora é 3 92. Isso significa que havia seis linhas de dados lidos trabalho pergunta em valor de
cavalos de potência, e acabamos de nos livrar deles. Ok, vamos mais. Se você olhar para esses dados, a potência, é muito compreensível. Valor de potência será um numérico, mas porque alguns fora os valores foram ponto de interrogação dependem de um estado de um quadro com Quando ele tomou os dados do conjunto de dados aqui, ele pode não ter considerado o poder do cavalo como um dedo do pé numérico. Descubra isso. Vamos executar este comando DF dardo aplicar mapa. Quem está aqui? Você vai dizer e p dot está bem. Andan-lo. Olha para isto. Diz MPT é verdade que Sra eles são Todos os valores são numéricos Israel números cilindro . Sim. Deslocamento numérico Americal Patasse Power. Olhe para a sua queda. Essa foi a data até quadro não considerou cavalos de potência como um numérico. Então, o que fazemos? Precisamos converter dame toe numérico isso para que d f barra de hash com ponto pd para sublinhar Medic DF mais uma vez Harsh poder a função de atum médico na classe de quadro Banda Aceh Data Nós
convertemos a potência para uma coluna numérica. Ok, vamos continuar. Vamos ao redor do mesmo comando novamente. Está correndo. Então isso se tornou um verdadeiro numérico remanescente, que não é um romance, Lewis Carnie. Fora isso, todos os outros campos são numéricos. Quem está agora? Vamos descobrir se algum deles não tem poço, certo? Isto é tudo parte após o imposto fluorescente. Você já sabe que este D de dardo não é em algum território controlador ou aqui nenhum deles não tem valor. São Shem em boa sorte. Terminamos com a Basie verificada em dados na exploração de gravatas. Mas aqui vem a parte divertida. Quando você tem tantas variáveis toe play em torno de tudo para fora, essas variáveis podem não ser necessárias em seu modelo de dados, você tem que entender duas coisas muito importantes no caso de você ter tantos muito de primeiro, nós os chamamos de independentes variável, e esperamos que eles sejam Notley relacionados uns com os outros. Então, a primeira coisa, vamos descobrir se alguma dessas variáveis está relacionada uma com a outra. Isso significa que se um outro crescimento também cresce em valor, você enviou tipo off relações existem entre a variável independente. Então não precisamos dessas variáveis. Não precisamos de pobres durões. Essas variáveis em nossos dados são mais modernas. Só precisamos de um deles. Então isso é o que é chamado multi chamado genialidade. E é isso que vamos descobrir se alguma das nossas variáveis independentes tem
genialidadelegal de Mutti genialidade
17. Udemy Steps2 de MLR: Ok, então existe uma questão muito simples de encontrar Metical na caridade, existem vários modelos. Vários assuntos estão encontrando multi Colin ality. Vamos verificar para fora deles um que eu considero como um modelo simples em que é chamado de
descobrir o Cory escuta entre essas variáveis independentes. Então, se você apenas um d de núcleo escuro e, em seguida, isso lhe dá uma métrica aqui em, você pode muito bem ver como essas variáveis estão relacionadas entre si? Então, se você olhar para cilindros, é muito alinhado e dependente do deslocamento, Tia Horsepower em vit. Então essas três variáveis, elas estão muito relacionadas uma com a outra. Cilindros, deslocamento, potência em vit. Então aqui temos uma linearidade multi-núcleo. Há mais um assunto que é chamado de cálculo de variantes inflates e fator menos para aquele. Agora, no poço, sabemos que os cilindros deslocam um hospital e esperam. Eles estão muito relacionados um com o outro. E nós temos uma alidade multi-corden em nossos dados. Então agora estamos indo trabalhar no fator de inflação variantes também cartão V i.
F. Radiance no lugar e eficaz o I f. Carreira
menina. Então, o que precisamos para calcular variantes? Inflaciona e fator primeiro e acima de tudo, precisamos importar as funções necessárias da biblioteca necessária deixada com isso. Então, neste comando, a partir de estatísticas modelo ponto começa começar variantes de importação influência distantes, fator de
inflação. Este é o funks, e nós vamos usar vários inflates e fatores. Então, uma vez que você importar
a função, a próxima coisa a considerar é que estamos indo para calcular variantes em carne e fator entre variáveis
independentes. Então a primeira coisa é, nós não precisamos de variável dependente como mpg. E segundo, para calcular, variante, altruísta e fator. Primeiro temos que converter todas as variáveis em Tippett Dent em números numéricos. Não pode ficar são engraçados, Merrick. Então vamos fazer isso primeiro D f um é igual a d f ponto Obter novos dados médicos. Ok, então nosso X está indo Toby dier telefone ponto drop E daí? Quais são os atributos? Vamos cair? Já discutimos sobre MPG. Nós vamos soltar MPD porque é uma variável dependente em Edison Toe que eu estou sugerindo que nós deixemos cair origem aqui porque eu não acho que isso vai contribuir muito para o modelo. Como vai o carro Neymar origem vai toe contribuir para o modelo fora MPT quando temos
tantas outras variáveis para brincar como o Hospital Deslocamento? Se ele realmente ouviu Marty Então vamos nos livrar disso agora em então vamos
dizer curso de acesso não é É apenas um comando muito simples para se livrar de qualquer atributo em seus dados de, até agora, tão bom. Mas vamos executá-lo para ter certeza de que importamos a função correta. Vamos fazer isso. Agora vem a festa divertida de variantes infla VfR infectada para o que
vamos fazer é criar um instantâneo fora do quadro de dados Classe pd ponto equipe aqui Tandon v e.
F. F. Seja um efeito. Brincadeiras mais ocupadas. Nós vamos chamar que variantes de função no lugar e afetados no passado desvaloriza valores X . Precisamos passar cada valor X um de cada vez, e é por isso que vamos executar uma sala distante tipo de coisa aqui para I nele em X dardos. Ip um. Entendi. Bom. Nate BF apresenta igual ex colunas ancoradas neste cartão VF rodada, mas ok, vamos executar isso. Ok? Tenho algo errado. O que é VF características foram X. Oh, novamente, Typo! Não que tenhamos. Certo, agora vamos dar uma olhada nisso. O Tumblr Elise. Qualquer valor com VF maior que 10 você deve se livrar deles. Comece com aquele que tem o maior valor aqui. Tem o mais alto. Bem, então eu vou remover o peso primeiro. Ok, vamos rodar de novo e dizer qual foi. Em seguida, temos mais ainda modelo que fez estudo em cilindros. Cilindros tem maior valor Então, em seguida, vamos remover cilindros. Muito bom. Estamos chegando perto. Ficamos com você, na verdade. Arison em Marder. Marder tem maior valor. Então vamos pegar uma agulha. Aqui é o Marty Model. O que temos agora? Deslocamento e potência. Vamos nos livrar do hospital. Estamos nos aproximando, vê? Na verdade descansa e já é inferior a 10. Então isso é bom para ir. Certo, vamos remover o hospital. Assim disse que fizemos tantas coisas para o poder dos corações. Gortari se livrou da pergunta que Waas converteu para o valor numérico. Mas agora não precisamos dessa piada, certo? Ok. Ok. Vamos fazer essa bunda. , Finalmente, temos dois deslocamento variável independente em, na verdade recente, e esses serão parte do nosso modelo de dados. Olha para isto. Isso é chamado de exploração de dados. Quando você entende seus dados, sua vida se torna muito fácil. Começamos com oito variáveis independentes, mas agora, quando se trata de criar nosso modelo, sabemos que não precisamos de seis delas. Só precisaremos tirar essas variáveis independentes do crítico MPG. Bom trabalho antes de concluir a sua razão PLO imposto e passar para a carta de processamento de dados pré para mais uma coisa. Vamos desenhar. I dispersão gráfico fora este dois deslocamento variável independente e real surgido em. Vejamos, haveria um dedo esquerdo mais pesado que eu conheço aqui. Vamos usar a função “save on” chamada “Bear Enredo”. Pierre Brock, esta é a primeira vez que você está usando até que você vai adorar. Urso largo TF um em X. Isto está indo, Toby, Esta colocação Andi atividades em sobre por que nós vai ser o nosso mpg. Pequeno tamanho é o ponto C um e salvar a beleza. Roshal, você levantou. Vamos aumentar o tamanho. Parece muito pequeno. Certo, agora acertamos. Sim, eles parecem um crescente re linear. Bem, sim. Eles parecem um bom ajuste para múltiplos rebatizados lineares como este. Olha, comportamento
Selenia. Isso também parece um comportamento gentil, terrivelmente próximo. Eu posso traçar uma linha aqui, e bonito, mas parece que um enorme é macio. Davidson está por aqui. Árvore polinomial batizada pode ser um ajuste melhor, mas, hey, nós tivemos uma regressão linear múltipla eleita em Eu acho que múltipla regressão linear e se encaixa bem para ambos fora deles. Nosso recurso seleciona qualquer etapa não terminou até agora. O que fizemos foi o tribunal ler a genialidade multi-core. Isso significa que pegamos a leitura das variáveis independentes que estavam muito relacionadas entre si. Ainda temos que usar. Ainda temos que decidir quais dessas variáveis têm o maior impacto em seu
produto confiável . Você pode começar com, por exemplo, 15 20 em recompensas, e você é deixado com este recompensas disseminadas são talvez 56 no relatório depois de ser
demitido médico em caridade. Agora você tem que executar os restantes em triplos em mais uma rodada off selects e processo e há vários processo de seleção são nível em vários modelos de regressão linear que irá ajudá-lo a descobrir se alcançar entre os restantes independentes ser consideradas para seus dados finais. Argamassa um fora Esses critérios são chamados de retroceder. Alamin não está ligado. Esse é um que vamos usar para este morteiro. Há vários. Há eleições muito piores. Há eliminações para trás e eles são sótãos bíde. Nel l um minuto desde que eu vou explicar cada um deles.
18. Udemy Steps3 de MLR: Ok para usar o elemento para trás, não é? Primeiro, importe os fundos necessários das bibliotecas necessárias. Vamos importar. Há mártires ponto a p a. Então, neste ponto, se você olhar para isso, nós pegamos uma fórmula, é por isso
que igual a B zero mais está vindo. Este b zero pressione Beaven excelente mais B dois extras quando Por que é realmente nosso mpg é igual pouco
ocupado vai ser uma constante em então ser coeficientes em este vai ser esta colocação em mais uma vez Beato Outra piada desde ou aqui e este vai ser. Na verdade, não
é para fazer eliminações para trás e trabalhar. Nós temos que colocar a variável independente aqui também, não pode ser apenas para ser através, então a maneira como ele funciona primeiro temos que dizer mpg igual a p zero em um E então esses valores aqui. Então isso se torna a nossa fórmula. Então isso significa que temos que ter mais um recurso adicionado a esta tabela e esse recurso tem valor apenas um Soto Adicionar que há um comando muito simples. Vamos dizer que X é igual a dardo sm em constante e é isso. Ele vai adicionar uma linha constante com valor um para X, vamos imprimir X e então você vai entender. Oh, aqui. Por isso, adicionou mais uma constante de cartão de recurso, e ele transportar este bem com 1111 conteúdo, deslocamento acelera. E isso é bom para ir a seguir ou aqui. Vamos continuar com isso só vamos entrar. Este tipo, Grécia, senhor. Soilless. Esse é o nome que vamos mostrar. Nós vamos criar. Podemos colocar qualquer nome aqui. E eu gostaria sim, início
semelhante Quayle s Y em X, nós vamos encaixá-lo. E agora vamos imprimir o resumo, está bem? E vamos fazer isso muito bem. Então, o que estamos procurando nisso? Estamos procurando por esse valor ser maior do que hífen. T em qualquer valor de feição. Maior que 0,5 é significativamente com sua ponta de cinco. Então há uma grande teoria sobre o quê? É P e vou escrever um bloco sobre isso. Andi, vou colocar como uma das palestras. Se você quiser entender o que é ser o que hipótese nula e como isso ser trabalho. Você pode passar por isso. Mas por agora, entenda o que estamos procurando aqui é para qualquer valor futuro este aqui ser maior do que D não deve ser mais do que 10,5 se for mais do que 0,5 o que é o caso aqui para real Sursen. Usado para se livrar desse recurso que eu conheço Aqui, olhe para a única condição. O número é grande. Um. Encontre este número de condição aqui. Isso pode indicar que existem fortes Metical na realidade são outros novos problemas médicos . Isso significa que mesmo depois de todos esses exercícios aqui, nós não poderíamos nos livrar de um fora da narrativa de resfriamento. É muito forte, realmente sincero, entre o deslocamento acelera. E, como vimos em Cory razão aqui, deslocamento e realmente ouvir, eles eram muito relacionados. 0.95 É um número muito alto, mas não conseguimos nos livrar disso quando calculamos Ivy fora. Mas ou aqui quando fazemos este resumo, é, ainda
está indicando que você deve se livrar de acelera e para o seu modelo final. Então vamos fazer isso. Vamos ser lidos. Na verdade, surgiu. Vamos investigar esse cara de novo. Digamos que x igual a ex gota escura. Ok, vamos 22º é claro, são artistas Coro vai cair. A razão pela qual nossa cidade fantasma quadrada você adiciona mais variáveis. Artista bastante vai subir se você reduzir o número de variáveis. Carro artista correu para baixo. É por isso que dizemos no mundo da ciência de dados que quando se trata de entender se o seu modelo de
dados está funcionando ou não, não
é apenas o nosso silêncio. Há várias outras coisas. Mesmo eu vou quadrado 0.6 Pode ser um bom moderno porque depende de muitos outros fatores . Dedo, Ok, deixa um. Portanto, não há pico mais tarde do que o orçamento de Fife, bem como condicionado desceu. Então esse aviso é que a corrida desapareceu, então parece que temos um bom moderno. Agora temos o dedo brincar com apenas um deslocamento variável. Olha para isto. Começamos com oito variáveis independentes. Mas quando se trata de criar o nosso modelo e passando dedo do pé, que modelo a variável vitesse um forte efeito sobre a nossa variável alvo. Ficamos com apenas um e que ele se desloca. Essa é a palavra que fora de seus impostos. Florissant, você está na parte certa, meu caro amigo, menos quero que já parte profunda de pessoas maiores sentadas porque temos nosso X e Y Pronto Agora temos toe criar nosso conjunto de treinamento na data de teste nós que é muito semelhante ao que você fez em rebatizar linear simples a partir de s escala e não modelo seleciona. Um dia de avião de importação é invertido. Ex trem X dist. Por que adolescente? Por que dist ele Quest Train gosto é flagrante. X y gosto Tamanho é igual a ponto de Onda. Este dia vai ser zero. Sim, sendo que se estende, vejo ex dist. A Darcy. Por que 10? Por quê? Só ponta escura. Uh, por que Justiça? Sim, acertamos. 3 13 para trem extra in e 79 4 decks teste. Até agora,
tudo bem. Agora, isso entre o nosso modelo de SK Aprendeu Dart no ano importação moderna Dean Muito bom no ano
Limpo Sublinhado Rick igual a 18 ano graça. E em um bom próximo. Nós estamos indo dedo no modelo e é semelhante ao que temos feito em Simple in Eric. Ouça, Asham, nosso modelo está treinado agora vamos prever o próximo caminho. Vamos prever y baseado no teste X. E isso é para vir aqui. Muito bom X. Por que previu lá? E agora vamos comparar Desvaloriza Lifton. Vamos entender o quão perto estamos em nossa previsão comparados os valores de Y aproveitados. Por que testar como fizemos no modelo linear, certo? Deixou com isso. Ok, fiz este comando. Ou aqui 28 29 22 26 12 13 38. E lá eu acho que parece muito bom. Em poucos lugares, está longe, como 38 28, mas poucos lugares é muito perto. 28. 29 em 12. 13 33 29. Nada mal. 1920 não foram ruins. Sim, parece-me muito bom. Vamos imprimir uma distância e traçar o valor do gosto Y por previsões e valor em que nos
dará uma boa idéia fora. Como poderemos prever os valores Y até agora? Espero que já saiba traçar distúrbios e sangue. Eu sei que você escolhe. Então esse é o Senado. Comece a não provar sangue. Nosso Por que apenas Nós vamos dizer cor é igual se eles são e vizinho ele cita realmente valores. E digamos que não queremos o telegrama dele. Então o Equus dele, os fundos e vamos fazer o mesmo para limpá-lo. Mas desta vez vamos longe demais. Eu rezei para que nós vamos dar cor como verde e nós vamos dedo do pé colocar o rótulo como
valores preditos aan den. Aqui seria um pouco, e se assim
fosse, apareceu. Dido é bom. Vamos ver. Bem, aqui eu acho que estamos bem perto, certo? Olha para isto até ao MPC 10. Estamos muito próximos um do outro, mas e depois disso, há algumas variantes aumentadas. E depois disso, temos um jogo perto. Portanto, este é um moderno razoavelmente bom que temos trabalhado em que desenvolvemos. Esse é um modelo muito bom em um dados do mundo real. Não se esqueça, este é um estudo de caso real feito pela universidade e somos capazes de prever muito perto
neste modelo é muito bom modelo que temos trabalhado. Você deveria estar orgulhoso de si mesmo. Te vejo na próxima palestra.
19. PolynomialLinearRegressionIntroduction: Olá. Havia esse Lecter em rebatizado linear polinomial. Parabéns por completar rebatizado linear simples Você já entende. Regressão linear simples significa que há apenas uma variável independente sobre ele é dedão obscuramente liberado. A variável dependente no proprietário do farm é dependente. Variável igual a. Por que interceptar mais coeficiente Beaven em variável independente? É um fazendeiro aqui. O que é regressão linear múltipla? regressão linear múltipla é a extensão quase. O Grissom. Por aqui, há mais de um valor de recurso toe play ao redor, então por que é diretamente depender de valores de recurso? Mas há mais de um valor de característica, e é por isso que há mais de um bastante adequado no caso de uma festa, nem eu, um rebatizado lenient. Por que a variável dependente não está apenas diretamente relacionada com o recurso, mas também é baseada no valor exponencial fora do recurso. Por exemplo, olhe para esta linha. Não é uma linha reta, é uma linha de cartão. Se você encaixar esta linha de menina em uma fórmula, ele vai se parecer com isso. Por que eu poderia fazer B zero. É por isso que entrar Dica mais B um café enviado em sim mais B dois em X é silencioso. Então não é apenas X, é X em X, e é por isso que você pegou essa linha de ouro. Se você é pontos dispersos olhar como este, em
seguida, esta linha irá resultar em reboque. Linha curva. Mas ainda é uma linha. É por isso que é chamado de linear. Mas chama-se polinômio porque estamos aqui. Sua variável dependente é polinomial off variável independente. Espero que tenha percebido a diferença entre regressão linear polinomial em outras
digresses lineares . Como uma razão genética simples e múltipla. Ficará mais claro quando você fizer o projeto mão-filho. Você vai ver na próxima palestra. Vejo-te na próxima palestra.
20. Gravação linear polynomial 2: Olá aí. Responda. Você está muito animado com o modelo de regressão linear polinomial, e eu sinto o mesmo. Você vai usar o mesmo caderno de modelo de regressão linear múltipla. Então abra o caderno antes de começarmos polinômio. Concordo mesmo? Crescent, quero que faça mais uma coisa, que é desenhar um gráfico de dispersão completo. Expulsar você em completo. Por que os valores previstos usando regressão linear múltipla. Então vamos fazer isso. Vamos dizer isso. Bloco de dispersão em um Pierre de dardo está espalhado. Vamos colocar o X. Por quê? E dizem que a cor vai ser. Dizem azul. Certo, próximo. Então este é o valor completo de X e y. A seguir, vamos dizê-lo. Espalhe mais uma vez X E agora vamos colocar os rivais previstos, não avivamentos tão juntos previstos por valores Muito dedo do pé copiado. Isto daqui. Coloque-o aqui no teste “enterrado”. Vamos dizer x na cor. Vamos dizer que vai ser,
mas é um ponto barbudo e se assim você faz. Aqui você vai a linha vermelha waas Os valores previstos e este azul são os reais. Lembra-se? Eu te disse no início que isso parece mais uma diminuição linear polinomial no que eu significava para nós em vez de criar um se uma grande linha. Se você olhar para este pontos dispersos, eles se parecem mais com uma luz de carro de linha de cartão. Então, se colocarmos uma linha como esta, um Colin que se encaixe melhor, então apenas uma linha reta. E essa linha de carros vem do Paul na nossa refeição. Rebatizado linear. Então é isso que vamos fazer agora. Toda a exploração de dados que fizemos em múltiplos lineares, imprudentes, e vamos continuar com a mesma coisa. Não vamos refazer tudo isso. Vamos supor que o melhor modelo vai ser a variável independente será deslocamento em. Estamos indo para o pé. Preveja o mpg para que a exploração de dados não seja necessária. Continuaremos de onde vivemos para ele. Mlr que em múltiplos lineares. Ouça. E agora vamos fazer o processamento de dados pré muito polinomial linear arrependido dados esquerdinos três processamento para Polly Norm Ano ainda. O Grissom. Certo, primeiro
temos que importar a biblioteca correta. Sk len Não, mas ele processando. E daqui, vamos importar Polly ou Mia. Ok, Em seguida, vamos criar a instância fora desta classe. Vamos chamá-lo de Polly Bali nem características de refeição. Temos a instância. E agora o X Polly vai ser o Bali Dart em forma, escolha Transform. Vejamos, acertamos até agora. Então você precisa executar o caderno completo, ok? Sim, sim. Aqui também. Vamos lá. Vamos ver. Parece um tipo de outra vez. É matar, não censurar. Uma coisa. Está tudo bem. Ok. Bom. Agora, a próxima, isto vai ver este ex poli. O que contém agora? Então vamos dizer que o coração B fez, uh, frame x exportação é por isso que eu estou convertendo para um dado para ele para obter o melhor. Veja melhor compreensão nesta primavera,
os primeiros funerais aqui. Veja melhor compreensão nesta primavera, Vamos ter passado algum tempo compreendendo este zero. É um valor constante. 111 Não vamos nos preocupar com isso. Este é o valor do
deslocamento, o valor do deslocamento é o valor zero, certo? A. Ele precisava de um 73 50 TV e fazer os mesmos valores, modo que estava correto. Mas o que é A segunda coluna adicionada pelo recurso polinomial pré processamento. Você entende isso? Isto é simplesmente Esquire fora esses valores aqui, 94249 é bastante depois 807 para usar para 50. Este coro fora 350 Lembre-se, o que era uma pergunta para o Miller? Regressão linear múltipla. Regressão linear múltipla. Waas. Por que é igual B zero em um depois disso, mais B um em X agora qualidade descascador polinomial normalmente Nicolas e pedidos e tornou-se Por que igual a ser zero em um mais ser um em X. Então, é lá em um dedo decente que ele adicionou Beato em dois X é silencioso aqui, então expandiu a equação. By the way, quando criamos a instância de características polinômios, temos que aprovar um decreto e se você não aprovar decreto, ele assume também. Então, digamos que assumiu grau quanto a. Mas se eu disser três, vamos ver o que acontece aqui. Ele vai colocar exponencialmente. Ele vai colocar X três aqui, então nós não vamos para lá. Vamos limitar-nos a dois graus no próximo Lector, vou dizer-lhe o mistério por trás disto para, uh sobre mistério por trás desta licenciatura. Por que isso é importante? Então entenda que a pergunta mudou. Agora não se limita a ser apenas um. Excelente. Ele adicionou B dois x esquire. E se você aumentar o grau ele vai continuar se estendendo que vai enfraquecer. Seja três mais raios-x para três. Pressione antes em excesso para quatro. Como isso. Então, até agora, tudo bem. Você entende o que aconteceu agora, você tem o valor X e o valor do coral em excesso. Não. Certo, então esse é o seu ex poliéster. Então as pessoas de dados através das coisas mudam o que vem a seguir? Em seguida, temos toe fit este dados toe pedidos lineares e moderno. Então vamos chamá-lo de mais ajuste de endro. Polly Dark ajuste em X polly. Não muito certo. Assim qualidade começar os pés habilmente e, em seguida, certo. Ok. Então este é o nosso modelo polinomial. Estamos nos encaixando com habilmente e branco. E agora vamos chamar a nossa Lynn Neary Grayson. Então vamos criar uma instância fora. Mesma regressão linear classe matemática ano magra rebatizado aqui. E então nós vamos encaixar isso com nosso ex poliéster e rival assim x sublinhar Polly. E quando virem que isto é bom. Ok, então nosso modelo está em forma agora, nós podemos você, Theis, e prever valor y. Então vamos ver porquê. Predição. Certo, então por que sublinhar? Digamos que Polly colocou que vai ser terra. Faça isso quando você sabe, começar a prever o mesmo é o que você fez durante a regressão linear e ou aqui estamos indo
caminho do pé o valor X polly, que é aqui corpo duff transformar. Certo? Então, apenas mas o X Party Bem aqui. Ok. Na morte Nosso Por que papagaio Polly que também correu bem em uma comparação menos desenvolveu o valor
real certo com por que o valor previsto usando Corey diminuição normal e dedo do pé moderno comparar que tivemos os tribunais e estamos aqui. Vamos usar o mesmo. Oh, aqui, baby. Então nós vamos dizer que desta vez você tem que fazer você tem que neste aqui vai se tornar nosso y Rezou em vez disso eu rezei que será y Polly rezou em vez disso fora. Por que testar? Vamos usar o caminho completo. Muito bom. Olha para isto. 18 15 59 15 14 18 15 16 15 15 Este parece uma previsão melhor. Disse-me que ficará mais claro quando trotarmos. Gráfico de dispersão. Então vamos desenhar. Eles dispersão gráfico novamente é mantido separado. Isto vai ser visto e agora a este, no nosso seguinte, são meras previsões. Então isso vai ficar bem na cor com a taxa de Ruthie. Digamos que pintado à mão verde. Muito bom. Olha para isto. Nosso novo polinomial re Crescent trouxe-lhe a linha curva. O que eu estava falando e que parece melhor do que a linha reta. A previsão. Porque a natureza dos pontos de dispersão aqui parece ouro. E esta aqui, a linha do cartão. Acho que está dando uma melhor previsão. Que tal olhar para o nosso para marcar? Vamos ver isso. Vamos ver se há alguma melhoria no nosso para marcar. Então nosso dedo marca empresas, Sim, K muito bom. Em seguida, imprima no seu núcleo. Mas, uh e isso vai ser nosso para sublinhar seu núcleo. Então por que valores reais? Então eu e, em seguida, protegido Wells aqui na Nike Ways esquerda impresso, o são para marcar para descascador. Provavelmente se arrepende de estagiário normal sobre este aqui será por que, Ok, vamos executar isso. Oh, aqui. Portanto, há melhorias no nosso para o seu núcleo para fora. Então o são para marcar quatro mlr foi apontado para ele e para pilar para a mesma data como é 40.68 ele para que este status, ele parece um melhor ajuste para polinômio rebatizado,
em seguida, jumiller. Então essa é a vida da ciência de dados. Quando você obtém os dados, você pode fazer suas rajadas fiscais e entender os dados. Mas você ainda pode não saber qual algoritmo vai caber melhor para esses dados. E esta é a prática que você vai acabar fazendo. Você vai fazer você se encaixar em um algoritmo. Obter seu são para marcar, obter suas previsões, e então você vai tentar outro gravado. E então esse algoritmo pode dar um escritor melhor do que o algoritmo anterior. Isso significa que você está seguindo em frente. Você está melhorando. E foi isso que fizemos neste exercício. Tentamos prever a eficiência de combustível. Usando regressão linear múltipla. Temos 64% para marcar e a previsão é muito boa. Mas melhoramos usando rebatizado linear polinomial. Então pólen normalmente perto imprudente e para nós obter um melhor resultado 10
regressão linear múltipla para este conjunto de dados. Muito bom. Vejo-te na próxima semana.
21. KNN Introdução: Olá aí. Bem-vindo ao algoritmo do vizinho K mais próximo. Antes de eu dar um mergulho mais profundo em K e um algoritmo que nós levamos você através de uma
distinção muito importante entre diferentes nosso ritmo. Em Há modelos paramétricos e não paramétricos. Você já passou por regressão linear simples, regressão linear
múltipla e sótão lini polinomial. Ouça em eletiva anterior em uma reunião de comportamento notado é que todos eles têm a pergunta dedo seguir em frente. Com base nessa equação, eles derivam a variável dependente. Por quê? Então essa é a pergunta complicada parâmetro. Já existe uma fórmula que eles seguem. O conjunto de dados de treinamento é adequado que os coeficientes de fórmula são derivados e apostar nesse coeficiente. A questão é completa sobre o resto fora dos dados como dados de teste. Os nossos dados futuros estão a pé no equipamento. Com base nisso, D y é derivado. É assim que os modelos paramétricos funcionam. Depois, existem modelos não paramétricos. Os modelos não paramétricos não têm tal pergunta. Eles analisam o comportamento dos dados
e, com base nesse comportamento após os dados, prevêem a variável dependente. Então essa é a diferença entre modelos paramétricos e não paramétricos. Decaimento e modelo é modelo não paramétrico. Isso significa que não há fórmula fixa. Nossa equação que eles seguem muito bem agora que você entende que Cayenne em é um elevador moderno não paramétrico, entender como pode e funciona. Então, digamos que você estava executando uma campanha de marketing com base em certos parâmetros certos recursos de seus clientes, talvez idosos, homens ou mulheres, sua localização, sua renda familiar. Talvez com base em que você descobriu um comportamento com um partido é o seu produto, são eles não. Mas é o seu produto. Então, se é sim e não. E se você traçar um gráfico, isso é o que você recebe. Todos os pontos do dia são o não ponto. Agora considere que há um novo cliente nova pessoa nas mídias sociais, nosso onde quer que você esteja executando o acampamento de marketing e você tem que prever onde essa pessoa vai comprar o seu produto ou não. Então, basicamente, você tem que prever estranho. Neste ponto, esses dados pertencem. Pertence aqui? O que é sim, mas pertence aqui? O que não é como o algoritmo não, nós estamos classificando este ponto pertence. É aí que entra a caiena e o algoritmo. Imagine as férias e o algoritmo funciona. Ele decide se afastar desse ponto baseado em seus vizinhos. Mas a questão é quantos alguém quer considerar? E esse é o Cavell. Por exemplo, se eu ver, Eu quero considerar três vizinhos em torno dele solidez de que três vizinhos em então maioria leva que este não é neste caso. Há dois pontos no lado sim um ponto no lado norte. Então este ponto se tornará s que com esse cliente que você está analisando, ele está indo toe comprar seu produto que faria com uma previsão O que Iphigenie Este gato cinco as previsões e mudanças porque agora há três pontos no lado norte e dois pontos no site F. Agora este ponto se torna nenhum pai significa que a previsão é que este cliente não está indo toe partido s seu produto. Assim, com base no cabo, a previsão muda. Há uma lógica que Tobie seguiu. Será que eu tenho isso? Deu um loop e ele vai pousar é enquanto vamos passar pelo projeto Hansen na próxima palestra. Foi outra coisa dedo do pé? Considere dizer ao algoritmo que considere gays como cinco. Mas como o algoritmo saberá quais pontos vizinhos considerar? K é cinco, de modo que vai considerar cinco pontos vizinhos, mas que ponto vizinho considerar. Dizemos a esses pontos para considerar então eles consideram essas teses e esse
ponto de luta também reconsideram essas teses cinco pontos que cinco pontos a considerar e é aí
que a lógica do cálculo da distância entre este ponto, o ponto previsto e o ponto vizinho vem em Pedro. Há três lógica distinta nossa capacidade de considerar esta distância 1º 1 é você limpar a distância que levará X um após este ponto com o X um fora do ponto vizinho encontrar uma diferença é coro que diferente semelhante violento neste ponto e Por que eu fui atrás ponto
vizinho e ele vai tirar um total fora que ele vai fazer isso para cada um fora os valores aqui e para o qual você era comunista E ele acha este valor como o menor seus dentes, o comunismo fora de luta vizinhos que ele vai considerar Obviamente, neste caso, descobrirá que a filha e esta rota do coro do total serão os mais baixos para este comunismo. Então considere quanta competência e tem que fazer Tem que primeiro encontrar a diferença para cada um dos pontos de dados. E então ele tem que encontrar esse número único um pontos baseado no K para o qual esta distância é mais baixa. Tanto cálculo. E tem que fazer para pegar os vizinhos gauleses. E é por isso que selecionar K é um papel muito importante em K e um algoritmo. E, claro, você vai entender que quando você faz as mãos no projeto por enquanto, eu acho que você sabe como esta caiena legal e coisa funciona, como ele calcula a distância, como ele descobre quais vizinhos Considere. Então este é um após a lógica para calcular a distância Euclidiana e há várias outras lógicas como esta. Dê-me salvar distância em Manhart e distância tem uma distância segura é máxima fora dos valores
absolutos nas distâncias de Manhattan o total após absoluto bem, use a diferença. Ok, incrível. Eu acho que você entende K e o suficiente. Te vejo na próxima palestra.
22. Passo de KNNRegression 1: Olá. Chegará a isso. O Richter. Parabéns por completar a regressão linear simples. linear múltipla na regressão linear polinomial. Você já teria notado que eu tenho o mesmo caderno aberto. Então vamos continuar usando o mesmo caderno. Mesma data em que está. Vamos melhorar os são para marcar basicamente a nossa previsão usando outro algoritmo neste momento é chamado de gays. Vizinho mais próximo regredir um algoritmo K vizinho mais próximo. Eu vou para o resultado de re crescente nas classificações Celeste aqui. Neste caso, temos um dado contínuo. Então vamos usar a análise re crescente para prever o valor do MPC. Vou chamá-lo de K. E daí em diante, antes de começarmos Cayenne e algoritmo, deixe-me fazer mais uma coisa. Terminamos nosso Lecter anterior aqui, onde comparamos a arte com a pontuação de Millar e Peeler. Mais recente melhorado. Estas letras tinham média raiz é bastante erro para isso, porque isso é outro critério visto comparar algum tempo raiz média é bastante erro é mais importante do que artista marcou. Então é por isso que vamos fazer isso e comparar metade dele. Então vamos fazer isso. Então, primeiro nós vamos importar a partir deste Kailyn Dark Medics importar significa é escure-lo em. Nós também vai precisar de met é festa tranquila rota Sq. Muito bom. Nós já abrimos o nosso para marcar mais tarde. Corra a rota. Quero dizer, é quieto, não
é? Oh, meu Deus. Em que vai ser é bastante rota fora para vir aqui. É feliz que anotou. Quero dizer, é silencioso dos dois poços. Da mesma forma. Então isso é muito, hum, muito no,
tipo,
no tipo, dedo do pé. A mesma coisa para B A r se levanta b l r. Será por isso que meu corpo Brit. Ok, aqui vamos nós. Então nós temos o nosso para marcar e raiz média é bastante raro para um homem em um pouco de RP aqui. Portanto, há uma melhoria no nosso para marcar, bem como raiz Minutos trimestre. Muito bom. Agora podemos começar o K e o algoritmo. Vamos usar o mesmo conjunto de dados. Veremos se há melhorias. Usando K e um algoritmo para usar K e um algoritmo, precisamos primeiro importar o vizinho homossexual. Agressor importava da biblioteca Kellan de Kailyn Dot. Qualquer vizinho importava bem? Vizinhos gays, agressores. E, em seguida, criar instância para K e n vizinho, o kraisser importava. Cayenne e igual pé limpador vizinho Gay. Sim. Você poderia fazer isso exemplo fora que Oh, aqui vamos colocar em vizinhos iguais a nove em. Não te preocupes, eu explico-te. Qual é o significado desse valor em Por que escolhemos nove por agora? Basta colocar os vizinhos finais uma chamada para nove na próxima. Nós vamos encaixar o ganho e com o extremo em justamente em valor, explicou
ele. E branco. Certo, então pegamos o mártir. Temos caiena e modelo. Vamos por aí. Isto parece bom na próxima, nós estamos indo para o pé. Prever renascimento. Isso é um crédito WYY. E isso é bom, mas tudo bem, e depois desiste. Obter e, uh, prever sobre. E aqui vai ser X muito fácil, certo? Muitas vezes temos Por que prever valores? Em seguida, vamos comparar o real versus o valor preditivo morte aqui. Eles são muito de três d de três. Oh, aqui. 18 15 15 14 18 15 16 15 13 14. Parece muito bom para mim. Mas como fazer com certeza que isso é melhor do que o último? A primeira coisa que vamos fazer é criar um gráfico de dispersão. Estender. Este é o gráfico de dispersão. Esto isso. Certo, porta T do
Medo está espalhada X. Por que neste caso vai ser previsível dentro de dois dias e eu vou separar X e colorir estes tentando, digamos, eu vou dizer, colocar Nestea. Uau, eu acho que este aqui os pontos amarelos estão mais alinhados com os valores reais. Os pontos azuis comparados com a linha enrolado verde, que era para a qualidade normalmente. Deitrich, escute na linha reta de ataque, que foi para mais pessoas lineares, diminuir em Vamos verificar nossos números. Vamos passar o nosso para a corte dele e raiz que significa erro de escudeiro. E vamos ver se há alguma melhoria nisso. Certo. Então vamos fazer isso. Está bem. Este ano Aqui estão, então. Sim, você vê? Está bem. E depois, está bem. E então preveja. Obrigado. Muito boa lição. Isto. Ok, agora vamos comparar. Então, não vamos marcar fora do curso? Há a melhoria no caso off pl r 12.68 em crianças fora Kane, e é pontos em cinco em ao mesmo tempo, Root erro quadrado médio desceu de quatro pontos tratar off 3.8. Então isso é definitivamente uma melhoria. Então Kienan está nos dando uma previsão melhor e moderna, então. Mlr RPs. Então, parabéns, você está se mudando para Derickson seco. Uma coisa que eu quero dizer se você olhar para este garoto e não é uma linha de estado e é
por isso que não é chamado de regressão linear. Regressão linear é simples. Diminuição linear em nosso múltiplo em Ieroklis são Pol Anomaly perto imprudente e que realmente lhe dá uma linha. Ou é chamado de linha são linha reta, mas seu caso fora canhão porque é baseado nos pontos vizinhos mais próximos. Não é uma linha reta, é apenas preditivo. I valores ser ele nos pontos vizinhos mais próximos e é por isso que ele se parece com um gráfico de dispersão em linha com os pontos reais. E talvez seja por isso que está dando uma melhor previsão neste caso. Certo? Então você está indo na direção certa, Meu querido amigo. Agora você está se tornando cientistas de dados agora, você sabe, quando você obtém dados como brincar com eles e como ficar melhor e melhor em sua previsão. Mas antes de concluirmos, lembro-me que estava a falar de vizinhos iguais a nove. Andi,
eu disse-te que te explicaria sobre isso.
23. Passo de KNNRegression 2: no rosto conceito, você já está entendendo O algoritmo vizinho K funciona com base nos vizinhos. Como se eu considerar um ponto aqui, é baseado em há os vizinhos nele calcula a distância. Mas entre esse ponto e o vizinho e então ele decide, certo, onde esse ponto pertence? O número aqui está dizendo ao algoritmo quantos pontos você deve considerar como vizinho. Então, se eu der nove, isso significa que o algoritmo está indo para o pé. Considere nove pontos em sua vizinhança. Consideraria nove pontos, e chegará aos valores previstos. Você pode começar com aquele em ir em frente, mas o vacay e e e nunca algoritmo trabalhar que raiz significa Squire Edgar aqui torna-se muito alto se Cavell que é baixo. Mas isso não significa que se você manter cabo interessante, Houthis vai continuar indo para baixo. Há o ativo no ponto. Você tem que entender. E como é que eu inventei isto? Número nove. Vamos passar por isso. Eu vou te explicar. Como é que eu inventei o número nove deles? É muito fácil. Vamos filmar para escrever algumas linhas da mordida e do tribunal e vamos entender. Então vamos dizer que para K no intervalo 20 vamos executar a mesma lógica como prever o valor y. Mas em vez de apenas passar e vizinho como nove, vamos passar e vizinho do número um para o número 19 e ver como geral o miniter
rota Esquire está mudando. Então, à esquerda com isso. Certo, igual Tok mais um. Em seguida, basta copiar a mesma coisa aqui em, em seguida, o meu orou na impressão de sprint Ok, valor, que é este ano. Ok, então o MSC duro na nossa embaixada está bem ali. Muito bom menos do que este Até agora cabo um é cinco pontos ele. Começa em 5.1 é o mais alto. Bem, oh, então ele continua caindo. Olha para isto dá descer, para
baixo, para baixo, para baixo, para baixo até o oito e nove e, em seguida, ele aumenta depois disso. Então, se eu traçar um gráfico desses, ficaria claro. Então vamos traçar um gráfico para traçar o ofício. Eu preciso de todos esses erros bem deve em alguns np Desculpe para me deixar criar um vazio primeiro e seguida, adicionar esses valores de erro em que. Ok, vamos ver, eu tenho todos aqueles salgueiros. Sim, eu tenho os valores. Agora eu posso desenhar o produto. Longo. Ocorre, Lord Worlds, rápido fluxo de dados quente Emma C. E então apenas o ponto de trama menina trouxe. Aqui está. Começou com mais de 5,5 aqui. 5.8, certo. Continue indo para baixo com a caverna muito de 2.5 vai para baixo e depois de cerca de oito ou 9 18 lugares novamente, certo, então você pode escolher oito ou nove e esse é o valor ideal para isso. Fui passar a noite. É assim que você obtém o valor ideal para K usar em Cayenne e Al Qaida.
24. KnNclassititchiera1: Olá aí. Bem-vindo a isto, Richter. Vamos começar carro de partida e aceitabilidade em. Prever sua particípio com base em K e, em seguida, classificador. Vai ser divertido. Então, a primeira coisa é que vamos dar um bom nome ao nosso caderno e vamos dizer que está bem . E, em seguida, elegante. Aqui. Ok, Próximo. Muito rapidamente. Nós vamos importar toda a biblioteca necessária importação lumpy. Não posso ser divertido. O voto do Aziz PD tem pontos e, em seguida, vamos para um ditador importante baseado em anteriores eleitos, você entende os dados sobre espero que você tenha uma história. Ligue o seu computador agora vamos importar esses dados para um quadro de dados sobre o
pai comum que é. Estes são os meus dados do nome DF B d tart que comer pena ponto Leia CSP e, em seguida, nosso e, em seguida, dar seu nome de arquivo ou aqui Se eu nome é cartão, nosso arquivo de dados não tem qualquer hitter, então vamos chamar cabeçalho como nenhum medidor diário no arquivo é Kama e, em seguida, vamos dar nomes para a coluna que é nomeado para os atributos no nome vai ser aqui mesmo
Indiscreto porta de manutenção. Olha
, seriam 50 carros. Muito bem, DF dardo atingido. Veterano. Muito bom. Então, temos os nossos dados. Índia difícil. Vergonha ou aqui. A próxima coisa é, vamos ver a forma dos dados. Como B são os nossos dados? 1728 linhas e sete colunas. Muito bom no carro. Ou aqui está o nosso alvo. Variável ativada. Existem 123456 variáveis independentes. Então, como você vê aqui, estas são todas variáveis categóricas. Precisamos convertê-las em variáveis numéricas e como fazer isso. Você já sabe disso. Tem incluindo, então vamos fazer rótulo na cortejamento. Então, você vai importar da Kaylen? Não processem mão de obra importada na cota, e depois vamos para o tribunal. Cada um dos campos d f. Comprando igual a antes disso, temos que criar uma instância off label em trimestre, certo? É uma classe, então precisa de uma instância para recriá-la. Primeiro na batida. Ok, então l b c dot pés e este tribunal se transforma. E você faz o mesmo? Fazemos a mesma coisa para outros campos dio I m D O próximo vai ser portas dia em pessoa e olha, é bota 50. O carro é uma variável-alvo. Então não vamos ao tribunal no sprint agora, você foi atingido? Muito bom. Todos estão codificados agora. Até agora,
tudo bem. Se você quiser ver o Quellos único na variável alvo carro, é muito fácil Você pode apenas executar esta linha de tribunal. Você, Deus em apenas ver Unique. Estes são seus valores únicos nas variáveis-alvo. Então, seus carros vão ser segregados entre inaceitáveis baixa baixa alta aceitabilidade média. Aceitável. Muito bom e bom. Certo? Você tem reboque Segregate que seus carros de grupo entre estes mesmos um vezes fora. Aceitável. Então, há mais de 1728 registros. Seu dedo do pé. Prever essas classificações em data futura nós Se você tem estes seis no pior nível
após o carro, você deve ser capaz de prever se ele está entre um dos sete categoria fora do curso. Certo, então vamos ter mais em corporatistas. Então vamos nos certificar se todos os seis valores de feição são valores numéricos agora. Então vamos fazer que DF dardo Aplicar mapa e ser dardo é realmente não atingido. Certo, tão verdade. verdadeiro Verdadeiro, ,
verdadeiro, verdadeiro e adiante Isto é esperado. Nós não fizemos no cartão de tribunal, por isso vai padrão. Mas todos os poços do futuro são verdadeiros. Então todos os recursos são valores numéricos agora Muito bom. É hora de definir nosso x e y. então vamos dizer X igual a d f ponto drop O que isso foi descartando cartão? Porque era um alvo que éramos. E por que você tem igual dedo? Bom, bom. Então temos que encontrar nosso x e y em seguida Vamos definir nossos dados de treinamento. Sente-se de sua habilidade e seleção de modelo escuro Importar quero dizer espalhou seu espírito. Bom. Agora ex trem ex prato, certo? Jean, Por que provar um rápido e é virado X y tamanho prato Como resultado, vamos fazer 20% tamanho do texto e eu não sei em vez foi visitar Baker Athm. Até agora, tudo bem a seguir. Antes de realmente chamar o Cayenne e classificador e passar este trem e dados de teste para
o classificador Precisamos descobrir o valor ideal fora de K. Lembre-se que fizemos este exercício durante o dia e e regressando. Temos que fazer a mesma coisa para descobrir o valor ideal dos gays que você pode usar aqui. Vamos fazer isso. Eu vou ver aqui. Encontre o melhor valor fora. Ok, vamos começar com Gail e ponto Neighbors Importar nome chave, chupeta de
nascimento de Mad Import. Sq. Nossos dentes têm rota de Eskil e nenhum médico importa. Quero dizer, é quieto. É muito bom. Vamos começar. Eu vou dizer por que um dedo igual aqui nós vemos. Transforme isso precisamos fazer porque para este bolo imprudente, até mesmo as variáveis alvo tem que ser codificada. Não pode ser uma variável categórica. Então é por isso que eu vou pisar na etiqueta, incluindo para o carro que eu vou pegar. Mas também Ok, então tem a minha gravadora incluída. No próximo eu estou indo toe criar um NPR e r Timothy vazio, e vamos começar para K na faixa 20. Ok é igual a K mais um. Você já fez isso. Se você quiser, você pode copiar e colar a partir do bloco de notas anterior programa que está ganhando graus e caderno mesmo abrir e copiar a partir daí. Então eu vou criar um exemplo de uma cruz de vizinho aqui você vai. Então essa é a instância agora fora de uma nave vizinha. E quando criamos a instância, passamos o número e vizinho, lembra? Oh, aqui. Vamos passá-lo para passar. É K agora, K e então ponto fit Nós vamos para X e Raven E vamos calcular a raiz. Média é bastante erro. Vamos pintar o dedo do pé do valor. Este aqui, isto é necessário no caso de você querer traçar um gráfico. Se você não quer fotografar, então você não precisa colocar o dedo se desenvolve para esta área vazia. Mas Lester, isso significa, é comedores de lulas. Por que, mesmo assim, Cayenne e são bonitos. E nós estamos indo para o caminho X bem aqui. Então essa é a nossa área vazia. Agora vamos trazer o valor da chave de impressão, e este vai ser o nosso cabo aqui. E depois Adam Aceval. Andi, vai ser esse cara. Nada mal. Está bem. E vamos ver se acertamos. Muito bem, Lettie. Portanto, ou é sete r oito. Então, nele é mais baixo e depois dar aumentando depois que se olha e famílias. Então, vou esquecer isso. Vamos começar com os valores. Então temos a caiena e o valor. Então vamos treinar nosso modelo de dados. Kienan vai ser k Ele veste classificador e em eles valem vai ser C um Muito bom. E então k n n ponto Se ele e nós estamos indo para passar nossa troca e escrevê-lo athm Uma vez que você tem nossos pés modelo de dados sobre os dados de treinamento sentar. Estamos prontos para prever. Então, por que Break vai ser homossexual e ARD prever ex angústia. Bom trabalho. Agora basta medir a precisão do nosso modelo de SK Len Import Medics em, em
seguida, correr a precisão que eu não poderia marcar por que e, em seguida, K e, em seguida, prever e ex Bom trabalho. Muito bom. Temos precisão de 93% de 93% de precisão em K e algoritmo secreto. Você deveria estar orgulhoso de si mesmo.
25. KNNClassifierDemoUdemy Step 2: Muito bom. Vamos traçar y valor o poço real. Oh, e por que previu Bem, e confirme o quão perto eles estão tão perto de conspirar. A primeira coisa que temos é Primeiro, temos que converter ambos os atos e por que em nosso atual X e y ese panda logo depois, vamos convertê-los para MP três agora. Ok, então isso vai converter X e y dedo do pé. NPR é muito bom agora que você os converteu reboque. Podemos começar a traçá-los. Então vamos dizer quatro x e. Por que e em Jeep X raio escuro. Tem que ser
rebocada. Tem sido difícil. XY Vamos traçar isso primeiro, vai levar algum tempo porque vai traçar o dedo do pé. Scatter trazido para cada ponto fora X e y e muito bom. Vamos torná-lo pouco com marcador extravagante vai ser Oh, e tamanho vai ser o tamanho s. É um tamanho quatro vai ser entregue à esquerda. Com isso esquerda para mais uma coisa Esta cor colocar. Eu acho que existem valores originais, então vamos como temos seguido no setor privado. Dê-lhe calorias. Grupo. Bom trabalho. Agora vamos imprimir os valores previstos. Então estes são realmente valores X e Y. Agora estamos indo dedo do pé imprimir os valores previstos para que vamos ver ovos e em vez disso fora Por que ele vai ser aqui que en e prever Ben y E eles começaram a ver aqui. Você vê olá e inst off. Oh, vamos dizer estrela. E nós vamos reduzir o tamanho também novamente para que ele plote em cima do real e então vamos ver PST escuro. Então vai levar algum tempo. Aqui você vai ver uma estrela amarela. Esses são os valores previstos e os pontos azuis. Esses são valores reais e você vê valores preditos em cima de cada valor real. Então isso está funcionando bem. 24 baixa. Eles não tinham valores preditivos para todos os outros casos. Está a prever perfeitamente bem. E é por isso que você tem essa precisão de 93%. Então eu tenho um dever de casa para você. O que aconteceu com o baixo valor? Por que d previsão Waas não lá para o baixo valor. Basta olhar para os dados e eu acho que você vai encontrar resposta. Estou à espera da tua resposta. Por favor envie-me uma mensagem. Vejo-te no X Director
26. Regimento: Olá aí. Maior vara regressando é um dos meus favoritos em uma das razões pelas quais é o meu favorito é a matemática no mundo nele. Se você esqueceu sua matemática do ensino médio, então pode ser um pouco difícil para você entender isso. Então eu vou primeiro levá-lo para a matemática básica que você precisa para entender
rebatizado artístico . Não se preocupe, não
vou demorar muito tempo. Só vou explicar o que é demais para você entender. Maior Crescente da Vitória. Então, vamos falar. Este. Todos nós entendemos que 10 para o desligamento dois é igual a 200. É muito difícil esquecer até agora. Então, espero que todos nós entendamos isso. E ele não precisa de mais nenhuma explicação sobre se eu disser log off 100 para o melhor 10. Isso significa que eu estou dizendo o que desligar o 10 vai fazer 100. E a resposta, claro, é o dedo do pé, como vimos aqui. E nesse caso, off log, onde a base 10 é Deus logaritmos comuns. E se eu apenas escrever log off 100? Eu não escrevo baseado em 10. Em seguida, o que acontece em tais casos o ritmo é assumido para ser número Do ponto Mesmo 11 que
é e em. Esse tipo de ritmo lager é chamado logaritmos naturais e é possível que em s Ln 100 É
isso. Essa é a matemática básica de que estamos falando agora que a teoria no mesmo poço esquerda mover um dedo Entendendo rebatizado artístico. Antes de saltarmos para a regressão logística, vamos dar um passo atrás nisto. Compreender? O que fizemos na rebatizada linear Illini regredir. E vimos esta fórmula porque ele chamou Toe B zero mais Beaven filha ser um Nixon, certo? E entendemos que o lado direito desta equação é número contínuo o x um x dois x árvore e além. Estes são os nossos números contínuos sobre o resultado desta pergunta sagrada juntamente com coeficiente é um número contínuo e o resultado também será um número contínuo
que você trabalhou no caso está fora prevendo a eficiência de combustível. Muito Havia variáveis independentes como que eram várias características do carro e você veio com a eficiência de combustível protegida que era um número contínuo. Então entrada de saída de brasa
contínua, número contínuo. Vamos chegar à logística rebatizar maior razão Tikrit. Mesmo que o nome diga uma grande razão, na verdade
é Ah classificações arboretum e por classificações. E quero dizer que o resultado não é um número contínuo. Então vamos começar pelo lado direito. É o mesmo. Ainda é o mesmo número contínuo. Então resultado do site ser um número contínuo. Mas do lado esquerdo, porque são as classificações e a técnica, o resultado tem que ser um resultado binário no caso de fora da maior prisão decretada. Então resultado binário significa valores como sim, não, certo. Errado 01 Então esse tipo de resultado, a cidade complexa aqui é como você consegue um resultado de Banbury com os números contínuos? E é aí que está toda a diversão por trás da matemática. Comece em caso de regressão logística. Por que está repleto de algo assim? Bloquear B por um menos B. E este aqui, esta é a probabilidade. P significa probabilidade em tudo isso. Seja por um menos. B é chamado arte fora do resultado artístico. Portanto, no log off este valor, lembre-se, não
há base com o 10. Então esta é uma lei natural. Sim. Então esta é uma fechadura natural. E assim a fórmula é alterada Agora por que é substituído por log off B por um por P. Então isso é uma fórmula aqui. Isso significa bloquear nosso povo um por p onde p a probabilidade é chamada y. e se eu expandi-lo ainda mais, então eu apenas vir acima com esta fórmula de que P probabilidade é igual a um mais e e correu para menos y. e se eu expandi-lo ainda mais,
então eu apenas vir acima com esta fórmula de que P probabilidade é igual a um mais
e e correu para menos y.
Agora esta é a parte muito interessante. Por que eu fiz tudo isso? Porque nesta fórmula, não importa qual valor fora por que eu coloquei, eu sempre terei uma probabilidade. Valor e probabilidade. O valor será sempre entre zero e um. Então isso significa que eu ainda posso obter resultado disso como um número contínuo, que será minha esposa. Mas no momento em que eu colocar isso por que nesta equação eu vou ter a probabilidade com que
será é entre zero e um. Você não acredita em mim? Certo, vamos fazer isso. Coloquei vários rivais aqui nesta fórmula e este foi o meu resultado. Este era o meu valor P. Você pode experimentar com mais valores Y sobre este foi o ofício. Então agora eu tenho um ofício. São valores de probabilidade que terminam de 0 a 1 que estes são os valores da minha propriedade, e estes são valores y. Então provavelmente mesa que é 0 para 1 noite. Meu ofício está assim. E então eu posso seguir uma fórmula simples que se meu valor de probabilidade for menor que 0,5, eu não direi mais do que 0,5. Eu diria que sim. E aqui mudei meu resultado de número contínuo para bine. 80 resultado sim e não. E é por isso que gosto de rebatizado autista. A matemática básica fez um resultado numérico contínuo para um resultado binário. Então vamos chegar ao maior carrapato regredindo. Vemo-nos no próximo Lecter.
27. LogisticsRegressionDemoUsethisone: Olá. Chegará a esta palestra sobre o Congresso. Coalescência. O fato de você estar nesta palestra indica que você terminou uma
análise de regressão sobre ganho e classificador. Novo terno parabenizando a si mesmo. Você está fazendo um bom progresso. Então vamos começar. Vamos primeiro aos pés. Importar toda a biblioteca com o direito? Viva para isso. Mas antes disso, vamos citar o nosso caderno, não o bastão. Dia dos Grayson. Mais alunos para me lembrar. Ok. E agora importar biblioteca. Uma coisa devo dizer: Por que você estava comigo? Por favor, pratique todo este comando e digite-o. Não copie e cole a razão pela qual eu estou insistindo em seu tipo porque você é tão desenvolvido o hábito. Você deve se lembrar de todo esse comando de cor. Porque quando você vai para uma entrevista para ciência de dados, nosso trabalho de aprendizado de máquina, há uma grande chance de que eles peçam Good. Então eles vão te dar um problema. E eles vão pedir-lhe para desenvolver um algoritmo e você pode não ter o privilégio de copiar e colar lá. Então é por isso que fazer uso de todas essas palestras. Estou digitando aqui. Siga-me e desenvolva o hábito e digite cada comando. Essas coisas que você deve se lembrar de cor agora. Ok, eu fiz isso várias vezes, então eu vou ser muito rápido aqui na porta nº 2. P I m p import bond PD Matt bloqueou e eu sou Não seja um idiota como ph d.
Ok,em Ok, seguida, vamos ler nossa luta B d cão, mas coma. Sim, nós aqui Qt o demitiu junto com quando você não sabe que o arquivo. Você pode ter que lutar contra o banco cheio. Darcy s, nós e o banco. É, sem dúvida CS três, o completo tem cerca de 400.000 cartões D. É muito grande para você experimentar. Você pode fazer isso. Mas se você está fazendo isso em seu próprio computador, várias coisas como análise e se você está escrevendo estão plotando um gráfico. Essas coisas serão muito lentas. Então é por isso que eu sugiro usado este banco e seu sem dúvida CSP, que só tem 4000 carros em um meted diária neste caso, é mesmo Colin. Ok, eles dizem que acertamos. Até agora, depois isto. Sim. Algo não está certo. Oh, aqui. É a mesma coisa. De acordo com a verdade de aqui vamos nós. 21 colunas. Portanto, existem 20 valores fetais. E por que aqui, essa é a nossa variável alvo. Sim. Não
, terá os valores. Sim e não. Então diz: Onde isso implica? Mas o banco? Foi produto ou não? Até agora,
tudo bem. Agora eles começam o ataque. Florissant fez, uh o que fazemos? A primeira coisa. A primeira coisa é que verificamos o gole de nossos dados de ponto 4119. Essas 21 colunas são mostradas. Em seguida, vamos ver as aulas trimestrais. Oh, aqui, vamos ver. Idade. Uh, muito bom. Não está correlacionada com nenhuma coluna. Do Ressuscitado parece muito bom Campanha. Muito bom. Três dias, mas um bom prêmio foi muito bom. Vários. E parece que depende deles antes e deste. Mas sabemos que isso implica variável. Muito recentemente, Isso vai ser baseado nos caras empregados ou não. Então eu acho que isso deve ser bom. que não temos de fazer nada disto Achoque não temos de fazer nada disto. O que? Parece bom. Podemos chorar agora. Quais são os tópicos? Flores e parece bom. Eu acho que podemos ir para o pré-processamento de dados agora em pessoas de dados. Então eu acho que a primeira coisa que vamos fazer se rotular no tribunal tudo isso muito ambos. Mas antes que a carta separe nosso x e Y porque vamos rotular no tribunal apenas X. Eles independentes Muito sobre Não por quê. Ok, então é muito fácil. Por que vai ser essa variável alvo? Por que aqui? Então, por que é muito branco ZDF assim? E X vai ser tudo. Mas por quê? Certo? Ok, você tem Dot Drop? Por eixo ele vai um o bom. Temos X e y direito. E a próxima coisa vamos nos rotular no tribunal. Então, a partir dele é Galen dot pré processamento de importação para o trabalho em um quarto de pescoço. Claro, vamos criar instância fora do rótulo em um trimestre. Até agora, tudo bem. Portanto, existem 21 colunas das quais 20 são valores em destaque. Então temos que incluir 20 colunas aqui. Não vou escrever 81 deles um por um. Em vez disso, desta vez eu vou usar um longe até agora por Dean Range mistura off escuro coluna Então isso vai retornar 21 porque existem 21 colunas. Ok, então este declive vai correr 20 vezes. Começa. Eu pareço sim. BC dot Fit Não forma ex dot Eu amo este aqui. Lettie fez? Temos as colunas codificadas. Parece bom, mas olhe para os valores. 12 e 1 por 24 dias em 1 56, então todos estão em uma escala diferente. Então vamos colocá-los na mesma escala, certo? Então eles fazem isso a partir de Sim. Kailyn escuro pré processamento importá-lo padrão. É levantar-se. E nós também estamos aqui. Primeiro vamos criar a instância fora do concurso é a classe assassina. Sim. D d c l para ficar,
uh, e então nós vamos nos transformar. Ah, sim. Foi ele ponto Fit Transform X pouco nele. Muito bom nisso, mas você te dá o sucesso agora, isso é macio. O assassino converteu este X a reboque como tu lutas. Veja aqui agora é um Não é mais um vínculo. Um Estado Afrim. É por isso que eu coloquei cabeça que lhe deu Soto ver os primeiros porque temos que primeiro convertido para o quadro de dados. Fizemos isso de Vergonha X e então ou aqui vemos. Isso derramaria aqui. Ok. Muito vai. Eu os amo. Olhe em. Mesma escala. Agora, por volta de um. Menos de um estão por aí. Um parece bom. Agora é o momento certo Toe dividir nossos dados no treinamento e prová-los. É isso. Vamos fazer isso.
28. LogisticsRegressionDemoUsethisone: da morte. Guillen dot Murder Collecting importação entre gosto É um pouco X dentista. Por quê? Por que gosto vai ser gosto trem este split x e Y dist suspiros vai ser o mesmo ponto dedo do pé em um aleatório fez. Se o Fido for bom,
vamos trazer esta fita do Egito em troca do que vejo. Eu só estou certo adolescente? - Não. Por quê? Apenas muito bom. Temos X trem f gosto corretamente e mais leve. Agora é hora de tiene de argamassa de Yes killen dot anos magra Importar não Grayson autista . E nós criamos primeiro sua chance fora da logística rebatizar Autista Não, apenas grifo de tiquice. E então vamos nos encaixar no dedo do pé. Você sabe, eu vejo escuro encaixar o x 10, certo. Muito bom. Então, nosso modelo tem ajuste de feijão com os dados de treinamento em. Agora este apenas d argamassa e eu prevejo por que o comércio sublinhado vai ser dardo amarelo do mar. Prever escolhe Dist! Incrível. Então temos a nossa previsão do porquê. Agora Lay faz exatidão irritante fora de nossos valores y. Como equidade considerado assim, se matar médicos de importação imprimir, poderia ter C luva carrapatos. Isso não poderia isi. É bom. Tia, vamos correr o nosso Mar Amarelo, não prever X está aqui. Então, em vez de apenas colocar teste X, vamos prever UN completo X e comparado com o valor y real 91% Devo dizer que esta é uma pontuação muito boa dos pedidos logísticos e se encaixam muito bem para este levantamento conjunto de dados. Veja os valores reais suficientes da empresa com os valores previstos.
29. LogisticsRegressionDemoUsethisone: Muito bom. Então nós vamos criar um novo dado de D F. Três com real em valores preditos. BD dot fama de dados. O valor real vai ser Por que não perder em valores previstos vai ser esse cara Elsie , prever esse ato e ele vai continuar aqui em. Então vamos imprimir os três, real e previsto estão acasalando. Se eu disser 1.º $15 é tudo combinando. Então, por que não escrever algo para que possamos comparar o real e previsto para todos os 4119 2 carros? Listo, que nós estamos indo para escrever um pequeno tubo e tribunal para comparar nossos valores reais com os valores
previstos para cada 4119 D cartões sobre ele vai nos dar o número off registros para o qual realmente não importa com os valores previstos. Então, vamos começar. Primeiro, vamos definir o nosso contador para zero, e depois disso, vamos correr um longe para eu em troco de folga dia de três, que vai retornar 4100 vezes aqui. Então eu vou correr de 0 a 4119. Isso é para todos estes escreveu em. Nós vamos comparar real com o previsto para dar de três idóc dardo I zero, que é na verdade não está equipado para fazer você tem três escuro eu amo,
Eu quero que é previsto, em seguida, inclemente o contador por um. E no final vamos bater o contador. Então vamos rodar este bem aqui 3 56 registros. Então isso significa fora 4119 apenas 3 56 3 cartões não cumpriu com o valor preditivo. Então o real não corresponde com previsto para 3 56 regras que é muito menos para 4119. Então você tem um assassinato muito bom. Claro que eu entendo estes 3 56 que poderiam ter calculado o peso sobre a moeda também. Mas eu só queria para você que você também pode escrever uma mordida e ir para fazer o mesmo no procurado. Uma luta frenética no tribunal é que você pode realmente ver todos os aspectos onde estes bem não
foi atendido. Você pode imprimir todos aqueles DF três. Olho aqui e vejo todos esses custos. Boa coalescência congresso mais uma vez você terminou a logística regredindo com a taxa de
sucesso de 91% você foi capaz de prever se os clientes compraram o produto de
depósito bancário não são. Você pode usar a mesma coisa, mesma lógica em outros dados. Sente-se da mesma forma conjuntos de dados e pratique-o. Bom trabalho. Vejo-te nas próximas palestras.
30. Apoie a máquina vetorial: Olá aí. Bem-vindo a esta palestra. Vamos continuar trabalhando nessa mesma fonte de dados. A fonte de dados Nós trabalhamos durante a logística rebatizado A muito em um banqueiro waas tentando vender um depósito bancário toe seus clientes na DA Tínhamos uma fonte de dados off 4119 fora de suas lições em. Com base nisso, estávamos tentando prever se o cliente vai protestar contra o depósito bancário ou não . Durante o maior Crescente da Vitória, fomos capazes de prever até a precisão de 91% em 4119. Temos 356 síndrome de previsão. Vamos trabalhar no mesmo conjunto de dados e vamos ver se podemos obter alguma melhoria se
seguirmos a máquina vetorial de suporte. Certo, vamos começar primeiro precisamos importar a máquina vetorial de suporte. Então, a partir da escala e não Sim, VM comport. Sim, nós vemos. E a seguir temos que criar a instância fora. Sim, nós vemos. Então, sim, vemos classificador. Claro que pode dar qualquer nome aqui, certo? Você sabe disso, certo? Sim, nós vemos então eu nunca poderia este julgamento e perto do coronel primeiro. Então, anos magros
depois, depois aleatórios. O estado zero ligado. Então vamos encaixá-lo. Sim, nós vemos. Ponto de fogo elegante Fit livre para ser ex train em branco tendência. Muito bom. Até agora, tudo bem. Então temos o Ah, sim. Entende Classificado definido. E nós equipamos com os dados de treinamento. Agora que nosso modelo é treinado, vamos obter o valor preditivo. Porquê licitar? Sim, nós vemos Grassy para cabelo igual a Sim, nós vemos dardo de fogo Classy, eu prevejo. E vamos passar X dist! Muito bom. Temos isto. Próximas letras. Descubra a precisão desta vez e já a temos aqui. Então, quem energia com a mesma coisa? Não precisamos importar médicos de novo porque já está importado neste caderno que
conduzimos Diga minhas bochechas, e depois diga sobre esse cara aqui. Uh por quê? E barra ver texto ST FX. Você não mais X 9164 Vamos ver o que foi antes de 9135 tão pequena hortelã quarto? Não poderia, na verdade. Sim, então há melhorias, mas não muito. Agora vamos ver como Maney Porque o nosso ainda está errado. A última vez em logística concorda. E era 356 E desta vez eu não vou escrever a mesma lógica desta vez. Vamos usar o Matics confuso. Vamos fazer isso. Certo, então da terra do DSK, não os médicos importam matics confusos aqui. Digamos C Ah, água. Sim, nós vemos. Eu não confundi médicos iguais a confundir e meus truques. E aqui vamos passar o dedo do pé. Por quê? E o rival previsto Lou. Então esse cara, eles vêem o seu melhor aqui. Certo, e então nós sempre imprimimos nossos médicos confusos. Espero não ter feito nenhum tipo de lésbica. Certo, Hashem. Então, 72 mais 72. Então, cerca de 344 carros erroneamente ainda estão lá. De 4119. Então, 344 previsões erradas. Então, há uma melhoria. Última vez que foi 3 56 Desta vez é apenas 3 44 Então 14 Ah, melhores previsões agora, em comparação com a última vez toe alguma melhoria no próximo Lecter. Vamos usar o coronel diferente, não um linear, mas um RB do Coronel. Veremos se há alguma melhoria
31. Apoie a máquina vetorial: Olá aí. Bem-vindo a esta palestra. Vamos continuar trabalhando nessa mesma fonte de dados. A fonte de dados Nós trabalhamos durante a logística rebatizado A muito em um banqueiro waas tentando vender um depósito bancário toe seus clientes na DA Tínhamos uma fonte de dados off 4119 fora de suas lições em. Com base nisso, estávamos tentando prever se o cliente vai protestar contra o depósito bancário ou não . Durante o maior Crescente da Vitória, fomos capazes de prever até a precisão de 91% em 4119. Temos 356 síndrome de previsão. Vamos trabalhar no mesmo conjunto de dados e vamos ver se podemos obter alguma melhoria se
seguirmos a máquina vetorial de suporte. Certo, vamos começar primeiro precisamos importar a máquina vetorial de suporte. Então, a partir da escala e não Sim, VM comport. Sim, nós vemos. E a seguir temos que criar a instância fora. Sim, nós vemos. Então, sim, vemos classificador. Claro que pode dar qualquer nome aqui, certo? Você sabe disso, certo? Sim, nós vemos então eu nunca poderia este julgamento e perto do coronel primeiro. Então, anos magros
depois, depois aleatórios. O estado zero ligado. Então vamos encaixá-lo. Sim, nós vemos. Ponto de fogo elegante Fit livre para ser ex train em branco tendência. Muito bom. Até agora, tudo bem. Então temos o Ah, sim. Entende Classificado definido. E nós equipamos com os dados de treinamento. Agora que nosso modelo é treinado, vamos obter o valor preditivo. Porquê licitar? Sim, nós vemos Grassy para cabelo igual a Sim, nós vemos dardo de fogo Classy, eu prevejo. E vamos passar X dist! Muito bom. Temos isto. Próximas letras. Descubra a precisão desta vez e já a temos aqui. Então, quem energia com a mesma coisa? Não precisamos importar médicos de novo porque já está importado neste caderno que
conduzimos Diga minhas bochechas, e depois diga sobre esse cara aqui. Uh por quê? E barra ver texto ST FX. Você não mais X 9164 Vamos ver o que foi antes de 9135 tão pequena hortelã quarto? Não poderia, na verdade. Sim, então há melhorias, mas não muito. Agora vamos ver como Maney Porque o nosso ainda está errado. A última vez em logística concorda. E era 356 E desta vez eu não vou escrever a mesma lógica desta vez. Vamos usar o Matics confuso. Vamos fazer isso. Certo, então da terra do DSK, não os médicos importam matics confusos aqui. Digamos C Ah, água. Sim, nós vemos. Eu não confundi médicos iguais a confundir e meus truques. E aqui vamos passar o dedo do pé. Por quê? E o rival previsto Lou. Então esse cara, eles vêem o seu melhor aqui. Certo, e então nós sempre imprimimos nossos médicos confusos. Espero não ter feito nenhum tipo de lésbica. Certo, Hashem. Então, 72 mais 72. Então, cerca de 344 carros erroneamente ainda estão lá. De 4119. Então, 344 previsões erradas. Então, há uma melhoria. Última vez que foi 3 56 Desta vez é apenas 3 44 Então 14 Ah, melhores previsões agora, em comparação com a última vez toe alguma melhoria no próximo Lecter. Vamos usar o coronel diferente, não um linear, mas um RB do Coronel. Veremos se há alguma melhoria
32. SVM RBF: Olá. Lá vai voltar. Então, da última vez, usamos a área linear de Lini carnal. Coronel Sveum. E obtivemos 91% de precisão e tivemos 44 discos. Ainda prevendo errado. Bem, agora vamos usar o Coronel RBF, e ver se há alguma melhoria. Então vamos em frente. Copiar. Este ano, não este tipo. Copiado é bom. Aqui em nós são relatados o spc. Então não precisamos importá-lo novamente. E se você está reabrindo este caderno, é
claro que faz cada corrida aqui Andi usou Selecione esse cara. Está bem, está bem. Digamos que o seu estado está desligado. Sim. Você vê, classificador, deixe-me ser dis completando aqui, ok? E agora, em vez de linear, vamos dizer rbf em. Vou nomear isto de forma diferente. , Poderia ser,se e mais um sublinhado. Eu estaria se e é isso. Está bem. Muito bom. Então instância classificador Rbf foi criado em Vamos fazer a previsão agora sublinhado R B se nele, dar em Dixon. Está bem. Temos nossa previsão na data medir a precisão. Muito bom. Então, desta vez é melhor. É um 93%. Da última vez foi 91%. Então temos 2% de melhoria. Vejamos, nossas métricas confusas são qualquer melhoria no número de previsões erradas. Ah,
mas isso. Eu poderia ser? Sim, em. OK, ali. Vês? 2751. Então faça 70. Oh, há uma grande melhoria que a melhoria? Cerca de 66 discos. - Sim. Então agora o número total dos sentidos de críticos redondos desceu para 78 em comparação com 344
Sobrenome . Há melhorias em 64 cartões D. Isso é um grupo. Boa melhoria em lá é um muito off 50 93%. Então, parece que eu vou ser de coronel é melhor encaixar neste caso de dados, em
seguida, o Lee perto Cannon Art no maior seis mais. Então a conclusão é até agora nós estávamos usando RV do Coronel para esses dados. Ok, muito bom. Continuaremos olhando para outros algoritmos. Onda. Sintonia fina. Isso é para eu te ver na próxima palestra
33. Probability com BayesThereom: Olá aí. Bem-vindo a este Richter. É hora de falar sobre baseado aqui, mas antes de realmente dar um mergulho mais profundo em Beith aqui, hum, vamos rever o básico é probabilidade, e isso vai ajudá-lo a atualizar seu conhecimento fora da probabilidade. Depois disso, vamos estender o mesmo problema. Dois. Baseado aqui. Vamos começar. Vamos considerar que você tem duas caixas. Caixa um com tipo de bolas, nove bolas vermelhas e cinco bolas azuis, e depois caixa fazer com novamente para tipo de bolas. Quatro. Bola vermelha em 11 bolas azuis. Até agora,
tudo bem. Agora você está escolhendo sobre você não sabe de beat box. Você só pegou tudo. E agora você tem que encontrar a probabilidade de ter escolhido a bola na Caixa 1 e
depois ? É uma probabilidade de você pegar uma bola azul da Caixa 1. Da mesma forma, qual é a probabilidade de você escolher uma bola vermelha da caixa para ser? Qual é a probabilidade de alguns escolherem uma bola azul da caixa para? Então estas são quatro opções que poderiam ter acontecido. Você pode ter escolhido uma bola vermelha do boxe ou bola azul para Ambac. Um deles é Red Ball, de Bach para a nossa caixa de frente Global. Nós estamos indo para o pé. Encontre a probabilidade de cada um deles em uma questão muito simples. Então vamos começar. Primeiro. Temos que ficar quites. Um que podemos escolher desta caixa são iguais. Podemos escolher entre o chefe engrossado. Então, dois possíveis até você pode escolher a partir destes livros são desta caixa. Só há duas caixas. Então a possibilidade de alguns escolher a bola da caixa um é um por dois. Porque só há dois eventos possíveis. Há apenas duas caixas, então o número total de combinações possíveis é fora disso. Se você escolher na caixa um, a probabilidade de isso acontecer é um por dois. Da mesma forma, a probabilidade de escolher da caixa para é um por dois. Vamos lamentar qual é a probabilidade de escolher bola vermelha da caixa quando há nove
bolas vermelhas e há 14 número total de peças, então provavelmente alguns escolhendo bola vermelha da caixa um é nove por 14. Da mesma forma, probabilidade. Alguns escolhendo bola azul da caixa 1/8 cinco por 14. Da mesma forma, provavelmente fora escolhendo grande bola da caixa para comer quatro por 15 Número total de peças é 15 Redwall quatro assim quatro por 50 e, provavelmente, uma bola azul escolhendo de Bach para é l A. ganhou por 15. Até agora,
tudo bem. Agora vamos começar a calcular essas probabilidades. Comece com o primeiro 1 provavelmente fora escolher uma bola vermelha da caixa um, modo que seria mesmo multiplicado por P. R. Mesmo PR, mesmo se você está escolhendo bola vermelha, considerando a primeira caixa considerando o primeiro evento aconteceu, por isso é chamado P estão considerando, mesmo aconteceu. E isto é, se você multiplicar p mesmo e P R condicionado mesmo aconteceu, que lhe dará a probabilidade de escolher bola vermelha da caixa um para que seria ganho por dois. Multiplicado por nove por 14. Isso seria nove por 28 32% de probabilidade. O que provavelmente está fora de você? Pegando a bola azul do Box One de novo? Um por dois em cinco por 14 cinco por 28 18% cerca de 18% da mesma maneira provavelmente fora escolhendo uma
bola vermelha da caixa para um por dois em quatro por 15 para até 2013% Probabilidade na probabilidade de escolher uma bola azul da caixa para assim um por dois no reboque, Loon por 15 37%. Então essas respostas a pergunta por trás de cada probabilidade. Agora você pode calcular qualquer tipo de probabilidade possível. Então, quando você escolhe uma bola, você sabe que outras propriedades de escolher uma bola vermelha são bola azul de qualquer uma das caixas depois ? Então, quem tem a máxima probabilidade? Probabilidade mexicana é esse status? 1%. Essas eram as probabilidades máximas. Você vai acabar pegando uma bola azul do dedo do pé da caixa. Isso é er faz uma probabilidade de bomba. Se for preciso. Que dinheiro nisso, então eu vou colocar meu dinheiro neste aqui porque este tem maiores chances de acontecer 37% . Então esse é um fundo básico fora da probabilidade. Como o provavelmente funciona. Ok, qual é a probabilidade total de você escolher uma propriedade filha credível. Então esta metade de uma probabilidade de escolher Redwall da caixa um e esta probabilidade WAAS de escolher bola vermelha da caixa para então probabilidade total estão escolhendo bola vermelha é apontado dedo do pé pressione 0.13 ponto 45 em. Lembras-te destes eventos mutuamente exclusivos do exército? Isso significa que você não pode colocar sua mão em ambas as caixas juntas e há duas caixas Então quando você colocar sua mão no momento, você pode colocar sua mão apenas em uma caixa. Certo? Então o segundo evento não é dependente do primeiro evento. Eles são mutuamente evento exclusivo. Então é por isso que se você tem que calcular qual é a probabilidade total de você escolher uma
bola vermelha de qualquer uma das caixas? Isso seria um ponto para cinco. Isso seria total deste Prestes. Da mesma forma, a probabilidade
total de você escolher uma bola azul será 0,1 mais 0,37 pontos +55 E aqui vem a melhor parte da parte que todos estávamos esperando. Considere estes mesmos você tem caixa um e latir muito mesmo número. Ofereça bolas e bolas azuis. Exatamente. Mesma situação. Mas a pergunta é diferente. A questão é que escolheste uma bola vermelha. Andi, qual é a probabilidade desta parede vermelha ser da segunda volta? Esta é uma situação interessante. Você já tem uma bola vermelha. Você não tinha que descobrir a probabilidade da bola vermelha ser de caixa para E esse tipo de probabilidade é chamado de probabilidade fora e para o pé par, considerando se a bola vermelha então a parede vermelha que já é considerada uma bola vermelha é já considerado Você já se preocupou com. Agora temos que descobrir um provavelmente fora que bola vermelha ser do parque para, Então vamos ver o que fizemos no problema anterior. Então, no problema anterior, descobrimos diferentes tipos de probabilidades, certo? Propriedade off Se eu pegar todas as probabilidades de eles serem de caixa uma caixa para na probabilidade de que ser lido da caixa um azul da caixa em nosso vermelho de bach dedo do pé e azul de Bach
dedo do pé em que um total, provavelmente TF que está sendo lido foram, diz Prue. Agora aqui temos que descobrir a probabilidade dessa bola ser que Redwall ser da segunda caixa nesse tipo de propriedade é calculada usando baseado aqui. Bested um diz que P F E para R é igual a p f e. Duas probabilidade de e dois e provavelmente TF estão considerando Ito pela probabilidade total de coração , e você já calculou esses valores. Provavelmente F E dois é um por dois propriedade do nosso que escolhendo rival Tia escolhendo Redwall da segunda caixa Waas quatro por 15 em Porter Probabilidade off escolhendo bola taxa de qualquer fora das caixas Waas 45% Direita em. É assim que se você pode criar, ele vai descer para quatro por 13.5. Então tecnologia 2%. Então, responda a esta pergunta que se você tem uma bola vermelha, a probabilidade de essa bola ser da caixa para é de 30% nesse tipo de pergunta fora é respondida usando baseado aqui. Então isso é básico fora baseado aqui.
34. Introdução em Naives Bayes: Olá aí. Bem-vindos ao Distrito. Então você aprendeu sobre baseado aqui? Na palestra anterior. Como é que isto se baseia aqui? Um aplicado em aprendizado de máquina para responder a essa pergunta. Último olhar para este exemplo este exemplo contém dados de 1000 frutas. Pode ser banana ardente. Há algum outro tipo de frutas nisso? Os frutos são identificados com base nas características como se é longo são se é doce , não
são para ele ou se é L o r não. Olhe. Então você tem esses três recursos em você tem as aulas. Vamos considerar três aulas. Se você recebeu aleatoriamente essas características como longas, doces e baixas, você
será capaz de dizer que tipo de fruta é? Se é banana, laranja são qualquer outro tipo de fruta e este é um problema que vamos resolver usando baseado aqui. Mas se você notou ou aqui é chamado de base facas, não chamado base. A razão pela qual é chamado ni baseado, porque quando se trata de usar baseado aqui, hum, em aprendizado de máquina, há um grande A, alguns sol feito e há algum sol é que as características não estão relacionadas uns aos outros E é por isso que é chamado de minha base, porque assumindo que os recursos em seus dados não estão relacionados uns com os outros, se algo que não acontece com muita frequência, e é por isso que ele é chamado faca. Então, quando se trata de Massie aprendizagem, é chamado agora baseado aqui, vamos seguir em frente. Então, mais uma vez você tem 1000 observações sobre frutas, banana, laranja e qualquer outro tipo de fruta sobre estes frutos são identificados pelas características longo, doce e baixo. E se você é dado um doce longo em um baixo como um recurso, vamos ser capazes de dizer se é banana laranja são qualquer outro tipo de alimento? E esse é um desafio que vamos resolver usando a noite baseada aqui. Então esse é o desafio aqui. Tem uma fruta aleatória, que é errado, doce e uma baixa prever se é laranja, banana são outro tipo fora para resolver este problema. A primeira coisa que temos que fazer é resumir esses dados nesses dados. Você vê, lá as classificações e, por exemplo, é laranja nele. Zero on são um baseado em se a laranja é um baixo, doce junto. Então, neste caso, este ardente waas Um olhar. Então é Marcus um para os outros, é zero. Da mesma forma para banana É um longo esta banana foi um longo, doce e apaixonado. Então é a nossa marca. Melhor para aqui Há outra banana que é longa, mas não doce e não muito. Talvez não esteja maduro como se existissem 1000 discos. Então terno para resolver este problema em vir acima a probabilidade nós primeiro temos que resumir dados resumiu a contagem fora de cada um destes com base nas classificações, as classificações é que nós vamos ser nosso branco em todas essas características é o que está acontecendo Para ser nosso X. Então vamos um Este é o dado alguém Agora eu ajudo esses dados Eu ouvi essas classificações Então três classificações que eu tenho é banana estão em outras Estas três classes são como nossos três eventos. Então, primeiro vocês vinte anos vamos dizer banana chips banana se eu pegar uma fruta, qual é a probabilidade? Isso é banana. São 500 por milhares, certo? Há 250 mil alimentos em fora de que 500 são banana. Então a probabilidade de ser banana é 501,001 por dois. Vamos um. O que é provavelmente depois que a banana é longa? Então 400 por 504 por cinco. Da mesma forma, qual é a probabilidade? Depois de banana ser doce, ele senta-se Marana 3 50 por 500. Qual é a probabilidade após a banana ser um baixo? Alô, 450 por 500? Da mesma forma, qual é a probabilidade de ser laranja? Isso é fácil 300 por 1000 em. Da mesma forma, você precisa calcular a probabilidade disso. Não está sendo longo zero fora da propriedade do curso que não está sendo doce? 150 por 300 ganhou por duas probabilidades de que qualquer ser uma história de amor terminou com 301. Então, todas as laranjas são de cor amarela. Certo, um, digamos que outros outros tipos de frutas. Se eu pegar uma fruta, qual é a probabilidade de que isso seja outro tipo de fruta? É um por cinco. E então qual é a probabilidade desse outro tipo de alimento ser longo 100 por 200? O que é provavelmente todo esse outro tipo de fruta sendo doce? 150 por 200. Qual é a probabilidade desse outro tipo de fruta ser Hello? 50 por 200. Então, um por quatro. Muito bom. Temos essa probabilidade agora. Vamos calcular a probabilidade da filha E. Eu escolhi uma comida. Qual é a probabilidade dessa fruta ser longa? Como você calcula isso? Multiplica esse BB no reboque. Pierre, seja então B o a reboque. Ser off l com condicional provavelmente off outro em provavelmente off l com condições outras. E é assim que você vai enganar a probabilidade da fruta que você pegou ser uma
fruta longa . E aqui vem encontrar cinco. Da mesma forma probabilidade de que a fruta ser uma fruta doce é esta é a forma como você vai matar Clipe sobre ele vem para encontrar 65 e, provavelmente, de que o alimento ser l um alimento. É 0.8. Então esta é a nossa probabilidade total. Se eu pegar frutas, qual é a probabilidade de essa fruta ser longa? Estão sendo doces estão sendo um baixo Então temos o indivíduo Provavelmente estar fora de cada uma dessas possibilidades são Agora vem a nossa pergunta com a qual começamos esta palestra. A questão é, se você escolher um longo doce e l o fruto, qual é a probabilidade de ser banana são ardente são outros. Basicamente, temos que prever que se eu escolher um terno e uma fruta baixa, o que será? Se vai ser banana são não são outro tipo de comida. Esse tipo de pão. Dixon, você pode usar facas baseadas nele. Vamos ver como você já viu que no soro baseado, vamos usar a mesma fórmula mesma lógica na era estendida à noite e resolver este problema. Então, provavelmente eles estão pegando uma banana como falar ao longo doce sob um baixo alimento longo, doce e baixo. Qual é a probabilidade de ser uma banana? Você viu esta linha de fazenda baseada aqui? É a mesma fórmula. A fórmula diz Pebe em B l por B e, em seguida, ser doce com condicionado. É uma banana. Então propriedade de um baixo com a condição é banana e, em seguida, dividido por provavelmente fora
Propriedade longa de doce e provavelmente de por que isso é probabilidade de tortura. E se você fizer isso, se você colocar todos esses valores na fórmula, você terá 0,97 probabilidade disso. Sendo banana é 0,97 Deixe alguém da mesma forma, qual será a probabilidade de ser laranja a propriedade de ser Oren será zero porque a propriedade off não estão sendo longos. É zero tão fora do curso Não é um ardente porque provavelmente fora são em ser longo, que é um dos critérios neste e classe é zero, Então não é estão em para terno. Qual é a propriedade de ser outro pé mesmo. Coloque a fórmula aqui em colocar os valores provavelmente de ser qualquer outra fruta é 0.7 Então, quem é o vencedor? A Vênus é banana. É assim que você pode prever as classificações e fora de qualquer fruta nova. Se você sabe que as características são que características de frutas fora do ponto, Considere isso como um conjunto de dados ali mesmo. Tem 1000 discos? Se você adicionar um novo dado e você sabe o recurso dos dados usando a noite baseado aqui, um, você pode classificar muito Será que esses dados pertencem aqui. Tivemos três classificações e tivemos três recursos para brincar e fomos capazes prever que o novo ponto de dados pertence às classificações vit usando noite baseada aqui. Em seguida, vamos falar sobre como e onde no aprendizado de máquina esta era baseada na noite é usada. Vamos falar sobre exemplos do mundo real onde o herói baseado noite É um muito útil em como ele é usado. Vejo-te na próxima palestra.
35. GaussianNB: Olá. Haverá esta palestra sobre as mãos no treino fora da noite baseada aqui, hum, em Massillon e nove baseado aqui, hum, pode ser estendida em Massillon em várias formas em uma fazenda de uso comum é chamada Abelhas guardiãs da noite. Causa Ian faca baseado assume que as características em seus dados seguem a distribuição normal. Você já plotou a distribuição fora dos dados fora do recurso em palestras anteriores em mãos anteriores sobre a prática está usando Seaborn e você sabe como nem modéstia Wilson
parece . Então, se seus dados, seus recursos se encaixam distribuições normais, então você pode usar o classificador baseado em Goshen NY para classificar seus dados nesta palestra
neste mãos no néctar. Isso é o que você vai fazer. Então vamos começar por isso. Já escrevi o programa do departamento desta vez, vou passar por todo o tribunal de patentes que escrevi neste caderno de Júpiter. O código python neste já está lá. Eu disse, é também esta palestra, então você pode levá-la e você pode escrever por conta própria. Então, vamos começar. Claro, o primeiro você tem que importar todas as bibliotecas pandas MP importantes. Matt trouxe P um enredo Seaborn e s Kaylan Matics. Certo. Está bem. Uma vez que você importar todas as bibliotecas a seguir, você está indo para o pé. Leia o banco. Dardos adicionais? Sim, nós arquivamos no reboque. Os dados dos pandas impressos que o F foi atingido. Estes são os mesmos dados que você usou em mãos anteriores sobre práticas Ganhar e incêndios de classe e outros classificados Você vai usar os mesmos dados. Sente-se. Veja se há alguma melhoria com Gaussian Bay Classified. Certo? Então, como você fez antes, crie o vínculo um estado depois dele e imprima o quadril. Muito bom. 21 colunas, correto. Vamos ver os correlatos e mais uma vez. Lembre-se, em caso de noite baseada aqui, um, a suposição é e o mais importante Ah, alguns enviaram facilidade que os recursos não dependem um do outro. Eles são completamente independentes. É por isso que vamos rever o Coriolis e novamente em misturar sua qualquer dependência entre os recursos é removido. Então Randy vai depois do tribunal em Vamos rever isso agora ou aqui se você ver este ano. Oh, Bharti um é 0.94 relacionado com implicar que estavam lá muito relacionados uns com os outros, então você precisa remover um deles. Então eu estou indo para a mudança. Sabe, bomba, esta aqui na próxima está aqui, Imply estava certa, certo. Isso é 0,97 relacionado com esse cara. Ok, então esse também foi removido do dedo do pé. Ok, então vamos seguir em frente. Vamos remover esses dois recursos do quadro de dados. Execute este comando em. Vamos comandar o Corey. Ouça de novo, acho que desta vez parece melhor. Não vejo mais nenhum recurso fortemente correlacionado, então podemos querer Podemos continuar com esses recursos em. É hora de definir o seu caminho e definir o seu ex. E agora a mesma coisa que temos que fazer rótulo incluindo sobre isso é a mesma luta no tribunal Urina em palestras anteriores. A mesma coisa aqui. Faça o nível. De acordo com menos impressão depois disso. Vamos ver como o nosso X se parece depois disto aqui. Certo, eles entraram. De acordo está feito. Saídas são um e são o único contém os números, então nível, incluindo aqueles Good no próximo. Um padrão é assassino aqui em. Vamos imprimir o X novamente ver se ele é bom. Sim. Todos os valores são mais ou menos. Parece que tudo tem escala de feijão. Bom em. Agora, isso é o que estávamos falando. Todos os recursos devem seguir. distrito normal não era assim que eu escrevi este é mais programa aqui muito em. Estou fazendo um loop para todas as colunas. Então, se você beber essa porta de saída Sape, se eu for aqui, digamos que só vejo X Não beba. Eu entendo isso. 4119 crescimento e 80 colunas. Então 18 recursos direito sobre. Eu tenho que desenhar esta trama para todos os 18 deles para ter certeza que tudo seguindo nossa modéstia não
estava acontecendo. É por isso que estou fazendo esse loop. Se eu disser Xscape um que ganha, será 18 aqui. Estou a correr este telhado para o alcance deste número de colunas. Assim, as crianças para cada coluna sobre ele vai fazer o mar bon perturbação e conspiração. Logo depois, vou processar. Isto trouxe aqui. Se você olhar, todos eles estão seguindo uma distribuição normal como esta. Este gole bíblico indica “dis “normal para Wilson. Então, estamos prontos para ir a seguir. Como sempre nós chamaríamos a habilidade e seleção de argamassa em testículos contaminados Pleat, Nós estamos indo toe dividir os dados no treinamento e teste tamanho local vai ser ponto toe . Até agora tão bom em ou aqui através em caminhada Gaussian nb direita,
Então, de s Kellan Dark Knight base cuidado importação E nós criaram instância fora Gaussian e nós em seguida alimentá-lo dados de coloração a extensão e branco foi para Gaussian nb muito bom. Em seguida, vamos prever ou aqui passou os dados de teste e prever valores y
aqui . Estamos calculando a precisão. Infelizmente, a precisão é de 88% que é menor 10 decaimento em e e outro algoritmo Nós seguimos em Richter
anterior. Mas, no entanto, você tem a idéia de como Gaussian e nós podemos ser usados para esse tipo de problemas . Ninguém vai ter mãos futuras na prática é onde vamos usar Gaussian e nós Andi, com a alta taxa de precisão sobre isso é a vida real certa. Isto é o que acontece na vida real. Você aplica um monte de algoritmo de classifica com base na precisão que você vai saber qual algoritmo se encaixa irá rebocar esses dados. Isso é exatamente o que estamos fazendo aqui agora. Você sabe como entrou e nós podemos ser usados para este tipo depois que ele está muito dentro. Suas características eram uma distribuição normal. Então, porque você é características seguido distribuições normais. Tentamos usar Gaussian e estar neste é o registro de precisão na próxima palestra. Nós estamos indo dedo usado são diferentes tipos fora da base noturna, dois problemas diferentes e ver o quão bom essa precisão vem. Está bem
, vemo-nos na próxima palestra.
36. MultinormailNaiveBayes: Olá aí. Parabéns por aprender sobre soro de besta. Andi completando um treino de som de mão na noite gaussiana. Mijada. Espero que agora entenda a beleza por trás de NY baseado aqui. Hum, e como é fácil de usar, como você viu, a base Gaussiana agora é usada para venerar suas características Siga a simples distribuição Gaussiana. Há outro pedaço de faca muito interessante e que é multi Namir noite. A Beth. Neste caso, as características seguem simples Martina mera distribuição neste tipo de classificações. Classificações baseadas em noite DeMartino mia é mais apropriado para recursos que representam contagem de nossos países. Então este tipo de classificações é usado em caso de off. Por exemplo, classificações
de um documento. Simplesmente incrível. Há um documento e você quer dedo do pé. Compreender? Sobre o que é esse documento? Do que está falando, certo? Uma maneira de fazer isso é ler todo o mundo em seus documentos e depois descobrir a frequência de cada mundo. Então, se ele está usando, por exemplo, os mundos políticos muitas vezes, então é documento relacionado à política. Se ele está usando religioso foram muitas vezes. E são documentos relacionados à religião. Da mesma forma, seus e-mails podem ser filtrados como e-mails de spam não são normais. E-mail baseado no conteúdo. Tem algo como assassinatos G. Então esses são os casos para Martino Eu uma base noturna aqui é uma beleza, e você pode sentir a emoção na minha esposa. Tudo o que eu expliquei você até agora, lendo as palavras no documento e, em seguida, descobrir quantas vezes essa palavra é usada em que seus documentos e criando um vencedor fora de tudo o que é Deus, processamento de linguagem
natural. E esse é o meu tópico favorito. Não posso impedir-me de te levar lá. Então processamento de linguagem natural é uma coisa muito emocionante para aprender em Massie, emprestando linguagem sobre ele precisa de seus próprios seis, e é por isso que eu estou parando aqui como primeiro curso de classificação baseado noite, vamos continuar aprendendo faca multi normal base. Então falamos sobre processamento de linguagem natural. PNL nas próximas seis e te vejo lá.