Introdução ao Google Colab, instale o Tensorflow 2. 0, GPU e TPU grátis

Lazy Programmer Inc

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

- 1.
  
  Vídeo de introdução
  
  2:42
- 2.
  
  Como configurar o Google Colab
  
  12:25
- 3.
  
  Instalar o Tensorflow 2.0 no Colab (opcional)
  
  7:53
- 4.
  
  Como fazer upload de dados para o Colab
  
  11:31

Nível iniciante

Nível intermediário

Nível avançado

Todos os níveis

254

Estudantes

Projetos

Sobre este curso

Nesse curso, você vai aprender sobre como executar seu próprio código de ciência de dados e machine learning no Google Colab (Colab), que é um caderno de Jupyter executado no seu navegador.

Saiba como instalar o Tensorflow 2.0 e acesse a GPU e a TPU gratuitamente.

Conheça seu professor

Habilidades relacionadas

IA para desenvolvimento Desenvolvimento Mais desenvolvimento Ciência de dados

Level: Beginner

Projeto prático de curso

Use o que você aprendeu a fazer um script de machine learning básico no Google Colab:

Passo 1) carregue em seus dados

Passo 2) Instantiate seu modelo

Passo 3) Treine seu modelo sobre os dados

Passo 4) Avalie seu modelo

Como alternativa, execute qualquer código que você quiser!

Quando terminar, compartilhe um link para seu caderno do Colab com o resto do curso!

proyecto

Rodrigo Eduardo Méndez Villabona

Muhammad Luthfi

Nota do curso

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Vídeo de introdução: Todos e bem-vindos ao meu último curso, Introdução ao Colab. Então, quem sou eu e por que você deveria me ouvir? Bem, meu nome é o programador preguiçoso e sou autor de mais de 30 cursos on-line em ciência de dados, aprendizado de máquina e análise financeira. Tenho dois mestrados em engenharia e estatística. Minha carreira neste campo se estende por mais de 15 anos. Trabalhei em várias empresas que agora chamamos Big Tech e em várias startups. Usando a ciência de dados, aumentei as receitas milhões de dólares com as equipes que liderei. Mas o mais importante é que eu sou muito apaixonado por trazer essa tecnologia fundamental para você. Então, sobre o que é esse curso? Este curso é um coro muito simples criado para ajudar você a começar a usar o Google Colab. Agora, você deve estar se perguntando o que é o Google Colab? O Google Colab é uma plataforma de computação muito poderosa que permite que você execute em notebooks Jupyter na nuvem. Isso significa que você não precisa comprar hardware caro para fazer aprendizado de máquina e ciência de dados. Você pode simplesmente usar o hardware do Google para um festival gratuito. Você também tem acesso gratuito a GPUs e TPUs, que são essenciais para treinar redes neurais profundas modernas. Então, quem deve fazer esse curso e como você deve se preparar? Este curso foi desenvolvido para estudantes interessados em ciência de dados e aprendizado de máquina. Mas eu nunca ouvi falar de colab ou preciso de ajuda para configurá-lo. Você nem precisa saber programar para fazer este curso, embora isso possa ser útil se você quiser entender por que estamos fazendo o que fazemos. Então, em termos de recursos, o que você precisará para fazer este curso? Felizmente, não muito. Você precisará de um computador, um navegador da web e a conexão com a Internet. E se você está assistindo a este vídeo, então você já atende a essas condições. Agora, vamos falar sobre por que você deve fazer este curso e o que você deve esperar obter dele. Simplificando, o Google Colab é uma ferramenta poderosa e conveniente e é realmente incrível que possamos usá-lo gratuitamente. Ao usar o Google Colab, você poderá transferir todos os seus scripts importantes de ciência de dados e aprendizado de máquina para a nuvem e compartilhá-los facilmente com seus colegas. Ao final deste curso, você terá configurado o Google Colab em sua conta do Google. E você poderá executar seus próprios notebooks e usar as GPUs e TPUs gratuitas do Google. Então, espero que você esteja tão empolgado quanto eu para aprender sobre essa plataforma incrível. Obrigado por ouvir, e nos vemos na próxima palestra. 2. Como configurar o Google Colab: Nesta palestra, abordaremos um ambiente muito novo e empolgante para escrever código de aprendizado profundo em Python, que é o Colab do Google, abreviação de Collaboratory. Para aqueles que gostam de usar o notebook Jupiter, essa é uma opção ainda melhor. É basicamente o mesmo que o caderno Júpiter com os seguintes bônus. Primeiro, ele é hospedado pelo Google, o que significa que você não precisa usar seu próprio poder de computação. Você notará que quando você precisa baixar arquivos de dados, isso acontece de forma extremamente rápida porque, bem, a rede do Google é extremamente rápida. Segundo, você tem acesso a uma GPU e até mesmo à nova TPU do Google, o que é incrível. Um TPU não é algo que você pode comprar para seu computador pessoal. Portanto, é muito bom poder usar um. Lembre-se de que, da forma como o código do TensorFlow é escrito, você não precisa se preocupar com o tipo de dispositivo que está usando. Bem, na maioria das vezes, de um modo geral, o mesmo código funcionará se você estiver usando uma CPU, GPU ou TPU. Terceiro, os cadernos Colab são armazenados em seu Google Drive, então estão na nuvem. Você nunca o perderá e é muito fácil compartilhar com outras pessoas. A quarta é que muitas das bibliotecas de que você precisa para aprendizado profundo, aprendizado de máquina e ciência de dados já estão incluídas. Na verdade, fiquei surpreso com o fato haver muito mais do que imagino que existiriam lá ou até mesmo bibliotecas concorrentes de aprendizado profundo já incluídas, como o piano e o Py Torch. Então, para aqueles que odeiam fazer a configuração do ambiente, inclusive eu, isso é realmente incrível. Então, nesta palestra, não vamos fazer nada realmente complicado tecnicamente. Em vez disso, vamos falar sobre Google Colab e fazer algumas demonstrações curtas para que você saiba como ele funciona e possa ver por si mesmo que é como escrever Python em qualquer outro lugar. Para começar, presumo que você já saiba como criar uma conta no Google Drive. Se você não tiver um, acesse drive.google.com e cadastre-se. Depois de ter sua conta do Google Drive e fazer login, você verá essa interface. A partir daqui. Você pode acessar o novo menu, que permite criar todos os tipos diferentes de arquivos, como Google Docs, uma planilha, uma apresentação e assim por diante. Então, vamos fazer isso. Agora, o que você quer fazer é acessar o menu Mais e clicar em Colaboratório. Tudo bem, então, como você pode ver, isso traz um novo caderno. E a partir daqui, você pode usá-lo principalmente como faria com um notebook normal. Agora, uma coisa que pode acontecer com você é que talvez você não veja Colaboratório no menu. Então, como você pode ver, eu cliquei no menu Novo e cliquei em mais, mas não vejo o Colab nesse caso. Veja o que você pode fazer. Você deseja selecionar, Conectar mais aplicativos. A partir daqui, basta pesquisar por Colab. E a primeira coisa que vai aparecer é o Colab do Google. Adicione isso e o Google Colab estará disponível no menu que acabamos de ver. Então, se formos lá novamente, podemos ver que Colab e agora aparece onde deveria. Então, vamos entrar e renomear este caderno para tf dot Dato intro. Então, primeiro vamos direto às coisas boas. Como podemos usar uma GPU ou TPU? Para fazer isso, você deve ir ao menu de tempo de execução e selecionar Alterar tipo de tempo de execução. Como você pode ver, há duas caixas de seleção aqui. O primeiro permite que você selecione qual versão do Python você deseja usar. Então, usaremos o Python três para este curso. O segundo e permite selecionar o tipo de dispositivo que você deseja usar. Então, isso é nenhum, que é o padrão, ou GPU ou TPU. Agora, observe que às vezes a GPU ou TPU podem não estar disponíveis. Isso ocorre porque esses são recursos compartilhados. Portanto, seus colegas que fazem este curso e outros estudantes e pesquisadores de aprendizado de máquina em todo o mundo podem estar usando o Google Colab. E todos nós estamos compartilhando esses recursos. Portanto, se nosso uso desses recursos atingir o limite do que está disponível, talvez você não tenha uma GPU ou TPU disponível quando precisar delas. Por esse motivo, alguns dos códigos que você verá neste curso também podem ser feitos na minha máquina local. Mas lembre-se de que o código Python funciona da mesma forma em qualquer lugar, então não faz diferença. seguir, você pode ver que existem dois tipos principais de células que podemos criar no caderno. Código e texto. Você pode clicar em qualquer um deles para criar uma nova célula desse tipo. Vamos clicar em Texto, já que isso é um pouco mais fácil. Na verdade, não é algo que vamos usar com muita frequência, então vamos tirar isso do caminho. Então, na verdade, vou excluir a primeira célula. Tudo bem, como você pode ver, quando eu clico aqui, ele cria uma nova célula com o que parece ser um editor de texto rico. Você notará que está dividido em duas metades. A metade esquerda é onde você insere o texto e a metade direita é uma prévia de como ele ficará. Então, vamos inserir algum texto. Esse é o meu título. Agora você pode clicar no pequeno ícone t, grande T, que o transforma em texto de cabeçalho. Então você pode ver que isso torna isso um pouco maior e mais ousado, apropriado para um título. Em seguida, vamos inserir um texto normal. Esse é um texto normal. Observe que também existem esses colchetes de seta. Então, parece que vai nos permitir inserir trechos de código. Então, vamos tentar isso. E, como você pode ver, isso torna o texto uma fonte monoespacial , apropriada para código. Agora, existem algumas outras opções aqui. Assim, você pode criar um link, adicionar imagens, recuar, adicionar uma lista numerada ou com marcadores e assim por diante. Então, se você estiver interessado, brinque com isso. Caso contrário, não vamos mencionar isso novamente. Em seguida, temos a célula de código, então vamos criar uma dessas. Tudo bem, e como mencionado, não vamos escrever nenhum código sofisticado nesta palestra. Só queríamos fazer algo simples para garantir que tudo funcionasse conforme o esperado. Então, vamos começar importando o numpy e o matplotlib. Tudo bem, lindo. Como mencionei anteriormente, eles já vêm pré-instalados. Em seguida, vamos criar uma nova célula de código e criar uma onda senoidal. Então, primeiro precisamos criar alguns valores x. Então, vamos fazer x ir de 0 a 10 pi com 1.000 pontos intermediários. Em seguida, vamos fazer de y o seno de x. Em seguida, vamos criar uma nova célula e traçar o que acabamos de criar. Então, isso é apenas plt.plot x y. Agora, como este é um caderno, não há necessidade de chamar plt.show pois o enredo aparecerá apenas no próprio caderno. Tudo bem, muito legal. Funciona exatamente como um notebook normal. Nesse ponto, nos convencemos de que, no Google Colab, você pode fazer as coisas habituais que você esperaria de um notebook Jupyter. Agora, como mencionei anteriormente, uma coisa muito boa sobre o Colab é que ele já vem com várias bibliotecas úteis pré-instaladas. Na minha opinião, isso torna o Google Colab muito melhor do que o notebook Jupiter. E se alguém me pedisse para escrever em um ambiente de notebook, eu escolheria o Colab por padrão. Não sou muito fã de notebooks, mas sou um grande fã do Colab. Então, aqui podemos ver que eu escrevi alguns códigos para tentar importar várias bibliotecas. Especificamente, essas bibliotecas são bibliotecas que foram usadas em meus cursos, algumas mais do que outras. Alguns são muito raramente usados. Portanto, talvez você não espere que sejam incluídas bibliotecas como o Word Cloud, que usamos apenas uma vez até agora. No entanto, se olharmos, veremos que tudo o que tentei importar aqui não gera um erro. Então, isso nos diz que essas bibliotecas estão realmente disponíveis. O que é interessante para mim é que algumas dessas bibliotecas não estão nem um pouco relacionadas ao aprendizado de máquina. Obviamente, nós os usamos em meus cursos porque geralmente são úteis como bibliotecas Python. Mas é bom ver que o pessoal do Google também usa essas mesmas bibliotecas e pensa em incluí-las. Então, aqui você pode ver as coisas usuais, como scikit-learn, numpy, scipy, matplotlib em Pandas. Também temos o Torch e o Nano, que é surpreendente porque eles estão competindo bibliotecas de aprendizado profundo e o desenvolvimento para o gueto foi interrompido por um tempo. Agora. Também temos uma nuvem de palavras marítima, Beautiful Soup, que é para solicitações de análise de XML e HTML, que serve para fazer chamadas HTTP. Rede X, que é para funcionalidade gráfica, CB2, que é para OpenCV. E Jim, que é o OpenAI Gym. Em suma, muito impressionante e muito mais do que eu esperava. Então, há algumas ressalvas finais para o Colab de que eu queria mencionar isso. Primeiro, a principal coisa que você precisa lembrar é que essa é a nuvem, então esses são recursos compartilhados. Então, uma forma de isso afetar você é se você deixar seu notebook sozinho por um longo tempo, ele ficará inativo e se desconectará. Qualquer computação que você tenha executado anteriormente não será salva. Então, por exemplo , se você definir uma variável a igual a cinco e depois voltar depois que seu notebook foi desconectado e tentar imprimir a, ele dirá que a não está definido. Então você vê que esse notebook foi desconectado. Então, digamos que eu me reconecte e imprima a. Vai dizer que a não está definido. Outra forma de isso afetar você é que você pode ficar sem memória. Então, se isso acontecer, talvez você queira tentar executar o código em sua máquina local. E, conforme mencionado anteriormente, a GPU e a TPU podem não estar disponíveis. Então, ou você pode executar seu código sem a GPU ou a TPU, ou você pode executar o mesmo código localmente, como sempre, as opções que você tinha anteriormente ainda estão disponíveis. exemplo, você pode provisionar uma instância de GPU na AWS, que, se você escolher a AMI correta ou a instância de máquina da Amazon , também virá com as bibliotecas usuais pré-instaladas. 3. Instale o Tensorflow 2.0 no Colab (opcional): Agora, há um motivo pelo qual eu não mencionei TensorFlow especificamente na palestra anterior. Isso porque é sobre isso que vamos falar nesta palestra. Então, esta palestra será sobre como usar o TensorFlow até 0.0 no Colab. Você notará que, se importar o TensorFlow no Colab e verificar a versão, será 1.14. Então, vamos fazer isso. Agora. Obviamente, isso depende de quando você tenta fazer isso. Atualmente, no momento em que estou fazendo este curso, TensorFlow to 0.0 ainda está na versão beta, o que significa que ainda não foi lançado oficialmente. Portanto, se você tentar usar o comando usual, pip install TensorFlow, você não obterá o TensorFlow para 0.0. Obviamente, isso mudará no futuro quando o TensorFlow para 0.0 for lançado oficialmente, momento em que o comando usual pip install TensorFlow realmente fornecerá o TensorFlow para 0.0. E, claro, à medida que as versões subsequentes forem lançadas, isso mudará para 2.1 a 0.2 e assim por diante, ou qualquer número de versão que eles acabem usando. Felizmente, você pode instalar outras bibliotecas em um notebook Colab, que não veio com o notebook. Então, por exemplo se o Colab não viesse com o scikit-learn instalado, você simplesmente executaria o comando pip install scikit-learn dentro de uma célula de código dentro do notebook Colab. Em outras palavras, para instalar bibliotecas, é tão simples quanto executar os comandos PIP usuais. Você só precisa colocar o símbolo do estrondo primeiro, mais sobre isso depois. Por enquanto, estamos interessados no TensorFlow to 0.0. No momento em que fiz este vídeo, a versão atual do TensorFlow para 0.0 é beta-1. O comando atual seria Bang pip install menos q TensorFlow é igual a, igual a 2.0, 0.0 traço Beta-1. Observe que a opção menos q aqui significa silencioso, o que significa apenas imprimir menos coisas. Na verdade, ele não modifica a funcionalidade do comando. É importante ressaltar que aqui você deve ter em mente que uma das minhas famosas regras, aprenda os princípios, não a sintaxe. Isso é muito importante aqui. Por que eu digo isso? Bem, inevitavelmente, alguma alma perdida acabará dizendo: Por que devo usar esse comando quando o TensorFlow beta três for lançado? Isso não significa que a palestra está desatualizada? Você não deveria atualizar esta palestra? E lembre-se da regra, aprenda os princípios, não a sintaxe. Claro que hoje, a versão mais recente é a Beta-1. Amanhã isso pode ser Beta-2 e Beta-3 ou Beta quinhentos. Quem sabe? O princípio é consultar site do TensorFlow para verificar qual é o comando atual. Esse é o princípio. Não tente memorizar o comando de instalação literalmente, o que seria muito ridículo. Ok, então seja inteligente. Não seja boba. Aprenda os princípios e não memorize a sintaxe. Além disso, observe que você pode instalar a versão GPU do TensorFlow, que é, como de costume, pip install TensorFlow GPU. Curiosamente, no Colab, descobri que usar a GPU não é muito mais rápido do que usar a CPU. Portanto, para a maioria dos pequenos problemas, não importa muito o que você usa para TPUs. Discutiremos como isso funciona posteriormente no curso. Então, vamos executar isso. Então, depois de instalar o TensorFlow para 0.0, você pode verificar a versão novamente. Basta imprimir tf dot underscore, underscore version, underscore, underscore. E você deve ver 2.0, 0.0 ou algo similar. Então, vamos executar isso. Agora, há uma ressalva para isso, que é que descobri que às vezes não funciona. Então, mesmo depois de instalar o TensorFlow para 0.0, eu imprimo a versão e ela ainda diz 1.14. Parece que o problema é que se você importar TensorFlow e tentar alterar a versão, isso não funcionará. Portanto, se você fizer isso acidentalmente e realmente quiser que o TensorFlow chegue à 0.0, o que você deve fazer é primeiro garantir que você não esteja tentando importar o TensorFlow antes de instalar o TensorFlow. Então, vamos comentar isso. Em seguida, vamos ao menu de tempo de execução e selecione Reiniciar tempo de execução. Então, sim, então não estamos mais executando isso. Vamos apenas executar isso. E agora vamos executar isso. E isso funciona. Então, agora temos 2,0, 0,0 Beta-1. Agora, em geral, acho que isso é um pouco instável. Então, se eu executar esse notebook e tentar alterar a versão do TensorFlow mais tarde. Então, digamos que eu tente mudar de CPU para GPU ou o contrário, as coisas tendem a ficar um pouco estranhas. Então, o que eu gostaria de fazer é ter tudo definido desde o início, saber o que você quer usar e, em seguida, executá-lo assim desde o início e não tentar mudar as coisas no meio porque Às vezes, a coisa que você estava usando antes, é meio pegajosa. Portanto, mesmo que você tente mudar isso, na verdade não mudará. Agora, há outra ressalva importante, que é que, se você se lembra anteriormente, eu disse que se você deixar seu notebook inativo por muito tempo, ele se desconectará. Se isso acontecer, infelizmente, sua versão do TensorFlow voltará ao padrão e você precisará instalar o TensorFlow para 0.0 novamente. Agora, pessoalmente, não me importo de controlar todas as células a cada vez. Pois se eu realmente quisesse executar tudo de uma só vez, eu o executaria localmente. Mas se por algum motivo você quiser ter o TensorFlow to 0.0 Beta-1 instalado permanentemente em seu Colab. Você pode tentar a solução fornecida neste link que anexei. Novamente, isso depende de você. Mas, pessoalmente, eu não tinha um motivo para fazer isso sozinho. Então, você deve se lembrar que discutimos esse comando bancário, que, aliás, também existe no Jupyter Notebook normal. Até agora, você sabe que ele pode ser usado para executar comandos de instalação do pip. Mas, em geral, você pode tratar isso como uma diretiva que diz ao notebook que você deseja executar esse comando como faria no terminal, por exemplo, se eu quiser listar todos os arquivos no atual diretório, eu poderia usar o comando bang ls. Então, vamos tentar isso. Curiosamente, você verá que existe essa pasta que aparece chamada de dados de amostra. Portanto, podemos chamar manual como dados de amostra. Aqui você pode ver que temos o famoso conjunto de dados m-nest, o conjunto de dados California Housing e um arquivo JSON aleatório. Podemos ou não usá-los, mas eles são bons se você quiser apenas executar alguns testes simples, como, por exemplo, experimentar um classificador de imagens simples no m-nest. De qualquer forma, aí está. É assim que você usa o TensorFlow até 0.0 no Colab. No caso de ainda não ter sido lançado oficialmente. 4. Como carregar dados para a Colab: Nesta palestra, faremos mais algumas tarefas no Colab. Especificamente, veremos algumas maneiras de fazer upload de seu próprio conjunto de dados para o colab. Digamos, por exemplo, que seu cliente ou empregador forneça um arquivo CSV ou você baixe um CSV do Kaggle. Como podemos então tornar esse arquivo acessível a partir do nosso caderno Colab? Nesta palestra, discutiremos algumas maneiras diferentes de fazer isso. O primeiro método que vamos examinar é apenas usar o comando clássico do Linux W get. Conforme mencionado anteriormente, você pode executar comandos de linha de comando antes do comando com o símbolo de estrondo ou ponto de exclamação. Então, vamos fazer o download do conjunto de dados de arritmia. Agora, queremos verificar onde estão os dados e quando. Então, vamos usar bang ls para ver se os dados estão em nosso diretório atual. Ok, parece que é. Agora, vamos usar o comando head para ver as primeiras linhas do arquivo de dados. E também para verificar se o arquivo tem ou não uma linha de cabeçalho. Ok, então parece que não tem uma linha de cabeçalho. Em seguida, vamos tentar carregar os dados usando pandas. Vamos passá-lo no cabeçalho igual a nenhum, pois sabemos que os dados não têm um cabeçalho. Em seguida, como os dados têm muitas colunas, vamos ver apenas a primeira visualização. Também vamos renomear as colunas porque atualmente são apenas valores inteiros. Como de costume, como esses dados são do UCI Machine Learning Repository, basta verificar a documentação se quiser saber mais sobre os dados, como o que é cada coluna. Então, vamos executar isso. Próximo. Vamos criar um histograma dessas colunas de dados. Como o notebook, por padrão, torna o gráfico bem pequeno, vamos importar o matplotlib e alterar o tamanho da figura. Depois de fazer isso, podemos chamar df.head apenas para criar histogramas para cada coluna. Observe que adicionei um ponto e vírgula ao final de df.head só porque, se você não fizer isso, um caderno imprimirá o último valor retornado, como normalmente acontece, o que não queremos no momento. Então, aqui estão alguns bons histogramas para você ver. Em seguida, vamos criar um gráfico comum para análise de dados, a matriz de dispersão. Isso faz um gráfico de dispersão entre cada recurso e todos os outros recursos. Ao longo da diagonal. Ele apenas traça o histograma de cada recurso, que já vimos. Tudo bem, então é bastante normal até agora. Em seguida, vamos analisar o segundo método de carregamento e dados, que também se aplica quando você tem um URL. Isso é para usar o TensorFlow diretamente, especificamente a função de obtenção de arquivo Keras. Vamos começar atribuindo o URL a uma variável chamada URL. Vamos usar o conjunto de dados MPG automático. Embora realmente não importe o que você usa neste exemplo, contanto que você possa acessá-lo diretamente via URL. Vamos executar isso. Próximo. Vamos nos certificar de que temos TensorFlow to 0.0 instalado. Então, vamos executar pip install TensorFlow e imprimir a versão para garantir que tenhamos a correta. Em seguida, vamos chamar a função Keras get file. O primeiro argumento é o caminho do arquivo. Queremos salvar dois e o segundo argumento é a fonte do arquivo. Vamos executar isso. Note que é possível salvar o arquivo em um diretório diferente, mas vamos salvá-lo na pasta padrão Keras. Assim, você pode ver na impressão que o arquivo termina em conjuntos de dados slash, route, slash dot keras slash. Em seguida, vamos chamar o comando head para que possamos ver as primeiras linhas de um arquivo. Como você pode ver, não é exatamente um CSV. Em vez disso, cada coluna é separada por espaço em branco e não há nenhuma linha de cabeçalho. Então, para carregar esses dados, ainda podemos usar a função pandas read csv, mas precisamos passar dois argumentos. O primeiro argumento é dizer que não há linha de cabeçalho, cabeçalho é igual a nenhuma. E o segundo argumento extra é dizer aos pandas que o delimitador é um espaço em branco. Então, definimos o espaço em branco do membro igual a verdadeiro. Em seguida, chamamos df.head apenas para garantir que tudo funcione conforme o esperado. Então, como você pode ver, o resultado parece estar no formato correto. E a partir daqui, você pode processar esses dados usando o código Python, como faria normalmente. O terceiro método que analisaremos para adicionar seu próprio Colab mais rápido é fazer o upload do arquivo diretamente. Para fazer isso, precisamos executar uma função especial do Colab. Então, dizemos que do google dot Colab import files, então chamamos arquivos dot upload. Então, vamos executar isso. Então você vê que isso cria um botão de upload no qual podemos clicar e escolher um arquivo do sistema de arquivos local. Então, vou escolher as temperaturas mínimas diárias. E se imprimirmos o valor retornado, você pode ver que é um dicionário em que o nome do arquivo como chave e o valor é o conteúdo do arquivo. Se usarmos o comando e bang ls, podemos ver que o arquivo foi enviado para o diretório de trabalho. Em seguida, vamos ler o arquivo usando pandas para garantir que obtenhamos o que esperamos. Agora, esse arquivo tem algumas linhas de lixo perto do final. Então, eu expliquei isso definindo as linhas incorretas de erro do argumento iguais a falsas. Isso ignora os erros, mas os imprime à medida que são encontrados. Como você pode ver, o arquivo foi carregado com sucesso. Para acompanhar esse exemplo, veremos uma variação do que acabamos de fazer. Você lembra que quando você está escrevendo código em Python, às vezes é útil dividir seu código entre vários arquivos. Isso ajuda a organizar seu código e manter coisas semelhantes em um só lugar, mantendo as diferentes coisas separadas. Como um exemplo simples, às vezes aprenderemos sobre vários algoritmos em um curso, mas testaremos todos esses algoritmos no mesmo conjunto de dados. Não adianta reescrever o código para ser carregado no conjunto de dados e várias vezes diferentes. Em vez disso, podemos escrever o código de carregamento de dados uma vez e depois importá-lo de cada arquivo. Agora, você pode se perguntar se, como estamos trabalhando no Colab, como você pode importar uma função de um script Python? Se esse script Python estiver no seu disco rígido local. Felizmente, podemos adotar a mesma abordagem que já usamos para fazer o upload desse arquivo para o Google Colab. Então, aqui vou chamar os arquivos para fazer o upload novamente. E desta vez eu estou fazendo o upload do script Python, falso util dot py. Então, fake util dot py contém apenas uma função chamada Minha função útil. E tudo o que ele faz é imprimir Hello World. Depois de fazer o upload do arquivo, você pode ver que podemos importá-lo da mesma forma que faríamos se estivéssemos trabalhando localmente. Então, posso dizer de falso até importar minha função útil. Então, quando eu chamo minha função útil, você pode ver que o hello world está impresso exatamente como esperamos. E, a propósito, você pode estar se perguntando, como eu fiz, qual é realmente o caminho do diretório atual. Para determinar isso, basta executar o comando usual do Linux, PWD, e isso imprime o conteúdo da barra. Portanto, o Slash Content é nosso diretório de trabalho atual. A última coisa que eu queria abordar é algo que vocês provavelmente estão se perguntando. O Google Drive é para armazenar arquivos. Então, é possível acessar arquivos no seu Google Drive? E, claro, a resposta é sim. Então, para fazer isso, precisamos importar o drive do Google Colab. Em seguida, temos que montar a unidade chamando o Dr. Don mount e especificando a barra de conteúdo da barra de caminho G Drive. Então, isso vai te dar um código de autorização. Então você acessa o URL no seu navegador. Ele solicita que você faça login para aceitar alguns termos. E então ele fornece um código C, você copia esse código e o coloca de volta nesta caixa. Você pressiona enter. Ok, então isso funciona. Então, depois de fazer isso, podemos chamar ls novamente para verificar o que está agora no diretório atual. Podemos ver que agora há uma coisa extra aqui, G Drive. Então, vamos lá, dirija e veja o que isso nos dá. Tudo bem, então parece que agora temos uma coisa chamada Google Drive. Mais uma vez, lembre-se de que você precisa adicionar aspas se o caminho contiver espaços em branco. E agora podemos ver vários arquivos que estão no meu Google Drive, que é essencialmente um monte de conteúdo VIP para as versões VIP dos meus cursos.

Introdução ao Google Colab, instale o Tensorflow 2. 0, GPU e TPU grátis

Lazy Programmer Inc

Assista a este curso e milhares de outros

Assista a este curso e milhares de outros

Aulas neste curso

1.

Vídeo de introdução

2:42

2.

Como configurar o Google Colab

12:25

3.

Instalar o Tensorflow 2.0 no Colab (opcional)

7:53

4.

Como fazer upload de dados para o Colab

11:31

Sobre este curso

Conheça seu professor

Lazy Programmer Inc

Habilidades relacionadas

Projeto prático de curso

Nota do curso

Por que fazer parte da Skillshare?

Aprenda em qualquer lugar

Transcrições

Introdução ao Google Colab, instale o Tensorflow 2. 0, GPU e TPU grátis

Lazy Programmer Inc

Assista a este curso e milhares de outros

Assista a este curso e milhares de outros

Aulas neste curso

1.

Vídeo de introdução

2:42

2.

Como configurar o Google Colab

12:25

3.

Instalar o Tensorflow 2.0 no Colab (opcional)

7:53

4.

Como fazer upload de dados para o Colab

11:31

Sobre este curso

Conheça seu professor

Lazy Programmer Inc

Habilidades relacionadas

Projeto prático de curso

Nota do curso

Por que fazer parte da Skillshare?

Aprenda em qualquer lugar

Cursos relacionados

Transcrições