Transcrições
1. Vídeo de introdução: Todos e bem-vindos ao meu
último curso, Introdução ao Colab. Então, quem sou eu e por que você
deveria me ouvir? Bem, meu nome é o
programador preguiçoso e sou autor de mais de 30
cursos on-line em ciência de dados, aprendizado de
máquina e análise
financeira. Tenho dois mestrados em engenharia e estatística. Minha carreira neste campo se
estende por mais de 15 anos. Trabalhei em várias
empresas que agora chamamos Big Tech e em várias startups. Usando a ciência de dados,
aumentei as receitas milhões de dólares com
as equipes que liderei. Mas o mais importante é
que eu sou muito
apaixonado por trazer essa tecnologia
fundamental para você. Então, sobre o que é esse curso? Este curso é um coro muito
simples criado para ajudar você a
começar a usar o Google Colab. Agora, você deve estar se perguntando o que é o Google Colab? O Google Colab é uma plataforma de computação muito
poderosa que permite que você execute em notebooks
Jupyter na nuvem. Isso significa que você não
precisa comprar hardware
caro para fazer aprendizado
de máquina
e ciência de dados. Você pode simplesmente usar o
hardware do Google para um festival gratuito. Você também tem acesso gratuito
a GPUs e TPUs, que são essenciais para treinar redes neurais profundas
modernas. Então, quem deve fazer esse curso e como você deve se preparar? Este curso foi desenvolvido
para estudantes
interessados em ciência de dados
e aprendizado de máquina. Mas eu nunca ouvi falar de colab ou preciso de ajuda
para configurá-lo. Você nem precisa saber
programar para fazer este curso, embora isso possa ser
útil se você quiser
entender por que estamos
fazendo o que fazemos. Então, em termos de recursos, o que você precisará
para fazer este curso? Felizmente, não muito. Você precisará de um computador, um navegador da web e a
conexão com a Internet. E se você está
assistindo a este vídeo, então você já atende a
essas condições. Agora, vamos falar sobre
por que você deve fazer este curso e o que você deve
esperar obter dele. Simplificando, o Google Colab é uma ferramenta poderosa
e conveniente e é realmente incrível que
possamos usá-lo gratuitamente. Ao usar o Google Colab, você poderá
transferir todos os
seus
scripts importantes de ciência de dados
e aprendizado de máquina para a nuvem e compartilhá-los
facilmente
com seus colegas. Ao final deste curso, você terá configurado o Google
Colab em sua conta do Google. E você poderá executar
seus próprios notebooks e usar
as GPUs e TPUs
gratuitas do Google. Então, espero que você esteja
tão empolgado quanto eu para aprender sobre essa plataforma
incrível. Obrigado por ouvir, e nos
vemos na próxima palestra.
2. Como configurar o Google Colab: Nesta palestra,
abordaremos um ambiente muito novo e
empolgante para escrever código de
aprendizado profundo em Python, que é o Colab do Google,
abreviação de Collaboratory. Para aqueles que gostam de
usar o notebook Jupiter, essa é uma opção ainda melhor. É basicamente o mesmo que o caderno
Júpiter com
os seguintes bônus. Primeiro, ele é hospedado pelo Google, o que significa que você não precisa usar seu próprio poder de computação. Você notará que quando você
precisa baixar arquivos de dados, isso acontece de
forma extremamente rápida porque, bem, a rede do Google
é extremamente rápida. Segundo, você tem acesso a uma GPU e até mesmo à nova TPU do Google, o que é incrível. Um TPU não é algo que você pode comprar para seu computador pessoal. Portanto, é muito bom
poder usar um. Lembre-se de que, da forma como o código do
TensorFlow é escrito, você não precisa se preocupar com o tipo de dispositivo
que está usando. Bem, na maioria das vezes, de um
modo geral, o mesmo código funcionará
se você estiver usando uma CPU, GPU ou TPU. Terceiro, os cadernos Colab são armazenados em seu Google Drive, então estão na nuvem. Você nunca o perderá e é muito fácil compartilhar
com outras pessoas. A quarta é que muitas
das bibliotecas de que você precisa
para aprendizado profundo, aprendizado
de máquina e
ciência de dados já estão incluídas. Na verdade, fiquei surpreso com o fato haver muito
mais do que imagino que
existiriam lá ou até mesmo bibliotecas
concorrentes de aprendizado profundo já incluídas, como o piano e o Py Torch. Então, para aqueles que odeiam
fazer a configuração do ambiente, inclusive
eu, isso é
realmente incrível. Então, nesta palestra, não
vamos fazer nada realmente complicado
tecnicamente. Em vez disso,
vamos falar sobre Google Colab e fazer algumas
demonstrações curtas para que você saiba como ele funciona e possa ver por si mesmo que é como escrever
Python em qualquer outro lugar. Para começar,
presumo que você já saiba como criar uma conta
no Google Drive. Se você não tiver um, acesse drive.google.com
e cadastre-se. Depois de ter sua
conta do Google Drive e fazer login, você verá essa interface. A partir daqui. Você pode
acessar o novo menu, que permite criar
todos os tipos diferentes de arquivos, como Google Docs, uma planilha, uma
apresentação e assim por diante. Então, vamos fazer isso. Agora, o que você
quer fazer é acessar o menu Mais e
clicar em Colaboratório. Tudo bem, então, como você pode ver, isso traz um novo caderno. E a partir daqui, você pode
usá-lo principalmente como faria com
um notebook normal. Agora, uma coisa que pode
acontecer com você é que talvez você não veja Colaboratório
no menu. Então, como você pode ver, eu cliquei no menu Novo
e cliquei em mais, mas não vejo o
Colab nesse caso. Veja o que você pode fazer. Você deseja selecionar, Conectar mais aplicativos. A partir daqui, basta
pesquisar por Colab. E a primeira coisa que vai
aparecer é o Colab do Google. Adicione isso e o Google
Colab estará disponível no menu
que acabamos de ver. Então, se formos lá novamente, podemos ver que Colab e
agora aparece onde deveria. Então, vamos entrar e
renomear este caderno para tf dot Dato intro. Então, primeiro vamos
direto às coisas boas. Como podemos usar
uma GPU ou TPU? Para fazer isso,
você deve ir ao menu de tempo de execução e selecionar
Alterar tipo de tempo de execução. Como você pode ver, há
duas caixas de seleção aqui. O primeiro permite que você selecione qual versão do Python
você deseja usar. Então, usaremos o Python
três para este curso. O segundo e permite selecionar o tipo de dispositivo
que você deseja usar. Então, isso é nenhum, que é o padrão, ou GPU ou TPU. Agora, observe que
às vezes a GPU ou TPU podem não estar disponíveis. Isso ocorre porque esses
são recursos compartilhados. Portanto, seus colegas que fazem este
curso e outros
estudantes e pesquisadores de aprendizado de máquina
em todo o mundo podem
estar usando o Google Colab. E todos nós estamos compartilhando
esses recursos. Portanto, se nosso uso
desses recursos atingir o
limite do que está disponível, talvez você não tenha uma GPU ou TPU disponível quando
precisar delas. Por esse motivo, alguns
dos códigos que você verá
neste curso também podem ser feitos na
minha máquina local. Mas lembre-se de que o código Python
funciona da mesma forma em qualquer lugar, então não
faz diferença. seguir, você pode ver que existem dois tipos principais de células que podemos criar no caderno. Código e texto. Você pode clicar em qualquer um deles para criar uma nova
célula desse tipo. Vamos clicar em Texto, já que isso é um pouco mais fácil. Na verdade, não é algo que
vamos usar com muita frequência, então vamos tirar
isso do caminho. Então, na verdade, vou
excluir a primeira célula. Tudo bem, como você pode
ver, quando eu clico aqui, ele cria uma nova célula com o que parece ser
um editor de texto rico. Você notará que está
dividido em duas metades. A metade esquerda é onde
você
insere o texto e a metade direita é uma prévia de como ele ficará. Então, vamos inserir algum texto. Esse é o meu título. Agora você pode clicar no pequeno ícone t, grande T, que o transforma
em texto de cabeçalho. Então você pode ver que isso
torna isso um pouco maior
e mais ousado, apropriado
para um título. Em seguida, vamos inserir
um texto normal. Esse é um texto normal. Observe que também existem
esses colchetes de seta. Então, parece que vai nos
permitir inserir trechos de código. Então, vamos tentar isso. E, como você pode ver, isso torna o texto
uma fonte monoespacial
, apropriada para código. Agora, existem algumas
outras opções aqui. Assim, você pode criar um link, adicionar imagens, recuar, adicionar uma lista
numerada ou com marcadores e assim por diante. Então, se você estiver interessado, brinque com isso. Caso contrário, não vamos
mencionar isso novamente. Em seguida, temos a célula de código, então vamos criar uma dessas. Tudo bem, e como mencionado, não
vamos escrever nenhum código
sofisticado nesta palestra. Só queríamos
fazer algo simples para garantir que tudo
funcionasse conforme o esperado. Então, vamos começar importando o
numpy e o matplotlib. Tudo bem, lindo. Como mencionei anteriormente, eles já vêm
pré-instalados. Em seguida, vamos criar uma nova
célula de código e criar uma onda senoidal. Então, primeiro precisamos
criar alguns valores x. Então, vamos fazer x ir de 0 a 10 pi
com 1.000 pontos intermediários. Em seguida, vamos fazer de
y o seno de x. Em seguida, vamos criar uma nova célula e traçar o que acabamos de criar. Então, isso é apenas plt.plot x y. Agora, como este é um caderno, não
há necessidade de chamar plt.show pois o enredo
aparecerá apenas no próprio caderno. Tudo bem, muito legal. Funciona exatamente como um notebook
normal. Nesse ponto,
nos convencemos de que, no Google Colab, você pode fazer as coisas
habituais que você
esperaria de um notebook Jupyter. Agora, como mencionei anteriormente, uma coisa muito boa
sobre o Colab é que ele já vem com várias
bibliotecas úteis pré-instaladas. Na minha opinião, isso torna o Google Colab muito melhor
do que o notebook Jupiter. E se alguém me pedisse para escrever em um ambiente de
notebook, eu escolheria o Colab por padrão. Não sou muito fã de notebooks, mas sou um grande fã do Colab. Então, aqui podemos ver
que eu escrevi alguns códigos para tentar importar
várias bibliotecas. Especificamente, essas
bibliotecas são bibliotecas que foram
usadas em meus cursos, algumas mais do que outras. Alguns são muito raramente usados. Portanto, talvez você não espere
que sejam incluídas bibliotecas
como o Word Cloud, que
usamos apenas uma vez até agora. No entanto, se
olharmos, veremos que tudo o que
tentei importar aqui
não gera um erro. Então, isso nos diz
que essas bibliotecas estão realmente disponíveis. O que é interessante para
mim é que algumas
dessas bibliotecas não estão nem um pouco relacionadas ao
aprendizado de máquina. Obviamente, nós os usamos
em meus cursos porque geralmente
são úteis
como bibliotecas Python. Mas é bom ver que o
pessoal do Google também usa essas mesmas bibliotecas e pensa em incluí-las. Então, aqui você pode ver as
coisas usuais, como scikit-learn, numpy, scipy,
matplotlib em Pandas. Também temos o Torch e o Nano, que é surpreendente
porque eles estão competindo bibliotecas de aprendizado
profundo e o
desenvolvimento para o gueto
foi interrompido por um tempo. Agora. Também temos uma
nuvem de palavras marítima, Beautiful Soup, que é para solicitações de análise de XML e
HTML, que serve para fazer chamadas HTTP. Rede X, que é para funcionalidade
gráfica, CB2, que é para OpenCV. E Jim, que é o OpenAI Gym. Em suma, muito impressionante e
muito mais do que eu esperava. Então, há algumas ressalvas finais para o Colab de que eu
queria mencionar isso. Primeiro, a principal
coisa que você precisa lembrar é que
essa é a nuvem, então esses são recursos compartilhados. Então, uma forma de isso
afetar você é se você deixar seu notebook
sozinho por um longo tempo, ele ficará inativo
e se desconectará. Qualquer computação que
você tenha executado anteriormente não será salva. Então, por exemplo ,
se você definir uma
variável a igual a cinco e depois voltar
depois que seu notebook foi desconectado e tentar
imprimir a, ele dirá que a não está definido. Então você vê que esse notebook
foi desconectado. Então, digamos que eu me
reconecte e imprima a. Vai dizer que
a não está definido. Outra forma de isso afetar você é que você pode ficar
sem memória. Então, se isso acontecer, talvez
você queira tentar executar o código em sua
máquina local. E, conforme mencionado anteriormente, a GPU e a TPU podem não
estar disponíveis. Então, ou você pode executar seu
código sem a GPU ou a TPU, ou você pode executar o mesmo
código localmente, como sempre, as opções que você tinha anteriormente ainda
estão disponíveis. exemplo, você pode provisionar
uma instância de GPU na AWS,
que, se você escolher a AMI
correta ou a instância de
máquina da Amazon , também virá com as bibliotecas usuais
pré-instaladas.
3. Instale o Tensorflow 2.0 no Colab (opcional): Agora, há um motivo pelo qual
eu não mencionei TensorFlow especificamente
na palestra anterior. Isso porque é sobre isso
que vamos
falar nesta palestra. Então, esta palestra será sobre como
usar o TensorFlow até 0.0 no Colab. Você notará que, se
importar o TensorFlow no Colab e verificar a
versão, será 1.14. Então, vamos fazer isso. Agora. Obviamente, isso
depende de quando você tenta fazer isso. Atualmente, no momento em que
estou fazendo este curso, TensorFlow to 0.0 ainda
está na versão beta, o que significa que ainda não foi lançado
oficialmente. Portanto, se você tentar usar
o comando usual, pip install TensorFlow, você não obterá o
TensorFlow para 0.0. Obviamente, isso
mudará no futuro
quando o TensorFlow para 0.0
for lançado oficialmente, momento em que o
comando usual pip install TensorFlow realmente
fornecerá o
TensorFlow para 0.0. E, claro, à medida que
as versões subsequentes forem lançadas, isso mudará
para 2.1 a 0.2 e assim por diante, ou qualquer
número de versão que eles acabem usando. Felizmente, você pode instalar outras bibliotecas em
um notebook Colab, que não veio com
o notebook. Então, por exemplo se o Colab não viesse com o
scikit-learn instalado, você simplesmente executaria
o comando pip install scikit-learn dentro de uma célula de código dentro do notebook Colab. Em outras palavras,
para instalar bibliotecas, é tão simples quanto executar
os comandos PIP usuais. Você só precisa
colocar o símbolo do estrondo primeiro, mais sobre isso depois. Por enquanto, estamos interessados
no TensorFlow to 0.0. No momento em que fiz este vídeo, a versão atual do
TensorFlow para 0.0 é beta-1. O comando atual seria Bang pip install menos
q TensorFlow é igual a, igual a 2.0, 0.0 traço Beta-1. Observe que a
opção menos q aqui significa silencioso, o que significa apenas
imprimir menos coisas. Na verdade, ele não modifica a funcionalidade
do comando. É importante ressaltar que aqui
você deve ter em
mente que uma das
minhas famosas regras, aprenda os princípios,
não a sintaxe. Isso é muito importante aqui. Por que eu digo isso? Bem, inevitavelmente, alguma
alma perdida acabará dizendo: Por que devo usar esse comando
quando o TensorFlow
beta três for lançado? Isso não significa que a
palestra está desatualizada? Você não deveria atualizar
esta palestra? E lembre-se da regra, aprenda os princípios,
não a sintaxe. Claro que hoje, a versão
mais recente é a Beta-1. Amanhã isso pode
ser Beta-2 e Beta-3 ou Beta quinhentos. Quem sabe? O
princípio é consultar site do
TensorFlow para verificar qual é o comando atual. Esse é o princípio. Não tente memorizar o comando de
instalação literalmente, o que seria muito ridículo. Ok, então seja inteligente. Não seja boba.
Aprenda os princípios e não memorize a sintaxe. Além disso, observe que você pode instalar a versão GPU do TensorFlow, que é, como de costume, pip install TensorFlow GPU. Curiosamente, no
Colab, descobri que usar a GPU não é muito
mais rápido do que usar a CPU. Portanto, para a maioria dos pequenos problemas, não
importa
muito o que você usa para TPUs. Discutiremos como isso funciona posteriormente
no curso. Então, vamos executar isso. Então, depois de instalar o
TensorFlow para 0.0, você pode verificar a versão novamente. Basta imprimir tf
dot underscore, underscore version,
underscore, underscore. E você deve ver 2.0, 0.0 ou algo similar. Então, vamos executar isso. Agora, há uma ressalva para isso, que é que descobri que às vezes
não funciona. Então, mesmo depois de instalar o
TensorFlow para 0.0, eu imprimo a versão
e ela ainda diz 1.14. Parece que o
problema é que se você importar TensorFlow e tentar alterar a versão,
isso não funcionará. Portanto, se você fizer
isso acidentalmente e realmente
quiser que o TensorFlow
chegue à 0.0, o que você deve fazer é primeiro garantir que você não esteja tentando importar o TensorFlow
antes de instalar o TensorFlow. Então, vamos comentar isso. Em seguida, vamos
ao menu de tempo de execução e selecione Reiniciar tempo de execução. Então, sim, então não estamos
mais executando isso. Vamos apenas executar isso. E agora vamos executar isso. E isso funciona. Então, agora temos 2,0, 0,0 Beta-1. Agora, em geral, acho
que isso é um pouco instável. Então, se eu executar esse
notebook e tentar alterar a versão do
TensorFlow mais tarde. Então, digamos que eu tente mudar de
CPU para GPU ou o contrário, as coisas tendem a ficar
um pouco estranhas. Então, o que eu gostaria de fazer é ter tudo definido
desde o início, saber o que você quer usar
e, em seguida, executá-lo assim desde
o início e não tentar mudar as coisas no meio porque Às vezes, a coisa
que você estava usando antes, é meio pegajosa. Portanto, mesmo que você tente mudar
isso, na verdade não mudará. Agora, há outra ressalva
importante,
que é que, se você se
lembra anteriormente, eu disse que se você deixar
seu notebook inativo por muito tempo,
ele se desconectará. Se isso acontecer, infelizmente, sua versão do TensorFlow
voltará
ao padrão e você precisará
instalar o TensorFlow para 0.0 novamente. Agora, pessoalmente, não me importo de controlar todas as
células a cada vez. Pois se eu realmente quisesse
executar tudo de uma só vez, eu o executaria localmente. Mas se por algum motivo você
quiser ter o TensorFlow to 0.0 Beta-1
instalado permanentemente em seu Colab. Você pode tentar a solução fornecida neste
link que anexei. Novamente, isso depende de você. Mas, pessoalmente, eu não tinha
um motivo para fazer isso sozinho. Então, você deve se lembrar que
discutimos esse comando bancário,
que, aliás, também existe no
Jupyter Notebook normal. Até agora, você sabe que
ele pode ser usado para executar comandos de instalação do pip. Mas, em geral,
você pode tratar isso como uma diretiva
que
diz ao notebook que você deseja
executar esse comando como faria
no terminal, por exemplo, se eu quiser listar todos os arquivos
no atual diretório, eu poderia usar o comando bang ls. Então, vamos tentar isso. Curiosamente, você
verá que existe essa pasta que aparece
chamada de dados de amostra. Portanto, podemos chamar manual
como dados de amostra. Aqui você pode ver que temos
o famoso conjunto de dados m-nest,
o conjunto de dados California Housing e um arquivo JSON aleatório. Podemos ou não usá-los, mas eles são bons
se você quiser apenas
executar alguns testes simples, como, por exemplo, experimentar um
classificador de imagens simples no m-nest. De qualquer forma, aí está. É assim que você usa o
TensorFlow até 0.0 no Colab. No caso de ainda não
ter sido lançado oficialmente.
4. Como carregar dados para a Colab: Nesta palestra,
faremos mais
algumas tarefas no Colab. Especificamente,
veremos
algumas maneiras de fazer upload de seu
próprio conjunto de dados para o colab. Digamos, por exemplo, que seu cliente
ou empregador forneça um arquivo CSV ou você baixe
um CSV do Kaggle. Como podemos então tornar esse arquivo acessível a partir do nosso caderno
Colab? Nesta palestra, discutiremos algumas
maneiras diferentes de fazer isso. O primeiro método que
vamos examinar é apenas
usar o comando clássico do
Linux W get. Conforme mencionado anteriormente,
você pode executar
comandos de linha de comando antes do comando
com o símbolo de estrondo
ou ponto de exclamação. Então, vamos fazer
o download do conjunto de dados de arritmia. Agora, queremos verificar
onde estão os dados e quando. Então, vamos usar bang ls para ver se os dados estão em
nosso diretório atual. Ok, parece que é. Agora, vamos usar o comando
head para ver as primeiras linhas
do arquivo de dados. E também para verificar se o arquivo tem ou não uma linha de cabeçalho. Ok, então parece que
não tem uma linha de cabeçalho. Em seguida, vamos tentar carregar
os dados usando pandas. Vamos passá-lo no cabeçalho igual
a nenhum, pois sabemos que os dados
não têm um cabeçalho. Em seguida, como os dados
têm muitas colunas, vamos ver apenas a primeira visualização. Também vamos
renomear as colunas porque atualmente são
apenas valores inteiros. Como de costume, como
esses dados são
do UCI Machine
Learning Repository, basta verificar
a documentação se quiser saber
mais sobre os dados, como o que é cada coluna. Então, vamos executar isso. Próximo. Vamos criar um histograma
dessas colunas de dados. Como o notebook, por padrão,
torna o gráfico bem pequeno, vamos importar o matplotlib e alterar
o tamanho da figura. Depois de fazer isso, podemos chamar df.head apenas para criar histogramas
para cada coluna. Observe que adicionei um
ponto e vírgula ao final de df.head só porque,
se você não
fizer isso, um caderno
imprimirá o último valor retornado, como normalmente acontece, o que não queremos no momento. Então, aqui estão alguns bons histogramas
para você ver. Em seguida, vamos criar
um gráfico comum para análise de
dados, a matriz de
dispersão. Isso faz um gráfico de dispersão entre cada recurso e
todos os outros recursos. Ao longo da diagonal.
Ele apenas traça o histograma de cada recurso, que já vimos. Tudo bem, então é bastante
normal até agora. Em seguida, vamos analisar o segundo método de
carregamento e dados, que também se aplica
quando você tem um URL. Isso é para usar o
TensorFlow diretamente, especificamente a função de
obtenção de arquivo Keras. Vamos começar atribuindo o URL a uma
variável chamada URL. Vamos usar
o conjunto de dados MPG automático. Embora
realmente não importe o que você usa neste exemplo, contanto que você possa
acessá-lo diretamente via URL. Vamos executar isso. Próximo. Vamos nos certificar de que temos TensorFlow to 0.0 instalado. Então, vamos executar pip
install TensorFlow e imprimir a
versão para garantir que tenhamos a correta. Em seguida, vamos chamar
a função Keras get file. O primeiro argumento
é o caminho do arquivo. Queremos salvar dois e o segundo argumento
é a fonte do arquivo. Vamos executar isso. Note que é possível salvar o arquivo em um diretório
diferente, mas vamos salvá-lo na pasta padrão
Keras. Assim, você pode ver
na impressão que o arquivo termina em conjuntos de dados slash, route, slash dot
keras slash. Em seguida, vamos chamar o
comando head para que possamos ver as primeiras
linhas de um arquivo. Como você pode ver,
não é exatamente um CSV. Em vez disso, cada coluna
é separada por espaço em branco e não
há nenhuma linha de cabeçalho. Então, para carregar esses dados, ainda
podemos usar a função
pandas read csv, mas precisamos passar
dois argumentos. O primeiro argumento é
dizer que
não há linha de cabeçalho,
cabeçalho é igual a nenhuma. E o segundo
argumento extra é
dizer aos pandas que o
delimitador é um espaço em branco. Então, definimos o
espaço em branco do membro igual a verdadeiro. Em seguida, chamamos df.head apenas para garantir que tudo
funcione conforme o esperado. Então, como você pode ver, o resultado parece estar
no formato correto. E a partir daqui, você pode
processar esses dados usando o código Python, como
faria normalmente. O terceiro método que
analisaremos para adicionar seu próprio Colab
mais rápido é fazer
o upload do arquivo diretamente. Para fazer isso,
precisamos executar uma função especial do Colab. Então, dizemos que do google
dot Colab import files, então chamamos arquivos dot upload. Então, vamos executar isso. Então você vê que isso cria um botão de upload no qual podemos clicar e escolher um arquivo
do sistema de arquivos local. Então, vou escolher as temperaturas mínimas
diárias. E se imprimirmos
o valor retornado, você pode ver que é um
dicionário em que o nome do arquivo como chave e o valor
é o conteúdo do arquivo. Se usarmos o
comando e bang ls, podemos ver que
o arquivo foi enviado para o diretório de
trabalho. Em seguida, vamos ler
o arquivo usando pandas para garantir que
obtenhamos o que esperamos. Agora, esse arquivo tem algumas linhas de
lixo perto do final. Então, eu expliquei isso definindo
as
linhas incorretas de erro do argumento iguais a falsas. Isso ignora os erros, mas os
imprime à medida
que são encontrados. Como você pode ver, o arquivo
foi carregado com sucesso. Para acompanhar esse exemplo, veremos uma
variação do que acabamos de fazer. Você lembra que quando você está
escrevendo código em Python, às vezes é útil dividir seu código entre vários arquivos. Isso ajuda a organizar seu código e manter coisas semelhantes em um só lugar, mantendo as
diferentes coisas separadas. Como um exemplo simples, às vezes aprenderemos sobre vários algoritmos
em um curso, mas testaremos todos esses
algoritmos no mesmo conjunto de dados. Não adianta
reescrever o código para ser carregado no conjunto de dados e
várias vezes diferentes. Em vez disso, podemos escrever
o código de carregamento de dados uma vez e depois
importá-lo de cada arquivo. Agora, você pode se perguntar se,
como estamos trabalhando no Colab, como você pode importar uma função
de um script Python? Se esse script Python estiver
no seu disco rígido local. Felizmente, podemos adotar a mesma
abordagem que
já usamos para fazer o upload desse
arquivo para o Google Colab. Então, aqui vou chamar os
arquivos para fazer o upload novamente. E desta vez eu estou fazendo
o upload do script Python, falso util dot py. Então, fake util dot py contém apenas uma função chamada
Minha função útil. E tudo o que ele faz é
imprimir Hello World. Depois de fazer o upload do arquivo, você pode ver que
podemos importá-lo da
mesma forma que faríamos se
estivéssemos trabalhando localmente. Então, posso dizer de falso até
importar minha função útil. Então, quando eu chamo minha função
útil, você pode ver que o hello world está impresso exatamente como esperamos. E, a propósito, você
pode estar se perguntando, como eu fiz, qual é realmente o caminho do
diretório atual. Para determinar isso,
basta executar o comando usual do Linux, PWD, e isso
imprime o conteúdo da barra. Portanto, o Slash Content é nosso diretório de trabalho
atual. A última coisa que eu
queria abordar é algo que vocês
provavelmente estão se perguntando. O Google Drive é
para armazenar arquivos. Então, é possível acessar
arquivos no seu Google Drive? E, claro, a resposta é sim. Então, para fazer isso, precisamos importar o drive
do Google Colab. Em seguida, temos que
montar a unidade
chamando o Dr. Don mount e especificando a barra de
conteúdo da barra de caminho G Drive. Então, isso vai
te dar um código de autorização. Então você acessa o URL
no seu navegador. Ele solicita que você faça login para aceitar alguns termos. E então ele fornece um código C, você copia esse código e o
coloca de volta nesta caixa. Você pressiona enter. Ok, então isso funciona. Então, depois de fazer isso, podemos chamar ls novamente para verificar o que está agora
no diretório atual. Podemos ver que agora há
uma coisa extra aqui, G Drive. Então, vamos lá, dirija e
veja o que isso nos dá. Tudo bem, então
parece que agora temos uma coisa chamada Google Drive. Mais uma vez, lembre-se de que você
precisa adicionar aspas se o caminho contiver espaços em branco. E agora podemos ver vários arquivos que estão no
meu Google Drive, que é essencialmente um monte de conteúdo
VIP para as
versões VIP dos meus cursos.