Transcripciones
1. Video de introducción: Todos y bienvenidos a mi
último Curso, Introducción a Colab. Entonces, ¿quién soy y por qué
deberías escucharme? Bueno, mi nombre es el
programador perezoso y soy autor de más
de 30
cursos en línea en ciencia de datos, aprendizaje
automático y análisis
financiero. Tengo dos maestrías en ingeniería y estadística. Mi trayectoria en este campo
abarca más de 15 años. He trabajado en varias
empresas que ahora llamamos Big Tech y múltiples startups. Usando la ciencia de datos, he
aumentado los ingresos millones de dólares con
los equipos que he dirigido. Pero lo más importante es
que me
apasiona traerte esta tecnología
fundamental. Entonces, ¿de qué se trata este curso? Este curso es un coro muy
sencillo diseñado para ayudarte a empezar
con Google Colab. Ahora, tal vez te estés preguntando, ¿qué es Google Colab? Google Colab es una plataforma informática muy
potente que permite ejecutar en Jupyter Notebooks in the Cloud. Esto significa que no
necesita comprar hardware
costoso para hacer aprendizaje
automático
y ciencia de datos. Simplemente puedes usar el
hardware de Google para festival gratis. También obtienes acceso gratuito
a GPU y TPUs, que son esenciales para entrenar redes neuronales profundas
modernas. Entonces, ¿quién debe tomar este curso y cómo debe prepararse? Este curso está diseñado
para aquellos estudiantes
interesados en la ciencia de datos
y el aprendizaje automático. Pero nunca he oído hablar de colab ni necesito ayuda
para configurarlo. Ni siquiera necesitas
saber
codificar para tomar este curso, aunque eso podría ser
útil si quieres
entender por qué estamos
haciendo lo que hacemos. Entonces, en cuanto a recursos, ¿qué necesitarás para
poder tomar este curso? Por suerte, no mucho. Necesitará una computadora, un navegador web y la
conexión a Internet. Y si estás
viendo este video, entonces ya cumples con
estas condiciones. Ahora, hablemos de
por qué deberías tomar este curso y qué debes
esperar sacar de él. En pocas palabras, Google Colab es una herramienta poderosa
y conveniente y es realmente increíble que
podamos usarla de forma gratuita. Al usar Google Colab, podrás
descargar todos
tus
scripts importantes de ciencia de datos
y aprendizaje automático a la nube y compartirlos
fácilmente
con tus colegas. Al finalizar este curso, habrás configurado Google
Colab en tu cuenta de Google. Y podrás ejecutar
tus propios portátiles y hacer uso de las GPU y TPUs
gratuitas de Google. Entonces espero que estés tan emocionado
como yo conocer esta
increíble plataforma. Gracias por escuchar, y nos
vemos en la próxima conferencia.
2. Cómo configurar Google Colab: En esta conferencia,
vamos a repasar un entorno muy nuevo y
emocionante para escribir código de
aprendizaje profundo en Python, que es Colab de Google,
abreviatura de Collaboratory. Para aquellos de ustedes
a los que les gusta usar el cuaderno Júpiter, esta es una opción aún mejor. Esto es básicamente lo mismo que el cuaderno de
Júpiter con
las siguientes bonificaciones. Primero, está alojado por Google, lo que significa que no tienes que
usar tu propia potencia informática. Notarás que cuando
necesites descargar archivos de datos, sucede extremadamente
rápido porque,
bueno, la red de Google
es extremadamente rápida. Segundo, obtienes acceso a una GPU e incluso al nuevo TPU de Google, lo cual es bastante asombroso. Un TPU no es algo que puedas comprar para tu computadora personal. Entonces es bastante agradable
poder hacer uso de uno. Recuerda que la forma en que se escribe el código de
TensorFlow, no
tienes
que preocuparte por qué tipo de dispositivo
estás usando. Bueno, en su mayor parte, en
términos generales, el mismo código funcionará
ya sea que estés usando una CPU, GPU o TPU. Tercero, los cuadernos colab se
almacenan en tu Google Drive, por lo que está en la Nube. Nunca lo perderás y es muy fácil de compartir
con otras personas. Cuarto es que muchas de las bibliotecas que necesitas
para el aprendizaje profundo, aprendizaje
automático y la
ciencia de datos ya están incluidas. De hecho, me sorprendió que hubiera muchas
más de lo que supongo que
habría ahí o incluso bibliotecas de deep learning
competidoras ya incluidas, como el piano y Py Torch. Entonces, para aquellos de ustedes que odian
hacer la configuración del entorno, yo incluido, esto es
realmente increíble. Entonces en esta conferencia, no
vamos a hacer nada realmente complicado
técnicamente. Más bien, solo
vamos a hablar Google Colab y hacer algunas
demostraciones cortas para que sepas cómo
funciona y puedas ver por ti mismo que es como escribir
Python en cualquier otro lugar. Para empezar, voy a
asumir que ya sabes cómo crear una cuenta de
Google Drive. Si no tienes uno, ve a drive.google.com
e inscríbete. Una vez que tengas tu
cuenta de Google Drive y hayas iniciado sesión, verás esta interfaz. A partir de aquí. Puedes
presionar el nuevo menú, que te permite crear
todo tipo de archivos, como Google Docs, una hoja de cálculo, una
presentación, etc. Entonces hagámoslo. Entonces ahora lo que
quieres hacer es ir
al menú Más y
presionar Colaboratorio. Bien, así como pueden ver, esto trae a colación una nueva libreta. Y a partir de aquí, en su mayoría puedes usar esto como lo harías
con un cuaderno normal. Ahora bien, una cosa que te puede
pasar es que quizás
no veas Colaboratorio
en el menú en absoluto. Entonces como pueden ver, he golpeado el menú Nuevo
y he golpeado más, pero no veo a
Colab en este caso. Esto es lo que puedes hacer. seleccionar, Conectar más aplicaciones. Desde aquí, solo
busca a Colab. Y lo primero que va a
aparecer es Colab de Google. Agrega esto, y Google
Colab estará disponible desde el menú
que acabamos de ver. Entonces, si volvemos a ir ahí, podemos ver ese Colab y
ahora aparece donde debería. Así que entremos y
renombremos este cuaderno a tf dot Dato intro. Entonces primero vamos a ir
directo a las cosas buenas. ¿Cómo podemos hacer uso
de una GPU o TPU? Para hacer esto,
querrás ir al menú de tiempo
de ejecución y seleccionar
Cambiar tipo de tiempo de ejecución. Como puede ver, aquí hay
dos casillas selectas. El primero te permite seleccionar qué versión de Python
quieres usar. Así que vamos a estar usando Python
tres para este curso. El segundo y te permite seleccionar qué tipo de dispositivo
quieres usar. Entonces eso es ninguno, que es el predeterminado, o GPU o TPU. Ahora tenga en cuenta que
a veces la GPU o TPU podrían no estar disponibles. Esto se debe a que
se trata de recursos compartidos. Así que tus compañeros que
toman este curso y otros
estudiantes e investigadores de aprendizaje automático de
todo el mundo podrían
estar usando Google Colab. Y todos estamos compartiendo
estos recursos. Entonces, si nuestro uso de estos recursos alcanza el
límite de lo que está disponible, entonces es posible que no tenga una GPU o TPU disponible cuando los
necesite. Por esta razón, parte
del código que verás en este curso también se puede hacer en
mi máquina local. Pero recuerda, el código Python
funciona igual en cualquier lugar, por lo
que no hace diferencia. A continuación, se puede ver que hay dos tipos principales de celdas que podemos crear en el cuaderno. Código y texto. Puede hacer clic en cualquiera de estos para crear una nueva
celda de ese tipo. Vamos a hacer clic en Texto, ya que eso es un poco más fácil. En realidad no es algo que
vamos a usar muy a menudo, así que vamos a
sacarlo del camino. Así que en realidad voy a
borrar la primera celda. Bien, así como pueden
ver, cuando hago clic en esto, crea una nueva celda con lo que parece
un editor de texto enriquecido. Notarás que está
dividida en dos mitades. La mitad izquierda es donde
ingresas tu texto y la mitad derecha es una vista previa de cómo se verá. Entonces, vamos a introducir algún texto. Este es mi título. Ahora puedes hacer clic en el pequeño t, icono de T
grande, que
lo convierte en texto de encabezado. Entonces puedes ver que
hace que esto sea un poco más grande
y más audaz apropiado
para un título. A continuación, vamos a introducir
algún texto regular. Este es un texto regular. Tenga en cuenta que también están
estos corchetes de flecha. Entonces parece que nos va a dejar ingresar fragmentos de código. Entonces probemos eso. Y así como puedes ver, hace que el texto
sea
una fuente monoespacial, que es apropiada para el código. Ahora hay algunas
otras opciones aquí. Para que puedas hacer un enlace, puedes agregar imágenes, puedes sangrar, puedes agregar una lista
numerada o con viñetas y así sucesivamente. Entonces, si te interesa, juega con esto. De lo contrario no lo vamos
a volver a mencionar. A continuación tenemos la celda de código, así que vamos a crear una de esas. Bien, y como se mencionó, no
vamos a escribir ningún código
elegante en esta conferencia. Solo queríamos
hacer algo sencillo para asegurarnos de que todo
funcione como se esperaba. Entonces comencemos importando
numpy y matplotlib. Bien, hermosa. Como mencioné anteriormente, estos ya vienen
preinstalados. A continuación, vamos a crear una nueva
celda de código y hacer una onda sinusoidal. Entonces primero necesitamos
crear algunos valores x. Entonces vamos a hacer x ir 0-10 pi
con 1,000 puntos intermedios. A continuación, hagamos
y el seno de x. A continuación, vamos a crear una nueva celda y trazar lo que acabamos de crear. Entonces eso es solo plt.plot x y. ahora, como se trata de un cuaderno, no
hay necesidad de llamar a plt.show ya que la trama simplemente
aparecerá en el propio cuaderno. Bien, Muy cool. Funciona igual que un cuaderno
normal. En este punto,
nos hemos convencido de que Google Colab, puedes hacer las cosas
habituales que
esperarías de un Cuaderno Jupyter. Ahora, como mencioné antes, una cosa que es muy agradable
de Colab es que ya viene con un montón de
bibliotecas útiles preinstaladas. En mi opinión, esto hace que Google Colab sea mucho
mejor que el portátil Júpiter. Y si alguien alguna vez me pidiera que escribiera en un entorno de
cuaderno, elegiría Colab por defecto. No soy un gran fan del cuaderno, pero soy un gran fan de Colab. Así que aquí podemos ver
que he escrito algún código para intentar importar
un montón de bibliotecas. En concreto, estas
bibliotecas son bibliotecas que se han
utilizado en mis cursos, algunas más que otras. Algunos son muy raramente utilizados. Por lo que tal vez no esperes
que se
incluirían bibliotecas
como Word Cloud, que hasta ahora solo hemos
usado una vez. Y sin embargo, si
miramos, vemos que todo lo que
he intentado importar aquí
no arroja un error. Entonces esto nos dice
que estas bibliotecas están efectivamente disponibles. Lo que
me interesa es que algunas de estas bibliotecas no están en absoluto relacionadas con el
aprendizaje automático. Por supuesto, los hemos usado
en mis cursos porque generalmente
son útiles
como bibliotecas Python. Pero es agradable ver a la
gente de Google también hacer uso de estas mismas bibliotecas y así se pensó en incluirlas. Entonces aquí puedes ver las
cosas habituales como scikit-learn, numpy, scipy,
matplotlib en Pandas. También tenemos antorcha y el nano, lo cual es sorprendente
porque están compitiendo bibliotecas de
deep learning y desarrollo para el gueto se
ha detenido por un tiempo. Ahora. También tenemos seaborne word
cloud, Beautiful Soup, que es para solicitud de análisis XML y
HTML, que es para hacer llamadas HTTP. Red X, que es para funcionalidad
gráfica, CB2, que es para OpenCV. Y Jim, que es OpenAI Gym. En general muy impresionante y
mucho más de lo que esperaba. Entonces hay algunas advertencias finales para colab que
quería mencionarlo. En primer lugar,
lo principal que hay que
recordar es que
esta es la Nube, por lo que estos son recursos compartidos. Entonces, una forma en que esto te
afecta es si dejas tu portátil
solo por mucho tiempo, se volverá inactivo
y se desconectará. Cualquier cálculo que
hayas realizado antes no se guardará. Entonces, por ejemplo si define una
variable a es igual a cinco, y luego regresa
más tarde después de
que
se desconectó su computadora portátil e intente imprimir una, dirá
que a no está definida. Entonces ves que esta libreta
se ha desconectado. Entonces digamos que sí me
vuelvo a conectar e imprimo
a. va a decir que
a no está definido. Otra forma en que esto te afecta es que podrías
quedarte sin memoria. Entonces, si eso sucede, es posible que desee intentar ejecutar el código en su
máquina local en su lugar. Y como se mencionó anteriormente, posible
que la GPU y el TPU no
estén disponibles. Así que o puedes ejecutar tu
código sin la GPU o TPU, o puedes ejecutar el mismo
código localmente como siempre, las opciones que tenías anteriormente todavía
están disponibles. ejemplo, puede aprovisionar
una instancia de GPU en AWS, que si elige la AMI
correcta o Amazon Machine Instance vendrá con las bibliotecas habituales
preinstaladas también.
3. Instala Tensorflow 2.0 en Colab (opcional): Ahora bien, hay una razón por la
que no mencioné específicamente a
TensorFlow
en la conferencia anterior. Que es porque de
eso vamos a hablar en esta conferencia. Entonces esta conferencia va
a ser sobre cómo
usar TensorFlow a 0.0 en Colab. Notarás que si
importas TensorFlow en Colab y revisas la
versión, dirá 1.14. Entonces hagámoslo. Ahora. Obviamente esto
depende de cuándo intentes hacer esto. Actualmente en el momento que
estoy haciendo este curso, TensorFlow a 0.0
sigue en beta, lo
que significa que aún no ha sido lanzado
oficialmente. Entonces, si intentas usar
el comando habitual, pip install TensorFlow, no
obtendrás
TensorFlow a 0.0. Por supuesto, esto
cambiará en el futuro cuando se libere oficialmente TensorFlow a 0.0
, momento en el que el
comando habitual pip install TensorFlow realmente te dará
TensorFlow a 0.0. Y claro, a medida que se lanzan
versiones posteriores, eso cambiará a 2.1
a 0.2 y así sucesivamente, o cualquiera que sea el
número de versión que terminen usando. Por suerte, se pueden instalar otras bibliotecas en
un cuaderno Colab, que no venía con
el portátil. Entonces, por ejemplo si Colab no venía con
scikit-learn instalado, entonces simplemente ejecutaría
el comando pip install scikit-learn dentro de una celda de código dentro del cuaderno Colab. decir,
para poder instalar librerías, es tan sencillo como ejecutar
los habituales comandos PIP. Sólo hay que
poner
primero el símbolo bang , Más sobre eso después. Por ahora, nos
interesa TensorFlow a 0.0. En el momento en que hice este video, la versión actual de
TensorFlow a 0.0 es beta-1. El comando actual sería Bang pip install menos
q TensorFlow igual, igual a 2.0, 0.0 guión Beta-1. Tenga en cuenta que la
opción menos q aquí significa silencio, lo que solo significa
imprimir menos cosas. En realidad no modifica la funcionalidad
del comando. Es importante destacar
que aquí hay que tener en cuenta que una de
mis famosas reglas, aprender los principios,
no la sintaxis. Esto es muy importante aquí. ¿Por qué digo esto? Bueno, inevitablemente, algún
alma perdida terminará diciendo:
¿Por qué debería usar este comando cuando salga TensorFlow
beta three? ¿No quiere decir esto que la
conferencia está desactualizada? ¿No deberías actualizar
esta conferencia? Y recuerda la regla, aprende los principios,
no la sintaxis. Por supuesto que hoy, la
última versión es Beta-1. Mañana eso podría
ser Beta-2 y Beta-3 o Beta quinientos. ¿Quién sabe? El
principio es mirar sitio web de
TensorFlow para verificar cuál es el comando actual. Ese es el principio. No intentes memorizar el comando
install textualmente, lo cual sería muy tonto. Bien, así que sé inteligente. No seas tonta.
Aprende los principios y no memorizas la sintaxis. Además, tenga en cuenta que puede instalar la versión GPU de TensorFlow, que es como de costumbre, pip instalar la GPU TensorFlow. Curiosamente, en
Colab, descubrí que usar la GPU no es mucho
más rápido que usar la CPU. Entonces, para la mayoría de los problemas pequeños, no debería importar
tanto lo que uses para las GPU estará discutiendo cómo funciona eso más adelante
en el curso. Así que vamos a ejecutar esto. Así que después de instalar
TensorFlow a 0.0, puedes volver a verificar la versión. Simplemente imprima tf
punto subrayado, versión de
guión
bajo, guión bajo, guión bajo. Y deberías ver 2.0, 0.0 o algo similar. Así que vamos a ejecutar esto. Ahora hay una advertencia a esto, que es que descubrí que a veces hay
no funciona. Así que incluso después de instalar
TensorFlow a 0.0, imprimo la versión
y sigue diciendo 1.14. Parece que el
problema es que si importas TensorFlow y luego intentas
cambiar la versión, no
funcionará. Entonces, si accidentalmente haces esto y realmente
quieres que TensorFlow sea 0.0, entonces lo que querrás hacer es primero asegurarte de no intentar importar TensorFlow
antes de instalar TensorFlow. Entonces vamos a comentar esto. Y luego vamos
al menú de tiempo de ejecución y seleccionemos Reiniciar tiempo de ejecución. Entonces sí, así que
ya no estamos ejecutando esto. Sólo vamos a ejecutar esto. Y ahora vamos a ejecutar esto. Y funciona. Entonces ahora tenemos 2.0, 0.0 Beta-1. Ahora, en general, me parece
que esto es un poco torpe. Entonces si ejecuto este
cuaderno y luego
intenté cambiar la versión de
TensorFlow más tarde. Entonces digamos que trato de cambiar de
CPU a GPU o al revés, las cosas tienden a ponerse
un poco raras. Entonces lo que me gustaría hacer es tener todo establecido
desde el principio, saber lo que quieres usar, y luego ejecutarlo así desde
el principio y no tratar de
cambiar las cosas en el medio porque a veces lo
que estabas usando antes, es algo así como pegajoso. Entonces, aunque intentes
cambiarlo, en realidad no va a cambiar. Ahora bien, hay otra advertencia
importante a esto, que es que si
recuerda anteriormente, dije que si deja
su portátil inactivo por demasiado tiempo,
se desconectará. Si esto sucede, desafortunadamente, tu versión de TensorFlow
volverá a la predeterminada y necesitarás instalar TensorFlow a 0.0 nuevamente. Ahora personalmente, no me importa correr todas las
celdas cada vez. Ya que si realmente quisiera
ejecutar todo de una vez, simplemente lo ejecutaría localmente. Pero si por alguna razón te
gustaría tener TensorFlow a 0.0 Beta-1
instalado permanentemente en tu Colab. Podrías probar la solución proporcionada en este
enlace que he adjuntado. Otra vez, eso depende de ti. Pero personalmente, no tenía
razón para hacerlo yo mismo. Entonces recordarán que
discutimos este comando bancario, que por cierto, también
existe en el Cuaderno
Jupyter regular. Hasta ahora sabes que
se puede usar para ejecutar comandos pip install. Pero en general,
puedes tratar esto como una directiva que
le dice al cuaderno que quieres
ejecutar este comando como lo harías en
la terminal, por ejemplo, si quiero listar todos los archivos
en el actual directorio, podría usar el comando bang ls. Entonces probemos eso. Curiosamente,
verás que existe esta carpeta que aparece
llamada datos de muestra. Entonces podemos llamar manual
como datos de muestra. Aquí puede ver que tenemos
el famoso conjunto de datos m-nest,
el conjunto de datos de California Housing y algunos archivos JSON aleatorios. Podemos o no usar estos,
pero estos son buenos
si solo quieres ejecutar algunas pruebas simples como por ejemplo, prueba un
clasificador de imágenes simple en m-nest. En cualquier caso, ahí lo tienes. Así es como usas
TensorFlow a 0.0 en Colab. En el caso de que aún no
se haya dado a conocer oficialmente.
4. Subir datos a Colab: En esta conferencia,
vamos a hacer algunas tareas más en Colab. Específicamente,
vamos a ver algunas formas de subir tu
propio conjunto de datos a colab. Digamos por ejemplo, tu cliente
o empleador te da un archivo CSV o descargas
un CSV de Kaggle. ¿Cómo podemos entonces hacer que este archivo sea accesible desde nuestro cuaderno
Colab? En esta conferencia,
vamos a discutir algunas
formas diferentes de hacerlo. El primer método que
vamos a ver es solo
usar el comando clásico de
Linux W get. Como se mencionó anteriormente,
puede ejecutar comandos de línea comandos que preceden al comando con el símbolo bang
o signo de exclamación. Entonces, sigamos adelante y descarguemos
el conjunto de datos de arritmias. Ahora, queremos comprobar
dónde están los datos cuándo. Entonces usemos bang ls para ver si los datos están en
nuestro directorio actual. Bien, parece que lo es. Ahora usemos el comando
head para ver las primeras líneas
del archivo de datos. Y también para comprobar si el archivo tiene o no una fila de encabezado. Bien, Entonces parece que
no tiene fila de encabezado. A continuación, intentemos cargar
en los datos usando pandas. Lo vamos a pasar en
el encabezado es igual a ninguno, ya que sabemos que los datos
no tienen encabezado. A continuación, como los datos
tienen muchas columnas, solo
vamos a
tomar la primera vista. También vamos a
renombrar las columnas porque actualmente son
solo valores enteros. Como es habitual, ya que
estos datos son
del Repositorio UCI Machine
Learning, solo
puedes consultar
la documentación si quieres saber
más sobre los datos, como lo que es cada columna. Así que vamos a ejecutar esto. Siguiente. Vamos a crear un histograma
de estas columnas de datos. Como notebook por defecto
hace que la trama sea bastante pequeña, vamos a importar matplotlib y cambiar
el tamaño de la figura. Una vez que hayamos hecho eso, podemos llamar a df.head solo para crear histogramas
para cada columna. Tenga en cuenta que he agregado un
punto y coma al final de df.head solo porque
si no lo hace, entonces un cuaderno
imprimirá el último valor devuelto, entonces un cuaderno
imprimirá el último valor devuelto,
como suele hacer, lo cual no queremos en este momento. Así que aquí tienes algunos buenos histogramas
para que los veas. A continuación, vamos a crear
una gráfica común para el análisis de
datos, la matriz de
dispersión. Esto hace un diagrama de dispersión entre cada entidad y
cada otra entidad. A lo largo de la diagonal.
Simplemente traza el histograma de cada característica, que ya hemos visto. Bien, así que bastante
estándar hasta ahora. A continuación, veamos el segundo método de
carga y datos, que también se aplica
cuando se tiene una URL. Esto es para usar
TensorFlow directamente, específicamente la función Keras
get file. Empecemos asignando la URL a una
variable llamada URL. Vamos a estar usando
el conjunto de datos MPG automático. Aunque
realmente no importa lo que uses para este ejemplo, siempre y cuando puedas acceder directamente a
él vía URL. Vamos a ejecutar esto. Siguiente. Vamos a asegurarnos de tener TensorFlow a 0.0 instalado. Así que vamos a ejecutar pip
install TensorFlow y luego imprime la
versión para asegurarnos que tenemos la correcta. A continuación, vamos a llamar a
la función Keras get file. El primer argumento
es la ruta del archivo. Queremos guardar dos, y el segundo argumento
es el origen del archivo. Vamos a ejecutar esto. Tenga en cuenta que es posible guardar el archivo en un directorio
diferente, pero lo estaremos guardando en
Keras es carpeta predeterminada. Así se puede ver en
la impresión que el archivo termina en slash, route, slash dot
keras slash datasets. A continuación, llamemos al
comando head para que podamos ver las primeras
líneas de un archivo. Como puedes ver,
no es exactamente un CSV. En su lugar, cada columna
está separada por espacios en blanco y no
hay fila de encabezado. Entonces para cargar estos datos, todavía
podemos usar la función
pandas read csv, pero tenemos que pasar
en dos argumentos. El primer argumento es decir
que
no hay fila de encabezado,
encabezado es igual a ninguno. Y el segundo
argumento extra es
decirle a los pandas que el
delimitador es espacio en blanco. Entonces establecemos el
espacio en blanco de las extremidades igual a true. A continuación llamamos a df.head solo para asegurarnos de que todo
funcione como se esperaba. Entonces como puedes ver, el resultado parece estar en
el formato correcto. Y desde aquí puedes
procesar estos datos usando código Python como
lo harías normalmente. El tercer método que
vamos
a ver para agregar el tuyo más rápido Colab es subir
el archivo directamente. Para ello,
tenemos que ejecutar una función especial de Colab. Entonces decimos desde google
dot Colab importar archivos, luego llamamos archivos dot upload. Así que vamos a ejecutar esto. Entonces ves que esto crea un botón de carga en el que podemos hacer clic y luego elegir un archivo
del sistema de archivos local. Entonces voy a elegir temperaturas mínimas
diarias. Y si imprimimos
el valor devuelto, se
puede ver que se trata de un
diccionario donde el nombre del archivo como clave y el valor
es el contenido del archivo. Si usamos el
comando y bang ls, podemos ver que
el archivo ha sido subido al directorio de
trabajo. A continuación, leamos
en el archivo usando pandas para asegurarnos de que
obtenemos lo que esperamos. Ahora este archivo tiene algunas líneas de
basura cerca del final. Así que he
contabilizado eso estableciendo el argumento error malas
líneas iguales a falsas. Esto ignora los errores pero los
imprime a medida
que se encuentran. Como puede ver, el archivo
se carga correctamente. Para dar seguimiento a este ejemplo, vamos a ver una
variación de lo que acabamos de hacer. Recuerdas que cuando estás
escribiendo código en Python, a veces es útil dividir tu código entre varios archivos. Esto ayuda a organizar su código y mantener cosas similares, todo en un solo lugar mientras mantiene
diferentes cosas separadas. Como ejemplo sencillo, a veces aprenderemos sobre múltiples algoritmos
en un solo curso, pero probaremos todos esos
algoritmos en un mismo conjunto de datos. No tiene sentido
reescribir el código para cargarlo en el conjunto de datos y
varias veces diferentes. En su lugar, podemos escribir
el código de carga de datos una vez y luego
importarlo desde cada archivo. Ahora, tal vez te preguntes es
ya que estamos trabajando en Colab, ¿cómo puedes importar una función
desde un script de Python? Si ese script Python está
en tu disco duro local. Por suerte, podemos tomar el mismo
enfoque que ya hemos estado para subir ese
archivo a Google Colab. Entonces aquí voy a llamar
archivos para subir de nuevo. Y esta vez estoy subiendo
el script Python, fake util dot py. Así que falso util punto py contiene solo una función llamada
Mi función útil. Y todo lo que hace es
imprimir Hello World. Una vez que hayas subido el archivo, puedes ver que
podemos importarlo tal como lo haríamos si
estuviéramos trabajando localmente. Entonces puedo decir de fake util
importar mi función útil. Entonces cuando llamo a mi función
útil, se
puede ver que hola mundo está impreso tal como esperamos. Y por cierto,
tal vez te estés preguntando, como lo hice yo, cuál es realmente la ruta del
directorio actual. Para determinar esto, solo
puede ejecutar el comando habitual de Linux, PWD, y que
imprime contenido de barra diagonal. Así que Slash Content es nuestro directorio de trabajo
actual. Lo último que
quería cubrir es algo que
probablemente todos se estén preguntando. Google Drive es
para almacenar archivos. Entonces, ¿es posible acceder a
archivos en tu Google Drive? Y claro que la respuesta es sí. Entonces para hacer esto, tenemos que importar drive
desde Google Colab. Entonces tenemos que
montar la unidad
llamando al Dr. Don mount y especificando el path slash
content slash G Drive. Entonces esto
te va a dar un código de autorización. Entonces vas a la URL
en tu navegador. Te pide que te registres ya
que aceptas algunos términos. Y luego te da un código C, copias este código y lo vuelves a
poner en esta caja. Le pegas entrar. Bien, entonces eso funciona. Entonces después de que hayamos hecho esto, podemos llamar a ls nuevamente para verificar lo que hay ahora en
el directorio actual. Podemos ver que ahora hay algo
extra aquí, G Drive. Entonces vamos a ls, g Drive y
veamos qué nos da eso. Bien, entonces
parece que ahora tenemos una cosa llamada Google Drive. Una vez más, LS esto, recuerda que
tienes que añadir comillas si tu ruta contiene espacios en blanco. Y ahora podemos ver un montón de archivos que están en
mi Google Drive, que es esencialmente un montón de contenido
VIP para las
versiones VIP de mis cursos.