Intro para Google Colab, instala Tensorflow 2. 0, GPU gratis y TPU

Lazy Programmer Inc

Obtenga acceso ilimitado a todas las clases

Clases enseñadas por líderes de la industria y profesionales activos

Los temas incluyen ilustración, diseño, fotografía y más

Obtenga acceso ilimitado a todas las clases

Clases enseñadas por líderes de la industria y profesionales activos

Los temas incluyen ilustración, diseño, fotografía y más

Lecciones en esta clase

- 1.
  
  Video de introducción
  
  2:42
- 2.
  
  Cómo configurar Google Colab
  
  12:25
- 3.
  
  Instala Tensorflow 2.0 en Colab (Opcional)
  
  7:53
- 4.
  
  Sube datos a Colab
  
  11:31

Nivel principiante

Nivel intermedio

Nivel avanzado

Todos los niveles

254

Estudiantes

Proyectos

Acerca de esta clase

En este curso, aprenderás cómo ejecutar tu propio código de ciencia de datos y de machine learning en Google Colab (Colaboratory), que es un cuaderno de Jupyter que se ejecuta en tu navegador.

Aprende cómo instalar Tensorflow 2.0 y accede a la GPU y TPU de forma gratuita.

Conoce a tu profesor(a)

Habilidades relacionadas

IA para el desarrollo Desarrollo Más Desarrollo Ciencia de datos

Level: Beginner

Proyecto de clase práctica

Usa lo que aprende para hacer un script básico de aprendizaje automático en Google Colab:

Paso 1) carga en tus datos

Paso 2) Instala tu modelo

Paso 3) entrena tu modelo en los datos

Paso 4) evalúa tu modelo

¡Alternativamente, ejecuta cualquier código que te gustara!

Cuando hayas terminado, ¡comparte un enlace a tu cuaderno de Colab con el resto de clase!

proyecto

Rodrigo Eduardo Méndez Villabona

Muhammad Luthfi

Valoración de la clase

¿Por qué unirse a Skillshare?

Mira las galardonadas Skillshare Originals

Cada clase tiene lecciones cortas y proyectos prácticos

Tu membresía apoya a los profesores de Skillshare

Aprende desde cualquier lugar

Ve clases sobre la marcha con la aplicación de Skillshare. Progresa en línea o descarga las clases para verlas en el avión, el metro o donde sea que aprendas mejor.

Transcripciones

1. Video de introducción: Todos y bienvenidos a mi último Curso, Introducción a Colab. Entonces, ¿quién soy y por qué deberías escucharme? Bueno, mi nombre es el programador perezoso y soy autor de más de 30 cursos en línea en ciencia de datos, aprendizaje automático y análisis financiero. Tengo dos maestrías en ingeniería y estadística. Mi trayectoria en este campo abarca más de 15 años. He trabajado en varias empresas que ahora llamamos Big Tech y múltiples startups. Usando la ciencia de datos, he aumentado los ingresos millones de dólares con los equipos que he dirigido. Pero lo más importante es que me apasiona traerte esta tecnología fundamental. Entonces, ¿de qué se trata este curso? Este curso es un coro muy sencillo diseñado para ayudarte a empezar con Google Colab. Ahora, tal vez te estés preguntando, ¿qué es Google Colab? Google Colab es una plataforma informática muy potente que permite ejecutar en Jupyter Notebooks in the Cloud. Esto significa que no necesita comprar hardware costoso para hacer aprendizaje automático y ciencia de datos. Simplemente puedes usar el hardware de Google para festival gratis. También obtienes acceso gratuito a GPU y TPUs, que son esenciales para entrenar redes neuronales profundas modernas. Entonces, ¿quién debe tomar este curso y cómo debe prepararse? Este curso está diseñado para aquellos estudiantes interesados en la ciencia de datos y el aprendizaje automático. Pero nunca he oído hablar de colab ni necesito ayuda para configurarlo. Ni siquiera necesitas saber codificar para tomar este curso, aunque eso podría ser útil si quieres entender por qué estamos haciendo lo que hacemos. Entonces, en cuanto a recursos, ¿qué necesitarás para poder tomar este curso? Por suerte, no mucho. Necesitará una computadora, un navegador web y la conexión a Internet. Y si estás viendo este video, entonces ya cumples con estas condiciones. Ahora, hablemos de por qué deberías tomar este curso y qué debes esperar sacar de él. En pocas palabras, Google Colab es una herramienta poderosa y conveniente y es realmente increíble que podamos usarla de forma gratuita. Al usar Google Colab, podrás descargar todos tus scripts importantes de ciencia de datos y aprendizaje automático a la nube y compartirlos fácilmente con tus colegas. Al finalizar este curso, habrás configurado Google Colab en tu cuenta de Google. Y podrás ejecutar tus propios portátiles y hacer uso de las GPU y TPUs gratuitas de Google. Entonces espero que estés tan emocionado como yo conocer esta increíble plataforma. Gracias por escuchar, y nos vemos en la próxima conferencia. 2. Cómo configurar Google Colab: En esta conferencia, vamos a repasar un entorno muy nuevo y emocionante para escribir código de aprendizaje profundo en Python, que es Colab de Google, abreviatura de Collaboratory. Para aquellos de ustedes a los que les gusta usar el cuaderno Júpiter, esta es una opción aún mejor. Esto es básicamente lo mismo que el cuaderno de Júpiter con las siguientes bonificaciones. Primero, está alojado por Google, lo que significa que no tienes que usar tu propia potencia informática. Notarás que cuando necesites descargar archivos de datos, sucede extremadamente rápido porque, bueno, la red de Google es extremadamente rápida. Segundo, obtienes acceso a una GPU e incluso al nuevo TPU de Google, lo cual es bastante asombroso. Un TPU no es algo que puedas comprar para tu computadora personal. Entonces es bastante agradable poder hacer uso de uno. Recuerda que la forma en que se escribe el código de TensorFlow, no tienes que preocuparte por qué tipo de dispositivo estás usando. Bueno, en su mayor parte, en términos generales, el mismo código funcionará ya sea que estés usando una CPU, GPU o TPU. Tercero, los cuadernos colab se almacenan en tu Google Drive, por lo que está en la Nube. Nunca lo perderás y es muy fácil de compartir con otras personas. Cuarto es que muchas de las bibliotecas que necesitas para el aprendizaje profundo, aprendizaje automático y la ciencia de datos ya están incluidas. De hecho, me sorprendió que hubiera muchas más de lo que supongo que habría ahí o incluso bibliotecas de deep learning competidoras ya incluidas, como el piano y Py Torch. Entonces, para aquellos de ustedes que odian hacer la configuración del entorno, yo incluido, esto es realmente increíble. Entonces en esta conferencia, no vamos a hacer nada realmente complicado técnicamente. Más bien, solo vamos a hablar Google Colab y hacer algunas demostraciones cortas para que sepas cómo funciona y puedas ver por ti mismo que es como escribir Python en cualquier otro lugar. Para empezar, voy a asumir que ya sabes cómo crear una cuenta de Google Drive. Si no tienes uno, ve a drive.google.com e inscríbete. Una vez que tengas tu cuenta de Google Drive y hayas iniciado sesión, verás esta interfaz. A partir de aquí. Puedes presionar el nuevo menú, que te permite crear todo tipo de archivos, como Google Docs, una hoja de cálculo, una presentación, etc. Entonces hagámoslo. Entonces ahora lo que quieres hacer es ir al menú Más y presionar Colaboratorio. Bien, así como pueden ver, esto trae a colación una nueva libreta. Y a partir de aquí, en su mayoría puedes usar esto como lo harías con un cuaderno normal. Ahora bien, una cosa que te puede pasar es que quizás no veas Colaboratorio en el menú en absoluto. Entonces como pueden ver, he golpeado el menú Nuevo y he golpeado más, pero no veo a Colab en este caso. Esto es lo que puedes hacer. seleccionar, Conectar más aplicaciones. Desde aquí, solo busca a Colab. Y lo primero que va a aparecer es Colab de Google. Agrega esto, y Google Colab estará disponible desde el menú que acabamos de ver. Entonces, si volvemos a ir ahí, podemos ver ese Colab y ahora aparece donde debería. Así que entremos y renombremos este cuaderno a tf dot Dato intro. Entonces primero vamos a ir directo a las cosas buenas. ¿Cómo podemos hacer uso de una GPU o TPU? Para hacer esto, querrás ir al menú de tiempo de ejecución y seleccionar Cambiar tipo de tiempo de ejecución. Como puede ver, aquí hay dos casillas selectas. El primero te permite seleccionar qué versión de Python quieres usar. Así que vamos a estar usando Python tres para este curso. El segundo y te permite seleccionar qué tipo de dispositivo quieres usar. Entonces eso es ninguno, que es el predeterminado, o GPU o TPU. Ahora tenga en cuenta que a veces la GPU o TPU podrían no estar disponibles. Esto se debe a que se trata de recursos compartidos. Así que tus compañeros que toman este curso y otros estudiantes e investigadores de aprendizaje automático de todo el mundo podrían estar usando Google Colab. Y todos estamos compartiendo estos recursos. Entonces, si nuestro uso de estos recursos alcanza el límite de lo que está disponible, entonces es posible que no tenga una GPU o TPU disponible cuando los necesite. Por esta razón, parte del código que verás en este curso también se puede hacer en mi máquina local. Pero recuerda, el código Python funciona igual en cualquier lugar, por lo que no hace diferencia. A continuación, se puede ver que hay dos tipos principales de celdas que podemos crear en el cuaderno. Código y texto. Puede hacer clic en cualquiera de estos para crear una nueva celda de ese tipo. Vamos a hacer clic en Texto, ya que eso es un poco más fácil. En realidad no es algo que vamos a usar muy a menudo, así que vamos a sacarlo del camino. Así que en realidad voy a borrar la primera celda. Bien, así como pueden ver, cuando hago clic en esto, crea una nueva celda con lo que parece un editor de texto enriquecido. Notarás que está dividida en dos mitades. La mitad izquierda es donde ingresas tu texto y la mitad derecha es una vista previa de cómo se verá. Entonces, vamos a introducir algún texto. Este es mi título. Ahora puedes hacer clic en el pequeño t, icono de T grande, que lo convierte en texto de encabezado. Entonces puedes ver que hace que esto sea un poco más grande y más audaz apropiado para un título. A continuación, vamos a introducir algún texto regular. Este es un texto regular. Tenga en cuenta que también están estos corchetes de flecha. Entonces parece que nos va a dejar ingresar fragmentos de código. Entonces probemos eso. Y así como puedes ver, hace que el texto sea una fuente monoespacial, que es apropiada para el código. Ahora hay algunas otras opciones aquí. Para que puedas hacer un enlace, puedes agregar imágenes, puedes sangrar, puedes agregar una lista numerada o con viñetas y así sucesivamente. Entonces, si te interesa, juega con esto. De lo contrario no lo vamos a volver a mencionar. A continuación tenemos la celda de código, así que vamos a crear una de esas. Bien, y como se mencionó, no vamos a escribir ningún código elegante en esta conferencia. Solo queríamos hacer algo sencillo para asegurarnos de que todo funcione como se esperaba. Entonces comencemos importando numpy y matplotlib. Bien, hermosa. Como mencioné anteriormente, estos ya vienen preinstalados. A continuación, vamos a crear una nueva celda de código y hacer una onda sinusoidal. Entonces primero necesitamos crear algunos valores x. Entonces vamos a hacer x ir 0-10 pi con 1,000 puntos intermedios. A continuación, hagamos y el seno de x. A continuación, vamos a crear una nueva celda y trazar lo que acabamos de crear. Entonces eso es solo plt.plot x y. ahora, como se trata de un cuaderno, no hay necesidad de llamar a plt.show ya que la trama simplemente aparecerá en el propio cuaderno. Bien, Muy cool. Funciona igual que un cuaderno normal. En este punto, nos hemos convencido de que Google Colab, puedes hacer las cosas habituales que esperarías de un Cuaderno Jupyter. Ahora, como mencioné antes, una cosa que es muy agradable de Colab es que ya viene con un montón de bibliotecas útiles preinstaladas. En mi opinión, esto hace que Google Colab sea mucho mejor que el portátil Júpiter. Y si alguien alguna vez me pidiera que escribiera en un entorno de cuaderno, elegiría Colab por defecto. No soy un gran fan del cuaderno, pero soy un gran fan de Colab. Así que aquí podemos ver que he escrito algún código para intentar importar un montón de bibliotecas. En concreto, estas bibliotecas son bibliotecas que se han utilizado en mis cursos, algunas más que otras. Algunos son muy raramente utilizados. Por lo que tal vez no esperes que se incluirían bibliotecas como Word Cloud, que hasta ahora solo hemos usado una vez. Y sin embargo, si miramos, vemos que todo lo que he intentado importar aquí no arroja un error. Entonces esto nos dice que estas bibliotecas están efectivamente disponibles. Lo que me interesa es que algunas de estas bibliotecas no están en absoluto relacionadas con el aprendizaje automático. Por supuesto, los hemos usado en mis cursos porque generalmente son útiles como bibliotecas Python. Pero es agradable ver a la gente de Google también hacer uso de estas mismas bibliotecas y así se pensó en incluirlas. Entonces aquí puedes ver las cosas habituales como scikit-learn, numpy, scipy, matplotlib en Pandas. También tenemos antorcha y el nano, lo cual es sorprendente porque están compitiendo bibliotecas de deep learning y desarrollo para el gueto se ha detenido por un tiempo. Ahora. También tenemos seaborne word cloud, Beautiful Soup, que es para solicitud de análisis XML y HTML, que es para hacer llamadas HTTP. Red X, que es para funcionalidad gráfica, CB2, que es para OpenCV. Y Jim, que es OpenAI Gym. En general muy impresionante y mucho más de lo que esperaba. Entonces hay algunas advertencias finales para colab que quería mencionarlo. En primer lugar, lo principal que hay que recordar es que esta es la Nube, por lo que estos son recursos compartidos. Entonces, una forma en que esto te afecta es si dejas tu portátil solo por mucho tiempo, se volverá inactivo y se desconectará. Cualquier cálculo que hayas realizado antes no se guardará. Entonces, por ejemplo si define una variable a es igual a cinco, y luego regresa más tarde después de que se desconectó su computadora portátil e intente imprimir una, dirá que a no está definida. Entonces ves que esta libreta se ha desconectado. Entonces digamos que sí me vuelvo a conectar e imprimo a. va a decir que a no está definido. Otra forma en que esto te afecta es que podrías quedarte sin memoria. Entonces, si eso sucede, es posible que desee intentar ejecutar el código en su máquina local en su lugar. Y como se mencionó anteriormente, posible que la GPU y el TPU no estén disponibles. Así que o puedes ejecutar tu código sin la GPU o TPU, o puedes ejecutar el mismo código localmente como siempre, las opciones que tenías anteriormente todavía están disponibles. ejemplo, puede aprovisionar una instancia de GPU en AWS, que si elige la AMI correcta o Amazon Machine Instance vendrá con las bibliotecas habituales preinstaladas también. 3. Instala Tensorflow 2.0 en Colab (opcional): Ahora bien, hay una razón por la que no mencioné específicamente a TensorFlow en la conferencia anterior. Que es porque de eso vamos a hablar en esta conferencia. Entonces esta conferencia va a ser sobre cómo usar TensorFlow a 0.0 en Colab. Notarás que si importas TensorFlow en Colab y revisas la versión, dirá 1.14. Entonces hagámoslo. Ahora. Obviamente esto depende de cuándo intentes hacer esto. Actualmente en el momento que estoy haciendo este curso, TensorFlow a 0.0 sigue en beta, lo que significa que aún no ha sido lanzado oficialmente. Entonces, si intentas usar el comando habitual, pip install TensorFlow, no obtendrás TensorFlow a 0.0. Por supuesto, esto cambiará en el futuro cuando se libere oficialmente TensorFlow a 0.0 , momento en el que el comando habitual pip install TensorFlow realmente te dará TensorFlow a 0.0. Y claro, a medida que se lanzan versiones posteriores, eso cambiará a 2.1 a 0.2 y así sucesivamente, o cualquiera que sea el número de versión que terminen usando. Por suerte, se pueden instalar otras bibliotecas en un cuaderno Colab, que no venía con el portátil. Entonces, por ejemplo si Colab no venía con scikit-learn instalado, entonces simplemente ejecutaría el comando pip install scikit-learn dentro de una celda de código dentro del cuaderno Colab. decir, para poder instalar librerías, es tan sencillo como ejecutar los habituales comandos PIP. Sólo hay que poner primero el símbolo bang , Más sobre eso después. Por ahora, nos interesa TensorFlow a 0.0. En el momento en que hice este video, la versión actual de TensorFlow a 0.0 es beta-1. El comando actual sería Bang pip install menos q TensorFlow igual, igual a 2.0, 0.0 guión Beta-1. Tenga en cuenta que la opción menos q aquí significa silencio, lo que solo significa imprimir menos cosas. En realidad no modifica la funcionalidad del comando. Es importante destacar que aquí hay que tener en cuenta que una de mis famosas reglas, aprender los principios, no la sintaxis. Esto es muy importante aquí. ¿Por qué digo esto? Bueno, inevitablemente, algún alma perdida terminará diciendo: ¿Por qué debería usar este comando cuando salga TensorFlow beta three? ¿No quiere decir esto que la conferencia está desactualizada? ¿No deberías actualizar esta conferencia? Y recuerda la regla, aprende los principios, no la sintaxis. Por supuesto que hoy, la última versión es Beta-1. Mañana eso podría ser Beta-2 y Beta-3 o Beta quinientos. ¿Quién sabe? El principio es mirar sitio web de TensorFlow para verificar cuál es el comando actual. Ese es el principio. No intentes memorizar el comando install textualmente, lo cual sería muy tonto. Bien, así que sé inteligente. No seas tonta. Aprende los principios y no memorizas la sintaxis. Además, tenga en cuenta que puede instalar la versión GPU de TensorFlow, que es como de costumbre, pip instalar la GPU TensorFlow. Curiosamente, en Colab, descubrí que usar la GPU no es mucho más rápido que usar la CPU. Entonces, para la mayoría de los problemas pequeños, no debería importar tanto lo que uses para las GPU estará discutiendo cómo funciona eso más adelante en el curso. Así que vamos a ejecutar esto. Así que después de instalar TensorFlow a 0.0, puedes volver a verificar la versión. Simplemente imprima tf punto subrayado, versión de guión bajo, guión bajo, guión bajo. Y deberías ver 2.0, 0.0 o algo similar. Así que vamos a ejecutar esto. Ahora hay una advertencia a esto, que es que descubrí que a veces hay no funciona. Así que incluso después de instalar TensorFlow a 0.0, imprimo la versión y sigue diciendo 1.14. Parece que el problema es que si importas TensorFlow y luego intentas cambiar la versión, no funcionará. Entonces, si accidentalmente haces esto y realmente quieres que TensorFlow sea 0.0, entonces lo que querrás hacer es primero asegurarte de no intentar importar TensorFlow antes de instalar TensorFlow. Entonces vamos a comentar esto. Y luego vamos al menú de tiempo de ejecución y seleccionemos Reiniciar tiempo de ejecución. Entonces sí, así que ya no estamos ejecutando esto. Sólo vamos a ejecutar esto. Y ahora vamos a ejecutar esto. Y funciona. Entonces ahora tenemos 2.0, 0.0 Beta-1. Ahora, en general, me parece que esto es un poco torpe. Entonces si ejecuto este cuaderno y luego intenté cambiar la versión de TensorFlow más tarde. Entonces digamos que trato de cambiar de CPU a GPU o al revés, las cosas tienden a ponerse un poco raras. Entonces lo que me gustaría hacer es tener todo establecido desde el principio, saber lo que quieres usar, y luego ejecutarlo así desde el principio y no tratar de cambiar las cosas en el medio porque a veces lo que estabas usando antes, es algo así como pegajoso. Entonces, aunque intentes cambiarlo, en realidad no va a cambiar. Ahora bien, hay otra advertencia importante a esto, que es que si recuerda anteriormente, dije que si deja su portátil inactivo por demasiado tiempo, se desconectará. Si esto sucede, desafortunadamente, tu versión de TensorFlow volverá a la predeterminada y necesitarás instalar TensorFlow a 0.0 nuevamente. Ahora personalmente, no me importa correr todas las celdas cada vez. Ya que si realmente quisiera ejecutar todo de una vez, simplemente lo ejecutaría localmente. Pero si por alguna razón te gustaría tener TensorFlow a 0.0 Beta-1 instalado permanentemente en tu Colab. Podrías probar la solución proporcionada en este enlace que he adjuntado. Otra vez, eso depende de ti. Pero personalmente, no tenía razón para hacerlo yo mismo. Entonces recordarán que discutimos este comando bancario, que por cierto, también existe en el Cuaderno Jupyter regular. Hasta ahora sabes que se puede usar para ejecutar comandos pip install. Pero en general, puedes tratar esto como una directiva que le dice al cuaderno que quieres ejecutar este comando como lo harías en la terminal, por ejemplo, si quiero listar todos los archivos en el actual directorio, podría usar el comando bang ls. Entonces probemos eso. Curiosamente, verás que existe esta carpeta que aparece llamada datos de muestra. Entonces podemos llamar manual como datos de muestra. Aquí puede ver que tenemos el famoso conjunto de datos m-nest, el conjunto de datos de California Housing y algunos archivos JSON aleatorios. Podemos o no usar estos, pero estos son buenos si solo quieres ejecutar algunas pruebas simples como por ejemplo, prueba un clasificador de imágenes simple en m-nest. En cualquier caso, ahí lo tienes. Así es como usas TensorFlow a 0.0 en Colab. En el caso de que aún no se haya dado a conocer oficialmente. 4. Subir datos a Colab: En esta conferencia, vamos a hacer algunas tareas más en Colab. Específicamente, vamos a ver algunas formas de subir tu propio conjunto de datos a colab. Digamos por ejemplo, tu cliente o empleador te da un archivo CSV o descargas un CSV de Kaggle. ¿Cómo podemos entonces hacer que este archivo sea accesible desde nuestro cuaderno Colab? En esta conferencia, vamos a discutir algunas formas diferentes de hacerlo. El primer método que vamos a ver es solo usar el comando clásico de Linux W get. Como se mencionó anteriormente, puede ejecutar comandos de línea comandos que preceden al comando con el símbolo bang o signo de exclamación. Entonces, sigamos adelante y descarguemos el conjunto de datos de arritmias. Ahora, queremos comprobar dónde están los datos cuándo. Entonces usemos bang ls para ver si los datos están en nuestro directorio actual. Bien, parece que lo es. Ahora usemos el comando head para ver las primeras líneas del archivo de datos. Y también para comprobar si el archivo tiene o no una fila de encabezado. Bien, Entonces parece que no tiene fila de encabezado. A continuación, intentemos cargar en los datos usando pandas. Lo vamos a pasar en el encabezado es igual a ninguno, ya que sabemos que los datos no tienen encabezado. A continuación, como los datos tienen muchas columnas, solo vamos a tomar la primera vista. También vamos a renombrar las columnas porque actualmente son solo valores enteros. Como es habitual, ya que estos datos son del Repositorio UCI Machine Learning, solo puedes consultar la documentación si quieres saber más sobre los datos, como lo que es cada columna. Así que vamos a ejecutar esto. Siguiente. Vamos a crear un histograma de estas columnas de datos. Como notebook por defecto hace que la trama sea bastante pequeña, vamos a importar matplotlib y cambiar el tamaño de la figura. Una vez que hayamos hecho eso, podemos llamar a df.head solo para crear histogramas para cada columna. Tenga en cuenta que he agregado un punto y coma al final de df.head solo porque si no lo hace, entonces un cuaderno imprimirá el último valor devuelto, entonces un cuaderno imprimirá el último valor devuelto, como suele hacer, lo cual no queremos en este momento. Así que aquí tienes algunos buenos histogramas para que los veas. A continuación, vamos a crear una gráfica común para el análisis de datos, la matriz de dispersión. Esto hace un diagrama de dispersión entre cada entidad y cada otra entidad. A lo largo de la diagonal. Simplemente traza el histograma de cada característica, que ya hemos visto. Bien, así que bastante estándar hasta ahora. A continuación, veamos el segundo método de carga y datos, que también se aplica cuando se tiene una URL. Esto es para usar TensorFlow directamente, específicamente la función Keras get file. Empecemos asignando la URL a una variable llamada URL. Vamos a estar usando el conjunto de datos MPG automático. Aunque realmente no importa lo que uses para este ejemplo, siempre y cuando puedas acceder directamente a él vía URL. Vamos a ejecutar esto. Siguiente. Vamos a asegurarnos de tener TensorFlow a 0.0 instalado. Así que vamos a ejecutar pip install TensorFlow y luego imprime la versión para asegurarnos que tenemos la correcta. A continuación, vamos a llamar a la función Keras get file. El primer argumento es la ruta del archivo. Queremos guardar dos, y el segundo argumento es el origen del archivo. Vamos a ejecutar esto. Tenga en cuenta que es posible guardar el archivo en un directorio diferente, pero lo estaremos guardando en Keras es carpeta predeterminada. Así se puede ver en la impresión que el archivo termina en slash, route, slash dot keras slash datasets. A continuación, llamemos al comando head para que podamos ver las primeras líneas de un archivo. Como puedes ver, no es exactamente un CSV. En su lugar, cada columna está separada por espacios en blanco y no hay fila de encabezado. Entonces para cargar estos datos, todavía podemos usar la función pandas read csv, pero tenemos que pasar en dos argumentos. El primer argumento es decir que no hay fila de encabezado, encabezado es igual a ninguno. Y el segundo argumento extra es decirle a los pandas que el delimitador es espacio en blanco. Entonces establecemos el espacio en blanco de las extremidades igual a true. A continuación llamamos a df.head solo para asegurarnos de que todo funcione como se esperaba. Entonces como puedes ver, el resultado parece estar en el formato correcto. Y desde aquí puedes procesar estos datos usando código Python como lo harías normalmente. El tercer método que vamos a ver para agregar el tuyo más rápido Colab es subir el archivo directamente. Para ello, tenemos que ejecutar una función especial de Colab. Entonces decimos desde google dot Colab importar archivos, luego llamamos archivos dot upload. Así que vamos a ejecutar esto. Entonces ves que esto crea un botón de carga en el que podemos hacer clic y luego elegir un archivo del sistema de archivos local. Entonces voy a elegir temperaturas mínimas diarias. Y si imprimimos el valor devuelto, se puede ver que se trata de un diccionario donde el nombre del archivo como clave y el valor es el contenido del archivo. Si usamos el comando y bang ls, podemos ver que el archivo ha sido subido al directorio de trabajo. A continuación, leamos en el archivo usando pandas para asegurarnos de que obtenemos lo que esperamos. Ahora este archivo tiene algunas líneas de basura cerca del final. Así que he contabilizado eso estableciendo el argumento error malas líneas iguales a falsas. Esto ignora los errores pero los imprime a medida que se encuentran. Como puede ver, el archivo se carga correctamente. Para dar seguimiento a este ejemplo, vamos a ver una variación de lo que acabamos de hacer. Recuerdas que cuando estás escribiendo código en Python, a veces es útil dividir tu código entre varios archivos. Esto ayuda a organizar su código y mantener cosas similares, todo en un solo lugar mientras mantiene diferentes cosas separadas. Como ejemplo sencillo, a veces aprenderemos sobre múltiples algoritmos en un solo curso, pero probaremos todos esos algoritmos en un mismo conjunto de datos. No tiene sentido reescribir el código para cargarlo en el conjunto de datos y varias veces diferentes. En su lugar, podemos escribir el código de carga de datos una vez y luego importarlo desde cada archivo. Ahora, tal vez te preguntes es ya que estamos trabajando en Colab, ¿cómo puedes importar una función desde un script de Python? Si ese script Python está en tu disco duro local. Por suerte, podemos tomar el mismo enfoque que ya hemos estado para subir ese archivo a Google Colab. Entonces aquí voy a llamar archivos para subir de nuevo. Y esta vez estoy subiendo el script Python, fake util dot py. Así que falso util punto py contiene solo una función llamada Mi función útil. Y todo lo que hace es imprimir Hello World. Una vez que hayas subido el archivo, puedes ver que podemos importarlo tal como lo haríamos si estuviéramos trabajando localmente. Entonces puedo decir de fake util importar mi función útil. Entonces cuando llamo a mi función útil, se puede ver que hola mundo está impreso tal como esperamos. Y por cierto, tal vez te estés preguntando, como lo hice yo, cuál es realmente la ruta del directorio actual. Para determinar esto, solo puede ejecutar el comando habitual de Linux, PWD, y que imprime contenido de barra diagonal. Así que Slash Content es nuestro directorio de trabajo actual. Lo último que quería cubrir es algo que probablemente todos se estén preguntando. Google Drive es para almacenar archivos. Entonces, ¿es posible acceder a archivos en tu Google Drive? Y claro que la respuesta es sí. Entonces para hacer esto, tenemos que importar drive desde Google Colab. Entonces tenemos que montar la unidad llamando al Dr. Don mount y especificando el path slash content slash G Drive. Entonces esto te va a dar un código de autorización. Entonces vas a la URL en tu navegador. Te pide que te registres ya que aceptas algunos términos. Y luego te da un código C, copias este código y lo vuelves a poner en esta caja. Le pegas entrar. Bien, entonces eso funciona. Entonces después de que hayamos hecho esto, podemos llamar a ls nuevamente para verificar lo que hay ahora en el directorio actual. Podemos ver que ahora hay algo extra aquí, G Drive. Entonces vamos a ls, g Drive y veamos qué nos da eso. Bien, entonces parece que ahora tenemos una cosa llamada Google Drive. Una vez más, LS esto, recuerda que tienes que añadir comillas si tu ruta contiene espacios en blanco. Y ahora podemos ver un montón de archivos que están en mi Google Drive, que es esencialmente un montón de contenido VIP para las versiones VIP de mis cursos.

Intro para Google Colab, instala Tensorflow 2. 0, GPU gratis y TPU

Lazy Programmer Inc

Ve esta clase y miles más

Ve esta clase y miles más

Lecciones en esta clase

1.

Video de introducción

2:42

2.

Cómo configurar Google Colab

12:25

3.

Instala Tensorflow 2.0 en Colab (Opcional)

7:53

4.

Sube datos a Colab

11:31

Acerca de esta clase

Conoce a tu profesor(a)

Lazy Programmer Inc

Habilidades relacionadas

Proyecto de clase práctica

Valoración de la clase

¿Por qué unirse a Skillshare?

Aprende desde cualquier lugar

Transcripciones

Intro para Google Colab, instala Tensorflow 2. 0, GPU gratis y TPU

Lazy Programmer Inc

Ve esta clase y miles más

Ve esta clase y miles más

Lecciones en esta clase

1.

Video de introducción

2:42

2.

Cómo configurar Google Colab

12:25

3.

Instala Tensorflow 2.0 en Colab (Opcional)

7:53

4.

Sube datos a Colab

11:31

Acerca de esta clase

Conoce a tu profesor(a)

Lazy Programmer Inc

Habilidades relacionadas

Proyecto de clase práctica

Valoración de la clase

¿Por qué unirse a Skillshare?

Aprende desde cualquier lugar

Clases relacionadas

Transcripciones