Transcripciones
1. MLFirstLecture: OIR es aprendizaje automático. ¿ Es algún tipo de programa informático donde escribimos todos los escenarios posibles? Ajuste todas las variables incluidas son solo es una gran cantidad de datos. Nuestro it featured fancy Visualize no es ¿Qué es? ¿ Es sólo mucho fuera de funciones matemáticas? Jugar junto con los datos junto con el programa informático son Es solo un robot. ¿ Qué es? ¿ Es sólo un milagro que pasó con las máquinas? ¿ Qué es exactamente el aprendizaje automático? Para entender esto realista un paso atrás a menos que entender lo que es programa clásico? Entonces, ¿qué es la programación clásica? Programación clásica en el algoritmo Watts sobre las variables y utilizando esos algoritmos y esas variables v derecha Programas clásicos en los que V incluyen son una especie de
escenarios posibles . Estos algoritmos se pueden conservar en cualquier lenguaje de programación. Puede ser C, C más beytin. Y cuando incluimos todos los escenarios posibles a través de las variables, esa es nuestra programación clásica. Ahora agrega datos a esta mezcla. Ahora estamos escribiendo un programa de computadora, incluyendo variables, Pero esta vez tenemos datos. Entonces eso significa que podemos entender el comportamiento fuera de los datos en. Podemos hacer algo con nuestra programación y datos. Ahora no estamos escribiendo algoritmos sobre las variables cuyo valor no conocemos. Ya tenemos algunos datos, y estamos escribiendo programas de computadora basados en esos datos, y eso se llama minería de datos. Entonces estamos extrayendo los datos existentes sobre tratar de entender su comportamiento. ¿ Y si combinamos sus datos con todas sus características? Todo son características, y luego tratamos de entender los patrones detrás del comportamiento detrás de los datos. ¿ Qué más se puede derivar de estos datos? Toda la perspicacia, la inteligencia, todo tipo de comportamiento. ¿ Qué más se puede predecir con base en el estado? ¿ Nuestro trabajo de ciencia de datos de los treinta? Duda asigna en lo que es Masilela Ning. El aprendizaje automático es básicamente combinación fuera de este aprendizaje automático en paredes de datos programas
informáticos en las características después de los datos. Por lo que bienvenidos al mundo fuera de la rodilla Masilela. Va a ser divertido aprender sobre explorarlo juntos.
2. Términos de ML: hola allá Antes de empezar y tomar una inmersión más profunda en el aprendizaje automático latest Entiende algunos fuera de los términos en algunas de las palabras clave utilizadas en el mundo del machine learning. Estos otros términos que también usaré durante las conferencias es mejor. Entiendes esto Ahora, Andi, ten la misma comprensión cuando usé esos tocones. Y esos dadores consideran que este es un dato que captaste para tu Masilela. ¿ Algún análisis en estos datos? Todos los valores aquí, se
llaman observaciones. Cuando vemos observaciones estaban hablando de los valores valores de datos en siguiente la parte de bateador por aquí. Cuando dices cuarto baño Dane, abordar la identidad off se desarrolla. A esos se les llama etiquetas porque esto es sólo un dato tabular. Tienes etiqueta. Si esto fue de algún otro tipo después de duro, por ejemplo, si se trata de una imagen de foto, no
tendrás etiquetas sobre las que tendrás observaciones. Hay que entender, base en las observaciones qué representa exactamente. No hay etiquetas en esos casos. De acuerdo, La última, las etiquetas victoria presentan variables independientes. Por ejemplo. En este caso, si te digo dedo del pie analiza estos datos y predice el precio del departamento con estas características cuántas recámaras tiene, cuántos baños ha sido. Y se agrega longitud y latitud. Pero básicamente la ubicación, luego todas estas etiquetas, todos estos valores se convierten en variables independientes, también llamadas como predictores y características sobre el precio se convierte en variables objetivo también llamadas predicciones. Por lo que estos son términos muy importantes cuando se trata de aprendizaje supervisado en
aterrizaje Super White , habrá etiquetas. Habrá variables independientes y serán blanco. Muy abutos. Estas variables se agrupan en dos tipos diferentes. Si es algo así como dirección, que tiene valores fijos como dentro de una ciudad, hay direcciones fijas en las que no son números, cuáles son esto nos corrigen, ¿
verdad? Se les llama variables categóricas. Siguen ciertas categorías en. Si se trata de un número continuo como dormitorio, baño, puede
haber cualquier número de veteranos. Puede haber cualquier número de baños. Cualquier actualización numérica en departamento no es un número fijo. A esas se les llama variables numéricas. Eso es todo por ahora. Estos son términos importantes. Debes recordar cuando usamos estos términos más abajo las conferencias, deberías poder relacionarlo. Está bien, Impresionante. Te veo en el próximo. Posteriormente
3. Aprendizaje a diferentes tipos de aprendizaje automático: Hola llegarán a esta conferencia en este rector. Voy a llevarte a través de diferentes tipos de algoritmo de autoaprendizaje muscular. Entonces empecemos en un nivel muy alto. pueden segregar los algoritmos de Maciel Learning, se agrupan en tres categorías separadas. El 1er 1 es supervisado, luego no supervisado y luego tres ejecutorias. Entonces vamos a entender. Cuáles son estos algoritmo supervisado se sigue. Los datos de video pueden encajar en un mullah lejano. Si pones esos datos en su fórmula, puedes predecir el siguiente set off data próximo ocho off actos que se supervisa sin supervisión su cuando no puedes tener ninguna fórmula en tus datos, tu fecha no me etiqueté. No se puede tener ninguna fórmula. Por ejemplo, los datos de papá inmediato
considerados no tienen ninguna etiqueta adscrita a ella y eso es sin supervisión por lo que a un nivel muy alto. Esa diferencia entre supervisados y no supervisados, voy a decir, es una. Se puede formular que no pueda formularse en otro si sus datos tienen la etiqueta . Entonces eso es un básico diferente. El refuerzo es básicamente ensayo y error sí. La lógica se deriva en base a ensayo y error, por lo que sigues haciendo algunas cosas con los datos y en base al resultado, decides que el siguiente acceso supervisado se puede clasificar más en clasificaciones y
técnicas de remolque y regresión técnica. Las técnicas de regresión son donde predices el siguiente valor real. Puede ser cualquier cosa puede ser ganancia y pérdida. Estás prediciendo que puede ser tu predicción de la tasa de accidentes. Se puede predecir kilometraje coche, cualquier cosa donde se predice una muerte de valor real fueron que la media luna viene en imagen. Vas a aprender sobre el rebautizo lineal en diferentes granjas, fuera de solicitudes lineales y genéticas simples, lineales, imprudentes y múltiples. Escucha en un polinomio. Rebautizo muy indulgente fuera de curso. Sabrás mucho más sobre esto cuando aprenderás estas técnicas y tendrás proyectos
manos en mano durante este curso. De igual manera en clasificaciones. Y tienes logística, rebautizar disses, soporte de
entrada máquina vectorial de residuos nocturnos que vecino más cercano y bosque aleatorio. Las clasificaciones es básicamente lo que predices es sí, no
son tipo de cosa Binaria. O estás prediciendo sí o no, pero tienes un conjunto de valores y estás prediciendo cuál de estos valores va a suceder. Entonces las clasificaciones y es como clasificar tus datos sobre tu resultado en ciertos bolsillos , la máquina Vector soporte, vecino
gay más cercano y bosque aleatorio. Se pueden utilizar para clasificaciones como villas. Rebautizar. Vayamos por no supervisados sin supervisión. No tener datos de etiqueta, por lo que puede agruparlos en diferentes clústeres. Y hay algoritmos de clustering como un medio son se puede seguir un tipo prio de algoritmos, asociados y algoritmos. El refuerzo, como dije, es de juicio y error tipo apagado. La lógica son tus carreras de algoritmo basadas en el resultado fuera del acento anterior. Por lo que también se llama Proceso de Decisión Marco. Ese es uno del algoritmo que puedes usar. Entonces eso está todo encendido. Tomaremos una inmersión más profunda en cada uno de este algoritmo en futuras conferencias. Impresionante. Te veré en el próximo Lecter.
4. Jupyterinstallation: ¿ Cómo ahí vas a usar a Júpiter? Cuaderno en esta cancha? Jupiter Notebook es notebook basado en navegador con mucho off buenas características, que explorarás durante el curso en este rector, vas a instalar. Descarga en un cuaderno de inicio Júpiter. Empecemos antes de que empieces a descargar a Peter. Necesitas dedo del pie. Confirma si tienes sistema operativo de 64 bits. Son 32 bit sistema operativo en Windows Plate de Así se puede confirmar en o aquí
tengo 64 bit Simple Way is Goto Google y buscar para descargar Anaconda on Te llevará a www dot anaconda dot com. Hace que su haga clic en sistema operativo Windows, Mi querido en, pesar de que tengo sistema operativo de 64 bits, el bit más seguro es instalar 32 bit 32 bit funcionará en sistema operativo de 32 bits también. Un sistema operativo de 64 bits. En ocasiones incluso con el sistema operativo de 64 bits, es posible que tengas problemas si instalas 64 Wheat Anaconda. Entonces por eso estoy con 32 bit que están de acuerdo. Asegúrate de saber muy claramente, empezando y dar click en una estrella Tomará unos segundos. A lo mejor un minuto o dos. Depende de tu computadora. Escupir justo aquí está instalado. Y ahora ve a los programas y ya verás ahí mismo. Anaconda. Cuando se abra la anaconda, verás tus ops de cuaderno de Júpiter, y solo están haciendo clic en el almuerzo. Impresionante. Entonces este eres tú, cuaderno
Peter. Está demandando a todos los peleones a otros directores. Yo tengo. Pero sí lo hice. Si estás empezando fresco, uh, esto te quedará en blanco. No verás ningún día. Justo ahí. Otra forma. Toe abierto al cuaderno Peter es que puedes ir a nuestros programas. Anaconda el. Ahí mismo. Te encuentras con los policías cuaderno de Júpiter y dar click en eso en él se abriría el mismo notable. Entonces de esta manera no tienes que abrir un acordeón. Ve a Júpiter. Se puede abrir directamente. Derrotado. ve Muy bien. Estás todo listo. Tienes tu cuaderno de Júpiter descargado, y está funcionando. Te veré en próxima carta
5. Single de umada: Hola llegará a este más rico en este director, voy a llevarte a través de numpty. Número ser es una librería peletin en ella es duro fuera alguna ciencia de datos? ¿ Son el proyecto Massie Learning? Si inspiras a convertirte en datos, los científicos son profesionales del aprendizaje automático. No se puede ignorar a Lumpy. Entonces hablémoslo. Démosle el nombre MP demo y es una biblioteca Pitre para importar numpty y está C s vacía. Por lo que esto importará esa biblioteca en tu cuaderno y puedes usar t importado en funciones off numpty en tu programa antes de que yo empiece. Son pocas las cosas que quiero que entiendas para que tú y yo estemos en la misma plataforma tía tengamos la misma comprensión fuera de estos sistemas. Entonces primero, um, es Dios, Es asesino. Es asesino significa que si tienes valores como un dedo del pie como valores individuales, se
llaman es matar, ¿
verdad? Y luego hay otro término llamado Víctor. Por lo que Victor es muy solo dime Esnal, Ari así. Entonces si es un solo centavo es Ellery con valores, también
se llama Victor. Y entonces mis trucos son multidimensionales. Eso significa que tiene más de un centavo instantáneo como si tuviera filas y columnas, ¿
verdad? Al igual que esto. Un dedo, luego 34 bronceado, 56 Así que este es un ejemplo fuera de Matics. ¿ De acuerdo? Podría usar la distancia. Al igual que Victor son una métrica o multi diamondstein. Hillary es indistintamente. Más grande. Entonces, empecemos ahora. Lo primero que vamos a hacer es que te voy a llevar a través de algunas funciones de salir. ¿ Verdad? Está bien. Por lo que numb P no solo se trata de Ari y métricas, puedes ejecutar funciones numpty solo para devolver un solo valor. Por ejemplo, solo
puedo pintar un número aleatorio. Como si digo MP dardo al azar y me m t y comida, por ejemplo 17 aquí me va a devolver algún interior? Menos de 17. Muy bien. Por lo que aquí está regresando 16. Ahora. Si lo vuelvo a ejecutar, va a 10 3 pequeño remolque. Se sentirá 15. Entonces así me seguirá devolviendo un indígena diferente, pero todo en tedioso, menos de 17 on Like what lo hizo Otra función llamada aleatoria. Al final no, Deon. Y esto me dará números aleatorios. Al igual que si sigo corriendo
esto, solo me seguirá dando números aleatorios. Al igual que ahora está dando menos 1.2163 aquí. Por lo que hay este tipo de funciones disponibles en es modelo asesino. También como A y P se pueden usar para devolverte un solo. Bueno, ahora es el momento de que nuestra e vea. Ah, demonios. No. Listo. También llamó a Victor en esto es donde el uso real fuera número que inicia en la ciencia de datos y mundo de aprendizaje
automático. Antes de cualquier retraso sigamos adelante y creamos nuestra primera unidimensional Voy a dedo
Llamarlo DNP Victors one on para crearlo. Ari, sólo
tienes que decir, n p punto r a y proporcionar tu lista aquí. Por lo que voy al presidente Oneto tres por cinco, seis y siete. Eso es todo. Mi matriz es realmente, realmente puedo simplemente imprimir esta área aquí como DNP Victor. ¿ Qué? Y lo hice. Mi zona es realmente Es tan sencillo crear un qué si ya tengo una lista en fightin, Puedes tener un valor menos correcto y menos apagado. ¿ Verdad? 10 11 12 13 14 15. Esta es mi lista no es Ari, ¿verdad? Y las acciones? Dos cosas diferentes. Pero quiero crear una manera con esta lista somos fáciles menos es la palabra clave. Entonces vamos a una al menos bien Ahora, puedo crear fácilmente la matriz con esta lista. Puedo decir y p punto i d en registro. Basta con poner esta lista acostumbrada a uno. Eso es todo. Tengo mi área y puedo nombrar esta zona. ¿ Qué? Yo lo que quiero puedo ver DNP Victor también. Si este tipo y luego imprimir d y B vencedores a y esta es Mary. Y no sólo eso, puedo hacer lo contrario. Además, puedo convertir esta matriz a lista en el camino a hacer eso se acaba de poner esto muy aquí y luego llamar a la pelea y función llamada a lista y eso es todo. El área se convirtió dedo del pie de la lista. Ahora esta es una lista para que puedas intercambiarte entre nuestra a y Oriente muy fácilmente sin muchos problemas. Siguiente función, voy dedo del pie. Entonces se te pasó. Y si quiero dedo del pie upend un valor más a mi vencedor son mi única vez es Ellery DNP Victor uno muy fácil. Sólo di ni GNP tart upend. Andi, sólo pon tu ¿Estás aquí? Pon el valor en el que quieras subir. Por ejemplo, si quiero haber sido 100 no hay problema. Tengo 100. Yo le hice a mi carrera DNP Victor. Si asigné esto a mi DNP Victor uno en, entonces imprime mi DNP mejor uno. Yo circuito que 100 días aviso cazando esta cancha 100 anexó al final el que si
quiero sumar este 100 a este ritmo FIC produciendo dentro de la zona en por cierto, cuando lo llamo producirlo se llama Índice y el número índice con el que empieza cero. El índice partidista para uno es cero. Entonces este es un índice partidista al índice 20 es y tres en experiencia y cuatro en diferente. Se pueden cinco woodies de índice y seis y en usos desesperados. Lo harías Desde siete. Entonces así es como van la indexación. A ver si quiero dedo del pie inserto así voy a ver y ser dardo inserto y luego mi miel y luego quiero insertar en producen Escuchar, arbol on. Deseo insertar el valor 10. Entonces dime que realmente vamos. Esto es cero. Este es uno esto es a esto es tres. Por lo que el 10 debe agregarse después del número tres aquí. Muy bien. Sí. Entonces se suma en Indyk número tres, que está aquí en. Si quiero cambiar mi área, solo
puedo asignar este nuevo inserto y luego si quiero imprimir, ¿por qué DNP victor uno? Voy a conseguir 10 ahí mismo. Por ahora, tan bueno. No creo que debas tener problemas para seguir hasta ahora. Se ve fácil, ¿verdad? Muy bien. Mira estos valores. No están iniciados. Quería atender. Y por cinco ¿Qué pasa si quiero ordenarlo Muy fácil de decir en P Dar Saad y pasó los A D y B D y P Victor un día Lefty aquí. Curso Ártico Lo último asignó el vencedor iniciado a nuestro vencedor. OK, y ahora traigamos a este tipo. Está correctamente ordenado. ¿ Y si quiero borrar uno de esto? No hay problema. se puede hacer. Sólo di mp dot Traelo D y B, Victor uno. Y qué pasa si quiero eliminar valor en el índice uno acaba de pasar ese índice. Entonces, ¿cuál crees que se va a eliminar? Se trata de cuerpos índice y cero. Esto no son explosiones y una así también debería eliminarse, ¿
verdad? Hagámoslo. Digamos que D y B Victor uno es igual y luego brillante DNP Victor corre. Aquí vamos, a Dios dilatado. Hay un funks más muy interesantes y concatenación de autos. Entonces, por ejemplo, tengo otro vencedor DNP Victor tres. Cuando hay 11 hay 200 o tres. Yo quiero esto, Victor, Toby agregó con el DNP Victor uno y crear un nuevo actor están juntos. Entonces digo el MP Victor cuatro igual a np pistola de dardos que la red d y B mejor uno en DNP. Entonces aquí otra vez, protector uno en DNP Victor T. Y junto con eso, también
tenemos que decir y el acceso de acceso es igual a cero. Y te explicaré este acceso cuando hablemos de los multidiamantes. No, ese sería el momento adecuado para hablar de ello por ahora. Basta con poner el exceso llamado 20 en. Entonces imprimamos D y B Victor cuatro en. Aquí vas el y director para es comunistas y ofrecen DNP Victor tres y DNP Victor uno. Correcto. Entonces así es como no pueden meterse en su, um, trabajo de
función. Este es un vencedor muy pequeño. Esto es muy pequeño al principio de los proyectos de la vida real. Te saldrás con la suya miles de registros en si quieres encontrar índice de un
valor particular en que miles fuera de registro su lo común para eso y esa es la función impiden aquí afuera. Por lo que verás en p dot estamos en. Después verás tu nombre victorioso D y B Victor cuatro, y después pondrás el valor que estás estableciendo. Por ejemplo, estoy fijando para 101 Esto me devolverá el índice de descuento hace 101 año. Está diciendo que está en índice lo SolarCity 012345678101 existen en índice todavía y el tipo de datos fuera de ese valor es I nt Buenos informantes y justo hasta ahora creamos nuestro a nuestro auto onda. Estábamos jugando con eso, pero hay otras formas de crear un y esto va a ser muy útil para U. S. Básicamente, cuando se crea una idea visual ya que vamos a ver, es un DnB one on se pone a y B dardo una gama Andi, Entonces donde acababa de decir uno para el dedo 10 y dos. ¿ Qué pasará? Creará automáticamente Ari. Veamos una D y B. ¿Qué? Aquí tienes. Por lo que ha creado eres un off interiores valores entre uno y 10 con el intervalo apagado a eso significa que realmente empieza con uno y luego pasará también. Por lo que 13579 y el último valor nunca se incluye. Por lo que todos los valores estarán comenzando con el primer valor en el rango y serán menores que el último valor en la renta. En el espacio entre esos valores estará el número que has enorgullecido ya que inicio a las tres pondría el dedo Aaron impresionante. Estos aire útil. ¿ Y si quiero crear una matriz de todo ceros? Entonces digamos D y B. Tzeitel, realidad son solo cmp dot ceros. Y cuántos quieres Si quiero 10 así va a crear un día con 10 ceros. El PNJ Aquí tienes. Ha creado array con todos los ceros. Ha creado un remache 10 valores y todos son cero. Ahí agitado va igual. Puedo crear lejos con todos los de aquí. Si te preguntas dónde estás usarás este tipo de características. Se utilizará mayormente mientras se crea con los más ligeros desde. De acuerdo, sigamos en la siguiente función de la que vamos a hablar. Y esta es una función muy importante está tumbado en el espacio. Veamos qué hace. Entonces D y b mintiendo Su ritmo es igual a la línea oscura MP esta pieza en, Digamos que quiero imprimir del 1 al 5. Se 20. Escapar en de Sprinted. Aquí va, ¿Qué conseguimos? Se trata de imprimir valores entre uno y cinco. Se incluyen ambos que son 20 valores entre uno y cinco y todos están igualmente distanciados. Por lo que cada uno de estos se separa con la misma distancia 0.20 Así funciona el espacio luminoso. ¿ Y si quiero remar el valor máximo en mi zona? Es decir, sólo
dice DNP. Simplemente puedes decir Max en obtendrás el valor máximo Así que el valor Max es 5.0. ¿ Correcto? De igual manera. Si quieres mínimo, solo
tienes que decir media d y B nueve SB punto i quiero decir en el valor mínimo es uno. Y si quiero saber el índice fuera máximo y mínimo Bueno, en lugar de Mac, dirás air T max. Y eso te dará el índice después hace número aquí en si quieres el mínimo una
vez más. Lo mismo. Pero por aquí, dices atrevido. Aquí vamos. Es cero encendido. ¿ Y si quiero saber el tamaño de mi zona? Eso tampoco es tan difícil. Se d y B nueve cdtas y solo una talla. Aquí tienes. El lado fuera de esta carrera, 20. Por supuesto que s no se desarrolla, ¿verdad? Ah, olvidé decirte lo más importante y lo más fácil de hacer. Si quiero encontrar el valor en un índice específico, eso es fácil. Línea DNP. Seamos si quiero encontrar el valor Por ejemplo, ese índice 55 te mostraría el valor del índice cinco. ¿ Y si quiero el valor para el índice de rango fuera? Al igual que si quiero valor de 1 a 5, Así DNP línea SB. Yo quiero muy del 1 al 5. Diego. Te dará valores del 1 al 5. Es así como encontrarás los valores en un salario de diamante. Creo que cubrimos todo lo que necesitamos para cubrir en una sola dimensionalidad. A continuación, te
llevaré a través de array multidimensional
6. Numpy Multi dimensiones: Hablemos de mi Ari bidimensional. Ahora veamos mis demandas D. No, pero también llamó a los médicos. Primero creemos un ari multidimensional fuera de números aleatorios. Entonces digamos DNP al azar. Está en FY dardo punto aleatorio vanned on. Vamos a crear una matriz multidimensional de cinco por cuatro que faltó cinco filas y cuatro columnas. Conducir por cuatro D y P. Benda. Muy bien. Entonces esta es nuestras demandas Monte ahora sobre Recuerda hablar alguna vez de exceso. Por lo que todas las filas aquí se consideran excedentes. Cero columnas se consideran como exceso una. Por el contrario. Comienza en camino. Esto es 00 Eso fue fila cero columna cero. Se trata de 10 que ganan primera regla. COLUMNA VERO Esto es 20 que cuando segunda fila columna cero. De igual manera, este es 01 que con cero fila primera columna, la fila viene primero y después llamarlo. Por ejemplo, si quiero saber valor a andro grueso y primera columna D y B aleatoria, controlan primera columna y se desarrollan la muerte. Jiro Un dedo del pie, segunda fila 01 1ª columna. Este es el valor, esta misma cosa. Yo puedo ir un poco diferente. Podría decir que DNP regresó a casa a por uno. Devolverá lo mismo que puedo poner Fila y columna entre corchetes separados son puedo
mantenerlos en el mismo registro con coma. Y si quiero averiguar un rango como el 1er 1 aquí es para fila 2da 1 aquí es para columna y puedo mencionar el rango para poder decir D y B Vande um quiero ver de la fila uno a la Fila tres y cuatro columnas. Pasé de columna segundo dedo del pie llamando para que vean y eso s molesto. Obtengo fila 10 y 103 012 árboles de esta carretera de esta carretera a esta habitación. ¿ Verdad? Y llámenlo Toto. 401 toe do y cuatro Recuerda, El cuatro no está incluido. Entonces fueron dos y tres. Entonces dos y tres de aquí a aquí. Y 213 Entonces eso significa estos valores, ¿no? Por lo que 31 no está incluido. Por lo que serán uno y dos. Nadie le escribió y lo llaman dos y tres porque adelante lo lateralmente no está incluido. Tan idiota de lo hago aquí. Este encendido. Escucha, Así que así funciona. Al igual que si quieres conseguir un arreglo espacial molesto fuera sueldo multi diamante. Así es como quieres. Deberías llorar. Desarrollado. Lo tengo. Está bien. ¿ Cuál es el tamaño de mi ar e? ¿ Y si quiero saber la talla? Ahí es donde la justicia fácil. Sip on. Eso es todo. Dice la sape de tus matrices. Cinco y cuatro. Por ahora, tan bueno en. ¿ Y si quiero conocer los tipos de datos fuera de mi zona? Muy bien. Diga d tipo. Y eso es todo. El dato se sumerge. Todos los valores en esta zona son fruta. Creo que todo eso se trata de Ari multidimensional. Pasemos por algunas de nuestras cárceles. Se puede para formado en estas áreas. Eso puede suceder en cantante dimensionalidad son multidimensionalidad. Pero estos son algunos interesantes nuestra presencia que puedes realizar. Hagamos eso. Veamos nuestros regalos. Y veamos qué tipo de nuestras cárceles podemos realizar en nuestro NPR. Voy a definir mi propio Ari. No voy a actuar. Esos son regalos en este número aleatorio. Multi dimensionalidad. Entonces vamos a crear mi propio ary DNP i n t Médicos at n p dot buddy Voy a crear una
multidimensionalidad . Tienes que romper su a sus registros de coro para crear valores de Eddie multidimensionales . crecimiento en el interior son los registros de tarjetas. Oneto tres on, luego 456 789 10 11 12 15 14 15 Y gastan este tipo D y B y los médicos. De acuerdo, así que esta es mi área multidimensional. Voy a hacer mucho fuera de nuestra presencia en eso, el 1er 1 que me gusta. Es algo que puedo ver algunos, y esto me va a dar el total de todos los valores en esta zona aquí 1 20 Así que ese es el total de todos los valores en esta ciudad. ¿ Y si quiero dedo del pie saber cuál de estos valores se crean? El agradable pagado habla bien. Por ejemplo, quiero ver Veach de estos valores son mayores que siete D y B. Es copia esto y mayor que pronto. Aquí vas, para todos los valores donde no superó 78 reimprimir caídas y los valores que son
mayores que ,
digamos, uno, uno, se
imprimirá verdadero interesante, ¿
verdad? ¿ Y si quiero crear una R e con los valores a partir de esto? Muy. Pero los valores que son mayores que, digamos uno, por ejemplo, esa ciudad sólo dicen que es un 2do 1 en. Ah, no se olvide el es bastante registros. Y luego este disco, y luego voy a decir, conectó ese techo en un menos imprimirlo. Entonces no es ari para convertir esto en un día. ¿ Por qué tienes que hacer es decir el Ari original en el interior que pones a este tipo. De acuerdo, Ahora, mira, tienes esta subsidiaria. Nuestro David valora mayores a siete. Este comando es desucar ID. Pero yo sólo quería para que usted pueda hacer esto. ¿ Y si quiero cambiar todos estos valores? Entonces en lugar de nadie a Bueno, quiero asignar 100 Por ejemplo, eso se llama una radiodifusión. Todo lo que tengo que hacer es decir, aquí y luego necesito saber de qué sigue estoy hablando. Entonces recuerda, 012 y tres. Entonces estoy hablando de la regla número tres. Entonces eso significa regla número tres. Sería Él es bastante récords. Regla número tres Y luego de que Collins estoy hablando desde 0012 Like de cero a. Entonces, ¿qué voy a poner aquí? Cero hasta el último. Bueno, aquí están en la renta. El segundo valor no entra en contacto. Entonces yo diría tres bien, igual a 100 y luego menos impreso. Está bien. Aquí tienes. Que cambió 200. Esa es la radiodifusión. Es así como se pueden cambiar los valores en Larry multidimensional. Y si quiero sumar 50 toe todos estos valores justo al 52 it Eso también es fácil. Basta con ver esto en el 50. Es como si cualquier otro fuera persistente. Simplemente diga agregar 50 como este en impreso de nuevo. Aquí tienes. Cincuenta en ello, Bien desarrollado.
7. Funciones estadísticas de Numpy: como siguiente parte de esta entretenida jenny off explosivo numpty nos vamos a dar el dedo a explorar algunas funciones
estadísticas. ¿ Eso es funk testículo? Ya que puedes realizar en la nueve p. R e, ya te vendí alguna siguiente me voy de pie. Entonces lo eres Es tierno, ardiente. Y así solo dices impedir el arte, STD y pasarle tu nombre en él calculará un estándar arvioso y en tu santo. Por lo que para esto son una desviación estándar es 37.31 De igual manera, se pueden realizar varias otras funciones a estadísticas. Por ejemplo, si quiero ver la ruta Esquire fuera de cada uno de este valor, puedo decir MP dardo Sí,
Q rt y luego pastie nombre off Daddy aquí le dará su silencio anotó fuera cada uno de estos valores. De igual forma, se
puede hacer log. Entonces, por cierto, si no entiendes mucho de los detalles detrás de cuáles son sus televisores tiernos y qué es log ? No te preocupes. Eso cubriremos en futuras optativas Por ahora. Sólo recuerda que estas son las funciones estadísticas MP que puedes hacer usando M. P. M. P s La biblioteca de lucha ha lavado potencial, y este puesto Insel está aumentando cada día. Cuando sigas,
haz el proyecto en tiempo real como profesional de aprendizaje automático. Te solicito dedo del pie mantenerte actualizado con lo que está pasando en thes bibliotecas como MP s Kaylan Banda Matt trajo viva Be on Seaborn estas Air cinco bibliotecas que van a ser tu vida. Así que manténgase al tanto de estas bibliotecas y manténgase informado de lo que eran. Nuevas mejoras ocurriendo en estas bibliotecas. Cualesquiera que sean las funciones que se estén depreciando, cualesquiera que sean las nuevas funciones que se estén agregando. Artem, se acabó con numpty. Te veo próxima conferencia.
8. Pandas: Hola ahí. Ahora que tienes instalado el cuaderno Júpiter, vamos a hacer dos cosas juntos. Crearemos un nuevo cuaderno de Júpiter sobre exploraremos una biblioteca
beytin de aprendizaje automático muy importante llamada Wanda. Aquí tienes tu cuaderno de Júpiter. Vaya a nuevo y haga clic en Pelea. Y tres. Así se ve Júpiter Notebook. A esto se le llama venta. Puedes agregar tantos como quieras. Puedes eliminar si no lo quieres. Andi. Lo primero que haremos es que vamos a escribir de qué se trata. Digamos que haz haz, Andi, ve al tipo de celda de vela y hazlo Marta Markdown es como comentarios al respecto
te serán útiles cuando imprimas el cuaderno completo. Arvin Terminates está mirando este cuaderno Marcar abajo por aquí Puedes ver bateando. Lea este mensaje. Eso está bien. Y ahora nos vamos a importar biblioteca Pandas para PD on Al mismo tiempo, vamos a importar una biblioteca muy importante Numpty si eres nuevo para comprar artículos, solo entiende. Estas son bibliotecas muy importantes que vas a utilizar en el aprendizaje automático. Así que nos encontró en particular es lo que vas a explorar dedo del pie en esta conferencia que vas
a pasar algún tiempo en este dedo del pie vencedor. ¿ Entiendes qué? Se trata de fundadores Biblioteca. ¿ Qué se puede hacer? Usando esta biblioteca importaste las bibliotecas importantes Siguiente, menos a la derecha. Una cancha pequeña. Vamos a crear un marco de datos de pandas que es como crear una tabla en el aprendizaje automático como input sí citas va a ser y ahora va a ir del dedo áreas, por ejemplo, Las ciudades es una muy simple,
muy fuera de los números por seis, luego nueve y te hace Empiezas aquí cerca. El tiempo de este año va a ser profesor. En lo que va tan bien. Hemos visto un descanso. Llega aquí entonces Camino menos las columnas Los problemas van a ser sencillos. Mantenlo simple por ahora. El ver Vamos a construir esta cancha muy sencilla sobre Usted está listo para correr. Ya puedes terminarlo haz click en esto. Te preguntará CEO de Arias, ¿Quieres reiniciar el cardenal? Porque por aquí se ve que no hay números porque el coronel cuaderno no ha comenzado. Entonces truco en esto en él comenzará eso. Y aquí Tienes los números justo aquí. Ah, ¿quieres uno y dos ahora esto se convierte en parte del país? Esto es parte de cuaderno ahora. Condiciones normales. Ese primer detector y esto. Vamos. Y este comando en esto es nuestro marco de datos. Esto es exactamente lo que dimos en este año. 123456789 En las columnas ABC en esto por aquí se llama Índice. Vamos a jugar con esta carta, pero por ahora,
entienda, entienda, acabamos de crear un marco de datos fuera tos un día libre de números. Ahora vamos a crear otro dato de y esto va a ser un poco diferente de lo que es ahora. Entonces en la nueva venta, bueno, aquí si vas, obtienes más opciones. Insertan, insertan venta, evolucionan se insertan debajo de ella. Entonces lo voy a insertar a continuación. Y entonces aquí tienen dos iguales a BD en que Salgan de su tiempo país y oscuro. El día de hoy también va a ser éste. Digamos que la búsqueda últimamente no se olvide de Syntex. De acuerdo, Y escucha, digamos que va a ser y vivimos en donde entonces? 15 14 15 15 19 15 On it dijo una más Regla 19 Don t Muy bien por aquí. Entonces esto es fin. Esta vez vamos a ir a una cosa más importante. Vamos a nombrar nuestro en Texas Index igual que ellos no lo son. 1234 filas. Necesito cuatro en Nexis. Él que Andi como antes necesitamos dedo del pie. Columna Neymar Mantener el nombre de la columna parece una tía B. Ya veo. Se ve bien. Sí, un montón de yo no lo sé. Ah, sí, conseguimos más de lo requerido en Texas. Hay 1234 reglas. Por lo que B Q R s por ok ahora rallyes. Y aquí vamos. Tenemos el nuevo marco de datos encendido. Indicar un marco. Los índices son asirios lo llamaron BQ Arias. No se trata de números numéricos. Se basa en lo que nombramos hice antes de que más Sigamos algunos buenos. Citando estándar en inserciones hacia arriba, algunos marcaron algunos comentarios que serán útiles. Carta, dicen en tercer sello implica aquí. Vamos a ver 15 estado de James, Este tenemos que ir a la venta y decir que está marcado por abajo Padre Mark en ventas. Ahí no hay números. Sólo los tribunales el tribunal de servicio tienen los números porque tienen que seguir ciertos ejecutos en secuencia. Buen trabajo. Llegamos a la fecha, los afganos crearon dos conjuntos de datos. DF Andi tiene que Vamos a jugar abajo, Andi, siguiente Vamos es el Si solo ejecutas este comando, verás todas las columnas como ABC y tipo de datos tipo de datos de todas estas columnas con objeto con PTSD de columnas 30 de dos columnas. Se le va a ayudar en cómo ¿Qué índice? Si dices el índice, ves, ya
ves,son sus días de rango 0 a 3 y se
crean los pasos uno que esto es sólo un nuevo índice médico . Empieza cero sobre ella, incrementos por uno. ¿ Qué tal si voy venado demasiado oscuro ahí dentro? ¿ Quién aquí? Tiene nombres indexados, BQ, arias y, por
supuesto, tipo de
datos con objeto. La verdadera diversión comienza ahora cuando vamos a rebanar y a dados estos datos, siéntate usando Panda. Lo que vamos a hacer ahora él rebanando Haz eso en un Pero tenemos que ver con esto. Esto es sólo un comentario. Teníamos un buen tipo celular de venta en Dr y no hay números. Una vez más, basta con dar click en esto y directamente abajo. Está bien, aquí. Es cosa muy importante que vas a usar en Masilela ¿Y si lo quiero espacio? Llámalo. Si eres índices son numéricos como este, solo
puedes decir el f apretado. Yo los miro uno que te explicamos esta parte en índices de lucha. Empiezan cero. Entonces si se guarda uno, se
va a imprimir dedo del pie la segunda habitación. Ahora la primera veamos que click contra Y aquí tienes Se va a imprimir 456 Porque dimos uno. ¿ Y si digo que miro? Zero Va a ser el 1er 1 123 ¿Y si solo quiero a Tokyu? Mi nombre de índice, no el número de índice. En ese caso, verá DF demasiado bajo en. Por ejemplo. Yo solo quiero estar pagando mi habitación P. En ese caso, dirás local loc no loc en no Index Loc. Dirá su Lucy y le dará el nombre del índice. Por cierto, puedes def click en control. Entra en tu guárdelo en ti para hacer lo mismo que haces con el color surround encendido por aquí. ABC 10 11 12 sobre eso es el Speedo. De esta forma podrás obtener directamente un grupo de freak de velocidad. Por ahora, tan bueno. Ahora ya sabes como amigo de una fila de altavoces spate. ¿ Qué tal si quiero un subconjunto de estos datos, por ejemplo? Yo sólo quiero esta parte. 10 11 13 14 16 17 Sólo esta parte. Quiero crear un subconjunto fuera de él. Ese es él Está bien, vamos a seguir adelante. Tenía una celda nueva. Ahora vamos a crear un subconjunto. Después de que te vayas, vamos a la calidad de tres. El mando es el demasiado oscuro en el que estaría en esto. Hay dos argumentos. El primer argumento contiene el número después de los que quieres en este malestar. Empezar con cero en sus nombres. Árbol hace lo mismo Quieres solo dos columnas cero y te hace tener como aquí obtienes una e y b
recordar, sé uno. Sí, esta etapa ¿es? 10 11 13 14 y 16 17 tres Hace y hacer columnas ahora sólo siendo 50. Y usted ha creado un subsidio de los F dos y le da el nombre del fondo no se detiene aquí. Hay muchos comandos de este tipo para explotar antes de que yo sienta. Este 'll guinda en cubitos después de sus activos que te explicamos un aspecto más el cual
usarás en Massillon. ¿ Qué tal si digo, ustedes cuatro en y la F a que me miro? Entonces digo:
OK, OK, 0 a 3. Pero aquí dije que eran queridos por lo que pasó Santee en este mando. Digo que no incluya la última columna diciendo mi anidlo en. Estoy viendo no incluir este. Si creo que menos dos no incluyen las últimas dos columnas. B y C. ¿
Hacen eso? Sí, sólo
tiene Carlo fresco. ¿ Y si solo veo menos uno? El único príncipe el último? Vamos, Si veo estudio de última columna, Si digo menos uno, eso significa que no soy un principio con cero a menos uno. Sólo digo menos uno. Basta con poner menos uno. Eso significa que sólo tomará la columna grande. Ver 1ra 3 puertas 12 15 18 a 15. 18. Pero en el último color. Estas son algunas de las formas divertidas de usar puedes crear sub set off el conjunto de datos más grande en. Esto es lo que vas a usar en Massillon. No estamos hechos. Es lo más importante en la parte crítica fuera de Panda, que vas a utilizar en Wasilla. Knee es lo que daría por el último en que es leer las peleas. Entonces pongamos el mercado aquí. Tarjeta en. Ves, esto va a estar abajo. ¿ Crees? Fonda Podrías leer cualquier tipo de pelea que puedas salir con dos años. Finalmente convertimos de sitio web. Se puede t html cinco, uh, a la ciudad fácil. Acabas de dar en DVD punto Tetina es tres. Dooney y nosotros aquí para pelear sobre tengo Ver soy yo en este enlace. Y aquí es donde se almacena el archivo CSC. Este es el único comando que necesitas leer ahí. ¿ Lo ves? Yo sólo estoy bastante desordenado. Y aquí tienes. ¿ Ves? Eso sí, archivamos en eso. Tenemos lado justo con uno. Vamos. El archivo completo está aquí mismo en ese archivo está en este conjunto de datos. ¿ Lo cogiste? Eso es todo. Ahora todo el marco de datos de Banda juvenil CS 35 llamó el If it on. Sea lo que sea que seas presidencia realizada aquí, puedes realizar sobre el si lo d si tus datos para jugar ahora y vas a estar Hacer todo esto rebanando, cubitos, indexando en todas esas cosas haciendo Massillon en este tipo de datos. Entonces en eso te ibas de dedo leer una pelea con muchos datos usando panda on. Entonces después de eso, lo
harás es entrenar a los conductores y rebanando y cortando en cubitos todo ese tipo de análisis son que puedes ver todo ese tipo de operaciones en los datos usando Panda, bulmpy y otras bibliotecas. Pero el panda es la biblioteca más importante a la hora de leer el archivo sobre instruir, rebanar y recortar esos datos más grandes. Te veo en próxima conferencia. Adiós adiós. Pero no vayas a ninguna parte, Head. No lo hemos hecho Lo más importante en parte más emocionante fuera de Brenda me quedé para el último en que es leer los cinco. Cuando estás haciendo aprendizaje automático, primero
tienes que leer los datos sobre eso. De lo primero que irás usando Fonda. Entonces sigamos adelante mientras lideramos los datos. Lees los datos y te transfieres a ellos a una fama de datos. Ya sabes de él. Entonces el si son mis datos a partir de ahora el comando de leer. El archivo es BT dot Reid, voy a leer CS tres archivo. Por lo que va a ser PD puerta plomo para ver si nosotros si estás leyendo aceptado, sería aceptado. Entonces, así, hay comandos para leer diversas peleas. Podrás obtener una excelente calidad ya que podemos detectar. Archivo. Podrías comer huevos. Esmeralda. Ahí se puede obtener cualquier tipo de archivo. Vamos por eso. Mi ver, si llegamos aquí, Este es un tipo de datos de código abierto. Nunca a ti. Se puede casi inmediato. Entonces voy a leer el de este año que archivamos en esa fecha. Se me va a contar en esta fama de datos. Y yo dije: No
tienes que hacer nada. Vamos a decir bastante una sentada en un montón aquí mismo. ¿ Tienes esos datos en el marco de datos? D Si está encendido ahora, cualquiera que sea nuestra presencia que realice aquí en el marco de datos, puede realizar el mismo tipo de nuestra presencia en los datos de este es el primer paso en cualquier aprendizaje automático. Primero hay que leer los datos sobre. Después comienzas a rebanar, cubitos y analizar los datos. ¿ De acuerdo? Estamos a punto de terminar con esta conferencia. Ya hemos explorado suficientes detalles en Panda on. Nuestro expediente está listo. Es hora de decir la pelea. Entonces ve aquí. Pelea. Sue está encendida. Entonces aquí puedes obtener el nombre. Dijeron que eso se convierte en mi lucha. Hay varias cosas buenas en cosas muy útiles de ti, Peter. Pero les hablaré de ellos en su momento. Una cosa muy importante que te quiero decir en este momento es que puedes descargar todo este archivo SHTML como pdf son cualquier cosa por ejemplo. Puedo descargar este sht, etc. Si abro. Así es como los luchadores ahora puedo ver en esta pelea a cualquiera sobre David. Tengo día todos los comentarios. Oro razonó que el cierre de corrida fría está ahí mismo. Pero este es tu cuaderno completo. Se puede decir con cualquiera que se puede, de hecho, poner buena esperanza. Eso haremos en su momento. Esa es una belleza de Júpiter. Entonces todo esto se trata de Panda en Júpiter on. Te veo en próximas conferencias.
9. DataExploration Seaborn2: Cómo lo hice estoy sentada en un restaurante y estoy pensando, si tengo un dato de clientes fuera de esta retórica y cuánto están en la cuenta cuánto tienen dolor como propina. Alguna información sobre esos clientes les gusta su género, sean fumadores o no, ciencia fuera del tamaño de la fiesta, ¿Cuántos clientes comen juntos? ¿ Puedo encontrar un patrón? ¿ Y puedo decir quién paga más con fumadores, pagar más o no fumadores pagar más sobre qué le gustaba al servidor? Los meseros se meten más profundo. ¿ Va a encontrar algún tipo de perspicacia en que van al mundo fuera fecha que anoto no es exploración de
datos es uno de los pasos más importantes para cualquier científico de datos? A menos que entiendas tus datos, no
puedes hacer mucho con ellos y morder y novias. Diversas bibliotecas para la exploración de datos Matt Part y See Bon son las que
más se utiliza en este rico. Voy a llevarte a través de la Biblioteca Seaborn. Entonces digamos que atacaron prisión usando veo Ir en Lección 40 bibliotecas. Por supuesto, la primera biblioteca va a ser fondo La belleza de la tierra en importación Si bon SNP Vamos a importar volcado
como y ser tres bibliotecas principales es nuestro pan y mantequilla fuera de cualquier científico de datos. A continuación vamos a importar el conjunto de datos mayormente cada biblioteca, como ver una como biblioteca como mordedor. Paseo bibliotecario. Su propio conjunto de datos para propósito de degustación fueron nosotros sí importamos dips de tarjeta detestada de la costa. Ahí está los consejos igual a sí, en esta oscuridad. Dicen sus datos, en el conjunto de datos. El nombre es tips on. Siguiente. Vamos a crear el marco de datos de Fonda para estos datos. Dijo esto Ya sabes Lo hizo, uh, crema y le pusieron dipsy. Veamos ahí primero. Pocos roles después de datos fueron buenos para ir. Por el momento, tan bueno. De acuerdo, vamos a ejecutarlo. Tu enfermedad. Ah. Sí. Esto sería una enfermedad. De acuerdo, así que aquí tienes. Este es el dato dijo que vamos a trabajar en una sentada de datos muy simple. Vio la factura total pagada a fondo monto seis masculino o femenino sobre si la persona que pagó este total montará y el restaurante Table Mountain wasa fumador o no. ¿ En qué fecha fue esa? Es un muerto algún día. ¿ Y a qué hora se fue? ¿ Fue una cena de almuerzo? qué hora estaba encendida. ¿ Cuál es el tamaño de la fiesta? 2345 Ok, así que muy simple Data's it. Veamos cuántos datos hay en estos datos? Siéntate así d f dr Ver, va a Sue s detestada a su a 44 filas. Y por supuesto, hay siete columnas. No muy grande. Ahora tenemos estos datos. Esto es muy fácil de entender. ¿ Qué tipo de detritus? Pero cuando eras científico de datos en estás go toe pronosticar punta Entonces no es sólo mirar estos datos. Andi, piensa bien, ahora entiendo que necesitas entender el comportamiento fuera de los datos que esto también fue suficiente. El dato de lo profundo que se ve afectado por total Billy bounder por un fumador son de día después de V auto por tiempo, muy almuerzo o cena. Nuestro lado de la fiesta, Estas cosas que tienes que entender y esta entendiendo estos aspectos después de que se llama exploración de
datos en. Ahí es donde Seaborn viene a mano. Por lo que muy primero, lo que necesitas hacer en tales casos es entender la distribución fuera de los datos. Y para ello, es necesario trazar la gráfica de distribución. Sólo di que sí. Ennis Dart Dist! Blot on def! El DF. Entonces consideremos todo el objeto. Usted fuera de estos ejercicios, queremos dedo del pie predecir lo profundo en base a ciertas otras variables. Por lo que nuestra variable objetivo es profunda y hay ciertas características variables dependientes como Billy mi propio sexo habló. Sí, sé qué fecha es hora y tamaño. Entonces lo primero que voy a hacer es entender que estas dos persona tras punta en este
conjunto de datos si es distribución normal, son no es normal. Distribuye. Ejecutemos este comando en. Aquí tienes. Este es el distrito no estaba fuera de datos profundos en parece una distribución normal. Si ves una curva de campana como esta, es una distribución normal, más o menos. De acuerdo, entonces vamos más a continuación. Voy a entender a Veach fuera de estos mismísimo del mundo, afecta la cinta alrededor de la mayoría. Y entender que lo mejor es lo que se llama mapa de calor. Al siguiente vamos a dibujar hit map. Pero antes de dibujar el mapa de calor, tenemos el dedo del pie primero, asegúrate de que estas cosas estén coordinadas. Entonces vamos, para eso es métricas coordinadas Equus d si oscuro podría relacionarlo. A continuación vamos del dedo del pie. Crear mapa de calor en esto. Métrica correlacionada. De acuerdo, hit map. Médicos. núcleo en eso. Entonces este es un sicario. No se ve muy informante porque le faltan los números aquí para agregar el número que dices un arte que costó por aquí River. Ahora tiene números. Mira la punta y aquí abajo. Ya ves, por
supuesto, punta a punta será uno ahí Darvill tres el uno al otro. Pero entre el total de la factura y el tamaño, se
puede ver el monto total de la factura afecta a la punta más entonces al lado. ¿ Por qué no conseguimos otras variables como esta? Es fumador diurno y todo porque estos son variables categóricas. Cuando hagas el análisis científico de datos sobre estos datos, lo primero que harás es convertir esta variable categórica en cualquier
variable médica . Cuando realmente hagas ese tipo de análisis sobre estos datos, toda esta columna serán números. Por eso no vienen aquí. Pero el punto es lo nuevo en el análisis del mapa de calor. Entenderás que tu variable objetivo se ve más afectada por la característica de trigo. ¿ Cuándo se puede decir variable independiente en. En este caso, parece que el total realmente está afectando más que el sitio. Lo tengo. Por lo que llegamos a informar a Merson sobre nuestros datos. Por el momento, esa es la distribución normal sobre el total. Realmente la cantidad son fijas, el profundo más que el tamaño de la pieza. Muy bien. Por el momento, tan bueno. Vamos a crear más visualizar la esencia sobre que nos dará más adentro a través de los datos. Entonces a un lado para visualizar es y vamos a crear es una trama. Creo que punto de la muerte ¿Eres parte? Y por aquí, vamos a enorgullecernos. Nuestro eje X va a ser factura total. Por qué los exes va a estar en nuestros datos. Es DF muy sencillo, Ok. Y o aquí? Muy bien. Entonces nos quitamos el complot. La factura total fue tan empinada, pero no está muy clara. O
sea, no es muy informativo. Añadamos algunos criterios más para obtener una información adecuada. Vamos a añadir tiempo de color. Está bien, vamos a ver. Aquí vamos ahora. Conseguimos dos parcelas en base al tiempo. Bueno, es hora del almuerzo o de la cena. Bien. Hagamos algo de trabajo. No. Diga quién va fumador, tendremos más informantes. Y en base a donde esa la persona Wasit fuma o no. De acuerdo, ahora tenemos diferentes colores basados en un fumador. Sí o no. Vemos un patrón. Veo un patrón lineal aquí en ambos casos. Por lo que va, tan bien. Añadamos tamaño. También del tamaño de este dardos. Aquí será más grande son los más pequeños en base a la siguiente grieta diaria. Todas las menciones aquí nos convencimos en el tamaño de los criterios. Tenemos una columna aquí, ¿verdad? Por lo que en base al tamaño de la fiesta Visy, los diferentes tamaños fuera del médico. Y aquí tienes. Cuanto más grande es el tamaño de
la fiesta, más grandes son los perros aquí. Entonces con base en esta gráfica ahora, entiendo que es un patrón lineal ya que el total va a aumentar, la cantidad de tipi aumenta. Y hay algunos Parton relacionados con si las oportunidades, fumador o no. Pero no pudimos distinguir mucho aquí para entender que en parte en la mano de día para crear línea
regresiva basada en los criterios, ya sea que wasa humo o no. Y así lo hacen. Digamos que aquí están unos más delgados,
um, um, traídos y una vez más realmente empezar con X es proyecto de ley de tortura. Muy bien. ¿ Por qué es igual a profundo? Andi lo hizo, uh búsqueda. ¿ Tienes una Okay, Entonces ellos regresión lineal que ya sabíamos, verdad? Necesitamos un poco más informar. ¿ No es esto? Agrega esos criterios contra el tiempo igual. Entonces tendremos que gráficos ahora basados en el tiempo libre, El día en o aquí. OK, nos dieron dos gráficas prestadas en la cena. Encendido otra vez. Siempre es el mismo comportamiento, ya sea para el almuerzo o la cena Italia cerca de rebautizado. Yo quiero entender si hay una diferencia en el comportamiento en base a si la persona Wasit fumadora o no, Vamos a añadir esto. Ja, ja! Ahora entiendo eso Veamos esto. Entonces lo comprobado es una persona fumadora en el origen ah aquí es no fumador y hay un patrón La persona que fumo Si el monto de la factura es menor, da re literalmente motivo. Pero le pregunté La cantidad billy aumenta el kun profundo por fumador radi usa en comparación con la persona con Artie fumando. Por lo que ahora conseguimos una muy buena visión de estos datos en base a si la persona es fumadora o no hasta el momento, entendimos normales estos dos seno, la cantidad de punta está más basada en la voluntad total en ahora. Entendemos que si el monto de la factura es alto, es mejor así no fumador. Si buscas una buena propina, vamos más. Añadamos un poco más con sus ideas. Y esta vez vamos a dibujar con el dedo del pie algo llamado trama de gato. Entendimos que hay una diferencia en el comportamiento. ¿ Existe alguna diferencia de comportamiento en la cantidad de tipi en base al día de la semana? Para entender eso, dibujemos un tipo diferente fuera de chat. Dicen que X igual hoy. Andi, Uh, por qué igual profundo y datos igual a querido Lester y esto no está terminado pero menos Renate o aquí tenemos algo. No está muy limpio. Entonces pongamos amable Así que en ese tipo de piso coloque un papel muy importante para aquí. Voy a decir amable que un poco. Do. ¿ Ves una mejor ahora? Esto me dice que el viernes hizo ah lista número fuera de la gente comunión Onda punta en Monte. No tan alto, pero el jueves la gama de personas que se dan al dólar T, por ejemplo, eso es alto el sábado, ese poco acogedor pero la cantidad profunda aumenta como tal vez mucha gente viene Sábados y domingos outs. Viene mucha gente, uno más dentro de la mirada. Estos son los análisis tipo off que podemos obtener dependiendo de diferente tipo off graph. Como digo, la trama del gato de este tipo aquí juega un papel muy importante. Puedo cambiar el dedo del pie amable Wilen, por ejemplo, aquí en él se verá diferente. Ah, aquí. Tan mismo tipo de información, pero es una caja fuerte diferente. Pero de igual manera, no
puedo cambiar la barra del dedo del pie sobre ella lo hará. Por lo que un tipo de bar diferente de Ted Sieben es muy buena biblioteca de cuando se trata de
exploración de la fecha . Existen varios asuntos de este tipo de etiquetas utilizando los cuales se pueden visualizar sus datos y
se puede obtener una visión al respecto. Por lo que antes de empezar a aplicar algoritmo en el entrenamiento, tu modelo y todo esto te ayuda a entender los datos antes de que termine. Si solo vas en Google aquí,
eh, mira, mira, pelea de
bonos y biblioteca. Este es el sitio para esa biblioteca en algunos de los ejemplos que tengo pronto aquí fue del sitio y se puede ir y explorar más allá que tienen muy buenos ejemplos aquí. Eso fue sobre la biblioteca Seaborn. ¿ Y cómo puedes explorar tus datos usando eso? Una biblioteca. Te veo en próxima conferencia.
10. DataPreprocessing: después de la experiencia de datos, y siguiente cara es el pre procesamiento de datos. Recuerda, los datos que estás viendo te son leídos capaces como humano. Pero cuando envías esos datos para Messina y tienes que hacerlos legibles bajo estable por una máquina en máquina, solo cosas en términos de números no entiende variables categóricas,
variables como teníamos en nuestro conjunto de datos anterior, como el almuerzo masculino femenino de la hora de la cena, ese tipo de variables categóricas que no entiende. Por lo que en la parte del pre procesamiento, hay
que convertirlo en los números. Pero eso es solo una pieza de pre procesamiento. Tienes que hacer ciertas otras cosas como parte del pre procesamiento de tus datos antes de
pasarlos a algoritmos de aprendizaje automático. Entonces, empecemos. Empezaremos importando bibliotecas muy importantes. 1er 1 por supuesto, es numpty como el MP, y luego no te olvides de estancarnos como PD on Vamos a importar Savon Muy bien. Ahora que usted ha importado todas las bibliotecas importantes hasta el momento, vamos primero en fort. Nuestros datos al respecto van a ser la misma ciudad de datos en la que estás en la conferencia anterior. Los regalos nos lo hicieron desde,
Sí, Sí, Biblioteca de
Tenis. Está por ahí. Sí. Entonces empiezo a cargar debajo de la escuela. ¿ Lo hizo en nombre de conjunto de datos. Se profundiza. A continuación, vamos a crear Banda Data Frame sobre los datos se ajusta a dardo OPD Did, uh, gratis on, por
supuesto, Sólo tienes que poner consejos aquí que tenga un nombre. Dejé primavera la cabeza fuera de los récords de bateador. Tan unidos tarjetas hayderi fuera del amigo de datos para que tengamos campo que nos dieron la
familia de datos . Vamos a correr este impresionante buen trabajo ¿nos hizo? Está listo como parte de pre procesamiento. El primero que hacemos es asegurarnos de que no haya valores nulos como no hay
valores vacíos en cualquiera de estas características son variables objetivo ¿hacer eso? Es una D de los datos de video de Name is No. Entonces será sí y no en no lo hizo. Entonces dice 000 Eso significa que no hay registros indican un marco que no tiene valores, por lo que todos ellos tienen algún valor. Muy bien. Si existe una columna que no tiene ningún valor, que tomar una decisión. ¿ Cómo te sientes esa columna como o bien pones un número rojo son que simplemente ignoras su la tarjeta. Depende del caso por caso. Normalmente, no
es estadístico que ignores ese registro, pero en algunos casos no se sugiere que seas popular con el valor promedio. Por lo que hay que estudiar los datos durante su progresivo fiscal el, luego decidir. ¿ Cómo sientes que faltan datos? Y lo haremos por su abajo en nuestro proyecto. Por ahora. Sólo recuerda, no debe
haber nada. No, vamos más. Siguiente cara es dedo del pie, ¿
entiendes de qué tipo? Después de eso, tienes describir tus datos y por aquí lo hará. Entonces usted el análisis estadístico fuera de sus datos como cuántos hay a 44 filas? ¿ Hay el medio fuera de la fecha? Yo estándar ateísmo en todos los demás detalles. Género. Haga usted dentro de 1.3 que con la fecha del motor los detalles se cierran por no muy lejos el uno del otro. Esto es sólo mantener bien que el valor promedio fuera de los 2.99 de BP pero se puede obtener el mismo tipo de análisis. El análisis estadístico para todas las variables profundo es su variable objetivo, Pero también puede obtener estas entidades para cada variable cada entidad, cada variable objetivo en este marco de datos. Y para hacer eso, di tu fama de datos y luego describe y aquí trabajas. Te da el análisis estadístico fuera todo nuevo médico fue muy bueno. Sigamos adelante, amigo
mío. Aquí viene la verdadera diversión. El procesamiento de datos reales un comienzo con una tarjeta de biblioteca sin embargo escalando desde, uh, así que es K un punto estar procesando desde este sentarse bibliotecas. Se importa el fondo ya que se necesita así que lo primero que hay que hacer es convertir todas estas variables
categóricas en números. Y para eso es etiqueta en trimestres. Veamos qué hace. Sí, correcto. Está bien. Etiqueta Gorder la F es igual a ellos orden de trabajo. De acuerdo, tenemos la distancia y ahora menos en la corte. El rasgos Comencemos con el sexo. Aquí se ve hembra masculina. Vamos a convertirlo en un número numérico, que se llama incluyendo así sucesivamente. El común para eso es el trabajo. En cuarto sobre disco Teoh, Dark fit subrayó transformada sobre DF en el mismo. Por lo que la columna de de Sexo se va a transformar usando etiqueta en trimestre. Corremos esto y sentémonos para el hit del punto F. Y aquí tienes. Cambió de macho hembra. Se convirtió en cero y uno encendido. En base a esto, se
puede decir que reemplazó hembra por cero y enviarle uno por correo. Ahora el algoritmo de aprendizaje debe ver puede entender esta columna. De igual forma, contenemos todas las demás variables. Hagámoslo. Un fumador en él es más, ¿no es el día? Entiendo. Si eres bueno en pelear, entenderás esto a eso. En cambio, después de escribir ET individualmente, podría usar un bucle y podría hacerlo fácilmente en una sola línea que viene. Pero no quiero que sí te complices de ello. ¿ Qué mejor se puede hacer con Martin? No te considero como una pelea un experto en este punto. Por eso me estoy centrando más en lo que se puede hacer en el aprendizaje automático con unos
comandos muy simples . A pesar de que es más de una noche libre, honestamente
puedes mejorarla para el en tu vida real usando la peleaen nuestras
herramientas prisioneras como el azul y todo eso. Por supuesto, tuvo que aprender a morder, Pero para convertirse en científico de datos, no
tienes que ser experto después de peletin así que Escucha uno. Ah, aquí. Muy bien. Ahora, ya ves, todas estas variables son reemplazadas por unos valores numéricos. Todavía es marco de datos aún Estado Banda fuera de él y aún mantiene la misma estructura. Apenas que los valores, las variables categóricas Ártico colocó con números. Y ahora tu algoritmo de máquina entenderá Thes thes tipo de pre procesamiento Tienes que
hacer antes de decidirte. Grabado en el Richter anterior cuando estábamos hablando de mapa de calor, hemos visto que el mapa hit consideró sólo pocas columnas, igual que las cintas totales construyen profundo y el tamaño en él no consideraban las variables categóricas . Ahora hemos convertido esas variables categóricas en remolque. Los números numéricos menos crean ahora el mismo mapa de calor, y veamos qué pasa. De acuerdo, entonces alguien en esta vez nos vamos de pie crear nuestra cantidad de sicario se subrayan. Mi plato, este es Cornelius y las métricas eran seguridad porque el dardo DF Cory, escucha y es crear el mapa de calor y los datos, por
supuesto. Siente a nuestros médicos encendidos. No, porque Y aquí tienes. Ahora cuenta con todas las características que es correcto. Tiene de todo. Y en este punto, si miras esto,
ya ves, ya ves, para propinas factura total tiene el número más alto. Por lo que la punta sigue siendo afectada más por la hija. William me parece lógico porque si eres torturado, cantidad
va es alta. Tu cantidad será alta sobre por qué se ve afectada negativamente por el día y la hora en
total factura, la siguiente variabilidad afectada más es el tamaño. Se ve afectado por seis y un fumador también positivamente. Pero el fumador es el que está afectando a la red de Italia Va a dividir sus datos dentro valores
destacados y variable objetivo Aquí. El objetivo variable es el puntillas obtiene un objetivo Variable Nómbralo. Por qué en te vas dedo del pie tienen dips en estos target variable de encaje blanco print y punto hit Y aquí tienes Todos los consejos están ahí en descanso fuera del campo Pondrás como característica como tal x en solo ADF en tu buen dedo del pie. Dejar caer la variable objetivo activa. Es uno que contigo Considera todos aquellos Sólo estás dejando uno fuera del campo y que es profundo y descanso después de marco de datos. Estás asignando como el futuro que acaba de entender eso y esta imprimir tu el punto extra hit Muy bien. Cuando este Impresionante. Ahora tienes a tu ex. ¿ Tienes tu por qué? A continuación te vas dedo del pie dividir tus datos completos en remolque. Datos de entrenamiento sobre entrenamiento de datos probados que voy a ser utilizado por tus datos Modern toe train sí para que pueda decidir el mejor coeficiente se basan en moderno para ti. Y una vez que haya decidido mejor modelo para usar basado en el tren mejor usará
los datos de prueba dedo del pie Sabor ese modelo si te estás confundiendo, son no te preocupes, quedará
claro cuando hagamos el proyecto. Pero por ahora entender? Dije gente de datos evaluando los pasos que vas dedo del pie divide tus datos en datos de entrenamiento y lo prueban. Entonces vamos a hacer eso hasta ahora es dividir rotador en remolque? Citas. Pónganse en probado. Ibas a importar de pie una clase de sí, Killer biblioteca otra vez? Sí. Skillon Dark asesinato La víctima importación Dean, yo sólo respeto a tu vas a decir que 16 picks ¿Por qué tú por qué? Dist solicita Mancha dist! Es bota knicks justo en. O aquí. Vas a decir que Desta tamaño como fuera a menudo tamaño de datos completo. ¿ Cuánto quieres poner a prueba cuánto quieres poner a prueba el entrenamiento del dedo del pie? Depende de usted y está sujeto a los datos. Pero normalmente, como una caída, se ve que la gente sigue 80 20. Ponen 80% de datos para el conjunto de entrenamiento y 20% datos. Padre por los testes. Es Así que encontremos dos muy buenos menos impresos esta primavera. En las cintas se dice que no hay que llevar la completa. No vienes aquí. Entonces es uno grande. Son 2 40 fotos, ¿verdad? Sólo imprimamos la tetera Data Street. De acuerdo, creo que son lo suficientemente buenas Muerte, serio? Él capaz es bastante datos en prueba y datos de Tren, por ejemplo, el extra y ha ganado 95 filas y columnas seguras. Por supuesto, ahí uno tiene Así 123456 Y es 1 95 filas divididas a 44 filas en 1 95
entreno yendo dedo del pie y 49 yendo a prueba. De igual forma, para el ribete blanco, ha puesto 1 95 filas de entrenamiento de dedo y 49 a Así que eso es más o menos lo que haces en el pre
procesamiento de datos ? ¿ Hay más complicaciones como la etiqueta incluida No será suficiente. Tienes remolque use un corazón por cuarto. Porque si usas la etiqueta por trimestre sólo entonces nos da números bondadosos. ¿ Cuál podemos mirar de diferentes maneras, verdad? Si es cero y uno, también se
puede decir que cero tiene mayor preferencia que uno que no es
correcto, ¿verdad? De la misma manera podría haber otros datos. Entonces dedo del pie, supere tal tipo de análisis sesgado son complicados es que el aprendizaje automático son grandes de mi dedo del pie de entrenamiento. Vas a hacer un corazón por cuarto, aunque que ciertas cosas vamos a hacer nuestras durante el proyecto. No quiero hacerlo más complicado en este momento. Estos son el procesamiento básico de datos. Haces por más cosas. Proyecto de aprendizaje automático. Por ahora, este es el pre procesamiento de datos en aprendizaje automático para usted. Ah, antes de que vaya dejaré dentro del nombre aquí con el relámpago. Hice, uh tres. Este es impresionante. Te veo en ecléctica
11. SimpleLinearRegressionExplanation: Hola ahí. Ahora es el momento adecuado para hablar de un tipo diferente de algoritmo de aprendizaje automático en cuando hablamos de algoritmos de aprendizaje automático. El 1er 1 con el que empezar es simple disminución lineal. ¿ Qué es el retroceso? Primero ordenas, entiendes el significado de regresivo. Si miras en diccionario inglés, el significado de regresión. El significado estadístico off regresivo es una medida tras relación entre el valor
medio una variable sobre los valores correspondientes fuera de otras variables. Entonces, apegémonos a esto. Se trata de una relación con el valor medio de una variable, con el valor correspondiente fuera de otro video. Vamos más en electores anteriores, usted ha pasado por la exploración de datos sobre el pre procesamiento de datos. Encendido en que ha visto esta gráfica apagada. ¿ Por qué su ex fue wasa parcela dispersa? En el caso fuera de Tibbs datos sentarse DeVivo pasos alrededor de un dilema total ex waas. El siguiente paso en el algoritmo de aprendizaje automático es toe. Predecir un comportamiento basado en estos puntos en el oficio. Tienes que predecir lo que pasó después. El modo en que se vea este punto parece que va a ser una media luna re lineal. Entonces si trazo una línea podríamos ser capaces de predecir tendencia. Todo esto va a seguir. El punto crítico aquí es entender Veach Line es una línea correcta. En este caso, la línea puede ser o esta línea 'll. ¿ Se puede con esta línea o se puede. Con esta tierra, siempre
es línea recta. Cualquiera de esto parece correcto. ¿ Cómo sabemos que un ritual es óptimo? ¿ Cuál es la mejor línea? ¿ Cuál está demandando la tendencia? La forma más óptima de descubrir que hay algo llamado matemático menos Esquire . Eso significa que tomas una de esas líneas y luego dibujas líneas verticales de tu línea de tendencia para que el verdadero vencedor sea como tu más amplio en. Entonces puedes despejar esta diferencia y tomar un Squire tras diferencia. Por cada uno de estos puntos y toma un total de eso. El total off que es coro tras diferencia. Aerolíneas de video tiene el menor total que tiene menos Esquire. El aproximado no es cualquiera de las líneas, al
menos total es la línea correcta y la luz más óptima. Entonces así es como describo con palabras cuando se trata de aprendizaje automático, que formularlo, y esta es la fórmula detrás de la que hay que encontrar los coeficientes esta fila ocupada, este V cero y Beavan es lo que tenías que encontrar dedo del pie draw la luz óptima sobre esto es la fórmula
matemática para encontrar ese bizarro e incluso en la descripción del selector, encontrarás el enlace. Muy se puede ir y leer los detalles detrás de cómo este piloto matemático de Fórmula Uno. Pero para este rector, sólo vamos a entender que esto es una fórmula matemática. Tienes que alimentarte a tu dedo del pie de aprendizaje muscular. Ser capaz de calcular los coeficientes bizarro y Beaven activado, luego troteado hacia maligno. ¿ Cómo lo hicimos? ¿ Yo estoy parejo? Es sí, x y sesgo xx ¿Cuál es su manera sexual? Sí, X Y es el poderoso Bricusse. Y después de la diferencia entre XX es y por qué exes fuera de tu línea de tendencia ¿Un punto real en? Sí, excepto es Esquire de la diferencia fuera del valor X entre la línea del tren y el punto real . Y ese es tu Beaven. Una vez que consigues el Beaven, el B cero es fácil ocupado. Levanta y menos B uno dentro de ella. Esto lo entenderá en términos más de tres años cuando vamos a la derecha por programa 10 con esta fórmula en. Usaremos eso para morder programa para dibujar la línea del tren para el mismo estado de datos fuera factura
total y monto de acantilados. Te veré en próxima conferencia.
12. SimpleLinearRegressionProgram: Hola ahí. Bienvenido dedo del pie esta conferencia. Ahora que entiendes lo que es la regresión lineal simple sobre fórmulas matemáticas que
lo involucran , Escribamos nuestra primera pelea y programa, que va a estar implementando algoritmo de regresión lineal simple sobre esto. Vamos a la derecha desde cero. Escribiremos el algoritmo completo en nuestra lucha y programa. Como científico de datos, normalmente no tienes que hacerlo porque hay hecho en bibliotecas de nivel. Sólo tienes que llamar a esa biblioteca, y eso haremos. Ve. Pero pasemos por esta conferencia sobre Hagamos esto por nuestra cuenta para que entiendas y
aprecies las complejidades así como entenderás a un luchador de pujas arriba. Entonces empecemos el primer rumbo, claro. Escribe lo que quieras seguir, entonces. Siguiente paso. Ya lo sabes. Sí, tienes razón. Importar la biblioteca's ser un Tempe bajo PT Matt Block y yo d No seas un en Dft en importar gente en su en un deslumbramiento, ¿
verdad? Siguiente ocho instrucciones desactivadas sobre la primera función que vamos a escribir es encontrar los acantilados. Es ese bizarro y Beaven. Y aquí está nuestro primer Fox y encuentra a Griff, pasará X y escribirá. Con esta función, nos detendrá rápido y de acuerdo a puede ser tamaño darn. Este comando nos va a dar el tamaño fuera del conjunto de datos en. A continuación, vas a encontrar el valor medio Víctor. Ampliar camino. Esto tiene comandos GNB normales que ya aprendiste es cuando estábamos hablando de normal y las bibliotecas. Por lo que no tengo el dedo deliberado sobre esto otra vez. Ya sabes que estas cosas impiden que el arte signifique bastante encendido. A continuación vamos dedo del pie, calculamos el sí XX y sí, x Y recuerdo que el B uno es igual. Hacer s x y por como xx y aquí vamos a calcular Sí, x y y sí, XX s ex esposa. Digamos que eso va a ser y Pete son algunos fuera X en y menos y ese es el tamaño aquí en media X en media derecha en. De igual manera s XX se va a ser MP perro pulgar apagado. Si X y X menos yen en quiero decir apagado x dos, quiero decir apagado y ahora es el momento de calcular el coeficiente. Genial. Entonces, ¿cuál es el? B uno es igual a s ex esposa por S. XX en ocupado. ¿ Quién va a ser igual? ¿ Me refiero a por qué? Menos incluso en X media? ¿ Recuerdas la definición de Grayson libre? Vuelve atrás y comprueba qué después de David es suficiente retrocediendo y comprenderás lo que estamos haciendo aquí. ¿ De acuerdo? En su estas funciones nos va a devolver B cero. Andi. Muy bien. Tenemos el coeficiente. Por lo que la próxima función va a estar tramando mucho sus remordimientos en la vida. De acuerdo, vamos a escribir nuestra constante trama del dedo del pie. Muy cristiano como Así vamos a llamar a un BLT. Subrayar regresión en ese marcador por aquí. Vamos a pasar X. ¿Por qué? Y b b el área que ayudará al visitante y ser capaz de fiesta alineada La línea regresiva que necesitas desprendió X valor desprendido. ¿ Por qué? Valores y los coeficientes B cero y ser parejo. Estos son todos arrestos. Estos no son valores individuales. Culpable es ganado. Entonces te vas a sangrar. El se está bloqueando. Primer curso X. ¿Por qué color? Vamos a la m. Está bien en entonces marcadores. Veamos si nuestro favorito de la familia en entonces tamaño del Marcus dejó su técnica bien y luego predigo, verdad? Esto se pronostica valor off. ¿ Por qué? Porque en tu línea de tren, los valores
Divi son valores pronosticados, ¿
verdad? Entonces por qué predijo quoth b cero b coeficiente más Beavan en su queremos y luego X Y ahora es el momento de trazar E Grayson, tienes X. Tienes y poética y se predijeron valores. Y te volviste bizarro y ser cuando eres rápido ya que ahora podrías bloquear el tiro año teeter plot X y trenza y es un color Su en base han sido entregados lanza vecinos Tito eran tarjeta muerta sobre barba son por eso lo tienes bien. Y luego así el producto para así solo tienes que ver construido hacia fuera. Tan muy bueno Video a funciones Quieres calcular coeficiente sobre otros Para dibujar los lamentos
en la vida Ya terminamos ahora solo tenemos que escribir la función principal y llamar a este peaje. Es muy fácil. Ahora vamos a escribir el oh, hizo ese subtítulo esforzándose por hacer hash aquí. Está bien. Y ven a Margo muy bien en es momento de llamar a la función principal Muy bien. Eso es correcto. La función principal. Ya no puedo aguantar mi emoción. De acuerdo, Mean on vamos a usar los mismos consejos. Conjunto de datos. Sé que estás muy emocionado por ello. Entonces sigamos. Terminémoslo, Señor, Ha dicho salsas sobre la India. PD frecuente. No, hice crema profunda. Eso son bastantes salsas. Tus consejos y llevemos la cabeza Así sabremos que lo hicimos bien. Está bien. A continuación están nuestros fuera las razones recoge la F Entonces ¿qué es X? Porque se trata de una simple regresión lineal. Podemos tener sólo una variable independiente o aquí vamos a decir hija Bill sobre por qué va a ser DF. Y a continuación vamos a llamar a nuestra esposa estimada, cuál es ésta? Vete aquí. Encuentra rápido para ser iguales. Encuentra tumba en Jim Path X y justo en. Después bloqueó el lugar en fila. Y estamos aquí. Vamos a llamar a nuestra cerveza D función rigurosa y de línea. Copiar basado Andi X Y. Y nos dieron nuestro ser ahora que normal Si el me cerró bien, terminamos. Vamos a ejecutarlo ahora. Y aquí vamos. Digresión de horas. Y nueve. Entonces eso es lo que se necesita. Remolque crear algoritmo en la lucha del dedo del pie. Ten tus simples lamentos de liga en la vida. Sé lo que estás pensando. Debes estar pensando. Pero dije que no tienes. Luchamos un dedo del pie experto, convertimos en científicos de datos. ¿ Massie está aprendiendo? Profesional? En realidad, tenía razón. No tienes que escribir este algoritmo desde cero. Estos ya te están esperando. Hay bibliotecas de lucha que ya se conservan las cuales ya tienen esta
construcción de algoritmos . Sólo tienes que llamar a esa biblioteca. Te llevaré a través de una biblioteca de este tipo. En realidad, ya
viste esa biblioteca cuando estábamos hablando de ahorrar en. Existen diversas bibliotecas de este tipo. Pero echemos un vistazo a este. Esta es mi favorita. trata de Farsi creyó rebautizo lineal en él es proporcionado por Sieben. Por lo que dicen en año. Kristen, Ya ves C peón esta noche, bebé encima o aquí Sólo tienes que montar uno. Vamos, necesitas escribir solo un simple Vamos. Tomemos el mismo día lo hace aquí. De acuerdo, Esta vez hay un DF bastante en el sencillo comando Hacer todas estas cosas es la disonancia. Empezar una extremidad, el bloque ex record, cerveza total
del dedo del pie. ¿ Y por qué ir a fondo en la cita? Podría puntear el teléfono. Apenas este 19 Vamos y te pondrás lo mismo duro. Aquí tienes. Exacta misma línea de regresión lineal. La línea simple, pero sólo un comando y esa es la belleza fuera edificio, pelea y biblioteca durante este curso muy fueron posibles. Vamos a usar edificio ya o nivelen librerías para ti. Andi, eso es todo. Ese es el final de esta conferencia. Siguiente. Después, vamos a usar algo. Se puede relacionar con el mundo real mejor que estos tips base de datos en. ¿ Vas a usar simple lineal rebautizado en ese ejemplo del mundo real? Los datos del mundo real se sientan. Y después de eso, vamos a pasar a diferentes algoritmos y jugar con diferentes luchas y las bibliotecas son así que te veo en la próxima conferencia.
13. Demostración de Regression lineal simple: Hola. Ahí vendrá a esta conferencia en este Lecter. Nos vamos a poner en práctica la regresión lineal simple. Pero esta vez vamos a usar la biblioteca provista de fightin. No vamos a escribir nuestro propio algoritmo. Usaremos mordida y biblioteca provista, y mediremos la puntuación. El rendimiento anota para ese modelo para asegurarse de que esté funcionando. Empecemos. El primer cinta, como saben, está definiendo lo que vamos a hacer. Entonces vamos justo aquí. El rubro. Simple en ti, Chris. ¿ Y lo hiciste? Andi Y sí, sé lo que iba a hacer. Eso en el siguiente. Menos importación bibliotecas importan. No, B hey puede ser importación. Fonda's tiene piedad en la importación. Si bon como en la Tierra y pidió, pero no menos importante muy importante. Importar parcela loca aquí. Ivy No sea manera. Pureza de la sangre grande. Ahora nos adaptamos, consigue nuestro conjunto de datos. Datos de alimentos Mercado estatal Bloquear la fuente con día. ¿ Lo hace? Encontrarás en la descripción de esta conferencia. Basta con descargar esos datos. Siéntate en algún lugar de tu computadora y luego condonas este comando para que el marco
de datos pandas lea esa pelea, va a ser archivo de texto e d punto A pesar de que es un archivo de texto, todavía
dirás el guión bajo de Billy Darcy CS tres ellos son y ponen la parte donde has contado el archivo El nombre del archivo es Bill DJ stories, no txt. Entregan comedores. Deberías poner como mi estrés central. Sí, y además y ciérralo. Eso es todo. En desesperada Deif cabeza para asegurarse de que está ahí en el tohave a menos que rentar muy bien. Por lo que mueren ahí es básicamente los datos fuera de alturas de construcción o historias sensibles estos otros años en DA Esto es sólo una recoge datos suficientes Y este es el conjunto de datos que han creado desde hace varios años. Ya ves cómo Maney optó por razones que ahí d después de ovejas 60. Por lo que hay 60 observaciones que tienen Ah, correcto. De 9 19 noventa a varios años más, realidad
han criminalizado la altura de los edificios eran historias sexys. ¿ Cuál es lo primero que tú Jake en la exploración de datos? Tomar seguro también es parte después de regla fiscal no es así. Ya empezamos. Detectar pisos sí, uh, explotó. De acuerdo, entonces ahora estamos en dictar explícitamente Paso. Ya revisé la caja fuerte y sé que hay 60 observaciones. A continuación vamos a comprobar si hay algún valor nulo. Y vamos por eso es DF no es tan impresionante. Hay valores normales. El Hyatt, ¿Alguna historia? Los datos que vamos a jugar ya son datos numéricos. Por lo que no tenemos dedo del pie codificarlo. Eso es un ist. Si no tenemos que hacer a continuación, vamos a ver qué tipo de verduras y tiene. Debería tener distribuciones normales y para nosotros usar Lini recrea un algoritmo y comando para eso es que ya conoces. Sí, basta que sea Eban dist traído en él. T h t y luego ser médico. Muy bien. Aquí tienes. Se ve muy distribuciones normales. Aquí hay algunas anomalías, pero podemos ignorarlo por ahora. Entonces, ¿qué es? Looks, distribución
normal. Buenas noticias. Ahora que sabemos que es un Wilson normalizado, vamos a revisar el tipo de relación entre altura, Alguna historia? aping más fresco que es dibujar. Scatter productos eran buenos. Digamos punto o así. Y aquí vamos a la relación dispersa. Parece que una disminución lineal normal, simple en la altura aumenta junto con sus historias para que podamos jugar alrededor y usar regresión lineal simple. De acuerdo, creo que tenemos suficiente información sobre los datos. Ahora podemos pasar a la siguiente cara. Eso es el preprocesamiento de datos. Ellos tuprocesamiento. A lo mejor nos marcan hacia abajo. Pero después del pre procesamiento fueron primero yendo dedo del pie rezar los datos de datos en huevo Y por qué
vamos a predecir el número de pisos que nutren historias que el edificio puede tener en
base a su altura. Por lo que la variable X se va a ocultar. Y entonces ¿por qué va a ser número de pisos? Te hasta ahora, tan bueno Atrapaste la X e Y antes de que sigamos adelante y antes de que dividamos esta X y esposa están ahí adentro para entrenar y fecha ya que tenemos que convertirlos en NPR A. En este punto, están en Banda State. Un marco para que puedas usar s Kaylan algoritmo de regresión lineal simple. Necesitas convertirlos toe np ery on. Es muy fácil tan solo cierre de dedo este año y luego decir valores. Yo hago bastante lo mismo para el otro lo crucero y digo valores. Por ahora, tan bueno. A continuación, vamos a explotar el conjunto de datos en los datos de tren y prueba Tal como está, el dolor y el gusto lo disuade de su selección de modelos de Kalen Dart. Importación grano desaliñado y ahora recoge 10 x ¿Por qué el dolor? Por qué sólo va a ser Dean. Sabor Desesperado X y por qué platillo para salvar Va a ser 0.2 en un estado aleatorio va a ser cero en este pick impreso Cadena X. Just Why Team? ¿ Por qué sólo en este viaje? Muy bien. Entonces tenemos los datos aquí. Está bien. Entonces en lugar de rentar todo, podríamos haber sido acaba de decidirse alfabetización mediática estatal. No, si 48 fueron 48. Bueno, impresionante. Por el momento, tan bueno al lado que se va a hacer modelo seleccionando datos pre procesamiento es turno. Es hora de seleccionar lo moderno, y aquí es donde la parte crítica A off seleccionar el alcohol actual Italia estrellas en base lo que hemos visto hasta ahora es una distribución sencilla. Y hay una relación lineal de rebautizo entre la piel. Cualquier historia. Si uno aumenta el valor de otro también aumenta, por lo que Es una genética simple, realidad, ya que así vamos a utilizar un modelo de regresión lineal simple. Y el modelo de regresión lineal simple se va dedo del pie vienen de SK. Aprende de Eskil, Entonces oscuros, años
magros Mordor se movió y en el aire, Grecia, aquí dentro. Todavía están aquí. Click it se cierra aún el motivo. De acuerdo, Entonces ahora lo siguiente es drenar lo moderno en mortero. ¿ Por qué necesitamos tratar en el mortero? ¿ Alguna idea? Piénsalo. Es algo religión dedo del pie calculando el coeficiente y blanco engañoso.
14. Paso de la demostración de la vuelta lineal: ¿ Por qué necesitamos proporcionar datos de capacitación? Establecer dedo del pie este modelo? Piénsalo. Sí, lo tienes. El algoritmo está ahí pero cada simple, cualquier arrepentimiento y tiene sus propios coeficientes los suyos. ¿ Por qué interceptar y su propio Beaven? El ocupado Ruby cuando estábamos hablando justo en ese ocupado árabe incluso se puede calcular sólo en base a los datos. Es por eso que proporcionas datos de entrenamiento, dijo dedo del pie ese modelo para que pueda calcular los pecados graves para tus datos. Vamos a llevar a esos Griff's y vamos a hacer que pegado vaya pez ya que aplicar intercepto en lo común para eso es lineal punto intercept en entonces el siguiente es Imprimir Griff's y
veamos grave oficiante incluso en se puede conseguir el consejo ingley cerca de enfermo, no dejar de fumar si grave bajo la escuela. Veamos aquí tenemos los valores ladrón que intercepto en este caso es menos 2.5 en la carpa
acantilados es 0.7 así que tu modelo está listo. Tu la biblioteca beytin la ha tensado con tus datos y ha devuelto el coeficiente sobre interesados. Eso significa que tiene esta disminución en aquí y es igual a menos 2.55 65 más cero. Lo estás asumiendo por muerte extra, Equis. Y ha derivado para sus datos. A continuación nos vamos a poner a prueba estos coeficientes, este modelos lineales, mareado quiz y al proporcionar el probado es que por eso nos dividimos El conjunto de datos del tren fue entrenar el modelo
para que pueda calcular los coeficientes y probado como es para probarlo . Ya sea ese coeficiente que mi intercepción que calculó, te
está dando los valores correctos que quedan. Con eso, vamos a pronosticar valores y. Por qué pan solicitar el en año zik dot Predecir en X dissed. Llegamos a ver pregunta Ahora estamos aportando datos X aquí y se va del dedo Danos la Y en eso. ¿ Por qué? Nosotros nos llamaremos. Por qué predecir Licitra Y entonces podremos comparar esta habilidad. El dardo nos está dispersando. Se dispersan en Siguiente vamos del dedo del pie trazar la línea regresiva con X justo y por qué jugó bien y así esto Vamos a correr desde aquí ¡Vamos! Dicen que el color es igual al rojo Ahora tenemos este Blanco valores pronosticados Esta línea roja se basa en por qué los valores pronosticados y se ve muy bien, ¿ verdad? Se va entre los dardos dispersos. Parece que es capaz de predecir el comportamiento. Si no está muy claro con una gráfica, vamos de pie, compare los valores. Comparemos el por qué los valores pronosticados con los valores de prueba blancos. Y entonces lo sabremos. OK, así que digamos que el F uno va a ser BD dardo hizo, uh, tema. Vamos a tener valores reales, razón por la
cual probar y que nos vamos a comparar con el valor predictivo
pronosticado va a ser. Por qué Subrayar predijo aquí pret on. Ahora vamos a traer a este querido teléfono y vamos a comparar 70 a 69 fuera que grandes eran Teddy quería a 2130 54 55. Está bastante cerca. Los valores predictivos son bastante cercanos con los valores reales. Ya sabes lo que hace esto aparte gráfico que nos hará que eso le daría una mayor claridad, así que d tengo que igualar a la F cabeza de un punto tener 15 puertas en esta parcela. Es que no tienen que trama tipo es bar on. Entonces son las cifras. Cinco es 16 10 en siguiente sólo poner la medida y menor conseguir líneas a la misma cosa para las líneas
menores. Para líneas menores. Sí, una mina. Aquí, Andi en él. Una especie aquí. Ahora puedes comparar. Está muy limpio ahora mismo. Se puede ver el real a continuación. Los azules son valores reales. Y nuestro cualquiera no un predecible. Sí, bastante bueno, también. Parece que nuestra modelo está funcionando. Es capaz de predecir las historias fuera del edificio en función de su altura, pero esto es sólo los 15 puntos de datos que se estaban comparando. ¿ Cómo podemos estar seguros de que todo el moderno para el registro 60 observaciones es muy efectivo y se va a pronosticar adecuadamente para datos futuros. Entonces, ¿cómo podemos tranquilizarte que el modelo de datos que hemos creado los coeficientes y el por qué interceptar se convirtió de ella y los secretos y vinimos de ella en realidad está funcionando bien para
toda la data set off 60 observación. Entonces para hacer eso, hay algo llamado métricas. Siempre puedes calcular el rendimiento de tu modelo para Matic. Te vas a importar el dedo, admitió
la métrica. Entonces de si matar, vas a importar médicos de su matando a los artistas modernos. Estábamos yo estaba hablando de su auto son a su núcleo. También se llama modelo Score Lo vamos a usar son a la escuela desde sus médicos asesinos. Se trata de matar guardia importación son dos anotación subrayada. Vamos a hacer que sus pocas ts signifiquen significados posteriores absolutos. Más tranquilo encendido. Están para escoltar. Imprimamos er para anotar primero. El sprint se acabó con la escuela, y lo común para eso es nuestro para subrayar puntaje en entonces, o aquí pones el blanco solo un valor. Y entonces por qué predijo? Bueno, muy bien. Menos impreso. El puntaje de la arteria es del 84%. No está mal. No es accidente. Siempre se podría mejorar esto pero 84% del puntaje decente. Y también depende del tipo de datos. Si hablas con un científico de datos, hay una opinión dividida al respecto. Algunos fuera de los datos. Los científicos creen que cuando se trata de regresión lineal, modelo no es sólo arte con corte, que en realidad fuente el rendimiento fuera de tu modelo. También hay que mirar los significados más tranquilos y raíz significan Es toda una lista. Calcula eso en lo muy para calcular que es, solo
vas a llamar a esta métrica inicio significa descanso absoluto y orgullo de l ensamblado. ¿ Por qué dissed en camino? O sea, absoluto después es 4.1. De acuerdo, continuación vamos dedo del pie print t quiero decir, está tranquilo. Other on Una vez más se va a hacer seis puntos significa que lo ha adquirido If Why dist en el camino un poco. decir, Esdecir,es la calidad es 31 siguiente, cuando es grosero significar es tranquilo. El intranquilidad en PDR se anuló significando líder de escuadra. Por lo que estas son la métrica por la que se puede ahorrar interior. El rendimiento moderno es bueno o no. Estos son todos en términos estadísticos y voy a poner electoral poner una planeación detallada de producto cada uno después de oh antes de más No olvidemos guardar el cuaderno con los
nombres propios . Por cierto, confinaste cada uno de estos cuadernos Lo que sea que estoy escribiendo aquí, todos estos cuadernos de Júpiter están ahí en mi get hope. También pondré el link toe the get up on the description off algunas de las conferencias. Muy bien. Te veo en próxima conferencia
15. Introducción de la Regression lineal tradicional: Hola ahí. Bienvenido a regresión lineal múltiple. Enhorabuena por terminar. Simple. Liderándolo retrocede y moderno en modelo de regresión lineal simple. Entendiste que el es datos dispersos. El variable independiente sobre variable dependiente puede estar relacionado por una ecuación Muy dependiente . Variable es igual dedo del pie. ¿ Por qué interceptar más coeficiente en variable independiente? Es una fórmula muy simple para encajar en los datos sobre si tu proyecto nuestro estudio de caso en el que estás trabajando solo tiene una variable independiente sobre ti estás prediciendo nuestra variable dependiente basada solo en esa única variable independiente en la pregunta parece lineal. Entonces estás de suerte. Puedes hacer rebautizo lineal simple y conseguir tu asistente NL. Baja tus predicciones, pero normalmente podrías terminar en proyectos como este. Estoy tomando ejemplo de precio de casa aquí, así que el precio de la casa depende de diversas características. Uno de los futuros podría ser el ingreso familiar. ¿ Cuál es el ingreso familiar de las personas que salen en esa localidad? A medida que aumenta el ingreso familiar, la asequibilidad aumenta por lo que el precio de la vivienda podría ser alto en esa localidad. El ingreso familiar promedio es alto, por lo que los precios podrían estar escondidos. Esa es la sabiduría de las Maravillas. Segunda característica. Podría depender de sus amenidades. Si hay muy buenas amenidades de mano de obra, entonces sí, los precios de las casas podrían subir. De igual manera. Crimen it si tasa delictiva es alta en esa localidad que los precios de la casa baja ahora, Considerado esto ahora tienes una variable dependiente de tres independientes, muy capacidadpara jugar alrededor eso se llama rebautizo lineal múltiple. ¿ Cómo vas a predecir el por qué Ahora Tienes que tener una fórmula en la que puedas caber toda esta variable
independiente a través de su fórmula. Vendrás de ella una línea recta que en realidad toma en cuenta toda esta
variable independiente y la fórmula podría verse algo así. Por qué la variable dependiente es igual a ser cero el y interceptar en entonces el que es coeficiente para la variable una característica uno en la característica Manuel Coeficiente entidad lejana a y entidad a valor coeficiente para la característica tres y destacado tres valor. Entonces esa es una media luna de linealidad múltiple. Es la magnitud bastante simple regresión lineal. Pero la regresión lineal simple tenía sólo un juego de dedo variable alrededor de una variable independiente . En caso de regresión lineal múltiple, tendrás más de una variable independiente para jugar, pero sigue siendo un modelo lineal. Sigue siendo números continuos y sigue siendo un lineal, retroceso y moderno en el mundo real. Podrías conseguir algo como esto. Podría obtener una trama de dispersión fuera. Por
qué, asnos x Hay puntos es puntos dispersos en función de diferentes valores de entidad. Por lo que obtendrás un dato con un montón de características en. En base a esa característica, hay
que predecir variable dependiente, y luego hay que venir de ella. Es fórmula a través de tus datos de entrenamiento, Calcularás este bizarro B uno b dos b tres, los coeficientes fuera de estas características y luego te derivarás esta fórmula. Una vez que hayas derivado la fórmula basada en los datos de entrenamiento, entonces estás bien para ir así por encima de nuestro flujo. Lo mismo. Pero la única diferencia es oriental de una variable independiente una característica. Bueno, ¿tienes función múltiple? Bueno, si el dedo del pie juega alrededor por lo que obtendrá coeficiente múltiple. Espero que tengas clara distinción entre regresión lineal simple y múltiple sobre cómo funciona la regresión lineal
múltiple. Sigamos adelante y hagamos un poco de Hanson y luego conseguirás que el exportador de trato tome el pie esta regresión lineal
múltiple. Te veo en próxima conferencia
16. Demo de clase de de mayoría: Hola ahí. Bienvenido dedo del pie Esta conferencia sobre coalescencia concreta estás haciendo un muy buen progreso. Estoy muy contenta por ti. Ahora que entiendes la regresión lineal simple, te
será fácil correlacionar cosas y entender múltiples solicitudes lineales después nuestra es solo unas pocas variables más independientes. ¿ Verdad? Son tan buenos. Entonces, empecemos. Ya lo sabes? Sí. Biblioteca de importación. Entonces hagámoslo. Muy primero importar numpty como MP I pude precisar erráticamente ritmo lo. Pero sí como contigo para que sigas esto y escribas a la misma velocidad que estoy escribiendo. Yo quiero que sigas todos y cada uno de los pasos, y quiero estar contigo. Por eso no estoy copiando y pegando cosas aquí. Lo estoy escribiendo junto con ustedes. De acuerdo, amigo, hagámoslo. Nos pones vínculo como belleza importación Beeban como sentencia en importación Mate blood l I B dardo B A sangre como belleza. Vamos a ejecutarlo para asegurarnos de que no me dieron ningún tipo de Ok. Se ve bien. A continuación te vas de dedo importar el conjunto de datos en anterior Director, ya
entiendes Dónde se sientan los datos y cómo obtenerlos. Una vez que tengas ese conjunto de datos se dice en tu computadora, puedes leerlo en estado panda. A frame ¿Música? Sí. Leer. Subrayar. CSP se fue con eso, El ético a PD oscuro beat subrayó CS que conocemos aquí, ponte nuestro. Poner la estructura completa del directorio, incluyendo el nombre del archivo o aquí definiendo es arto impedido? Nuestros datos en este archivo no tienen ocultos. Entonces vas a escribir un odiador de comandos igual a ninguno. El medidor diario va a ser hacia atrás. Cortar s y más escribir cartas. Ejecuta esto. Yo quiero mostrarte algo. Escucha, Andy, si no golpea, ¿qué obtienes? Obtienes los datos. Pero la cabecera. Mira esto. Dice 012345 Si quieres mantener el nombre del dedo del pie este haters, puedes darlo aquí mismo. Jessalyn nombra Comando el. Ponga sus nombres aquí. Los nombres van a ser el 1er 1 es mi espolón. Cilindros galones. El siguiente es el desplazamiento. Esta colocación en el entonces hospital nosotros. Nuestro siguiente es el peso. Cada lo hice realmente escuchar Entonces más el año Martin aquí en la auditoría, pero en entonces nombre de la tarjeta. Creo que ya terminamos. Está listo para otra vez. Ya estamos bien. Tenemos todos los nombres, ¿verdad? Impresionante. Entonces esto es algo nuevo que aprendiste en comparación con el anterior director que en lo meditó después de él. Puedes poner al bateador como ninguno si no tienes rumbo en tu conjunto de datos. Y entonces podrías enorgullecerse de los nombres de esos encabezados usando los nombres. Vamos. Bien. Este, WAAS Data Import. Qué En el estado empezamos ahora. Exploración de datos. Ya lo tienes. Datos extra show. No lo primero que vamos a hacer es averiguar la forma de los datos sobre eso, ¿verdad? Hay 3 98 registros en nueve columnas, 88 características y un objetivo. Tan totalmente si nos fijamos en este caballo de fuerza. Ah, lo siento. Me equivoqué un espíritu. Deja recurrente este sabio Habrá confuso. Tan bueno. Ahora lo tenemos. Abramos los datos. Y cuando abras los datos y miras esos datos,
verás que algunos fuera de los valores de caballos de fuerza tienen signos de interrogación. El primero es deshacerse de estos valores más tarde que hay diferentes estrategias. Dedo del pie, deshazte de este tipo después de que sea o dedo del pie borrado son para reemplazar esos signos de interrogación el valor medio nuestra media. Bueno, hay diferentes formas de hacerlo. Pero para esta conferencia sobre solo por comprensión, voy a quitar y vamos a jugar con el conjunto de datos restante. Quitémoslo. Vamos a ejecutar este comando. Nuestro marco de datos DF equivale a dos caída de puntos DF porque vamos a dejar caer algunas observaciones. Por supuesto. Entonces DF ¿tienes el dardo de pregunta de potencia del caballo en lo más cercano a escuchar Liberace hizo bien en menos bonita de de de cabeza oscura. No le gustó algunos El uso de datos de objeto no tiene atributo. Duro, Bob. Pero aún así lo tengo en Haas. Pero está bien, vamos a correr de nuevo. Vehículo. Por lo que nos deshicimos de las cuencas después, que tiene signo de interrogación en el poder pasado. Volvamos a ver la caja fuerte. De of God ahora es 3 92 Eso significa que había seis filas fuera de datos leer trabajo de pregunta en valor de
caballos de fuerza, y acabamos de deshacernos de ellos. Está bien, deja más. Si nos fijamos en este dato, los caballos de fuerza, es muy comprensible. valor de caballos de fuerza será un numérico, pero debido a que algunos fuera de los valores eran signo de interrogación dependen un estado un marco con Cuando tomó los datos del conjunto de datos aquí, podría no haber considerado la potencia del caballo como un dedo del pie numérico. Entérate eso. Vamos a ejecutar este comando DART DF aplicar mapa. ¿ Quién aquí? Vas a decir y p dot está bien. Andan lo. Mira esto. Dice MPT son ciertos que señora son Todos los valores son numéricos Israel números cilindro . Sí. Desplazamiento numérico Poder de Patasse Americal. Mira su caída. Ese fue el cuadro de fecha arriba no ha considerado a los caballos de fuerza como un numérico. Entonces, ¿qué hacemos? Necesitamos convertir dame toe numérico esto a ese d f barra hash con pd dot para subrayar Medic DF una vez más Potencia dura la función médica de atún en Banda Aceh Clase de marco de datos
Convertimos los caballos de fuerza en una columna numérica. De acuerdo, vamos a correr. Vamos s alrededor del mismo comando otra vez. Se está ejecutando. Por lo que esto se convirtió en un verdadero remanente numérico solo lleno, que no es una novela, Lewis Carnie. Aparte de eso, todos los demás campos son numéricos. ¿ Quién es ahora? Averigamos si alguno de ellos no tiene bien, correcto. Todo esto es parte después de impuestos fluorescente. Ya sabes que este D de dardo no es en algún césped controlador o aquí ninguno de ellos no tiene valor. Están Shem ur de buena suerte. terminamos con la Basie comprobada en datos en su exploración de empate. Pero aquí viene la parte divertida. Cuando tienes tantas variables toe play por todo fuera, esas variables podrían no ser requeridas en tu modelo de datos, tienes que entender dos cosas muy importantes en caso de que tengas tantas muy de primero, las
llamamos independientes variable, y esperamos que sean Notley relacionados entre sí. Entonces lo primero, vamos a averiguar si alguna de estas variables está relacionada entre sí. Eso significa que si un crecimiento otro también crece en valor, enviaste relaciones tipo off existen entre la variable independiente. Entonces no necesitamos esas variables. No necesitamos pobres duros. Esas variables en nuestros datos más modernos. Necesitamos sólo uno de ellos. Entonces eso es lo que se llama multi genialidad. Y eso es lo que vamos a averiguar si alguno de nuestra variable independiente tiene
genialidadMutti cool genialidad
17. Lde de clase de: De acuerdo, entonces existe un asunto muy sencillo de encontrar a Metical en la caridad, existen varios modelos. Diversos asuntos están encontrando multi Colin ality. Vamos a revisar a apagarlos uno que considero como un modelo sencillo sobre que se llama
averiguar el Cory escucha entre estas variable independiente. Entonces si solo un d de núcleo oscuro y entonces esto te da una métrica aquí en adelante, puedes ver muy bien ¿cómo se relacionan estas variables entre sí? Entonces si nos fijamos en cilindros, está muy alineado y dependiente del desplazamiento, tía Horsepower on vit. Por lo que estas tres variables, están muy relacionadas entre sí. Cilindros, desplazamiento, caballos de fuerza sobre vit. Entonces aquí mismo tenemos una linealidad multi core. Hay un asunto más en eso se llama calcular variantes infladas y factorizar menos a esa. Por lo que ahora, en el altamente bien, sabemos que los cilindros desplazan un hospital y esperan. Están muy relacionados entre sí. Y conseguimos una alidad multi corden en nuestros datos. Por lo que ahora vamos del dedo del pie a trabajar en variantes factor de inflación también tarjeta V i. F. Resplandor en su lugar y efectivo el I f. carrerismo de
niña. Entonces, ¿qué necesitamos para calcular variantes? Inflado y factor ante todo, necesitamos importar las funciones requeridas de la biblioteca requerida que queda con eso. Entonces en este comando, a partir de estadísticas modelo punto comienza alejado influencia variantes de importación, factor de
inflación. Estos son los funks, y vamos a usar varios inflados y factores. Entonces una vez que importas
la función, lo siguiente a considerar es que vamos a calcular variantes en carne y factor entre variables
independientes. Entonces lo primero es que no necesitamos variable dependiente como mpg. Y segundo, para calcular, variante, desinteresado y factor. Primero tenemos que convertir todas las variables en Tippett Dent en números numéricos. No puede quedar son divertidos, Merrick. Entonces hagámoslo primero D f uno igual a d f punto Obtener nuevos datos médicos. Ok en entonces nuestra X va Toby dier teléfono dot drop Entonces, ¿qué? ¿ Cuáles son los atributos? ¿ Vamos a caer? Ya discutimos sobre MPG. Vamos a soltar MPD porque es una variable dependiente en Edison Toe que estoy sugiriendo que bajemos el origen aquí porque no creo que vaya a aportar mucho al modelo. ¿ Cómo va a contribuir el auto origen Neymar con el dedo del pie al modelo fuera de MPT cuando tenemos
tantas otras variables para jugar como Desplazamiento Hospital? Si realmente escuchaba en Marty Así que vamos a deshacernos de eso ahora mismo entonces vamos a decir acceso curso no es Es sólo un comando muy simple para deshacerse de cualquiera de los atributos en tus datos de, hasta ahora, tan bueno. Pero vamos a ejecutarlo para asegurarnos de que importamos la función correcta en Tenemos esto bien. Hagamos eso. Lo tenemos bien Ahora viene la fiesta divertida de variantes infla VfR infectado por lo que
vamos a hacer es crear un instante off data frame Class pd dot data team Por aquí Tandon v i e. F. Sé un efecto. Busier bromas. Vamos a llamar a eso variantes de función en su lugar y afectadas en el pasado devalúa los valores X . Tenemos que pasar cada X valor uno a la vez, y por eso vamos a ejecutar un tipo de habitación lejana aquí para I en él en X dardos. Ip uno. Lo tengo Bueno. Características de Nate BF es igual a ex columnas acopladas en esta tarjeta VF ronda, pero está bien, vamos a ejecutar esto. ¿ De acuerdo? Tengo algo mal. Qué Es VF características fueron X. Oh, otra vez, Typo! No es que lo hagamos. De acuerdo, ahora vamos a ver esto. El Tumblr Elise. Cualquier valor con VF mayor a 10 debes deshacerte de ellos. Comience con el que tiene el valor más alto por aquí camino. Tiene más alto. Bueno, entonces voy a quitar el peso primero. De acuerdo, vamos a correr de nuevo y digamos cuál se ha ido. A continuación, tenemos más modelo todavía que sí estudio sobre cilindros. Los cilindros tienen mayor valor. Por lo que a continuación vamos a retirar cilindros. Muy bien. Nos estamos acercando. Nos quedamos contigo, en realidad. Arison on Marder. El marder tiene mayor valor. Entonces vamos a buscar una aguja. Marty Modelo aquí. ¿ Qué tenemos ahora? Desplazamiento y caballos de fuerza. Vamos a deshacernos del hospital. Nos estamos acercando, ¿
ves? En realidad descansa y ya es menor de 10. Entonces eso es bueno ir. De acuerdo, vamos a sacar el hospital. Así dijo que hicimos tantas cosas por el poder de los corazones. Gortari se deshizo de esas preguntas Waas la convirtió al valor numérico. Pero oye, ahora no necesitamos eso gracioso ¿verdad? Está bien. Está bien. Hagamos ese culo. Um, así que finalmente, tenemos dos desplazamientos variables independientes en, en realidad recientes, y esos van a ser parte de nuestro modelo de datos. Mira esto. A esto se le llama exploración de datos. Cuando entiendes tus datos, tu vida se vuelve muy fácil. Empezamos con ocho variables independientes, pero ahora, a la hora de crear nuestro modelo, sabemos que no necesitamos seis de ellas. Sólo vamos a necesitar bajar esas variables independientes del dedo del crítico MPG. Buen trabajo antes de concluir su razón de la OLP fiscal y pasar a la carta de pre procesamiento de datos a una cosa más. Dibujemos. Scatter grafica fuera de este dos desplazamiento variable independiente y real surgido en. A ver, habría dedo del pie izquierdo más pesado que conozco aquí. Vamos a utilizar la función save on llamada bear plot. Pierre Brock, esta es la primera vez que lo usas hasta que te va a encantar. Oso amplio TF uno on X. Esto van, Toby, Esta colocación Andi actividades en sobre por qué vamos a ser nuestro mpg. Pequeño tamaño es el punto C uno y guardar la belleza. Roshal, ¿lo levantaste? Aumentemos el tamaño. Se ve muy pequeño. De acuerdo, ahora lo tenemos bien. Sí, se ven como una media luna re lineal. Bueno, sí. Parecen un buen ajuste para rebautizo lineal múltiple así. Mira, comportamiento
Selenia. Esto también se ve amable, muy cercano a la conducta. Aquí puedo trazar una línea, y bonita, pero parece que una enorme es tierna. Davidson está encendido para aquí. Árbol polinomio bautizado podría ser un mejor ajuste, pero, hey, tuvimos un electo off regresión lineal múltiple en creo que regresión lineal múltiple y encaja bien para ambos fuera de ellos. Nuestra característica selecciona cualquier paso no ha terminado hasta el momento. Lo que hicimos fue que la corte leyera genialidad multi core. Eso significa que pillamos leímos las variables independientes que estaban muy relacionadas entre sí. Todavía tenemos que ponerle puesta. Todavía tenemos que decidir cuál de esas variables tiene el mayor impacto en tu
producto confiable . Podrías empezar con, por ejemplo, 15 20 en recompensas, y te quedas con esta recompensas difundidas son tal vez 56 en reporte después de ser
despedido médico en caridad. Ahora tienes que ejecutar los que quedan en triples en una ronda más selecciones y proceso
y hay varios proceso de selección son nivel en modelos de regresión lineal múltiple lo que te ayudará a averiguar si alcanzar entre los independientes restantes las variables deben ser consideradas para sus datos finales. Mortero uno off Esos criterios se llama atrasado. Alamin no está encendido. Ese es uno que vamos a usar para este mortero. Ahí hay varios. Hay elecciones mucho peores. Hay eliminaciones atrasadas y son son áticos bide. Nel l un minuto desde que voy a explicarles a cada uno de ellos.
18. Lación de demos de la de de la R: bien usar elemento atrasado, ¿no? En primer lugar tener toe importar los fondos requeridos de las bibliotecas requeridas en Vamos a
importar el dedo . ¿ Hay mártires puntan a p a Así que en este punto, si nos fijamos en esto, cogimos una fórmula, razón por la
que se acerca igual a B cero plus. Esta b cero prensa Beaven excelente plus B dos extra cuando ¿Por qué es en realidad nuestro mpg igual ocupado poco va a ser una constante en entonces ser incluso coeficientes en este va a ser esta colocación en una vez más Beato Otro chiste desde adelante o aquí y este aquí va a ser. En realidad, no
es para hacer retroceder elimina y trabajar. Tenemos que poner la variable independiente aquí también, no puede
ser solo para estar a través, así que la forma en que funciona primero tenemos que decir mpg equivale a p cero en uno Y luego estos valores aquí. Entonces esa se convierte en nuestra fórmula. Entonces eso significa que tenemos que tener una característica más agregada a esta tabla y esa característica tiene valor solo una Soto Agrega que hay un comando muy simple. Vamos a decir X es igual a sm dardo en constante y eso es todo. Se va a agregar una línea constante con valor uno para X, imprimamos X y luego entenderás. Ah, aquí. Por lo que ha agregado una constante de tarjeta característica más, y él transporta este pozo con contenido 1111, desplazamiento acelera. Y eso es bueno ir a continuación o aquí. Vamos a seguir en esto sólo vamos a entrar. Este tipo Grecia, señor. Sin tierra. Ese es el nombre al que vamos al instante. Vamos a crear. Podemos poner cualquier nombre aquí. Y yo sí, similar inicio Quayle s Y on X, vamos a encajar. Y ahora nos vamos a imprimir el resumen, ¿de acuerdo? Y vamos a correr esto muy bien. Entonces, ¿qué buscamos en esto? Estamos buscando que este valor sea mayor que guión. T en cualquier valor de entidad. Mayor a 0.5 es significativamente con su puntiaguda de cinco. Entonces, ¿hay una gran teoría sobre qué? Es P y voy a escribir un bloque sobre eso. Andi, lo pondré como una de las conferencias. Si quieres entender lo que es ser lo que nula hipótesis y cómo funciona esto. Se puede pasar por eso. Pero por ahora, entienda lo que estamos buscando aquí es para cualquiera del valor futuro este de aquí ser mayor que D no debería ser más de 10.5 si es más de 0.5 que es el caso aquí para Arisen real. Acostumbrado a deshacerme de esa característica que conozco Aquí, mira la condición única. El número es grande. Uno. Encuentra este número de condición aquí. Esto podría indicar que hay fuerte Metical en realidad son otros nuevos problemas médicos . Eso significa que incluso después de todo ese ejercicio aquí, no
pudimos deshacernos de uno de la narrativa refrescante. Es muy fuerte, realmente sincero, entre el desplazamiento acelera. Y, como vimos en la razón Cory aquí, desplazamiento y en realidad escuchar, estaban muy relacionados. 0.95 Es un número muy alto, pero no pudimos deshacernos de eso cuando calculamos a Ivy. Pero o aquí cuando hacemos este resumen, lo
es, sigue indicando que debes deshacerte acelera y para tu modelo final. Entonces hagámoslo. Vamos a ser leídos. En realidad surgió el. Vamos a correr de nuevo a este tipo. Digamos x igual a ex gota oscura. De acuerdo, vamos 22 por supuesto, son artistas Coro bajará. El motivo por el que nuestro pueblo fantasma cuadrado agrega más variables. Artista bastante subirá si reduce número de variables. Coche artista corrió hacia abajo. Entonces por eso decimos en el mundo de la ciencia de datos que cuando se trata de entender si tu modelo de
datos está funcionando o no, no solo
es nuestro silencio. Hay varias otras cosas. Incluso voy a cuadrar hacia arriba 0.6 Podría ser un buen moderno porque depende de muchos otros factores . Dedo del pie Vale, deja uno. Por lo que no hay pico más tarde que presupuesto de Fife así como condicionado bajó. Entonces esa advertencia es tiene que correr ha desaparecido, por lo que parece que conseguimos un buen moderno. Ahora tenemos juego de dedo alrededor con un solo desplazamiento variable. Mira esto. Empezamos con ocho variables independientes. Pero cuando se trata de crear nuestro modelo y pasar dedo del pie, ese modelo la variable vitesse un fuerte efecto en nuestra variable objetivo. Nos queda sólo con uno y que se desplace. Esa es la palabra que fuera de su impuesto. Florissant, estás de la parte correcta, mi querido amigo, menos queremos ya profunda parte de gente mayor sentada porque tenemos nuestra X e Y Listos Ahora tenemos dedo crear nuestro entrenamiento set en fecha de prueba nosotros lo cual es muy similar a lo que has hecho en simple rebautizo lineal de s escala y no modelo selecciona. Um días de avión de importación se voltea. Ex tren X dist. ¿ Por qué adolescente? Por qué dist it Quest Train sabor es flagrante. X y gusto Tamaño igual a punto a Onda. Este día va a ser cero. Sí, siendo eso alargar, veo ex dist. Darcy. ¿ Por qué 10? ¿ Por qué? Sólo punta oscura. Uh, ¿por qué Justicia? Sí, lo
tenemos bien. 3 13 para tren extra en y 79 prueba de 4 cubiertas. Por el momento, tan bueno. Ahora esto entre nuestro modelo de SK Aprendió Dardo en año moderno importación Dean Bastante bueno en Clean year Subrayó Rick igual a 18 años de gracia. Y en un muy buen próximo. Nos vamos de punta en el modelo y es similar a lo que hemos hecho en Simple en Eric. Escucha, Asham, nuestra modelo está entrenada Ahora vamos a predecir camino en el próximo. Vamos a predecir y basado en la prueba X. Y eso es por venir aquí. Muy buena X. ¿Por qué se predijo ahí? Y ahora comparemos Devalúa Lifton. Entendamos lo cerca que estamos en nuestra predicción comparamos los valores fuera de Y presa. Por qué probar como hicimos en el modelo lineal, ¿verdad? A la izquierda con eso. Está bien, hecho este comando. O aquí 28 29 22 26 12 13 38. Y ahí creo que se ve bastante bien. En pocos lugares, está lejos, como 38 28 pero pocos lugares está muy cerca. 28. 29 el 12. 13 33 29. No está mal. 1920 no fueron malos. Sí, a mí me
parece bastante bien. Vamos a imprimir una distancia y trazar el valor del sabor Y sobre por predicciones y valor sobre eso nos
dará una idea bastante buena fuera. ¿ Cómo vamos a ser capaces de predecir los valores Y a estas alturas? Espero que ya sepas trazar disturbios y sangre. Sé que sí seleccionas. Entonces ese es el Senado. Comience sabor no en sangre. Nuestro Por qué solo Vamos a decir color igual si lo son y vecino que cotiza realmente valores. Y digamos que no queremos su telegrama. Entonces su Equus, los fondos y hagamos lo mismo para limpiarlo. Pero esta vez vamos demasiado lejos. Recé por que vamos a dar color como verde y vamos dedo del pie poner la etiqueta como
valores pronosticados aan den. Aquí sería un poco, y de ser así
, apareció. Dido está bien. A ver. Bueno, aquí creo que lo tenemos bastante cerca, ¿
verdad? Mira esto hasta MPC 10. Estamos muy cerca el uno del otro, pero y después de eso, hay algunas variantes aumentadas. Y después de eso, tenemos un juego cerca. Por lo que este es un moderno razonablemente bueno en el que hemos trabajado hemos desarrollado. Ese es un muy buen modelo sobre sobre un dato del mundo real. No lo olvides, este es un estudio de caso real hecho por la universidad y somos capaces de predecir muy cerca de este modelo es bastante buen modelo en el que hemos trabajado. Deberías estar orgulloso de ti mismo. Te veré en próxima conferencia
19. PolynomialLinearRegressionIntroduction introducción: Hola. Ahí estaban Ven dedo este Lecter sobre polinomio rebautizo lineal. Enhorabuena por completar rebautizo lineal simple Ya entiendes. Regresión lineal simple significa que solo hay una variable independiente sobre ella es el dedo del pie oscuro liberado. dependiente la variable dependiente del dueño de la finca. Variable igual. ¿ Por qué interceptar más coeficiente Beaven en variable independiente? Eso es un granjero aquí. ¿ Qué es la regresión lineal múltiple? regresión lineal múltiple es la extensión fuera simplemente casi. Grissom. Por aquí, hay más de una característica valores del dedo del pie juego, así que ¿por qué depende directamente de los valores de las entidades? Pero hay más de una característica valores, y por eso hay más de una bastante cabida en caso de que una fiesta, ni yo, un indulgente rebautizo. Por qué la variable dependiente no sólo está directamente relacionada con la característica, sino que también se basa en el valor exponencial fuera la característica. Por ejemplo, mira esta línea. No es una línea recta es una línea de cartas. Si encajas esta línea de chica en una fórmula, se verá así. Por qué podría hacer B cero. Es por eso que entrar Tip plus B un café enviado en sí más B dos en X es tranquilo. Entonces no sólo es X, es X en X, y por eso cogiste esta línea de oro. Si eres puntos dispersos se ven así, entonces esta línea resultará en remolque. Línea curva. Pero sigue siendo una línea. Por eso se llama lineal. Pero se llama polinomio porque estamos aquí. Tu variable dependiente es polinomial off variable independiente. Entonces espero que hayas captado la diferencia entre la regresión lineal polinomial en otras
digresiones lineales . Al igual que la razón genética simple y múltiple. Se hará más claro cuando hagas el proyecto de mano hijo. Te vas dedo del pie Ver en próxima conferencia. Te veo en próxima conferencia.
20. Grabación en directo de regresión lineal en directo2: Hola ahí. Respuesta. Estás muy emocionado por el modelo de regresión lineal polinomial, y yo siento lo mismo. Vas a usar el mismo cuaderno de modelo de regresión lineal múltiple. Entonces abre ese cuaderno antes de que empecemos polinomio. ¿ De verdad está de acuerdo? Media luna, quiero que hagas una cosa más, y es sacar una trama de dispersión fuera completa. Expulsarte en completo. Por qué los valores pronosticados usando regresión lineal múltiple. Entonces hagámoslo. Digamos que. Bloque de dispersión en un Pierre de dardo está dispersa. Vamos a poner X. ¿Por qué? Y dicen que el color va a ser. Dicen azul. De acuerdo, siguiente. Por lo que este es el valor X e y completo. A continuación, lo
vamos a decir. Dispertar una vez más X Y ahora vamos a poner a los rivales pronosticados, no avivamientos tan juntos pronosticados por valores Muy dedo copiado. Esto de aquí. Ponlo aquí en prueba Interred off X. Vamos a decir x en el color. Digamos que va a ser, pero en Let's a barba dot y si es así lo haces. Aquí vas la línea roja waas Los valores pronosticados y este azul son los reales. ¿ Recuerdas? Te dije al principio que esto se parece más a una disminución lineal polinomial en lo que quise decir para nosotros en lugar de crear una si una gran línea. Si miras estos puntos dispersos, se parecen más a una luz de coche de línea de tarjeta. Entonces si solo ponemos una línea como esta, un Colin que será un mejor ajuste, entonces sólo una línea recta. Y esa línea de autos viene de Paul en nuestra comida. Rebautizo lineal. Entonces eso es lo que vamos a hacer ahora. Toda la exploración de datos que hicimos en múltiples lineales, imprudentes, y vamos a seguir con lo mismo. No vamos a rehacer todo eso. Vamos a suponer que el mejor modelo va a ser la variable independiente será desplazamiento on. Nos vamos de pie. Predice el mpg para que no se requiera exploración de datos. Seguiremos desde donde vivimos para él. Mlr que en múltiples lineales. Escucha. Y ahora vamos a hacer el pre procesamiento de datos mucho polinomio lineal Lamentado Lefty Data tres procesamiento para Polly Norm Year en todavía. Grissom. De acuerdo, primero
tenemos que importar la biblioteca correcta. Sk len No, pero él procesa. Y a partir de aquí, vamos a importar Polly ni Mia cuenta con clase. De acuerdo, Siguiente, vamos a crear la instancia fuera de esta clase. Vamos a llamarlo Polly Bali ni características de comida. Tenemos la instancia. Y ahora X Polly va a ser Bali Dart fit, Transformar picos. A ver, Lo tenemos bien Hasta ahora. Entonces necesitas ejecutar el cuaderno completo, ¿de acuerdo? Sí, sí. Aquí también. Vámonos. A ver. Parece un tipo de otra vez. Es matar, no reproche. Una cosa. Está bien. Está bien. Bien. Ahora el próximo, esto verá a este ex poli. ¿ Qué contiene ahora? Entonces digamos que B d corazón lo hizo, uh, frame x export es por eso que lo estoy convirtiendo en un dato para que él consiga lo mejor. Ah, ver mejor entenderlo esta primavera, Los primeros funerales aquí. Pasemos algún tiempo entendiendo este cero. Es un valor constante. 111 No nos vamos a preocupar por eso. Este es el valor de desplazamiento, valor de
desplazamiento es el valor cero, ¿
verdad? A. Necesitaba un televisor 73 50 y hacer los mismos valores, así que eso fue correcto. Pero lo que es La segunda columna agregada por el pre procesamiento de la característica polinomial. ¿ Entiendes esto? Esto es simplemente Esquire fuera de estos valores aquí, 94249 es bastante después de 807 para llevar a 50. Este coro off 3 50 Recuerda, ¿Qué fue una pregunta para el Miller? Regresión lineal múltiple. Regresión lineal múltiple. Waas. Por qué iguala B cero en uno después de eso, más B uno en X ahora polinomio pelador calidad normalmente Nicolas y solicita y se convirtió ¿Por qué igual ser cero en uno más ser uno en X. Así que está ahí en un dedo decente que ha agregado Beato en dos X está tranquilo aquí, por lo que ha ampliado la ecuación. Por cierto, cuando creamos la instancia de rasgos polinomios, tenemos que aprobar un decreto y si no se aprueba decreto, se asume también. Entonces digamos que asumió grado en cuanto a. Pero si digo tres, veamos qué pasa aquí. Pondrá exponencialmente. Pondrá X tres aquí, así que no vamos a ir allí. Simplemente nos limitaremos a dos grados en el próximo Lector, te
diré el misterio detrás de esto a, uh sobre misterio detrás de este grado. ¿ Por qué es eso importante? Entonces entiende que la pregunta ha cambiado. Ahora ya no está más limitado a ser sólo uno. Excelente. Se ha agregado B dos x esquire. Y si aumenta el grado seguirá extendiendo que se debilitará. Ser tres más rayos x a tres. Presione antes sobre exceso a cuatro. Así. Entonces, hasta ahora
tan bueno. Entiendes lo que pasó justo ahora Tienes el valor X y exceso de valor coro. No. De acuerdo, así que ese es tu ex poli. Entonces las personas de datos a través de las cosas giran ¿qué sigue? Siguiente es que tenemos toe fit este data toe lineales peticiones y modernas. Entonces lo llamaremos más eneldo ajuste. Polly Ajuste oscuro en X polly. No del todo bien. Por lo que la calidad inicia los pies expertamente y luego a la derecha. Está bien. Entonces este es nuestro modelo el polinomio. Estamos encajando con expertamente y blanco. Y ahora llamaremos a nuestro Lynn Neary Grayson. Por lo que vamos a crear una instancia off. Misma regresión lineal clase de matemáticas año lean rebautizen aquí. Y luego nos vamos a meter dedo este con nuestro ex poli y rival por lo que x subrayan Polly. Y luego cuando vean esto es bueno. De acuerdo, Entonces nuestro modelo está en forma ahora Ahora podemos tú, Theis, y predecir el valor y. Entonces veamos por qué. Predicción. De acuerdo,
entonces, ¿por qué subrayado? Digamos que Polly puso se va dedo del pie sea tierra. Haz esto cuando sepas, empieza a predecir lo mismo s lo que hiciste durante la regresión lineal y o aquí vamos de
puntera el valor X polly, que es aquí body duff transform. ¿ Verdad? Entonces sólo pero la X Party Bueno aquí. Está bien. la muerte Nuestro Por qué loro Polly que también salió bien en un menos comparar desarrolló el valor
real correcto con por qué valor predicho usando Corey disminución normal y dedo del pie moderno comparar que teníamos las canchas y estamos aquí. Vamos a usar el mismo. Oh, aquí, nena. Entonces vamos a decir que esta vez tienes que hacer tienes que en este se convertirá en nuestro y Orado en lugar de apagado rezé Será y Polly oró encendido en lugar de apagado. ¿ Por qué probar? Vamos a usar forma completa. Muy bien. Mira esto. 18 15 59 15 14 18 15 16 15 Esta luce una mejor predicción Me dijo que se hará más claro cuando troteamos. Parcela de dispersión. Entonces dibujemos. Ellos dispersan trama de nuevo se mantiene aparte. Esto se va a ver y ahora aesto a nuestro siguiente son meras predicciones. Entonces eso va a estar bien en color con tarifa de Ruthie. Digamos verde pintado a mano. Muy bien. Mira esto. Nuestro nuevo polinomio re Crescent le ha traído la línea curva. El del que estaba hablando y eso luce mejor que la línea recta. El pronóstico. Porque la naturaleza de la dispersión apunta aquí luce de oro. Y este de aquí, la línea de cartas. Creo que da mejor predicción. ¿ Qué tal si miramos a nuestro para anotar? Veamos eso. A ver si hay alguna mejora en nuestro para anotar. Por lo que nuestras empresas puntan dedo del pie, Sí, K muy bueno. Después imprimir a su núcleo. Pero, uh y eso va a ser nuestro para subrayar su núcleo. Entonces, ¿por qué los valores reales? Por lo que yo y luego protegí Wells aquí en Nike Ways Izquierda impresa, los son para anotar para pelador. Probablemente aprendiz normal se arrepiente de esto aquí será Por qué, Vale, vamos a correr esto. Ah, aquí. Por lo que hay mejoría en nuestro hasta su núcleo hacia fuera. Por lo que el son para anotar cuatro mlr fue apuntado para ello y para pilar para la misma fecha que es 40.68 es por lo que este estatus, se ve un mejor ajuste para polinomio rebautizado, luego jumiller. Entonces esa es la vida de la ciencia de datos. Cuando obtienes los datos, puedes hacer sus ráfagas fiscales y entender los datos. Pero es posible que aún no sepas qué algoritmo se ajustará mejor a estos datos. Y esta es la práctica que terminarás haciendo. Harás que quepas un algoritmo. Consigue tu son para anotar, consigue sus predicciones, y luego probarás otra grabada. Um Y entonces ese algoritmo podría dar un mejor escritor que el algoritmo anterior. Eso significa que estás avanzando. Estás mejorando. Y esto es lo que hicimos en este ejercicio. Intentamos predecir la eficiencia del combustible. Usando regresión lineal múltiple. Tenemos 64% son para anotar y la predicción waas bastante buena. Pero lo mejoramos mediante el uso de rebautizo lineal polinomio. Por lo que el polen normalmente cerca de imprudente y para nosotros obtenemos un mejor resultado 10
regresión lineal múltiple para este conjunto de datos. Muy bien. Te veo la próxima semana
21. Introducción de KNN: Hola ahí. Bienvenido dedo del pie K algoritmo vecino más cercano. Antes de dar una inmersión más profunda en K y un algoritmo que te llevamos a través de una
distinción muy importante entre diferente nuestro ritmo. En Hay modelos Paramétricos y no Paramétricos. Ya has pasado por regresión lineal simple, regresión lineal
múltiple y ático lini polinomio. Escuchar en previa electiva sobre un comportamiento muster notado es que todos tienen la pregunta del dedo del pie seguir. En base a esa ecuación, derivan la variable dependiente. ¿ Por qué? Entonces esa es la pregunta de parámetro complicado. Ya hay una fórmula que siguen. El conjunto de datos de entrenamiento es adecuado que se deriven coeficientes de fórmula y apuesten por ese coeficiente. El interrogante está completo en el resto fuera de los datos como datos de prueba. Nuestros datos futuros están a pie en ese equipo. En base a eso, se deriva
D y. Así funcionan los modelos paramétricos. Después hay modelos no Paramétricos. modelos no paramétricos no tienen tal pregunta. Analizan el comportamiento de los datos, y en base a ese comportamiento después de los datos, predicen la variable dependiente. Entonces esa es la diferencia entre los modelos paramétricos y no Paramétricos. Descomposición y modelo es modelo no paramétrico. Eso significa que no hay una fórmula fija. Nuestra ecuación que siguen muy bien ahora que usted entiende que Cayenne en es un ascensor moderno no paramétrico, entender cómo puede y funciona. Entonces digamos que estabas ejecutando una campaña de marketing en base a ciertos parámetros ciertas características fuera de tus clientes, tal vez de edad, hombre o mujer, su ubicación, sus ingresos familiares. A lo mejor en base a eso te has enterado de que un comportamiento con una fiesta es tu producto, son ellos no. Pero es tu producto. Entonces si es sí y no. Y si trazas una gráfica, esto es lo que obtienes. Todo el día s puntos son el no punto. Ahora considera que hay un nuevo cliente nueva persona en las redes sociales, nuestra dondequiera que estés ejecutando el camping de marketing y tienes que predecir dónde esa
persona va a comprar tu producto o no. Entonces básicamente, hay
que predecir lo raro. En este punto, estos datos pertenecen. ¿ Pertenece aquí? ¿ Cuál es sí, pero pertenece aquí? Que no es ¿Cómo va a pertenecer el algoritmo No, estamos ordenando este punto. Ahí es donde entra el cayena y el algoritmo. Picture las vacaciones y el algoritmo funciona. Decide apartarse de este punto con base en sus vecinos. Pero la pregunta es ¿cuántos alguien quiere considerar? Y ese es el Cavell. Por ejemplo, si veo, quiero considerar a tres vecinos a su alrededor solidez de que tres vecinos sobre entonces mayoría lleva que esto no es en este caso. Hay dos puntos en el lado sí un punto en el lado norte. Por lo que este punto se convertirá en s que con ese cliente que estás analizando, se
va dedo del pie compra tu producto que haría con una predicción Qué Iphigenie Este gato cinco los pronostica y cambia porque ahora hay tres puntos en el lado norte y dos puntos en el sitio F. Ahora este punto se convierte en ningún papá significa la predicción es que este cliente no se va toe party s su producto. Por lo que con base en el cable, la predicción cambia. Hay una lógica que siguió Tobie. ¿ Tenía esto? Dio un bucle y él aterrizará es mientras vamos a pasar por proyecto Hansen en próxima conferencia. ¿ Fue otra cosa dedo del pie? Considera que le decimos al algoritmo dedo del pie considerar gay como cinco. Pero, ¿cómo sabrá algoritmo qué puntos vecinos considerar? K es cinco por lo que de esa manera se considerará cinco puntos vecinos pero qué punto vecino considerar. Nosotros decimos esto puntos a considerar Así que consideran estos thes tesis y este
punto de lucha También reconsideran estos thes thes tesis cinco puntos que cinco puntos a considerar Y ahí es donde la lógica off calculando la distancia entre este punto, el punto pronosticado y el punto vecino viene en Peter. Hay tres lógica distinta nuestra capaz de considerar esta distancia 1er 1 es que despejas la en distancia que tomará X uno después de este punto con el X uno fuera del punto vecino encontrar una diferencia Es coro que diferente similarmente violento en este punto y por qué fui tras punto
vecino y se va a tomar un total de descuento que va a hacer eso por cada off los valores aquí y para los que ustedes eran comunistas Y encuentra este valor como los más bajos sus dientes, el comunismo fuera pelea vecinos lo considerará Así obviamente en este caso encontrará que esa hija y esta ruta coro del total será más baja para este comunismo. Entonces considera cuánta competencia y tiene que hacer Tiene que encontrar primero la diferencia para cada uno de los puntos de datos. Y luego tiene que encontrar ese número único a puntos basados en la K para la que esta distancia es más baja. Ese tanto cálculo. Y tiene que ver para conseguir dedo del pie a los vecinos galos. Y por eso seleccionar K es un papel muy importante en K y un algoritmo. Y por supuesto, entenderás que cuando hagas el proyecto manos a mano por ahora, creo que ya sabes cómo funciona este cayenne fresco y la cosa, cómo calcula la distancia, cómo descubre qué vecinos considerar. Entonces este es uno tras lógica para calcular la distancia distancia distancia distancia distancia euclidiana Y hay varias otras lógicas como esta. Dame guardar distancia en Manhart y distancia tener una distancia segura es máxima fuera los valores
absolutos en las distancias de Manhattan el total después de pozo absoluto, use la diferencia. Está bien, impresionante. Creo que entiendes K Y suficiente. Te veo próxima conferencia
22. KNNRegression Step1: Hola. Ahí llegará a esto. Richter. Enhorabuena por completar la sencilla regresión lineal. Regresión lineal múltiple sobre regresión lineal polinomial. Ya te habrías dado cuenta de que tengo el mismo cuaderno Abierto. Por lo que vamos dedo del pie seguimos usando el mismo cuaderno. misma fecha que en. Vamos a realzar los dedos Los están para anotar básicamente nuestra predicción mediante el uso de otro algoritmo en esta ocasión se llama gay. Regreso vecino más cercano Un algoritmo K vecino más cercano. Iré al resultado para re media luna en clasificaciones Celeste sobre por aquí. En este caso, tenemos un dato continuo. Entonces vamos a utilizar el análisis de re media luna para predecir el valor de MPC. Voy a llamarlo K. Y entonces en adelante, antes de empezar Cayenne y algoritmo, déjame hacer una cosa más. Terminamos aquí nuestro Lecter anterior, donde comparamos el arte para anotar Millar y Pelador. Último mejorado. Estas cartas tenían raíz media es bastante error a esto porque eso es otro criterio visa comparar alguna vez raíz media es bastante error es más importante que artista anotó. Entonces por eso vamos a eso y comparar a ambos la mitad de él. Entonces hagámoslo. Por lo que primero nos vamos a importar dedo de este kailyn oscuro medics import mean se lo
escudriñó . También necesitaremos de met es ruta tranquila Sq fiesta. Muy bien. Ya abrimos nuestro para anotar más tarde. Sprint la ruta. Es decir, está tranquilo, ¿verdad? Oh, Dios
mío. En eso va a ser bastante ruta para venir aquí. Se alegra que se haya dado por baja. O sea, es tranquilo lo de estos dos pozos. De igual manera. Entonces eso está lejos, um, mucho en,
como, como, camino del dedo del pie. Lo mismo para B A r se levanta b l r Será por eso mi cuerpo Brit. De acuerdo, aquí vamos. Entonces conseguimos nuestro para anotar y raíz media es bastante raro para un hombre en un poco de PR aquí. Por lo que hay una mejora en nuestro para anotar así como raíz Minutos cuarto. Muy bien. Ahora podemos comenzar el K y el algoritmo. Vamos a usar el mismo conjunto de datos en. Ya veremos si hay alguna mejora. Al usar K y un algoritmo para usar K y un algoritmo, necesitamos importar primero al vecino gay. Agresor importó de s Kellan biblioteca de s kailyn dot Cualquier vecino importar bien? Vecinos gays, agresores. Y luego crear instancia para K y n vecino, importaba
el kraisser. Cayenne e igual dedo del pie Limpiador vecino gay. Sí. Podría hacerlo instancia fuera de eso Oh, aquí vamos a poner en vecinos iguales a nueve on. No te preocupes,
te lo explicaré. ¿ Cuál es el significado de ese valor en ¿Por qué elegimos nueve por ahora? Simplemente ponga a los vecinos finales una llamada a las nueve en siguiente. Vamos a encajar la ganancia y con el extremo en acertadamente en valor, explicó. Y blanco. De acuerdo, entonces tenemos al mártir. Tenemos nuestro cayena y modelo fit. Vamos por ahí. Esto se ve bien en el siguiente, vamos con el dedo del pie. Predecir reavivamiento. Ahora eso es un crédito WHYY. Y eso está bien, pero está bien, y luego se va. Obtener y, uh, predecir sobre. Y aquí va a ser X simplemente realmente fácil, ¿verdad? A menudo llegamos ¿Por qué predecir valores? A continuación, vamos a comparar lo real frente a la muerte del valor predictivo aquí mismo. Son demasiado de tres d de tres. Ah, aquí. 18 15 15 14 18 15 16 15 15 13 14. mí me parece bastante bien. Pero, ¿cómo hacer con un cierto que esto es mejor que el último? El anterior que recuerdo Lo primero que vamos a hacer es crear una trama de dispersión. Extender. Se trata de trama de dispersión. Esto eso. De acuerdo, la puerta del
miedo T es scatter x on. Por qué en este caso va a ser predecible dentro de dos días Y me separaré X y colorearé estos tratando de, digamos, voy a decir, Ponga Nestea. Wow, creo que éste los puntos amarillos están más estrechamente alineados con los valores reales. Los puntos azules compararon toa la línea rizada verde, que era para calidad normalmente. Deitrich, escucha en la línea recta de incursión, que era para más personas lineal, disminución en Vamos a correr nuestros números. Corremos nuestro nuestro a su corte y raíz significado Squire error. Y veamos si hay alguna mejora en eso. Correcto. Entonces hagámoslo. Está bien. Este año Aquí están, entonces. Sí, ¿lo ves? Está bien. Y luego Ok. Y luego predecir. Gracias. Muy buena lección. Esto. De acuerdo, ahora comparemos. Entonces, ¿no vamos a anotar fuera de curso? Ahí está la mejora en caso off pl r 12.68 en niños fuera de Kane, y es puntos en cinco on al mismo tiempo, Root mean square error ha bajado de cuatro puntos tratar off 3.8 it. Por lo que esto definitivamente es mejora. Entonces Kienan nos está dando unos mejores pronósticos y modernos, entonces. Mlr RPs. Por lo que felicidades, te mudas en seco Derickson. Una cosa quiero señalar con el dedo del pie si miras a este chico y no es una línea de estado y
por eso no se llama regresión lineal. regresión lineal es simple. Disminución lineal en nuestro múltiplo en Ieroklis son Pol Anomalía cerca de imprudente y que en realidad te da una línea. O se llama línea son línea recta, pero su caso off cañón porque se basa en los puntos vecinos más cercanos. No es una línea recta, solo
es predictivo. Yo valoro ya sea en los puntos vecinos más cercanos y es por eso que parece una gráfica de dispersión en línea con los puntos reales. Y tal vez por eso está dando una mejor predicción en este caso. ¿ Verdad? Entonces te estás moviendo en la dirección correcta, Mi querido amigo. Ahora te estás convirtiendo en científicos de datos ahora, ya
sabes, cuando obtienes un dato cómo jugar con él y cómo mejorar y mejorar en tu predicción. Pero antes de concluir, recuerdo que estaba hablando de estos vecinos iguales a nueve. Andi, te
dije que te explicaré sobre eso.
23. KNNRegression Step2: en la cara conceptual, ya
estás entendiendo El algoritmo vecino K funciona en base a los vecinos. Al igual que si considero un punto aquí, se basa en ahí están los vecinos en él calcula la distancia. Pero entre ese punto y el vecino y luego decide, Vale, ¿ dónde pertenece ese punto? El número aquí está diciendo al algoritmo cuántos puntos debes considerar como vecino. Entonces si doy nueve, eso significa que el algoritmo va del dedo del pie. Considera nueve puntos en su barrio. Consideraría nueve puntos, y surgirá con los valores pronosticados. Se puede empezar con el de seguir adelante, pero el vacay y y nunca el algoritmo funcionan esa raíz que significa Squire Edgar aquí se vuelve muy alto si Cavell que está bajo. Pero no quiere decir que si mantienes interesante cable, Houthis seguirá bajando. Ahí está el activo en punto. Tienes que entender. ¿ Y cómo se me ocurrió esto? Número nueve. Vamos a pasar por eso. Te voy a explicar. ¿ Cómo se me ocurrió su número nueve? Es muy fácil. Vamos a grabar en video para escribir unas líneas fuera de la mordida y cancha y vamos a entender. Entonces digamos para K en el rango 20 vamos a ejecutar la misma lógica como predecir el valor y. Pero en lugar de simplemente pasar y vecino como nueve, pasaremos y vecinos del número uno al número 19 y veremos cómo en general está cambiando el miniter de
ruta de Esquire . Por lo que se fue con eso. De acuerdo, igual a Tok más uno en. Entonces sólo copia lo mismo aquí en entonces mi rezó en de sprint print Vale, valor, que es este año. De acuerdo, en entonces duro MSC en nuestra embajada está justo ahí. Muy bueno menos que este Hasta ahora cable uno es de cinco puntos lo. Se inicia en 5.1 lo más alto. Bueno oh, entonces sigue bajando. Mira esto Da ir abajo, abajo, abajo, abajo, abajo El hasta el ocho y nueve Y luego aumenta después de eso. Entonces si trazar una gráfica de éstas, quedaría
claro. Entonces trazar una gráfica para trazar el oficio. Necesito todos estos errores bien adeudados en algunos np Lo siento por dejarme crear un vacío primero y luego agregar estos valores de error en eso. De acuerdo, veamos, tengo todos esos sauces. Sí, me dieron los valores. Ahora puedo dibujar el producto. Larga. Ocurre, Lord Worlds, punto
rápido Corriente de datos caliente Emma C. Y luego sólo chica trama punto traído. Aquí tienes. Empezó con más de 5.5 aquí. 5.8, derecha. Sigue bajando con la cueva mucho de 2.5 baja Y luego después de alrededor de ocho o 9 18 lugares otra vez, Correcto, Así que puedes elegir ocho o nueve Y ese es el valor óptimo para esto. Fui por la noche. Es así como obtienes el valor óptimo para que K lo use en Cayenne y al Qaida.
24. KNNClassifierDemoUdemy Step1: Hola ahí. Bienvenido a esto, Richter. Empecemos a arrancar auto y aceptabilidad en. Predice su participio basado en K y luego clasificador. Va a ser una diversión. Entonces lo primero es que vamos a darle un buen nombre dedo del pie nuestro cuaderno y lo llamaremos bien . Y luego con clase. Aquí. De acuerdo, Siguiente. Muy rápido. Vamos a importar toda la importación bibliotecaria requerida lumpy. No puedo ser divertido importador. ¿ Aziz pd t bond vote dot Y a continuación vamos dedo del pie importante dictador Basado en anterior electo Entiendes los datos sobre espero que tengas una historia. Gira tu computadora ahora nos vamos de dedo importar ese dato dedo un marco de datos en el
padre común que es. Estos son mis datos de nombre DF B d tart que comen lástima dot Leer CSP y luego nuestra y luego dar su nombre de archivo o aquí Si nombre es tarjeta, nuestro archivo de datos no tiene ningún bateador, por lo que llamaremos cabecera ya que ninguno medidor diario en el archivo es Kama y luego vamos a dar nombres a la columna que se nombra a los atributos en el nombre va a estar aquí mismo Prying puerta de mantenimiento. Mira, sería 50 autos. De acuerdo, golpe de dardo del
DF. Veterano lo. Muy bien. Entonces conseguimos nuestros datos. India Duro. Vergüenza en o aquí. Lo siguiente es que vamos a ver la forma de los datos. ¿ Cómo B son nuestros datos? 1728 filas y siete columnas. Muy bueno en el auto. O aquí está nuestro objetivo. Variable on. Existen 123456 variables independientes. Entonces, como ven aquí, todas
estas son variables categóricas. Tenemos que convertirlas variables numéricas del dedo del pie y cómo hacerlo. Ya lo sabes. Se tiene incluyendo Así que vamos a hacer etiqueta en cortejo. Entonces, ¿qué, vas a importar de s Kaylen? No estés tramitando mano de obra de importación en cupo, y luego vamos de pie en los tribunales. Cada uno de estos campos el d f. comprando igual a antes de eso, tenemos que crear una instancia fuera de etiqueta en trimestre, ¿
verdad? Es una clase, por lo que necesita una instancia para recrear. Primero en hit. De acuerdo, así l b c pies de punto y esta cancha se transforman. ¿ Y tú lo mismo? Hacemos lo mismo por otros campos dio I m D El siguiente está yendo dedo del pie ser puertas día en persona y mira, es bota 50. El auto es una variable objetivo. Entonces no vamos a ir a la corte en el sprint ahora, ¿te han atropellado? Muy bien. Todos están codificados ahora. Por ahora, tan bueno. Si quieres ver el único Quellos en variable target car, es una muy fácil Simplemente puedes correr esta línea de cancha. ¿ Tú, Dios en sólo ver Único. Estos son sus valores únicos en las variables objetivo. Por lo que tus autos van a estar segregados entre inaceptable baja media hi aceptabilidad. Aceptable. Muy bueno y bueno. ¿ Verdad? Tienes remolque Segregar que su grupo autos entre estos mismos una vez fuera. Aceptable. Por lo que hay más de 1728 registros. Tu dedo del pie. Predecir estas clasificaciones en fecha futura nosotros Si tienes estos seis en el peor nivel después de auto, deberías poder predecir si está entre una de las siete categorías fuera de curso. De acuerdo, entonces vamos a tener más en corporatistas. Por lo que vamos a asegurarnos de si todos los seis valores de entidad son valores numéricos ahora. Así que vamos a hacer ese dart DF Aplicar mapa y ser dardo realmente no es golpeado. De acuerdo, tan cierto. Verdadero, Verdadero, verdadero,
verdadero, verdadero y adelante Esto se espera. No lo hicimos en tarjeta de corte, por lo que va a por defecto. Pero todos los pozos futuros son ciertos. Por lo que todas las características son valores numéricos ahora Muy bueno. Es hora de definir nuestra x e y. así que digamos X igual a d f gota de punto ¿Qué fue esa carta cayendo? Porque ése es un objetivo que éramos. ¿ Y por qué igual dedo del pie lo haces? Bien, Bien. Por lo que tenemos que encontrar nuestro x e y siguiente Nos vamos de puntera Definir nuestros datos de entrenamiento. Siéntate desde tu habilidad y selección de modelo oscuro Importar Quiero decir desaliñado su espíritu. Bien. Ahora ex tren ex desaliñado, ¿verdad? Jean, ¿Por qué probar un rapido a y se volteó X y tamaño desaliñado Como resultado, vamos a hacer 20% tamaño de texto y no sé en su lugar fue a visitar Baker Athm. En lo que va tan bien a continuación. Antes realmente llamamos al Cayenne y clasificador y pasamos este tren y datos de prueba dedo
del pie el clasificador Necesitamos averiguar el valor óptimo de K. Recuerda que hicimos este ejercicio durante el día y y retrocediendo. Tenemos que hacer lo mismo para averiguar el valor óptimo de gay que puedes usar aquí. Hagamos eso. Yo voy a ver aquí. Encuentre el valor óptimo off. De acuerdo, empecemos desde que es Gail and dot Vecinos Importar nombre clave, Chupete de
nacimiento de Mad Import. Sq. Nuestros dientes consiguieron ruta desde Eskil y no hay importación de médicos. Es decir, está tranquilo. Es muy bueno. Empecemos. Voy a decir por qué un dedo igual aquí lo vemos Conseguirlo. Transformar esto lo tenemos que hacer porque para este pastel imprudente, incluso las variables objetivo tienen que ser codificadas. No puede ser una variable categórica. Entonces por eso me voy del dedo del pie de la etiqueta, incluyendo para el auto que voy a conseguir ¿De verdad? Pero también Está bien, así que ahí está mi etiqueta incluida. A continuación me voy de dedo crear un NPR vacío e r Timothy, y empecemos por K en el rango 20. Ok es igual a K más uno. Ya lo hiciste. Si lo desea, puede copiar y pegar desde el programa anterior cuaderno anterior que está ganando grados y cuaderno incluso abrir y copiar desde ahí. Entonces voy a crear instancia fuera de una cruz vecina aquí tienes. Entonces esa es la instancia Ahora fuera de una nave vecina. Y cuando creamos la instancia, tenemos el dedo del pie más allá del número y vecino, ¿recuerdas? Ah, aquí. Vamos a pasarlo para pasar. Es K encendido ahora, K y luego punto fit Vamos tanto a x como a cuervo Y vamos a calcular e root. El medio es bastante error. Nos vamos del dedo del pie a la pintura el dedo del valor. Este de aquí, esto se requiere en caso de que desee trazar una gráfica. Si no quieres fotografiar, entonces no necesitas ponerte dedo del pie desarrolla a esta zona vacía. Pero Lester, eso significa, es comedores escuadrones. Por qué incluso entonces Cayenne y son bastante en. Y vamos al camino X bien aquí. Entonces esa es nuestra zona vacía. Ahora vamos a traer ese valor de la llave de impresión, y ese va a ser nuestro cable aquí. Y después Adam Aceval. Andi, ese va a ser este tipo. No está mal. Está bien. Y veamos si lo hicimos bien. Muy bien, Lettie. Por lo que es o siete r ocho. Por lo que a ello es más bajo y luego dar aumento después de que uno mira y familias. Entonces me voy a olvidar de eso. Empecemos con los valores. Entonces conseguimos el cayena y el valor. Entonces capacitemos a nuestro modelo de datos. Kienan se va a ser k Lleva clasificador y en ellos vale va a ser C uno Muy bueno. Y luego k n n punto Si es y vamos a pasar nuestro intercambio y escribirlo athm Una vez que
tengas nuestros pies modelo de datos en los datos de entrenamiento siéntate. Estamos listos para predecir. Entonces por qué Break va a ser gay y y ard predecir ex angustia. Buen trabajo. Ahora Basta con medir la precisión de nuestro modelo de SK Len Import Medics on, luego sprint la precisión no pude anotar por qué y luego K y luego predecir y ex Buen trabajo. Muy bien. Obtuvimos precisión de 93% 93% de precisión en K y algoritmo clasificado. Deberías estar orgulloso de ti mismo.
25. KNNClassifierDemoUdemy Step2: muy bueno. Trazemos y valoremos el pozo real. Ah, y por qué predijo Bueno, y confirmar lo cerca que están tan de tramar. El primero que tenemos que hacer es Primero, tenemos que convertir ambos actos y por qué en nuestro actualmente X y ese panda justo después, vamos a convertirlos a MP tres ahora. De acuerdo, así que esto convertirá X e y dedo del pie. NPR es muy bueno ahora que los has convertido remolcan. Podemos empezar a tramarlos. Entonces digamos cuatro x e. por qué e En Jeep X rayo la oscuridad. Tiene que x e i e. en remolque. Ha sido duro. XY Vamos a trazar esto primero, va a tomar algún tiempo porque se va de dedo del pie plotted. Scatter trajo por cada punto fuera X e y e Muy bueno. Hagámoslo poco con marcador más fancier va a ser Oh, y el tamaño va a ser la talla s. Es una talla cuatro se va a entregar a la izquierda. Con eso dejado a una cosa más Esto puso color. Creo que hay valores originales, así que vamos como hemos seguido en el sector privado. Simplemente dale calorías. Grupo. Buen trabajo. Ahora vamos a imprimir e valores pronosticados. Por lo que estos son realmente valores X e Y. este momento nos vamos a imprimir los valores pronosticados así veremos huevos y en vez de fuera ¿Por qué va a estar aquí que en y predecir Ben y Y empezaron a ir a ver aquí. ¿ Ves hola e inst off. Oh, diremos estrella. Y vamos a reducir el tamaño también otra vez para que se complemente encima de lo real Y luego veremos PST oscuro. Por lo que va a tomar algún tiempo. Aquí vas a ver una estrella amarilla. Esos son valores pronosticados y los puntos azules. Esos son valores reales y ves valores pronosticados en la parte superior de cada valor real. Entonces eso está funcionando bien. 24 baja. No tenían valores predictivos para todos los demás casos. Está prediciendo perfectamente bien. Y por eso conseguiste esta precisión del 93%. Entonces tengo ah, tarea para ti. ¿ Qué pasó con el bajo valor? Por qué d predicción Waas no hay por el bajo valor. Basta con mirar los datos y creo que encontrarán respuesta. Estoy esperando tu respuesta. Por favor, envíame un mensaje. Te veré en X Director
26. LogisticRegressionIntroduction: Hola ahí. retroceso de palo más grande es uno de mis favoritos en una de las razones por las que es mi favorito son las matemáticas en el mundo en él. Si has olvidado tus matemáticas a nivel de bachillerato, entonces podría ser un poco difícil para ti entender esto. Por lo que primero te llevaré a las matemáticas básicas que necesitas para entender el
rebautizo artístico . No te preocupes, no
voy a tomar mucho tiempo. Yo sólo voy a explicar lo que es demasiado para que usted entienda. Mayor Media Luna de la Victoria. Entonces hablémoslo. Este. Todos entendemos 10 al apagón dos es igual a 200. Es muy difícil olvidar hasta aquí. Por lo que espero que todos entienda esto. Y no necesita más explicación sobre si digo cerrar sesión 100 a los mejores 10. Eso significa que estoy diciendo qué poder apagado el 10 hará 100. Y la respuesta, por
supuesto, es el dedo del pie, como hemos visto aquí. Y en tal caso, fuera de registro, donde la base 10 son logaritmos comunes de Dios. ¿ Y si solo escribo log off 100? No escribo basado 10. Entonces lo que sucede en tales casos el ritmo se asume como número Do point Mismo 11 it que es e on. Ese tipo de ritmo lager se llama logaritmos naturales y es posible en s Ln 100 Eso es todo. Esa es la matemática básica de la que estamos hablando ahora esa teoría en el mismo pozo izquierdo mover un dedo Entendiendo rebautizo artístico. Antes de saltar a la regresión logística, vamos a dar un paso atrás en esto. ¿ Entiendes? ¿ Qué hicimos en rebautizo lineal Illini regress. Y vimos esta fórmula Por qué llamó Toe B cero más Beaven hija Ser un Nixon ¿verdad? Y entendemos que el lado derecho de esta ecuación es el número continuo el x uno x dos x árbol y más allá. Estos son nuestros números continuos sobre el resultado fuera de esta santa pregunta junto con coeficiente es un número continuo y el resultado también será un número continuo en el que
has trabajado el caso está fuera predecir la eficiencia del combustible. Muy Había variables independientes como las cuales eran diversas características del auto y se le ocurrió la eficiencia del combustible protegido que era un número continuo. Por lo que entrada salida de brasa
continua, número continuo. Vengamos a la logística rebautizar más grande razón Tikrit. A pesar de que el nombre dice una gran
razón, en realidad es Ah clasificaciones arboreto y por clasificaciones. Y quiero decir que el resultado no es un número continuo. Entonces empecemos por el lado derecho. Es lo mismo. Sigue siendo el mismo número continuo. Por lo que desenlace del sitio sea un número continuo. Pero del lado izquierdo, porque son las clasificaciones y la técnica, el resultado tiene que ser un resultado binario en caso de que fuera mayor prisión decretada. Entonces resultado binario significa valores como sí, no, correcto. Incorrecto 01 Así que ese desenlace amable, la ciudad compleja aquí es ¿cómo se obtiene un desenlace de Banbury con los números continuos? Y ahí es donde está toda la diversión detrás de las matemáticas. Empezar en caso de regresión logística. ¿ Por qué está repleto de algo como esto? Bloquear B por uno menos B. Y este de aquí, esto es probabilidad. P significa probabilidad en todo esto. Ser por un menos. B se llama arte fuera arte desenlace art. Entonces en el log off este valor, recuerda, no
hay base con el 10. Entonces esta es una ley natural. Sí. Por lo que este es un candado natural. Y así se cambia la fórmula Ahora por qué se reemplaza con log off B por uno por P. Así que esa es una fórmula aquí. Eso significa bloquear a nuestra gente uno por p donde p la probabilidad se llama y. y si la amplío aún más, entonces simplemente me acerco mejor con esta fórmula que P probabilidad es igual a uno por uno más e corrió a menos y. entonces ahora esta es la parte muy interesante. ¿ Por qué hice todo esto? Porque en esta fórmula, no importa qué valor de por qué ponga, siempre
obtendré una probabilidad. Valor y probabilidad. El valor siempre estará entre cero y uno. Entonces eso significa que todavía puedo obtener resultado de esto como un número continuo, que será mi esposa. Pero en el momento en que ponga eso por qué en esta ecuación obtendré la probabilidad con la que
será está entre cero y uno. ¿ No me crees? De acuerdo, hagámoslo. Pongo varios rivales aquí en esta fórmula y este fue mi desenlace. Este fue mi valor P. Se puede experimentar con más valores Y sobre esto fue el oficio. Por lo que ahora tengo un oficio. Son los valores de probabilidad que terminan de 0 a 1 que estos son mis valores de propiedad, y estos son valores y. Por lo que probablemente mesa quién es 0 a 1 noche. Mi oficio se ve así. Y entonces puedo seguir una fórmula simple que si mi valor de probabilidad es menor a 0.5, diré no más de 0.5. Yo diría que s sí. Y aquí mismo cambié mi resultado de número continuo a bine. 80 resultado sí y no. Y por eso me gusta el rebautismo autista. El matemático básico ha hecho de un resultado de número continuo dedo del pie un resultado binario. Por lo que llegaremos a la mayor regresión de garrapatas. Te veré en el próximo Lecter.
27. LogisticsRegressionDemoUsethisone paso de la vez1: Hola. Ahí llegará a esta conferencia sobre el Congreso. Coalescencia. El hecho de que estés en esta conferencia indica que has terminado un
análisis de regresión sobre ganancia y clasificador. Traje nuevo felicitándote. Estás haciendo un progreso bastante bueno. Entonces, empecemos. Vamos a ir de pie primero. Importar toda la biblioteca con derecho? Vivir a eso. Pero antes de eso, pongamos un nombre a nuestro cuaderno, no al palo. Día de Grayson. Más estudiantes para que yo recuerde. Está bien. Y ahora importar biblioteca. Una cosa debo decir, ¿Por qué estabas conmigo? Por favor practica todo este comando y escríbalo. No copie y pegue la razón por la que estoy insistiendo en su tipo porque está tan desarrollado el hábito. Deberías recordar todo este mandamiento de memoria. Porque cuando vas a entrevista para la ciencia de datos, nuestro trabajo de aprendizaje automático, hay una muy alta probabilidad de que pregunten Bueno. Por lo que te darán un problema. Y te pedirán desarrollar un algoritmo y es posible que no tengas el privilegio de copiar y pegar ahí. Entonces por eso aprovecha todas estas conferencias. Yo estoy escribiendo aquí. Sígueme y desarrolla el hábito y escribe todos y cada uno de los comandos. Estas cosas que ya debes recordar de memoria. De acuerdo, lo
he hecho varias veces, así que voy a ir muy rápido aquí en puerto no. P I m p Import bond PD Matt bloqueado y yo sea No seas un prat como ph d Está bien, siguiente, vamos a leer nuestra pelea B d perro, pero comer. Sí, aquí Q t lo despidió junto con cuando no sabes que el expediente. Podría haber tenido que luchar contra el banco lleno. Darcy s, Nosotros y banco. Es, sin duda CS tres, la completa tiene alrededor de 400,000 tarjetas D. Es demasiado grande para que experimentes. se puede hacer. Pero si lo estás haciendo en tu propia computadora, varias cosas como el análisis y el si estás escribiendo están trazando un gráfico. Esas cosas serán muy lentas. Entonces por eso sugiero usado este banco y su sin duda CSP, que sólo tiene 4000 autos en un diario meted en este caso, es mismo Colin. De acuerdo, Dicen que lo hicimos bien. En lo que va, entonces esto. Sí. Algo no está bien. Ah, aquí. Es lo mismo. Según la verdad de aquí adentro vamos. 21 columnas. Por lo que hay 20 valores fetales. Y por qué Por aquí, ese es nuestro objetivo Variable. Sí. No, tendrá los valores. Sí y no. Entonces dice: ¿
Dónde implica esto? ¿ Pero el banco? ¿ Fue producto o no? Por el momento, tan bueno. Ahora inician el ataque. Florissant lo hizo, uh ¿qué hacemos? De lo primero. Lo primero es que revisamos el sorbo de nuestros datos de punto 4119. muestran esas 21 columnas. A continuación, vamos a ver las lecciones trimestres. Oh, Aquí, vamos a ver. Edad. Uh, bastante bien. No correlacionado con ninguna columna. Do Resucitado Se ve bastante bien Campaña. Bastante bien. Tres días, pero un buen Fue bastante buen premio. Diversos. Y parece que depende de em previo y éste. Pero sabemos que esto implica variable. Muy recientemente, Esto se va a basar en los chicos empleados o no. Entonces creo que esto debería estar bien. No tenemos que hacer nada de esto, creo. ¿ Qué? Se ve bien. Ya podemos llorar. ¿ Cuáles son los temas? Flores y luce bien. Creo que podemos ir de pie el pre procesamiento de datos ahora en las personas de datos. Entonces creo que lo primero que vamos a hacer si etiquetamos en la corte todo esto muy ambos. Pero antes de esa carta separan nuestra x e Y porque vamos a etiquetar en la corte sólo X. Ellos independientes Muy sobre No por qué. De acuerdo, entonces es muy fácil. ¿ Por qué va a ser esta variable objetivo? ¿ Por qué aquí? Entonces, ¿por qué es muy ZDF blanco así? Y X va a ser todo. Pero, ¿por qué? ¿ Verdad? Ok, ¿tienes gota de punto? Por qué eje va uno el bueno. Tenemos X e y derecha. Y lo siguiente nos vamos con la etiqueta del dedo del pie en la corte. Por lo que de ella es Galen dot pre procesamiento importación a mano de obra en trimestre un cuello. Por supuesto, vamos a crear instancia fuera de etiqueta en trimestre. En lo que va tan bien. Por lo que hay 21 columnas de las cuales 20 son valores destacados. Por lo que tenemos que incluir 20 columnas aquí. No voy a desacreditar 81 de ellos uno por uno. En cambio, esta vez voy a usar un lejos hasta ahora por Dean Range blend off Dark column Así que esto
devolverá 21 porque hay 21 columnas. De acuerdo, entonces esta pendiente va a correr por 20 veces. Se inicia. Yo parezco sí. BC dot Fit No formes ex dot Me encanta este. ¿ Lo hizo Lettie? Tenemos las columnas codificadas. Se ve bien, Pero mira los valores. 12 1 entonces por 24 día en 1 56 Así que todos están en una escala diferente. Entonces pongámoslos en la misma escala, ¿verdad? Entonces lo hacen desde Sí. Kailyn oscuro pre procesamiento importarlo estándar. Es levantarse. Y estamos aquí también. Primero vamos dedo del pie crear en la instancia Fuera de la tierna es clase asesina. Sí. D d c l a stander conseguir, uh Y entonces vamos a transformar. Ah, sí. ¿ Lo hizo es puntar Fit Transformar X poco en ella. Bastante bien en esto, pero te das el hit ahora esto es tierno. Es asesino ha convertido a esta X en remolque como peleas. Ver aquí ahora es un No es más un lazo. A Afrim estatal. Es por eso que muy me puse cabeza le dio Soto ver primeros pocos Porque tenemos que
convertir primero a marco de datos. Lo hicimos de Vergüenza X y entonces o aquí lo vemos. Eso serviría aquí. Está bien. Muy goto. Yo los amo. Mira. Misma escala. Ahora, ahí alrededor de uno. menos de uno por ahí. Uno se ve bien. Ahora es el momento adecuado Toe dividió nuestros datos en el entrenamiento y lo probó. Eso es todo. Hagamos eso.
28. LogisticsRegressionDemoUsethisone paso de la vezuna: de la muerte. Guillen dot Asesinato Coleccionando importación entre gusto Es un poco X dentista. ¿ Por qué? Por qué el gusto va a ser tren sabor esta split x e Y dist suspiros va a ser mismo puntiaguda dedo del pie en un aleatorio hizo. Si Fido se ponen bien, saquemos esta cinta de Egipto a cambio que veo. Yo sólo derecho adolescente? No. ¿ Por qué? Simplemente muy bien. Tenemos X tren f gusto con razón y más ligero. Ahora es el momento de tener de mortero de Sí killen dot lean years Importar no autista Grayson . Y sí primero creamos es chance off logistica rechristen Autistic No, solo griffin coqueto. Y luego nos vamos a poner dedo en forma. Ya sabes, veo oscuro ajuste el x 10 encendido, correcto. Muy bien. Por lo que nuestro modelo tiene frijol fit con los datos de entrenamiento en. Ahora este solo d mortero y predigo por qué el comercio de subrayado va a ser amarillo Dardo de mar. Predice picos Dist! Impresionante. Entonces conseguimos nuestra predicción por qué. Ahora Lay hace una precisión testy fuera de nuestros valores y. Cómo la equidad lo consideraba de si matando a los médicos de importación imprimen, podría tener garrapatas de guante C. No eso podría isi Es bueno. Por qué tía, sprint nuestro Mar Amarillo, no predecir X ls aquí. Entonces en lugar de solo poner prueba X, vamos a predecir UN X completo y comparado con el valor y real 91% Debo decir que esta es una muy buena puntuación toe logística solicita y encajan muy bien para este levantamiento conjunto de datos. Vea los valores reales suficientes de la empresa con los valores pronosticados.
29. LogisticsRegressionDemoUsethisone paso de la vez: muy bueno. Por lo que vamos a crear un nuevo dato de D F. Tres con real sobre valores pronosticados. BD dot data fame. Valor real va a ser ¿Por qué no perder en valores pronosticados va a ser este tipo Elsie , predecir ese acto y se va a ir aquí en adelante. Entonces imprimamos los tres, reales y pronosticados están apareándose. Si digo 1er $15 es todo coincidente. Entonces, ¿por qué no escribir algo para que podamos comparar lo real y pronosticado para todos los 4119 2 autos? Listo, que vamos a escribir una pequeña pipa y corte para comparar nuestros valores reales con los valores pronosticados para cada 4119 tarjetas D en él nos dará el número fuera de registros para los que en realidad no importa con los valores pronosticados. Entonces, empecemos. En primer lugar, vamos a poner nuestro contador a cero, y después de eso, vamos a correr un lejos para yo en cambio pelusa día de tres, que va a regresar 4100 veces aquí. Entonces voy a correr de 0 a 4119. Eso es por todos estos escribieron. Vamos a comparar real con el pronosticado así dar de de tres dardos idoc I cero, que en realidad no está equipado para hacer tienes tres oscuros me encanta, quiero que se predice luego inclement el contador por uno. Y al final vamos dedo del pie batir el mostrador. Entonces vamos a correr este pozo aquí 3 56 registros. Por lo que eso significa fuera 4119 solo 3 56 3 tarjetas no se cumplen con el valor predictivo. Por lo que el real no coincide con pronosticado para 3 56 reglas Eso es muy menor para 4119. Entonces te dieron un muy buen asesinato. Por supuesto entiendo estos 3 56 que podrían haber calculado peso en moneda también. Pero yo sólo quería para que usted también pueda escribir un bocado e ir a hacer lo mismo en el querido. Una pelea frenética en la corte es que en realidad se pueden ver todos esos saludos donde estos bien no
se cumplieron. Podrás imprimir todos esos DF tres. Yo miro aquí y veo todos esos costos. Buena coalescencia del congreso una vez más has terminado la logística retrocediendo sobre Con la tasa de
éxito del 91% pudiste predecir si los clientes han comprado el producto de
depósito bancario no lo son. Se puede usar lo mismo, misma lógica en otros datos. Sentarse igualmente conjuntos de datos y practicarlo. Buen trabajo. Te veré en próximas conferencias.
30. Máquina vectoriales de apoyo: Hola ahí. Bienvenidos a esta conferencia. Sigamos trabajando en esta misma fuente de datos. El origen de datos Trabajamos durante la logística rechristen Un muy en un banquero waas tratando vender un depósito bancario dedo del pie a sus clientes en DA Teníamos una fuente de datos fuera 4119 de sus lecciones en. En base a eso, estábamos tratando de predecir si el cliente va a protestar por el producto del depósito bancario o no . En durante la mayor Crescent de la Victoria, pudimos predecir hasta la precisión off 91% sobre de 4119. Tenemos 3 56 predicen síndrome. Trabajemos en el mismo conjunto de datos y veamos si podemos conseguir alguna mejora Si
seguimos la máquina vectorial de soporte. De acuerdo, comencemos Primero necesitamos importar el dedo del pie la máquina de vectores de soporte. Entonces desde la escala y no Sí, VM comport. Sí, ya vemos. Y a continuación tenemos que crear la instancia off. Sí, ya vemos. Entonces sí, vemos clasificador. Por supuesto que puedes dar cualquier nombre aquí, ¿verdad? Ya lo sabes, ¿verdad? Sí, vemos en entonces nunca podría este juicio e cerca de coronel primero. Entonces magra años adelante, luego al azar. El estado cero on. Entonces lo vamos a encajar. Sí, ya vemos. Punto de fuego con clase Ajuste libre para ser ex tren en blanco tendencia. Muy bien. En lo que va tan bien. Entonces nos dieron el Ah, sí. Ya ves, Clasificado definido. Y nos equipamos con los datos de entrenamiento. Ahora que nuestro modelo está capacitado, obtengamos el valor predictivo. ¿ Por qué pujar? Sí, vemos Grassy para cabello igual Sí, vemos Dardo de fuego con clase, predigo. Y vamos a pasar X dist! Muy bien. Tenemos esto. Siguientes letras. Descubre la precisión esta vez y ya la tenemos aquí. Entonces, ¿quién energía con lo mismo? No necesitamos volver a importar médicos porque ya está importado en este cuaderno que
llevamos a cabo Di mis mejillas, y luego solo decir de este tipo de aquí. Uh, ¿por qué? Y bar ver texto ST FX. You not plus X 9164 Vamos a ver qué Wasit antes 9135 Tan poco bitty room mint? No podría, en realidad. Sí, Así que hay mejoría, pero no mucho. Ahora veamos cómo Maney Porque nuestra sigue equivocada. La última vez en logística está de acuerdo. Y fueron 3 56 Y esta vez no voy a escribir la misma lógica esta vez. Vamos a usar Matics confusos. Hagámoslo. De acuerdo, entonces desde tierra DSK, no médicos Importa confundiendo Matics por aquí. Digamos C Ah, agua. Sí, Ya vemos. Yo t f confuso médicos igual a confundir y mis trucos. Y por aquí pasaremos el dedo del pie. ¿ Por qué? Y el predicho rival Lou. Entonces este tipo, lo ven lo mejor aquí. De acuerdo, Y entonces alguna vez le imprimimos nuestros confusos médicos. De acuerdo, espero no haber hecho ningún tipo de lesbiana. Está bien, Hashem. Por lo que 2 72 más 72. Por lo que siguen ahí alrededor de 3 44 autos equivocadamente. De 4119. Entonces 3 44 predicciones equivocadas. Entonces hay una mejoría. La última vez fue 3 56 Esta vez es solo 3 44 Así que 14 Ah, mejores predicciones ahora, comparación con la última vez dedo del pie alguna mejora en siguiente Lecter. Vamos a usar al diferente coronel, no un lineal sino RB de Coronel on. Ya veremos si hay alguna mejora
31. Máquina vectoriales de apoyo: Hola ahí. Bienvenidos a esta conferencia. Sigamos trabajando en esta misma fuente de datos. El origen de datos Trabajamos durante la logística rechristen Un muy en un banquero waas tratando vender un depósito bancario dedo del pie a sus clientes en DA Teníamos una fuente de datos fuera 4119 de sus lecciones en. En base a eso, estábamos tratando de predecir si el cliente va a protestar por el producto del depósito bancario o no . En durante la mayor Crescent de la Victoria, pudimos predecir hasta la precisión off 91% sobre de 4119. Tenemos 3 56 predicen síndrome. Trabajemos en el mismo conjunto de datos y veamos si podemos conseguir alguna mejora Si
seguimos la máquina vectorial de soporte. De acuerdo, comencemos Primero necesitamos importar el dedo del pie la máquina de vectores de soporte. Entonces desde la escala y no Sí, VM comport. Sí, ya vemos. Y a continuación tenemos que crear la instancia off. Sí, ya vemos. Entonces sí, vemos clasificador. Por supuesto que puedes dar cualquier nombre aquí, ¿verdad? Ya lo sabes, ¿verdad? Sí, vemos en entonces nunca podría este juicio e cerca de coronel primero. Entonces magra años adelante, luego al azar. El estado cero on. Entonces lo vamos a encajar. Sí, ya vemos. Punto de fuego con clase Ajuste libre para ser ex tren en blanco tendencia. Muy bien. En lo que va tan bien. Entonces nos dieron el Ah, sí. Ya ves, Clasificado definido. Y nos equipamos con los datos de entrenamiento. Ahora que nuestro modelo está capacitado, obtengamos el valor predictivo. ¿ Por qué pujar? Sí, vemos Grassy para cabello igual Sí, vemos Dardo de fuego con clase, predigo. Y vamos a pasar X dist! Muy bien. Tenemos esto. Siguientes letras. Descubre la precisión esta vez y ya la tenemos aquí. Entonces, ¿quién energía con lo mismo? No necesitamos volver a importar médicos porque ya está importado en este cuaderno que
llevamos a cabo Di mis mejillas, y luego solo decir de este tipo de aquí. Uh, ¿por qué? Y bar ver texto ST FX. You not plus X 9164 Vamos a ver qué Wasit antes 9135 Tan poco bitty room mint? No podría, en realidad. Sí, Así que hay mejoría, pero no mucho. Ahora veamos cómo Maney Porque nuestra sigue equivocada. La última vez en logística está de acuerdo. Y fueron 3 56 Y esta vez no voy a escribir la misma lógica esta vez. Vamos a usar Matics confusos. Hagámoslo. De acuerdo, entonces desde tierra DSK, no médicos Importa confundiendo Matics por aquí. Digamos C Ah, agua. Sí, Ya vemos. Yo t f confuso médicos igual a confundir y mis trucos. Y por aquí pasaremos el dedo del pie. ¿ Por qué? Y el predicho rival Lou. Entonces este tipo, lo ven lo mejor aquí. De acuerdo, Y entonces alguna vez le imprimimos nuestros confusos médicos. De acuerdo, espero no haber hecho ningún tipo de lesbiana. Está bien, Hashem. Por lo que 2 72 más 72. Por lo que siguen ahí alrededor de 3 44 autos equivocadamente. De 4119. Entonces 3 44 predicciones equivocadas. Entonces hay una mejoría. La última vez fue 3 56 Esta vez es solo 3 44 Así que 14 Ah, mejores predicciones ahora, comparación con la última vez dedo del pie alguna mejora en siguiente Lecter. Vamos a usar al diferente coronel, no un lineal sino RB de Coronel on. Ya veremos si hay alguna mejora
32. SVM RBF: Hola. Ahí va a volver. Por lo que la última vez utilizamos el área carnal lineal Line. Sveum Coronel. Y obtuvimos 91% de precisión y tuvimos que 44 registros. Siguen prediciendo mal. Bueno, ahora vamos a usar RBF Coronel, y a ver si hay alguna mejora. Entonces vamos a seguir adelante. Copia. Este año, no este tipo. Copiado es bueno. Aquí en nos reportan el spc. Por lo que no tenemos que importarlo de nuevo. Y si estás reabriendo este cuaderno, por
supuesto hace cada corrida aquí Andi usado Selecciona a este tipo. Está bien, está bien. Digamos su estado apagado. Sí. Ya ves, clasificador, déjame estar dis completando aquí, ¿de acuerdo? Y ahora, en lugar de lineal, vamos a decir rbf on. Voy a nombrar a esto diferente. Uh, esto podría ser yo si y luego uno más subrayado. Yo estaría si y eso es todo. Está bien. Muy bien. Así que la instancia clasificador Rbf se ha creado en Vamos a hacer la predicción ahora subrayado R B si en él, dar en Dixon. Está bien. Nos dieron nuestra predicción en fecha medir la precisión. Muy bien. Entonces esta vez es mejor. Es un 93%. La última vez fue del 91%. Por lo que conseguimos un 2% de mejora. Veamos, nuestras métricas confusas es cualquier mejora en el número off Predicciones equivocadas. Ah, bu esto. ¿ Podría serlo? Sí, en. OK, ahí. ¿ Ver? 27 51. Así lo hacen 70. Ah, hay una enorme mejora que la mejora? Alrededor de 66 registros. Sí. Por lo que ahora el número total fuera de ronda críticos sentidos bajó del dedo del pie al 78 comparado con toa 3 44
Apellido . Hay mejoría fuera de 64 tarjetas d. Eso es un grupo. Buena mejora sobre hay un bastante apagado 50 93%. Por lo que parece que voy a ser de Coronel se ajusta mejor en este caso de datos, luego el Lee cerca de Cannon Art en los seis más grandes. Por lo que la conclusión es hasta ahora nos pusimos de pie estar usando RV de Coronel para este dato. Está bien, muy bien. Seguiremos mirando otros algoritmos. Onda. Tinta fina. Esto son así los veré en próxima conferencia
33. Probación total de BayesThereom: Hola ahí. Bienvenido, a este Richter. Es el momento de hablar sobre basado aquí, pero antes de que realmente nos demos una inmersión más profunda en Beith aquí, um, revisemos los conceptos básicos son probabilidad, y esto te ayudará a refrescar tus conocimientos fuera de la probabilidad en. Después de eso, extenderemos el mismo problema. Dos. Con base aquí. Empecemos. Consideremos que tienes dos cajas. Box uno con a tipo de bolas, nueve bolas rojas y cinco bolas azules, y luego box do con otra vez a tipo de bolas. Cuatro. Bola roja sobre 11 bolas azules. Por el momento, tan bueno. Ahora estás recogiendo sobre lo que no sabes de beat box. Acabas de coger todo. Y ahora tienes que encontrar la probabilidad de que hayas escogido esa pelota de la Caja uno y luego ¿qué? Es una probabilidad fuera de ti escogiendo una bola azul de la Caja uno. De igual forma, ¿cuál es la probabilidad de que elijas una bola roja de Box to are? ¿ Cuál es la probabilidad de que pocos escojan una bola azul de box a? Por lo que se trata de cuatro opciones que podrían haber sucedido. Podrías haber escogido una pelota roja del boxeo o una bola azul para la de Ambac. Uno son Bola roja, desde Bach hasta nuestro puntera de caja frontal Global sobre. Nos vamos del dedo del pie. Encuentra la probabilidad de cada uno de estos en un asunto muy sencillo. Entonces, empecemos. En primer lugar. Tenemos que evento parejo. Uno que podemos escoger de esta caja son incluso dedo del pie. Podemos escoger del jefe engrosado. Por lo que dos posibles incluso tú puedes escoger de estos libros son de esta caja. Sólo hay dos cajas ahí. Por lo que posibilidad unos cuantos recogiendo el balón de la Caja uno es uno por dos. Porque sólo hay dos eventos posibles. Solo hay dos cajas, por lo que el número total de combinaciones fuera posible es salir de eso. Si eliges de la casilla uno, la probabilidad de que eso suceda es uno por dos. De igual forma, la
probabilidad de recoger de caja a es de uno por dos. Llamemos cuál es la probabilidad de recoger bola roja de la caja cuando hay nueve
bolas rojas y hay 14 número total de piezas, lo que probablemente unos cuantos recogiendo bola roja de la Caja uno es de nueve por 14. De igual forma, probabilidad. Unos cuantos recogiendo bola azul de la Caja 1/8 cinco por 14. De igual manera, probablemente fuera de recoger gran bola de box para comer cuatro por 15 Número total de piezas es de 15 Redwall cuatro por lo que cuatro por 50 y probablemente una bola azul pick de Bach a es l A. Ganado por 15. Por el momento, tan bueno. Ahora empecemos a calcular estas probabilidades. Empieza con el 1er 1 probablemente fuera escogiendo una bola roja de la Caja uno, lo que se estaría multiplicando incluso por P. R. Incluso PR, aunque estés recogiendo bola roja, considerando el primer cuadro considerando el ocurrió primer evento, por lo que se llama P están considerando, incluso sucedió. Y es decir, si multiplicas p par y P R condicionado incluso sucedió, eso te dará la probabilidad de recoger bola roja de la Caja uno para que se ganara por dos. Multiplicado por nueve por 14. Eso sería nueve por 28 32% de probabilidad. ¿ Cuál es probablemente de ti? ¿ Recogiendo el balón azul de la Caja uno otra vez? Uno por dos en cinco por 14 cinco por 28 18% aproximadamente 18% misma manera probablemente fuera de recoger una
bola roja de caja a uno por dos en cuatro por 15 para para por 2013% Probabilidad sobre probabilidad de escoger una bola azul de caja a así uno por dos en remolque, Loon por 15 37%. Por lo que estas responde la pregunta detrás de cada probabilidad. Ahora puedes calcular cualquier tipo fuera de probabilidad posible. Entonces cuando eliges una pelota, ¿
sabes qué otras propiedades fuera de escoger una bola roja son bola azul de cualquiera de las cajas después ? Entonces, ¿quién tiene máxima probabilidad? Probabilidad mexicana es que este estatus? 1%. Esas fueron las máximas probabilidades. Terminarás recogiendo una bola azul del dedo del pie de caja. Eso es er hace una probabilidad de bomba. Si tengo que hacerlo. Qué dinero en esto, entonces pondré mi dinero en éste porque éste tiene mayores posibilidades de que ocurra 37% . Entonces ese es un fondo básico fuera de probabilidad. Cómo funciona el probablemente el. De acuerdo, ¿cuál es la probabilidad total de que elijas una propiedad de hija creíble? Por lo que esta media probabilidad de recoger Redwall de la Caja uno y esta probabilidad WAAS de recoger bola roja de la caja a así probabilidad total están recogiendo bola roja es puntiaguda dedo del pie prensa 0.13 punto 45 on. ¿ Recuerdas estos eventos del ejército mutuamente excluyentes? Eso significa que no puedes poner la mano en ambas cajas juntas y hay dos cajas Así que cuando pones la mano en ese momento, puedes poner la mano solo en una caja. ¿ Verdad? Por lo que el segundo evento no depende del primer evento. Ellos son evento mutuamente excluyentes. Entonces, ¿por eso si tienes que calcular cuál es la probabilidad total de ti escogiendo una
bola roja de cualquiera de las cajas? Eso sería punto para cinco. Eso sería total de este Prestes. De igual forma, probabilidad
total fuera de ti escogiendo un balón azul será de 0.1 lo más 0.37 punto +55 Y aquí viene la mejor parte la que todos estábamos esperando. Considera estos mismos tienes caja uno y ladra demasiado mismo número. Ofrécelo bolas y bolas azules. Exactamente. Misma situación. Pero la pregunta es diferente. La pregunta es que escogiste una bola roja. Andi, ¿cuál es la probabilidad de que este muro rojo sea de segunda vuelta? Esta es una situación interesante. Ya tienes una pelota roja. No tenías que averiguar la probabilidad de que esa bola roja sea de caja a Y ese tipo de probabilidad se llama probabilidad fuera e al dedo parejo, considerando si la bola roja así la pared roja que ya se considera bola roja es ya considerado Ya te has preocupado. Ahora tenemos que averiguar una probablemente fuera esa bola roja siendo de parque a, Así que vamos a ver qué hemos hecho en problema anterior. Entonces en problema anterior, descubrimos diferentes tipos de probabilidades, ¿
verdad? Propiedad off Si recojo toda probabilidad de que sean de Box one box a on probabilidad de que se lea de Box one Blue from box on our Bach toe y blue from Bach toe on qué total, probablemente TF que se lee fueron, dice Prue. Ahora aquí tenemos que averiguar la probabilidad de que esa pelota sea que Redwall sea de segunda caja en ese tipo de propiedad se calcule usando basado aquí. Bested um dice que P F E a R es igual a p f e. dos probabilidades de e dos y probablemente TF están considerando Ito por probabilidad total de corazón , y ya has calculado estos valores. Probablemente F E dos es uno por dos propiedad de nuestro que escogiendo rival Tia recogiendo Redwall de segunda caja Waas cuatro por 15 on Porter Probabilidad off pick rate ball de cualquiera de las cajas Waas 45% Justo en. Es así como si puedes crear, bajará a cuatro por 13.5. Por lo que tecnología 2%. Entonces responde a esta pregunta que si tienes una bola roja, la probabilidad de que esa bola sea de box a es del 30% en ese tipo de pregunta se responde usando basado aquí. Entonces esto es básico off basado aquí.
34. Introducción a la introducción al teatro de la Bayes: Hola ahí. Bienvenido al Distrito. Entonces, ¿aprendiste sobre basado aquí? Um, en conferencia previa. ¿ Cómo se basa esto aquí? Um aplicado en el aprendizaje automático para responder esa pregunta. Última mirada a este ejemplo este ejemplo contiene datos de 1000 frutas. Puede ser ardiente de plátano. ¿ Hay algún otro tipo de frutas en esto? Las frutas se identifican en base a las características como si es largo son si es dulce , no lo
son o si es L o r no. Mira. Por lo que conseguiste estas tres características en ti Tienes las clases. Consideremos tres clases. Si te dieran al azar estas características como largas, dulces y bajas, podrás decir qué tipo de fruta es? Ya sea plátano, naranja son cualquier otro tipo de fruta y este es un problema que vamos a resolver usando basado aquí. Pero si te has dado cuenta o aquí se llama cuchillos base, no se llama base. El motivo por el que se llama ni basado porque cuando se trata de usar basado aquí, um, en el aprendizaje automático, hay una gran A, algo de sol hecho y hay algo de sol es las características no están relacionadas dedo del pie entre sí Y por eso se llama mi base, porque suponiendo que las características en sus datos no están relacionadas entre sí, si algo que no sucede muy a menudo, y por eso se llama cuchillo. Entonces, cuando se trata de Massie aprendizaje, se llama ahora basado aquí, sigamos adelante. Por lo que una vez más tienes 1000 observaciones fuera de frutas, plátano, naranja y cualquier otro tipo de fruta en estas frutas se identifican por las características largas, dulces y bajas. Y si te dan un dulce largo en un bajo como característica, podremos decir si se trata de naranja plátano son algún otro tipo de alimento? Y ese es un reto que vamos a resolver usando la noche basada aquí. Entonces ese es el reto aquí. Consiguió una fruta al azar, que está mal, dulce y un bajo predicen si es naranja, plátano son de otro tipo para resolver este problema. Lo primero que tenemos que hacer es resumir estos datos en estos datos. Ya ves, ahí las clasificaciones y, por ejemplo, está naranja en ella. Zero on son uno basado en si la naranja es un bajo, dulce a lo largo. Entonces en este caso, este ardiente waas Una mirada. Entonces es Marcus uno Para otros, es cero. De igual manera para plátano Es un largo este plátano wasa largo, dulce y enamorado. Entonces es nuestra marca. Mejor uno para aquí Hay otro plátano que es largo pero no dulce y no mucho. A lo mejor no está maduro apropiadamente así hay 1000 registros. Así que traje para resolver este problema en subir la probabilidad primero tenemos que resumir thes datos resumió el conteo off cada uno de estos en base a
las clasificaciones, las clasificaciones es vamos a ser nuestro blanco en todas estas características es lo que va para ser nuestra X. Así que vamos a uno Este es el dato alguien Ahora ayudo este dato escuché estas clasificaciones Así que tres clasificaciones que tengo es banana están en otras Estas tres clases son como nuestros tres eventos. Entonces primero veinticinco digamos plátano chips de plátano Si escojo una fruta, ¿qué es la probabilidad? Eso es plátano. Son 500 por miles, ¿verdad? Hay un cuarto de 1000 alimentos en de esos 500 son de plátano. Por lo que la probabilidad de que sea plátano es de 501,001 por dos. Vamos a una. ¿ Qué es probablemente después de que ese plátano sea largo? Por lo que 400 por 504 por cinco. De igual manera, ¿cuál es la probabilidad? Después de que el plátano sea dulce, se
sienta Marana 3 50 por 500. ¿ Cuál es la probabilidad después de que el plátano sea un bajo? Hola 4 50 por 500? De igual forma, ¿cuál es la probabilidad de que eso sea naranja? Eso es fácil 300 por 1000 encendido. De igual
forma, es necesario calcular la probabilidad de eso. ¿ No están siendo mucho tiempo cero fuera de curso propiedad off que no están siendo dulces? 1 50 por 300 ganados por dos probabilidad de que sean cualquier ser una historia de amor terminó con 301. Entonces eso fue todas las naranjas son de color amarillo. De acuerdo, uno, digamos otros otro tipo de fruta. Si escojo un fruto, ¿cuál es la probabilidad de que ese sea otro tipo de fruta? Es uno por cinco. Y entonces, ¿cuál es la probabilidad de que ese otro tipo de alimentos sea largo 100 por 200? ¿ Cuál es probablemente toda esa otra clase de fruta siendo dulce? 1 50 por 200. ¿ Cuál es la probabilidad de que ese otro tipo de fruta sea Hola? 50 por 200. Entonces uno por cuatro. Muy bien. Tenemos esta probabilidad ahora mismo. Calculemos la probabilidad de hija E. Yo cogí una comida. ¿ Cuál es la probabilidad de que la fruta sea larga? ¿ Cómo se calcula eso? Multiplicas ese BB en remolque. Pierre, ser entonces B o en remolque. Estar fuera l con condicional probablemente fuera de otro en probablemente fuera l con condiciones otra. Y así es como vas a engañar la probabilidad de que esa fruta que recogiste sea una
fruta larga . Y por aquí se trata de encontrar cinco. De igual manera probabilidad de que esa fruta sea una fruta dulce es así es como matarás Clip on se trata de encontrar 65 y probablemente de que ese alimento sea l un alimento. Es 0.8. Entonces esta es nuestra probabilidad total. Si recojo fruta, ¿cuál es la probabilidad de que esa fruta sea larga? Están siendo dulces están siendo un bajo Así que conseguimos al individuo Probablemente estar fuera de cada uno de estas posibilidades son Ahora viene nuestra pregunta con la que iniciamos esta conferencia. El interrogante es, si eliges un dulce largo y l o fruta, ¿cuál es la probabilidad de que sea el plátano son ardientes son otros. Básicamente, tenemos que predecir si recojo traje y una fruta baja, ¿cuál será? Si va a ser plátano son no son otro tipo de comida. Ese tipo de pan. Dixon, puedes usar cuchillos basados en él. Veamos cómo ya viste que en el suero basado, vamos a usar la misma fórmula misma lógica en época basada extendida a noche y resolver este problema. Por lo que probablemente estén recogiendo un plátano como hablar a lo largo de dulce bajo un alimento bajo Largo, dulce y bajo. ¿ Cuál es la probabilidad de que sea un plátano? ¿ Viste esta línea de granja basada aquí? Um, es la misma fórmula. El fórmula dice Pebe en B l por B y luego ser dulce con condicionado. Es un plátano. Entonces propiedad de un bajo con la condición es plátano y luego dividido por probablemente fuera
Propiedad larga de dulce y probablemente de por qué esto es probabilidad de tortura. Y si haces eso, si pones todos estos valores en la fórmula, obtienes 0.97 probabilidad de ello. Ser plátano es 0.97 Deja que alguien igual, cuál será la probabilidad de que sea naranja la propiedad de que sea de Oren será cero porque propiedad off no están siendo mucho tiempo. Es cero así que fuera de curso No es un ardiente porque probablemente off están en ser largos, que es uno de los criterios en esto y la clase es cero, Así que no está en por traje. Cuál es la propiedad fuera de ella siendo otro pie mismo. Poner la fórmula aquí en poner los valores probablemente de que sea cualquier otra fruta es 0.7 Entonces, ¿quién es el ganador? El Venus es plátano. Es así como se pueden predecir las clasificaciones y fuera de cualquier fruta nueva. Si sabes que las características son que las características de la fruta fuera del punto, Considera esto como un conjunto de datos ahí mismo. ¿ Tiene 1000 registros? Si agregas un nuevo dato y conoces la característica de los datos usando noche basado aquí, um, puedes clasificar muy ¿Que los datos pertenecen aquí. Teníamos tres clasificaciones y teníamos tres características para jugar y pudimos
predecir que el nuevo punto de datos pertenece toe vit clasificaciones usando la noche basada aquí. A continuación, vamos a hablar de cómo y dónde en el aprendizaje automático se utiliza esta era basada en la noche. Hablaremos de ejemplos del mundo real donde el héroe basado en la noche Es una muy útil en cómo se usa. Te veo en próxima conferencia.
35. GaussianNB: Hola. Llegará dedo del pie esta conferencia en manos sobre práctica fuera noche con base aquí, um, en Massillon e nueve con base aquí, um, se
puede extender en Massillon en varias formas en una de las granjas de uso común se llama Noche guardiana Abejas. Causa Ian knife based asume que las características en sus datos siguen la distribución normal. Ya has trazado la distribución fuera de los datos fuera del largometraje en conferencias anteriores en manos anteriores la práctica está usando Seaborn y sabes cómo se
ve ni modestia Wilson . Entonces si tus datos, tus características se ajustan a distribuciones normales, entonces puedes usar el clasificador basado en Goshen NY para clasificar tus datos en esta conferencia en esta mano néctar. Eso es lo que vas a hacer. Entonces empecemos por ello. ¿ No es que ya escribí el programa departamental de programas en esta ocasión me voy de pie pasar por toda la cancha de patentes que escribí en este cuaderno de Júpiter. El código python en esto ya está ahí. Dije, también
es esta conferencia para que puedas tomarla y la puedas escribir por tu cuenta. Entonces, empecemos. Por supuesto, el primero se tiene que importar todas las bibliotecas importantes MP pandas. Matt trajo P un complot Seaborn y s Kaylan Matics. Correcto. Está bien. Una vez que importas todas las bibliotecas a continuación, te vas del dedo del pie. Lee el banco. ¿ Dardos adicionales? Sí, Presentamos en remolque. Marco de datos de Pandas en impreso el F fue golpeado. Se trata de los mismos datos que utilizaste en prácticas de manos anteriores No ganancia y fuego con clase y otros clasificados Vas a utilizar los mismos datos. Siéntate. A ver si hay alguna mejora con Bahía Gaussiana Clasificada. ¿ Verdad? Entonces, como lo hiciste antes, crea el vínculo un estado después de él y solo imprime la cadera. Muy bien. 21 columnas, correcto el. Veamos los correlatos y una vez más. Recuerda, en caso de noche basado aquí, um, la suposición es y la más importante Ah, algunos enviaron facilidad de que las características no son en absoluto dependen unas de otras. Son completamente independientes en. Es por eso que Repasemos el Coriolis y de nuevo en mix tu cualquier dependencia entre las características se elimina. Entonces Randy's de after court on Repasemos esto ahora o aquí si ves este año. Ah, Bharti um está 0.94 relacionado con implicarlo que estaban ahí muy relacionados entre sí, por lo que es necesario quitar uno de ellos. Entonces voy a la mudanza. Ya sabes, bomba, Este de aquí en el siguiente está por aquí, Imply tenían razón, Correcto. Eso es 0.97 relacionado con este tipo. De acuerdo, así que uno también se iba a quitar el dedo del pie. De acuerdo, así que sigamos adelante. Eliminemos esas dos características del marco de datos. Ejecute este comando en. Vamos a correr el Corey. Escucha de nuevo en creo que esta vez se ve mejor. Ya no veo ninguna característica fuertemente correlacionada, Así que podemos querer Podemos continuar con estas características encendidas. Es hora de definir tu camino y definir tu ex. Y ahora lo mismo que tenemos que hacer etiqueta incluyendo en esto es la misma pelea en la corte Orina en conferencias anteriores. Lo mismo aquí. Hacer el nivel. De acuerdo con una impresión menos después de esto. Veamos cómo se ve nuestra X después de esto por aquí. De acuerdo, estaban adentro. De acuerdo se hace. Las salidas son un y son el único contiene los números, por lo que nivel, incluyendo los Bueno en siguiente. Un estándar es asesino aquí en. Volvamos a imprimir la X a ver si es bueno. Sí. Todos los valores son más o menos. Parece que todo tiene frijol escalado. Bueno en. Ahora es de lo que estábamos hablando. Todas las características deben seguir. Distrito normal no era así que escribí esto es más programa aquí Muy en. Estoy ejecutando un bucle para todas las columnas. Entonces si bebes esta puerta de salida Sape, Si voy por aquí, digamos que solo veo X No bebas. Entiendo esto. 4119 crecimiento y 80 columnas. Por lo que 18 características justo en. Tengo dedo del pie dibujar esta trama para todos 18 de ellos para asegurarme de que el todo siguiendo nuestra modestia no
estuviera encendido. Por eso estoy ejecutando este bucle. Si digo Xscape uno que gana, será 18 Aquí. Yo estoy corriendo este techo desde para el rango fuera de este número de columnas. Por lo que Niños por cada columna sobre él harán el mar bon perturbación y trazado. Enseguida pues estoy demandando. Esto trajo aquí Por aquí. Si miras, todos ellos están siguiendo una distribución normal así. Este sorbo bíblico indica dis normal a Wilson. Entonces estamos bien para ir a continuación. Al igual que siempre llamaríamos a la habilidad y selección de mortero en testes contaminados Plisado, Vamos dedo del pie dividir los datos en entrenamiento y tamaño de prueba El sitio de prueba va a ser puntual . Hasta ahora tan bueno en o aquí vía en caminar nb gaussiano derecha, Así de s Kellan Dark Knight base import precauciones Y creamos instancia off Gaussian y nosotros en entonces alimentamos datos de tinción la extensión y el blanco fue a nb gaussiano muy bueno. A siguiente vamos a predecir o aquí pasamos los datos de prueba y predecir los valores y por aquí Estamos calculando la precisión. Desafortunadamente, la precisión es del 88% lo que es menor 10 descomposición en y otro algoritmo Seguimos en Richter
anterior. Pero sin embargo se tiene la idea de cómo Gaussiano y nosotros podemos ser utilizados para este tipo de problemas . Nadie vamos a tener futuras manos en la práctica es donde vamos a utilizar gaussiano y nosotros Andi, con la alta tasa de precisión sobre esto es la vida real correcta. Esto es lo que sucede en la vida real. Aplicas mucho algoritmo mucho de clasificaciones en base a la precisión en la que sabrás qué algoritmo encaja remolcará estos datos. Eso es exactamente lo que estamos haciendo aquí en este momento. Ya sabes cómo entramos y podemos ser utilizados para este tipo después de que esté muy dentro. Tus características fueron una distribución normal. Entonces porque eres características siguieron distribuciones normales. Intentamos usar gaussiano y estar en este es el registro de precisión en la próxima conferencia. Nos vamos dedo del pie usado son diferentes tipos fuera de base nocturna, dos problemas diferentes y ver qué tan buena viene esa precisión. De acuerdo, te
veo en la próxima conferencia.
36. MultinormailNaiveBayes: Hola ahí. Enhorabuena por aprender sobre el suero bestia. Andi completando una práctica de sonido de mano en la noche gaussiana. Enojado. Espero que ahora entiendas la belleza detrás de ny basado aquí. Um, y lo fácil que es usar, como has visto, la base gaussiana ahora se usa para ven tus características Sigue la distribución gaussiana simple. Ahí hay otra pieza de cuchillo muy interesante y esa es multi noche Namir. Beth. En este caso, las características siguen la simple distribución de Martina en este tipo de clasificaciones. DeMartino mia las clasificaciones basadas en la noche son las más apropiadas para las características que representa contar nuestros países. Por lo que este tipo de clasificaciones se utiliza en caso apagado. Por ejemplo, un documento clasificaciones. Simplemente increíble. Ahí hay un documento y quieres dedo del pie. ¿ Entiendes? ¿ De qué se trata ese documento? ¿ De qué está hablando, verdad? Una forma de hacerlo es leer todo el mundo en su documento y luego averiguar la frecuencia de cada mundo. Entonces si está usando, por ejemplo, los mundos políticos muchas veces, entonces es documento relacionado con la política. Si está usando religiosos fueron demasiadas veces. Y se trata de documentos relacionados con la religión. De igual forma, sus correos electrónicos se pueden filtrar ya que el correo no deseado no es normal. Correo electrónico basado en el contenido. Tiene algo así como asesinatos G. Entonces esos son los casos para Martino Me una base nocturna aquí es una belleza, y se puede sentir la emoción en la de mi esposa. Lo que sea que te expliqué hasta ahora, leyendo las palabras en el documento y luego averiguando cuántas veces se usa esa palabra en que sus documentos y creando un vencedor fuera de ella todo lo que es Dios, procesamiento del lenguaje
natural. Y ese es mi tema favorito. No puedo detenerme de llevarte allí. Por lo que el procesamiento del lenguaje natural es una cosas muy emocionantes para aprender en Massie, prestar lenguaje en él necesita sus propios seis, y es por eso que me detengo aquí como primer curso de clasificador basado en la noche, seguiremos aprendiendo cuchillo multi normal base. Después hablamos del procesamiento del lenguaje natural. PNL en las próximas seis y te veo ahí