Conceptos básicos de IA: ChatGPT, Claude, Midjourney, Flux y más | Arnold Oberleiter | Skillshare

Velocidad de reproducción


1.0x


  • 0.5x
  • 0.75x
  • 1x (Normal)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Conceptos básicos de IA: ChatGPT, Claude, Midjourney, Flux y más

teacher avatar Arnold Oberleiter

Ve esta clase y miles más

Obtenga acceso ilimitado a todas las clases
Clases enseñadas por líderes de la industria y profesionales activos
Los temas incluyen ilustración, diseño, fotografía y más

Ve esta clase y miles más

Obtenga acceso ilimitado a todas las clases
Clases enseñadas por líderes de la industria y profesionales activos
Los temas incluyen ilustración, diseño, fotografía y más

Lecciones en esta clase

    • 1.

      INTRODUCCIÓN

      1:08

    • 2.

      ¿Qué es IA?

      3:13

    • 3.

      Qué son los LLM como ChatGPT, Claude, Gemini, etc.

      13:54

    • 4.

      Las interfaces de los LLM

      8:39

    • 5.

      ¿Qué pueden hacer los LLM?

      8:20

    • 6.

      Ingeniería rápida

      10:59

    • 7.

      Más consejos rápidos de ingeniería

      9:36

    • 8.

      Personalización de LLM con indicaciones del sistema y RAG (generación aumentada de recuperación)

      9:19

    • 9.

      Perplejidad y Huggingchat

      1:07

    • 10.

      Los desarrolladores pueden usar LLM a través de la API OpenAI

      7:11

    • 11.

      Resumen de los estudios LLM

      2:57

    • 12.

      Explicación del modelo de difusión

      5:38

    • 13.

      Ingeniería de instrucciones para modelos de difusión: comienza con DALL E

      7:15

    • 14.

      Conceptos básicos de Midjourney

      10:09

    • 15.

      Ideogram y Adobe Firefly

      7:55

    • 16.

      Modelos de código abierto

      13:33

    • 17.

      Resumen de la generación de imágenes con modelos de difusión

      1:31

    • 18.

      Videos de IA con Kling AI

      15:34

    • 19.

      Texto para hablar con ElevenLabs y más

      21:20

    • 20.

      Transcribir con susurros

      3:25

    • 21.

      Generación de música con IA con Udio

      6:38

    • 22.

      ¡Recapitulación y GRACIAS!

      3:39

  • --
  • Nivel principiante
  • Nivel intermedio
  • Nivel avanzado
  • Todos los niveles

Generado por la comunidad

El nivel se determina según la opinión de la mayoría de los estudiantes que han dejado reseñas en esta clase. La recomendación del profesor o de la profesora se muestra hasta que se recopilen al menos 5 reseñas de estudiantes.

191

Estudiantes

1

Proyectos

Acerca de esta clase

Domina la IA rápidamente, sin sentirte abrumado

Estás ocupado, lo entendemos. Quieres aprovechar el poder de la IA, pero no tienes tiempo para un curso de 50 horas.

Imagina adquirir habilidades prácticas de IA que aumenten de inmediato tu eficiencia en gráficos, texto, correos electrónicos, código y más, todo sin la complejidad.

Por qué este curso es perfecto para ti:

  • Aprende rápido: sumérgete directamente en aplicaciones prácticas de IA que puedes utilizar de inmediato.

  • Aumenta la eficiencia: automatiza y mejora tus tareas diarias para ahorrar tiempo y recursos.

  • Destaca: impresiona a tus colegas y amigos con tu nueva experiencia en IA.

Lo que ganarás:

  • Comprender con claridad los fundamentos de la IA: comprende la IA, los modelos de difusión y LLM sin jerga técnica.

  • Domina la ingeniería de indicaciones: libera todo el potencial de ChatGPT y otros LLM como Gemini, Claude o Llama con indicaciones eficaces.

  • Crea imágenes impresionantes: usa modelos de difusión como DALL-E, Adobe Firefly, Stable Diffusion, Flux, Recraft y Midjourney para generar gráficos increíbles.

  • Explora la IA en los medios: sumérgete en videos, narraciones y música con IA para elevar tu creación de contenido con herramientas como Elevenlabs, Kling, Runway, Pika y más

En resumen: dominarás la IA lo más rápido posible.

Conoce a tu profesor(a)

Teacher Profile Image

Arnold Oberleiter

Profesor(a)
Level: All Levels

Valoración de la clase

¿Se cumplieron las expectativas?
    ¡Superadas!
  • 0%
  • 0%
  • Un poco
  • 0%
  • No realmente
  • 0%

¿Por qué unirse a Skillshare?

Mira las galardonadas Skillshare Originals

Cada clase tiene lecciones cortas y proyectos prácticos

Tu membresía apoya a los profesores de Skillshare

Aprende desde cualquier lugar

Ve clases sobre la marcha con la aplicación de Skillshare. Progresa en línea o descarga las clases para verlas en el avión, el metro o donde sea que aprendas mejor.

Transcripciones

1. Introducción: Tu Buzzy y yo lo entiendo. La IA puede parecer complicada y quieres aprenderla lo más rápido posible. Con un horario atrasado y un trabajo de tiempo completo, no tienes tiempo para pasar por un curso de 50 horas. Solo quieres habilidades prácticas de IA para aumentar la eficiencia en gráficos, texto, correos electrónicos, código y más. Si ese eres tú, entonces este curso es perfecto. Imagínese impresionar a todos con conocimientos de IA, bien, cuando cuenta Te cruzaste como un verdadero profesional. En este curso, obtienes una comprensión clara de la IA, las LLM y los modelos de difusión, cómo usar LLM como Chachi BT, con ingeniería rápida, explorando modelos multimodales y de alto rendimiento, impulsando técnicas para modelos de difusión como Dai AdaObviaFly, impulsando técnicas para difusión estable de media hora, de la IA, las LLM y los modelos de difusión, cómo usar LLM como Chachi BT, con ingeniería rápida, explorando modelos multimodales y de alto rendimiento, impulsando técnicas para modelos de difusión como Dai AdaObviaFly, difusión estable de media hora, flujo y más. los conocimientos sobre videos, voces e incluso la creación musical impulsados por IA . Y por cierto, si te preguntas quién soy mi nombre es Arnie, y doy clases de IA antes de que ChiPT incluso fuera una cosa Así que estoy relativamente largo en el juego. También tengo un pequeño canal alemán de YouTube, y eso es lo que hago. 2. ¿Qué es IA?: Podemos profundizar en el mundo de la IA, necesitamos definir qué es realmente la IA. Entonces la IA es simplemente un término en ciencias de la computación. El objetivo es crear máquinas con inteligencia humana. Por ejemplo, reconocimiento de patrones, toma de decisiones basada en datos y también ejecución de tareas. Y no pienses en terminator. Se trata de tareas sencillas. También puede estar escribiendo algún texto como lo hace Chachi Pit. ¿Cuál es el objetivo final? El objetivo final es AGI, por lo que la inteligencia general artificial. Y eso simplemente significa aprender, comprender, resolver problemas y procesos creativos, así o mejor que los humanos. Entonces, la inteligencia general artificial es más inteligente que la mayoría de los humanos, y ese es un objetivo y nadie sabe exactamente cuándo se alcanzará esto. Y meta final y nadie sabe si esto alguna vez sucede es ASI. Super inteligencia artificial. Esta IA sería más inteligente que todos los humanos combinados. Y como dije, no pienses en terminator ahora mismo. ¿Qué no es la IA? La IA no es todo saber, no es segura de sí misma, no tiene emoción, y el objetivo actual es simplemente lograr una meta establecida. Dile a la IA, oye, escríbeme algún texto o hazme una foto y la IA lo hará. Eso es por ahora, pero también tenemos robótica y demás, pero ese no es el tema principal en este curso Vamos a hacer algunos ejemplos aquí mismo, y también puedo escribir esto. Entonces algunos ejemplos tenemos asistente de voz, y la mayoría de ustedes conocen asistente de voz. Entonces CiRIA s Google Assistant pero también GPD voz y simplemente entienden y responden a los comandos de voz La voz GPT o la API de WISPA es realmente genial. También nos sumergiremos en esto más adelante en el curso. Entonces tenemos sistemas de recomendación, y esto es viejo. Solo piensa en Netflix o Spotify o incluso YouTube. Miras el video, y en base a tu comportamiento, los algoritmos encontrarán videos similares. Y luego también tenemos conducción autónoma. Así que los autos autónomos usan IA para entender dónde están y luego conducen en esa dirección. Y esto es simplemente IA real. Como el FSD de Tesla, por ejemplo, es real AI, por lo que no están programados para conducir en esta carretera Miran el camino y luego ajustan su comportamiento. Y por supuesto, tenemos LLM y modelos de difusión. Tan grandes modelos de lenguaje y modelos de difusión. Los modelos de lenguaje grande hacen que los modelos de texto y de difusión hagan imágenes. Esto de aquí mismo es el núcleo. Y porque es el núcleo, comenzamos con LLM Entonces en el siguiente video, voy a ver y vamos a echar un vistazo más de cerca a lo que son los LLM 3. Qué son los LLM como ChatGPT, Claude, Gemini, etc: De la gente conoce HachBD. JacPT es un LLM, y aquí puedes hacer muchas cosas y vamos a hacer una inmersión profunda en Pero déjame decirte, tenemos muchos más LLM. Básicamente, si vas en este sitio web, el chatbot arena, ves que tenemos muchos LLM diferentes Vienen de Opie, por lo que HaChipt viene de Opeie Entonces tenemos a Géminis. Esto viene de Google. Tenemos a Grock. Esto viene del XI, por lo que ELN Mask Tenemos nube, nube viene de trópico. Sólo quiero decirles que tenemos muchos LLM diferentes Y en este video, quiero mostrarte cómo funciona un LLM porque necesitas entender los conceptos de tokens y así sucesivamente para poder usarlos correctamente porque tokens y la estructura de un LLM es importante para que puedas usarlo correctamente lo más rápido posible Básicamente, son sólo dos archivos. Y hacemos sólo un ejemplo sencillo con Lama dos. Para todos los que ya saben exactamente qué es un LLM y cómo funciona, por supuesto, pueden saltarse la conferencia Básicamente, un LLM son solo dos archivos. Tenemos un archivo, y este archivo es básicamente el archivo de parámetros, y simplemente lo hago aquí como P. Esto significa parámetro. Y tenemos un segundo archivo, y el segundo archivo es sólo para ejecutar estos parámetros. Yo sólo lo llamo ejecutar archivo. Este archivo de ejecución es la mayoría de las veces escrito en C. C es un lenguaje de programación o en PyTon Así que ambos pueden funcionar eventualmente. Entonces lo que tenemos aquí mismo es el archivo de parámetros y el archivo run. Y el archivo run la mayor parte del tiempo son simplemente 500 líneas de código. Así que usamos 500 líneas de código para ejecutar este archivo. Y este archivo es donde ocurre la magia porque este archivo es gigantesco Haz un ejemplo con un LAM que sea de código abierto, y el LAM se llama ama two. Entonces ama es, por supuesto, el LLM de meta, y tienen diferentes modelos Y este Lama, también, donde hacemos este ejemplo, este es el modelo 70 B. Entonces esto simplemente significa que tenemos 70 mil millones de parámetros. Entonces sabes que este es un archivo relativamente grande que tenemos aquí mismo. Entonces este archivo de parámetros tiene 70 mil millones de parámetros, y ¿cómo obtenemos todos estos parámetros? Tenemos que entrenar este archivo y lo entrenamos en mucho texto. Utilizamos 10 terabytes de texto para entrenar este archivo. Entonces usamos diez textos de Theraby. Este es un texto de todo Internet. Entonces esto podría ser artículos de Wikipedia, sitios web, y mucho, mucho más. Y este archivo, podemos simplemente comprimir este archivo hacia abajo, y este archivo sólo tiene 140 gigabytes de tamaño. Entonces este archivo es de apenas 140 gigabytes tamaño y lo entrenamos en 10 terabytes Ya sabes, podemos comprimirlo, mucho. Este archivo de parámetros, simplemente puede pensar este archivo como un archivo zip. Simplemente comprime todos estos datos. Para comprimir estos datos, necesitamos mucha potencia de GPU. Entonces necesitamos mucha potencia de GPU para poder comprimir estos datos. Y por eso también NVDA fue una gran acción en los últimos años Si miras, por ejemplo, las acciones de NVIDIA, ya ves, tenemos una carrera gigantesca, y esto es básicamente porque todos necesitan GPU Entonces ya ves que tenemos una carrera gigantesca, pero esto no se trata de acciones en estos momentos Entonces básicamente, usamos mucha GPU. Esto lo hago muy sencillo. También tengo explicaciones más detalladas, pero no creo que necesitemos esto en este curso. Así que simplemente comprimimos diez textos Trabte en un archivo de 140 gigabytes, y luego tenemos el segundo archivo El segundo archivo es el archivo Run. Son sólo unas pocas líneas de código. Y si tenemos un código abierto, a una am igual que Lama dos o incluso Lama tres o lo que sea de código abierto como ese que quieras, podemos descargar este archivo y podemos ejecutar estos archivos localmente en nuestro PC Y esto nos trae la máxima seguridad de los datos porque nada pasa por Internet. Con estos dos archivos, son un poco mágicos porque aquí trabaja la arquitectura del transformador de fondo. Simplemente puedes pensar en la red neuronal. No necesitamos bucear tan profundo. Pero básicamente, la red neuronal ve palabras y predice qué palabra siguiente viene más probable Entonces funciona básicamente así. Entrenamos en todos los textos, y así el LLM simplemente aprende cómo se estructura el texto Si preguntamos, por ejemplo, qué debo comer hoy, el LLM simplemente predecirá qué palabras escuchará muy probablemente un humano Esto en este momento esto simplemente se llama el pre entrenamiento con el pre entrenamiento, simplemente alucinamos cosas de este archivo Pero luego viene lo segundo. Lo segundo es la afinación fina y con la afinación fina, le damos al LLM muchos ejemplos de cómo los humanos quieren tener su respuesta Alimentaríamos, por ejemplo, una pregunta. Qué debo comer hoy, y luego alimentaríamos una respuesta que a los humanos les gusta. Por ejemplo, hoy podrías comer bistec. Si alimentamos esto una y otra vez, el LLM aprende cómo los humanos quieren sus respuestas Esto se llama afinación divina, y esta es la segunda parte para ejecutar LLM Entonces la última parte es el llamado aprendizaje por refuerzo, y podemos desglosar esto realmente muy simple. Después del pre entrenamiento y afinación divina, simplemente haremos este aprendizaje de refuerzo. Esto básicamente significa que hacemos una pregunta, obtenemos una respuesta, y luego le decimos al LLM si esto es bueno o no Esto es básicamente el aprendizaje de refuerzo. Entonces tenemos tres fases de entrenamiento. El pre-entrenamiento, simplemente usamos mucha GPU para comprimir mucho texto en un archivo más pequeño llamado ZIP, y podemos alucinar texto fuera de estos y podemos alucinar texto fuera Para mejorar estas alucinaciones, hacemos fina Entonces alimentamos muchas preguntas con respuestas estructuradas de una manera que a los humanos les gusta. Y en esta fase, D LLM aprende cómo los humanos quieren sus respuestas Y por último, el aprendizaje de refuerzo, simplemente echamos un vistazo, Oye, tiene este sentido o no, yo sí, pulgares arriba, si no pulgares abajo, y LLM simplemente aprenderá más cómo queremos nuestras respuestas Ahora lo siguiente que es realmente, muy importante es que ya lo hayas aprendido. En esta arquitectura transformadora, hay redes neuronales, y redes neuronales funcionan con pesos. Básicamente, trabajan con números. Y para que tenga sentido para la red neuronal, por supuesto, necesitamos tener números. Entonces lo primero es, por supuesto, si alimentamos una pregunta en un LLM, el LLM hará números a partir de estas preguntas, los llamados tokens Estas fichas son números, y con estos números, la red neuronal puede hacer sus cálculos. ¿Qué palabra vendrá más probablemente como la siguiente palabra? Quiero mostrarles simplemente cómo están estructurados estos docons Si vamos en este tokenizador, podemos verlo. Simplemente podemos escribir Qué puedo comer hoy por ejemplo, y ahora ves que tenemos cinco fichas, 20 caracteres, y las fichas están estructuradas de esta manera. Si presionamos aquí en los identificadores de token, entonces esto es básicamente lo que los LLMC El LMC son números, y con estos números, la red neuronal puede hacer sus cálculos y nos da una buena respuesta Si presiono aquí mismo, por ejemplo, en claro, una vez más, entonces voy a mostrar ejemplo, ve un ejemplo más grande. Y aquí también se ve que no todas las palabras son una sola ficha. Esto se divide un poco diferente. Aquí ves invisible es, por ejemplo, dos fichas, y aquí este punto también es token separado. Entonces tenemos muchos tokens diferentes, y si presionamos en token en estos, ya ves, esto es básicamente lo que ve el LLM y el LLM hace sus cálculos con los Pero por qué te muestro esto porque esto es importante porque tenemos un límite simbológico. Cada LLM tiene siempre un límite a la cantidad de tokens que puede entender en este momento Si vamos a este artículo aquí mismo, ¿qué son los tokens? Omei nos dice que una ficha tiene aproximadamente cuatro caracteres en inglés Significa que 1,500 palabras son aproximadamente 2048 fichas. Y esto es importante porque cada LAM tiene un límite de token diferente. Se puede ver aquí abajo. Ahora mismo en este momento, GPD para Turbo y también GPD para Omni, y muchos otros modelos, tienen aproximadamente 128,000 tokens de tienen aproximadamente 128,000 También tenemos modelos que tienen límite de 2 millones de endocen. También tenemos un modelo de código abierto más pequeño que solo tienen un límite de 4,000 docenestocen, y lo importante es que entiendas que tan pronto como se alcance el límite de dtcen, LLM ya no entenderá las cosas que hablaste anteriormente con el Sólo quiero mostrarte un ejemplo en el chat GPD. Simplemente le digo al LLM escribir una historia sobre un zorro, y ahora nuestros primeros tokens se generan Y en cuanto estemos cerca del límite de tokens, así que en cuanto hable, por ejemplo, otras cosas, ahora mismo, solo supongamos que quiero tener diferentes historias aquí mismo en este chat. Por ejemplo, cuéntame una historia sobre una rana. Ahora mismo, por supuesto, se generan nuevos tokens. Y en cuanto lleguemos a nuestro límite de tokens, el LLM ya no sabrá nuestra pregunta anterior y tampoco la respuesta porque el LLM siempre solo conoce los últimos En este caso de JCEPT, la ventana de contexto es relativamente grande, por lo que conoce 128,000 Estas son aproximadamente 100 mil palabras, aproximadamente, como dije. Y después de ello, ya no conseguirá lo que platicamos anteriormente. Entonces por favor, por favor, por favor recuerde siempre los últimos tokens cuentan, y todo lo que haya terminado ya no estará en el conocimiento del LLM Se le puede llamar así. Por supuesto, tenemos muchas técnicas para incrementar este conocimiento, por ejemplo, tecnología directa y así sucesivamente, hablaremos de esto más adelante. Pero por ahora, hay que entender que cada LLM tiene un límite de token Eventualmente esto desaparecería. Eventualmente, el límite de fichas será tan grande que ya no necesitamos pensarlo, pero ahora mismo en este momento, tenemos estos límites y necesitamos saber esto. Básicamente, si alguna vez te preguntas por qué el LLM ya no sabe de lo que hablabas anteriormente, es simplemente porque se alcanza el límite de docen En este video, has aprendido cómo funciona un LLM. Básicamente, sólo tenemos dos expedientes. Tenemos un archivo de parámetros y un archivo de ejecución. El archivo run es solo un código para ejecutar el archivo de parámetros, y el archivo de parámetros es simplemente muchos textos de Internet, pero se comprime en un pequeño archivo similar a un archivo CIP Necesitamos mucha GPU para hacer esto. Este fue el pre entrenamiento. Después del pre entrenamiento viene la afinación divina. Aquí alimentamos las preguntas y respuestas de LLM para que LLM pueda aprender cómo queremos nuestras Y después de la afinación divina, el paso final es el aprendizaje de refuerzo. Simplemente hacemos preguntas, obtenemos respuestas y calificamos las respuestas si son buenas o no. Y con esta última fase, el LLM va a mejorar en estas tareas También has visto que en el fondo funciona, la arquitectura del transformador. Estas son redes neuronales y redes neuronales hacen cálculos con números. Por eso necesitamos dividir nuestras palabras en fichas. Con estos tokens, podemos hacer los cálculos y calcular qué palabra viene más probablemente como la siguiente palabra lo que queremos tener. Es necesario entender estos tokens porque cada LLM tiene un llamado límite de tokens Tan pronto como se alcance el límite de tokens, el LLM ya no sabrá qué cosas perras anteriormente Siempre mira los últimos tokens, y por supuesto, los límites de tokens dependen del modelo. A veces son 4 mil tokens, pero puede subir hasta los 2 millones. Y una última cosa, claro, es muy importante qué preguntas hacemos LLM porque con buenas preguntas, obtenemos buenas respuestas A esto se le llama ingeniería pronta, pero más sobre eso, por supuesto, más adelante. Te veo en el siguiente video, sé que hicimos esto un poco rápido, pero creo que este detalle técnico es que todos simplemente deberían tener una idea de esto. Entonces lo hicimos rápido. Lo hicimos no con todo detalle, pero esto es más que suficiente para trabajar con este modelo. Necesitas estos detalles técnicos para entender que aquí no tienes preguntas ilimitadas antes de que JGBT se olvide de las cosas, y también necesitas entenderlas porque ingeniería rápida es realmente importante para obtener buenos resultados, y solo obtienes una buena salida si das una buena entrada Se llama ingeniería rápida. Quiero hablar de ingeniería rápida en la siguiente sección. 4. Las interfaces de los LLM: Este video quiere mostrarte algunos de los LLM más importantes y, por supuesto, también su interfaz Ahora, ya viste que tenemos muchos LLM diferentes, y podemos encontrar innumerables LLM y podemos encontrar innumerables en estas arenas de chatbot Los más importantes son, al menos cómo veo JetPT de Opmei, Clade de antrópico, Gemini de Google, eventualmente también modelos de código abierto, y podemos usarlos ya sea en Grock o también podemos Ahora, queremos comenzar con HPT porque creo que este es por lo menos ahora el mejor Sí, a algunas personas les encanta el coágulo porque Clot también es muy bueno codificando Entonces básicamente, sí, también pueden codificar. Quiero mostrarte la interfaz en detalle de JCPT porque si entiendes JCPT entiendes también todas las Esta justo aquí es la barra donde puedes escribir tus preguntas. Y a estas preguntas las llamamos las indicaciones. Y por supuesto, la ingeniería rápida es el arte de escribir las preguntas correctas. Si quieres subir cosas en HathIPT, tienes esto aquí mismo. Se pueden adjuntar archivos. Puedes subir fotos o archivos PDF y esas cosas y analizarlo. Esto de aquí mismo es la búsqueda, el botón web. Si presionas sobre estos, HatChipt buscará en la web. Vamos a probar esto por una vez. Si presionamos en la búsqueda, podemos escribir el precio de Bitcoin hoy. Entonces aquí básicamente puedes ver que recuperamos el texto y también obtenemos algunos enlaces donde podemos hacer clic si queremos. Entonces estas son las fuentes, y si las presionas, podemos ver al HpD buscado en la web Utilizamos capitalización de mercado de monedas y así sucesivamente. Ahora bien, si usas un chat nuevo en la esquina izquierda, está vacío una vez más, y tus chats antiguos están aquí mismo. Lo siguiente que puedes hacer es, por supuesto, presionar en HatPd y usar diferentes modelos Tenemos el GPD normal para Omni genial para la mayoría de las tareas. Tener GPD cuatro oh con lona. Si presionas sobre estos, el lienzo también es muy agradable porque digamos que quieres generar algún código. Dame el código de mordedura para una serpiente. Chet GPD abrirá este lienzo, y en este lienzo, podemos editar un poco este código Esto es muy agradable. Así que aquí en el lado derecho, puedes dar click. Puedes revisar el código, puedes portarlo a otros lenguajes como JavaScript o algo más. También puedes corregir errores. Puede agregar registros, y puede agregar comentarios si lo desea. Para todo el mundo que codifica, espero que entiendas lo que quiero decir. Si generamos texto normal con este lienzo, también es agradable porque también podemos editar nuestro texto en este lienzo. O bien podemos sugerir ediciones, podemos ajustar la longitud, para que podamos hacerlo, por ejemplo, más corto si quieres, y si lo enviamos, se volverá a escribir pero Y ahí lo ves, tenemos básicamente el mismo texto pero mucho más corto. Entonces podemos ajustar el nivel de lectura. Entonces, por ejemplo, para la escuela egresada o para el jardín de infantes. Lo siguiente es que podemos añadir pulido final. Si presionamos sobre esto, JetPT lo hará completamente automático Simplemente lo reescribirá y reestructurará un poco. A lo mejor hay algo mal o un poco demasiado corto, y ves que obtienes mejores salidas. Y lo último, claro, también podemos agregar imágenes si queremos. Y ahí tenemos lindas imágenes pequeñas. Además de este lienzo, tenemos también 01 avance. Vista previa abierta es el modelo que piensa. Si le damos a JCPT una tarea difícil, JCPD es capaz de pensar un poco antes ¿Es este un buen título de YouTube? ¿A mí me gusta en Marte? Piense en palabras clave, tasa de clics y más. Y JCPT comenzará a pensar. Entonces ya ves que HHIPT está pensando. Se genera alguna ficha. Aquí se puede ver el proceso de pensamiento, y luego se puede levantar con mejores respuestas porque JCIPT se da siempre nuevos tokens para pensar, y ahí tenemos nuestra salida Además de la previa 01, también tenemos el 01 Mini. Esto hace básicamente lo mismo, pero es más rápido. Y si presionas en más modelos, ahora mismo, tenemos GPD para O Mini y GPD para modelo Legacy Si solo quieres tener chats temporales, también puedes incluirlos. Si vas en este signo de interrogación, ves que puedes reportar contenido ilegal puedes usar atajos. Tienes términos y políticas, notas de la versión, guía de ayuda y te ac, y este criterio es simplemente tu nombre. En la esquina izquierda, te *****. Entonces, si presionas sobre estos, puedes actualizar tu plan. Yo pago ahora mismo 20 dólares al mes, pero también puedes empezar gratis. Si usas el plan de negocios, debes pagar 25 dólares al mes. Básicamente, obtienes lo mismo. Pero lo más importante es que tus datos serán automáticamente excluidos de la capacitación. Entonces esto es un poco más seguro. En el lado izquierdo, también puedes cerrar la barra lateral y devolverla a la vida. Se puede pulsar en los chats de búsqueda. Y aquí puedes buscar los chats que ya tuviste con hat GPD Y si presionas sobre estos aquí mismo, nuevo chat como si tuvieras un NuCat Entonces tienes estas cosas aquí mismo. Estos se llaman GPD y quiero mostrarles más sobre los CPD más Pero si presionas en Explorar GPD, básicamente lo que puedes hacer es que puedas buscar GPD específicos que otras personas hayan hecho Si quieres hacer, por ejemplo, programación, puedes dar click en Programación y encontrar GPDs específicos que estén a la medida para la programación Este es un GPD para PyTon y si presionas sobre Sarchat, simplemente puedes chatear con este GPD, y esto es, como dije, Esa es básicamente la interfaz JaHipt. Si entramos en Cloud, básicamente ves que la interfaz es relativamente similar. Aquí puedes escribir lo que quieras hacer. También puedes actualizar la Nube. Esta interfaz es un poco más sencilla, pero básicamente hace lo mismo que JaHipt pero más simple, como te dije M código serpiente, y también coágulo me dará código serpiente, y también coágulo agregará algo en como lienzo Este de aquí mismo es Géminis. Ahora mismo, Géminis está en alemán aquí para mí, Gemini también es un LLM normal, y también puede hacer básicamente lo mismo que Chachi Bitty Esto de aquí es Grock y en Grock básicamente puedes usar LLM de código abierto Y la interfaz es minimalista. Puedes escribir tus cosas aquí mismo o también puedes hablar con estas cosas. Y por cierto, también puedes instalar hat ChiPT en tu PC, y lo tienes como aplicación, y también puedes instalarlo en tu smartphone y puedes hablar con HatChipt Esta de aquí es la aplicación HatchiPit, y si hablamos con la aplicación hatchipit, Oye, Chat Chi Pit, cuéntame una pequeña historia sobre un zorro. Érase una vez, en un frondoso bosque, vivía un zorro inteligente llamado Fiona Conocida por su ingenio rápido, Fiona le encantaba explorar y aprender sobre todo lo que la rodeaba. Un día, se topó con una trampa colocada por cazadores usando su astucia Ese es básicamente el modo avanzado de voz. Creo que esto es ahora mismo una función de pago. Entonces, si pagas por ChatBD y simplemente instalas la aplicación en tu PC local, puedes usar este modo de voz Avanzado Y lo último que quiero mostrarte es Olama. Si descargas Oma, esto se ejecutará localmente en tu PC. No te preocupes si no quieres hacer esto. Sólo quiero mostrarte cómo funciona. Simplemente presiona Descargar aquí mismo, luego puedes ir a los modelos, y puedes buscar los modelos que quieras. Y lo siguiente que debes hacer es entrar a tu terminal, y esta cosa funcionará localmente. En tu terminal, puedes buscar los modelos que quieras usar. Por ejemplo, Lama 3.2, simplemente puedes presionar O Lama ejecutar Lama Si copias estos y los lanzas en tu terminal, puedes descargar estos modelos de Lama o puedes ejecutarlos. Si ya están instalados, puedes ejecutarlos. Entonces tengo esto instalado, y ahora también puedes hacer estas cosas aquí mismo. Cuéntame una historia sobre el rock, y luego Lama me contará una historia sobre la roca Esto de aquí es especialmente genial para la privacidad de datos, pero por supuesto, no hay una interfaz agradable en OLAM Puedes vincular esto junto con, por ejemplo, cualquier cosa LLM, pero esto es demasiado grande para este curso porque necesitamos aprender estas cosas rápido Entonces básicamente, si quieres ejecutar las cosas localmente, puedes hacerlo totalmente. Pero en su mayor parte, si estás empezando, solo usa HaChipt en la interfaz estándar Entonces en este video, viste todas las interfaces que son importantes. Si desea ejecutar LLM lo más rápido posible. En el siguiente video, quiero mostrarles lo que pueden hacer los LLM. 5. ¿Qué pueden hacer los LLM?: Este video quiere darte una visión rápida de lo que las LLM pueden hacer, y no importa en qué LLM eres Básicamente, la mayoría de los modelos fronterizos pueden hacer lo mismo, y también los modelos de código abierto vendrán con el tiempo. Cada LLM puede hacer que el texto sea más grande o código y hacer que el texto o el código sean más pequeños Para que puedas resumir texto o expandir texto. Solo hagamos un ejemplo. Puedes escribir un poco de palabras y obtener muchas palabras. Dame un texto de marketing para mi sitio web, IA con Arnie. No, realmente no tengo este texto de marketing. este momento, utilizo el modelo de vista previa OO solo porque estaba activo. Ahora CHGPT piensa un poco qué texto de marketing debería escribir, y luego obtendré mi respuesta Entonces aquí ves que convertimos un poco de texto en mucho texto. Espero que entienda lo que quiero decir. A continuación, podemos resumir texto. Este aquí mismo es un artículo en medio sobre LLM. Básicamente puedes simplemente copiar un poco de texto. Se puede tirar a JTCPD y decir resumir en balas. Entonces, básicamente, se puede resumir el texto. Y ahí lo tienes. Ahora tenemos algunas viñetas sobre este texto. Lo mismo con el código. Se puede generar código. Podemos hacer básicamente algo así. Podemos crear mucho código muy rápido. Dame el código para la página web HDML que tenga tres botones Sólo puedo encender dos de los botones al mismo tiempo. Debe ilustrar que no es posible estar quebrado, inteligente y ocupado al mismo tiempo. Ahora generará algún código HDML. Ahora está el código. Vamos a ver si funciona. Copio el código. Hago un nuevo archivo de texto. Lanzo el código en el archivo de texto y lo guardo. Ahora lo guardo como HDML HDML Sí. Y abro la página web quebrada, inteligente, ocupada. No funciona porque, como, piensa por ti mismo, sí, puedes ser inteligente y ocupado, pero entonces no estás en quiebra porque trabajas en las cosas correctas. Si estás quebrado, no puedes ser inteligente y ocupado porque si fueras inteligente y ocupado, no estarías quebrado, pero puedes estar, por supuesto, quebrado. Y ocupado pero no inteligente. Si estás quebrado e inteligente, no estás ocupado porque no haces nada porque simplemente no funciona de esa manera. Y claro, si tienes mucho código, por ejemplo, en una página web, también puedes intentar hacer que el código sea más pequeño. Entonces sí, también puedes resumir código si funciona. También puedes generar algunas tablas si quieres. Entonces esta, por ejemplo, es una tabla sobre las macros de un plátano. Entonces el texto puede ser, por supuesto, también tablas. Y ahora viene la parte divertida porque los LLM también pueden usar herramientas, como una calculadora, un intérprete Biton o un modelo de difusión Un modelo de difusión hace imágenes. Yo quiero mostrarte. ¿Qué es tres veces 98 por 98? Si enviamos esto, ves que estamos analizando. Entonces básicamente, utilizamos herramientas. Creo que JaHipt simplemente nos escribirá más guión PTN para hacer esto Si presionas sobre análisis de vista, ves que ChaChiPT usa un intérprete de Python para darnos el resultado. Haz una foto sobre el plátano, y HCBT utilizará un modelo de difusión como Dali para crear esta Y ahí tenemos el plátano. Por supuesto, también podemos analizar cosas. Déjame mostrarte lo que hay en el conjunto de datos. Eso es básicamente, déjame mostrarte un conjunto de datos con algunas cosas de redes sociales. Esto es básicamente el uso de las personas, entonces donde están, están en Snapchat, ****, muelle, arresto de pin, y así sucesivamente. Y ves que esta es una mesa muy, muy grande, y podemos analizar estas cosas. Aquí me da una mesa. Disculpe, ahora mismo, está en alemán, pero ahora mismo queremos hablar en inglés. Y eso es básicamente también lo siguiente que quería mostrarles porque, por supuesto, los LLM también pueden traducir cosas. Entonces aquí hay cosas en alemán. Simplemente puedes decirle a HathPT, traducir esto en inglés Y puedes hacerlo también, viceversa. El conjunto de datos contiene 1,000 filas con las siguientes columnas. ID de usuario, app, minutos diarios gastados, publicaciones por día, me gusta por día, seguidores por día. Y aquí se obtiene de todo. Entonces ves Pinterest, Facebook, Insta, **** Doc, y LinkedIn. Minutos diarios gastados, publicación por día, me gusta por día, sigue por día. Hacer un gráfico a partir de esto porque podemos usar herramientas, ya sabes. JGBT utilizará un gráfico BTN para crear una gráfica agradable para nosotros. Y aquí lo tenemos, Facebook, Installink entonces, Pinterest, y así sucesivamente Y claro, si presionas sobre estos, podemos cambiar a un gráfico interactivo. También podemos usar, por ejemplo, diferentes colores si te gustan otros colores. Y luego si te gusta, primero, puedes hacerlo más grande. Pero si te gusta, como te dije, también puedes descargarla por este botón. Y HGPT también entiende el contexto de este chat. Hacer un cerdo que ilustre el conjunto de datos. JCPT simplemente entenderá que se trata de redes sociales y lo más probable es que consigamos algunas personas que usen un teléfono o algo así Al menos así es como lo adivinaría. Y ahí lo tenemos. Esta es una página de redes sociales. Y claro, con algunos datos porque se trata de un conjunto de datos. Por cierto, esto se llama llamada de función. No tenemos tiempo suficiente para sumergirnos tan profundamente en estas cosas. Solo piénsalo de esa manera que cada vez el CheBT o un LLM no sea lo suficientemente inteligente, usarán diferentes herramientas para hacer esto Andrew Karpathy también le gusta decirnos que el LLM es nuestro nuevo sistema operativo como una computadora que puede usar diferentes herramientas Y sobre el uso de la herramienta, por favor tampoco olvides que pueden usar Internet. También pueden usar Internet para buscar información en vivo. Ya te mostré esto en el último video. Y también importante antes de hablar de capacitar a nuestros LLM, claro, también son multimodelo Esto significa que pueden escuchar, hablar y ver. Sobre escuchar y hablar, ya viste esto. En el último video. Sólo quiero mostrarte que ellos también pueden ver. Si estás en ChaChiPT, puedes subir fotos Por ejemplo, esta, esta es una imagen de Hugging Face sobre el aprendizaje por refuerzo, y sí, esto parece complicado ¿Qué hay en lo grande? Explícalo como si tuviera cinco años. Y por cierto, sí, la calidad es horrible. Vamos a ver si JaHipt puede conseguirlo. Sí, lo consigue. Comienza con el modelo de idioma. Imagina que la computadora es como un niño que ya conoce algunas palabras y frases y así sucesivamente. Entonces dale una recompensa, haz que realice estos pasos de aprendizaje combinados Esto es refuerzo aprendiendo de Hugging Face. Esta es básicamente esta imagen aquí mismo de Hugging Face Esta es en estos momentos la buena calidad. En HHIBT, he subido a propósito la mala calidad, pero incluso con la mala calidad, ChaChipD puede verlo y puede explicarlo como cinco Así que los LLM también pueden ver hablar y escuchar. También se pueden entrenar diferentes LLM. Podemos entrenar diferentes LLM con indicaciones. Esta es la llamada Ingeniería pronta. También podemos usar tecnología directa o afinación fina. Quiero profundizar en la ingeniería rápida en el siguiente video porque la ingeniería rápida es realmente importante. En este video, has aprendido que los LLM pueden hacer muchas cosas Primero, pueden generar texto. Segundo, pueden resumir texto. Tercero, pueden crear código, también hacer que el código sea más pequeño, y pueden usar muchas herramientas diferentes para analizar datos, crear imágenes, usar una calculadora y hacer muchas cosas geniales. Solo piensa por ti mismo lo que es más importante para ti. Puedes hacer tareas completas con un LLM. Solo piénsalo de esa manera. Se puede escribir una historia sobre una empresa que hace el bien, por ejemplo. Entonces puedes hacer algunos cálculos, cómo les va en el futuro. Entonces puedes hacer algunas mesas, cómo les va. Y por último, puedes hacer una foto de un inversionista feliz. Esta es toda una presentación. Entonces JGBT y LLMs, realmente pueden ayudarte mucho 6. Ingeniería rápida: Hablemos de ingeniería rápida. Esta guía viene directamente de Opie. Entonces la compañía detrás de JCPD. Y sí, JATCPT o los modelos Op MI, también están incluidos en el Esto ahora mismo está en alemán, pero claro, podemos usar copiloto también en la versión en inglés, y sí, también podemos usarlo con fondo blanco Este es simplemente el tema que utilizo. Posteriormente, lo usaremos con el fondo blanco. Volvamos a la ingeniería rápida. La ingeniería rápida es importante porque si no das buenos insumos, no obtendrás buenos resultados. Y quiero mostrarte la pronta ingeniería en el copiloto de Microsoft, pero esto funciona completamente igual Por supuesto, también en Jet CCPD y cada uno de los modelos bajo el sol porque estos conceptos son siempre los mismos Este recurso, puedes leer esto tú mismo si quieres, pero queremos hacerlo lo más rápido posible. No tenemos tiempo para cada técnica de ingeniería rápida, por lo que la hacemos rápida. Esto de aquí mismo, este es el ejemplo de un rápido muy, muy malo. Dame un artículo sobre smartphones. ¿Por qué es malo este aviso? Este prompt es malo porque no damos ningún contexto. Entonces, si enviamos esto y usamos, por ejemplo, balance aquí mismo, lo más probable es que obtengamos una respuesta, pero la respuesta no es específica porque no damos entradas específicas. Y boom ahí tenemos nuestra salida. Entonces aquí hay un artículo del guardián. Y simplemente tenemos un artículo. Tenemos un enlace donde podemos hacer click. Ahora bien, este es un mal aviso, y tenemos que esperar obtener una mala salida. ¿Por qué esta salida es mala? No necesariamente diría que esto es realmente un mal resultado. Es solo salida de lo que preguntamos. Pedimos un artículo, y tenemos un artículo que no es específico. A lo mejor tenías algo en mente que quieres publicar en tu blog. Pero no puedes hacerlo con este artículo. Esta salida es simplemente mala porque no damos ningún contexto. Ahora, te diré ahora mismo que es muy, muy fácil dar contexto. Y para dar contexto, sólo hay que entender un principio clave. Este principio clave se llama asociación semántica. ¿Qué significa asociación semántica? Solo supongamos que te digo una palabra o dos palabras o diez palabras. Solo supongamos que te digo, por ejemplo, dios griego. Con estas dos palabras, tienes inmediatamente otras 100 palabras en tu cerebro. Otras 100 fotos quizá también en tu cerebro. Tienes diferentes dioses griegos en tu cabeza. Quizás también tengas en tu cabeza imágenes diferentes de dioses griegos. Tienes quizá también como la vieja Roma en tu cabeza. Tienes cosas como un buen cuerpo en tu cabeza. Tienes diferentes cosas en la cabeza. Y ese es básicamente todo el concepto de ingeniería rápida. Tenemos que dar contexto. Necesitamos usar asociación semántica porque todos estos grandes modelos de lenguaje, así copiloto que usan HHIPT, todos ellos, todos ellos, Entonces, si les decimos a estos LLM solo una o dos palabras, tienen todas las otras palabras en el fondo Tienen esto en su conocimiento. Si decimos, por ejemplo, smartphone tienen muchas palabras diferentes que son similares a los smartphones. ¿Por qué tienen esto? Porque están entrenados en el texto, como ustedes saben. Simplemente buscan el texto donde encuentran la palabra smartphone muchas veces. Si les damos un poco más de palabras, todas estas serán más precisas. Podemos darles, por ejemplo, palabras como Apple o Android o artículo de blog si quieres hacer un artículo de blog y mucho, mucho más. El concepto clave está aquí mismo que con unas pocas palabras, le darás mucho contexto a los LLM porque son asociativos Solo hagamos un ejemplo. Presionamos nuevo tema y partimos de cero. Usamos una salida balanceada y le digo al copiloto algo así Esto sería un aviso que tiene mucho sentido. Empezamos con algo como esto. Eres un experto para smartphones. ¿Por qué hacemos esto? Esto de aquí mismo, esto se llama instigación de roles. Entonces le damos el modelo de lenguaje grande. En este caso, copiloto o Hechipt un papel. Por lo que es un experto para smartphones. Y luego le damos un poco más de contexto. Ya sabes, el Google Pixel ocho pro al detalle. ¿Por qué es importante esto? Porque si le decimos que es un experto para smartphones y conoce a detalle el Google Bxeledp, buscará en artículos donde se incluya todo Así que conseguimos muy, realmente expertas buenas salidas para smartphones y el LLM buscará en artículos sobre el Google BixeledP Y luego le decimos al LLM exactamente lo que necesitamos. Necesitamos un artículo de 600 palabras por qué el pixel eight pro es bueno. Queremos tener un artículo positivo. Esto también es clave. Esto de aquí mismo, esta es la asociación semántica de la que hablé Por supuesto, todo esto está relacionado con la asociación semántica, pero esto especialmente Solo incluyo tres palabras Gemini nano, LLM, y en dispositivo Estas son simplemente palabras libres, y si usamos estas palabras libres, el LLM buscará artículos donde todo esto esté incluido porque para mí, esto es importante Esta es una de las características clave que hace que al menos en mi mente, el Google Pixel Eight P. Tan bueno porque tenemos Gemini nano, un modelo de lenguaje grande, un modelo de lenguaje pequeño, grande que se ejecuta en el dispositivo. También podemos incluir cosas como sin latencia si queremos. Así que no te preocupes si no lo entiendes ahora mismo porque vamos a conseguir un artículo. Entonces, si eres un experto en cosas como esta, simplemente puedes decirle al LLM que también el LLM es un Simplemente le decimos que es un experto en smartphones. Conoce el Google Pixel ocho P, y luego le damos algunas palabras que necesitamos o queremos incluir en nuestro artículo, y el LLM buscará las cosas adecuadas para nosotros Entonces enviamos esto, y estoy relativamente seguro de que obtenemos una salida que es mucho mejor. Por supuesto, también puedes incluir cosas como escribir el artículo para un 10 años si quieres que sea realmente, muy simple porque, claro, la Asociación semántica también puede hacer eso Entonces buscaremos artículos que sean realmente, muy fáciles de entender. Pero ahora mismo no quiero hacer esto. Simplemente envié esto y vamos a conseguir un buen artículo. Esto tal vez podamos incluirlo también en un sitio web. Y aquí tenemos nuestro artículo y espero que veas que la salida es completamente diferente a la anterior. Como experto en smartphones, te puedo decir que el Google BixeleightP es un excelente dispositivo que ofrece una gama de características y capacidades que una gama de características y hacen que se destaque Aquí hay alguna razón y así sucesivamente, por lo que el diseño y la calidad de construcción, la cámara, el software, el Gemini nano y ALM Por lo que el BixeleightP es alimentado por Google Por supuesto, también puedes ser más específico. Como, por ejemplo, hacer este artículo para mi sitio web o hacer este artículo como un hilo de Twitter o algo así. Haz el artículo para un hilo de Twitter. Los lectores son estudiantes de tecnología, por lo que incluyen detalles. Y obtendremos cada detalle y el formato estará bien para un hilo de Twitter. Entonces ahora ya ves, tenemos muchos detalles. Entonces hablamos del software. Hablamos de la cantidad de megapíxeles y sensores que tiene nuestra cámara y mucho, mucho más Y también podemos hacerlo más sencillo. Digamos que quieres tener este artículo para los 12 años Haz el artículo para niños de 12 años. más probable es que excluyamos las palabras que son un poco duras para nuestros chicos más jóvenes. Lo ves de inmediato. Una de las mejores cosas del Google es la cámara y así sucesivamente. No usamos todas estas palabras duras y obtenemos una salida más fácil. Y eso es básicamente todo lo que necesitas entender si quieres empezar de inmediato a escribir tus indicaciones. Necesitas hacer indicaciones estructuradas. Esto de aquí mismo, por ejemplo, es un prompt de estructura porque empezamos con un rol. Esto también se llama roll prompting. En el siguiente video, te daré algunos ejemplos más rápidos, rápidos. Empezamos con el rol, así que eres un experto en X Y yZ y conoces tal vez algunos detalles Luego usamos nuestro prompt de estructura para decirle al LLM lo que necesitamos exactamente Quiere tener un artículo que aproximadamente 600 palabras de largo sobre la sonda de píxeles ocho, y necesitamos saber por qué es buena. Y luego desencadenamos la asociación semántica solo con unas pocas palabras Para que no tengas que usar estas palabras. Simplemente es importante que incluyas algunas de estas palabras. Entonces este video fue sobre ingeniería rápida. Sólo quiero decirles que los LLM son relativamente sencillos de entender porque solo pueden hacer dos cosas si lo desglosamos en los principios clave Pueden hacer que el texto sea más grande y pueden hacer que el texto sea más pequeño, y necesitamos usar buenos prompts para obtener buenos resultados Tenemos que activar la asociación semántica. Esto lo podemos hacer con indicaciones estructuradas. Podemos darle, por ejemplo, un rol que necesitamos para decirle al LLM lo que queremos tener exactamente, y necesitamos asegurarnos de usar unas palabras que sean similares a las cosas que nos gustan Por supuesto, tenemos Cillian diferentes conceptos incitadores. Tenemos la cadena del pensamiento, el árbol del pensamiento, y mucho, mucho más. Tengo otros cursos que cubren esto en detalle. Pero en este curso, quiero que puedas usar lo más rápido y eficiente posible. En el siguiente video, te mostraré uno o dos trucos más que son importantes para la ingeniería rápida, y luego estás listo para rockear lo más rápido posible. Solo recuerda dar contexto para obtener una buena salida. 7. Más consejos de ingeniería rápidos: Este video, quiero darte algunos consejos y trucos más sobre cómo hacer prompts eficientes para CIPD o en este ejemplo, por supuesto, para Entonces, veamos qué trucos tengo para que trabajes rápido. Por supuesto, ya viste el papel incitando. Entonces solo dale un papel al LLM. Eres un experto en XYZ. Esto lo cubrimos en el último video. Pero esto de aquí mismo es completamente nuevo. El disparo incitando. En la toma que incita, simplemente das ejemplos Ahora, ¿qué significa esto? Se puede decir, por ejemplo, que es un experto en copywriting, y aquí hay una copia que me gusta, y luego simplemente pegas una copia y le dices al LLM hacer una copia similar para X Y y Z. Y estas dos cosas aquí mismo, son realmente, realmente geniales Respira hondo y piensa paso a paso. ¿Por qué funcionan estas dos cosas? Quiero explicarte. Respira hondo y piensa paso a paso. También puedes juntar esto. Esto funciona simplemente porque también el LLM pensará paso a paso Esto no sólo es mejor para ti sino también para el LLM. Vamos a hacer un ejemplo rápido. Supongamos que quieres instalar BTn, por ejemplo, pero no sabes nada de PyTon Si simplemente escribe cómo instalar BTN, la probabilidad es relativamente grande de que obtenga una salida que comience en un punto que no entiende A lo mejor empiezan con un paso que aún no entiendes. Esto no sólo es problemático para ti, sino quizás también para el modelo de lenguaje grande. Si el LLM no está entrenado en el texto perfecto, siempre tiene sentido decirle al LLM que piense paso a paso porque el LLM comenzará con cosas como vamos a abrir el navegador web Chrome Entonces este es el primer paso. Si le dices al LLM que piense paso a paso, o tal vez también que respiren hondo, el LLM simplemente comenzará en el primer paso, y el primer paso es más probable que abra un navegador web Después de esto, necesitas escribir en Google, por ejemplo, Python. Y si ves todo esto, obtienes, antes que nada, una mejor salida, y el LLM siempre puede asociar más cosas porque también el LLM tiene nuevas palabras El LLM comienza a escribir cosas como Google Chrome como buscar PyTon y así sucesivamente Y en esa instancia, el LLM tiene más cosas en su propia ventana de contexto Esto es realmente, muy práctico. Entonces este es un consejo que realmente no puedo estresar lo suficiente. Respira hondo y piensa paso a paso. Y por cierto, no me lo invento. Hay estudios por ahí que demuestran que estas dos palabras, estas dos oraciones mejoran la salida, y aquí viene una divertida. Algo así también funciona muy, muy bien. Te doy 20 dólares, por ejemplo. Entonces le damos a Chachi PT, le damos al copiloto, le damos al LLM una pequeña propina agradable Le damos algo de dinero o al menos le ofrecemos algo de dinero. Además, esta frase de aquí mismo muestra que el LLM crea mejor salida si decimos que simplemente damos algo de dinero Ahora no me preguntes exactamente por qué funciona esto. Yo solo sé que funciona, y sé que hay estudios por ahí que también te dicen que esto funciona. Entonces necesitas entender simplemente agregando frases como tomar una respiración profunda, pensar paso a paso, y te doy 20 dólares. Obtendrás una mejor salida del copiloto. Así que anota esto. Esto es importante para mí. Y el papel que incita ya entiendes. Para el disparo que incita, quiero darte un ejemplo ahora mismo Tomamos tu nuevo tema, y vamos a asumir que realmente quiero tener una copia para algo. Podemos comenzar con algo como esto. Eres un experto en copywriting. A mí me gusta este ejemplar. Entonces simplemente comenzamos con nuestro papel. Le damos el papel de experto en copywriting. A mí me gusta este ejemplar. Y ahora incluimos un ejemplar que nos gusta, y lo hacemos de esta manera. Entonces estas cosas de aquí que incluyo, esto es simplemente la copia o al menos una parte de la copia de mi curso todo de IA. Así que simplemente tenemos una copia que de verdad, verdad me gusta porque como yo mismo he escrito esta copia, y luego podemos decirle al LLM muchas cosas diferentes. Hago esto un poco más corto solo para mostrarte de qué se trata todo esto. Ahora mismo, también te muestro un bonito truco. Contesta, solo con Bien. Esto se puede hacer siempre para ahorrar algunas fichas. Para que podamos mandar esto y obtendremos un bien de vuelta. Y después del ok, simplemente podemos decirle al LLM más cosas. Entonces ya ves, tenemos el ok de vuelta, y ahora puedo decirle al LLM como lo que queremos ahora El LLM tiene la copia o al menos una parte de la copia. Recuerde, los LLM son asociativos, por lo que entienden cómo se estructura la copia Obtenemos nuestro o back para ahorrar algunos tokens, y ahora le decimos al LLM lo que queremos tener ahora mismo Dame una copia similar pero para un curso llamado Microsoft Co Pilot. Esto es importante porque uso esto mucho solo para obtener más ideas para mis copias. Esto es realmente, muy práctico. Entonces primero, has escrito una copia tú mismo o encontraste una copia en Internet o lo que sea. Das esto como ejemplo, y le dices al LLM que responda solo con bien. Obtén tu bien de vuelta, y ahora puedes pedir la siguiente tarea. Por ejemplo, dame una copia similar, pero para el curso llamado copiloto de Microsoft Y aquí tenemos una copia similar. Así que bienvenido al curso de introducción a Microsoft Copilot, su viaje al mundo de la finalización de código impulsado por IA Si nos desplazamos hacia arriba, esto comienza similar a mi copia original. Bienvenido a toda la IA. GPD mid tourney Sabi fusión y desarrollo de aplicaciones. Te adentras en el mundo de la inteligencia artificial. Esta clase magistral es perfecta para cualquier persona y así sucesivamente. Y esto también es cierto aquí mismo. Este curso es perfecto para cualquier persona. Entonces ya ves que usamos un estilo similar, pero no exactamente las mismas palabras. Ahora bien, esto es realmente genial, y esta es la característica más fuerte del disparo que incita. Solo volvamos a esta cosita linda de aquí. Entonces ya viste cómo funciona la incitación del disparo. Simplemente damos ejemplos y obtendremos una salida similar pero no la misma salida. Si usas disparos, no necesitas respirar hondo No es necesario usar las cosas paso a paso. Y tampoco necesitas decir que das dinero porque tienes un buen ejemplo y el LLM puede ser lo suficientemente asociativo para entender lo que necesitas Esto es más probable que sea cierto si no usas ejemplos. Si usas las indicaciones normales de roles, entonces tendría mucho entonces tendría mucho sentido incluir tomar una respiración profunda, pensar paso a paso, o te doy 20 dólares al final de tu texto El concepto clave es siempre que se necesita para dar contexto. momento no estoy seguro de cómo escribir esto en inglés, lo mejor esto es un poco mejor. Y siempre hay que entender que los tokens no son ilimitados. Debido a esto, ya viste en este pequeño ejemplo agradable que usamos algo como el Bien, así que responde solo con o. esto es solo para ahorrar algunas fichas. Así que no quieres tanto un sinfín de ejemplos sinfín de cosas que no tienen mucho sentido. Siempre necesitas entender que estos LLM son asociativos y obtendrás respuestas precisas o respuestas cortas si dices respuesta solo con ok Y entonces puedes hacer tu siguiente pregunta, y eso es básicamente todo. Entonces en este video, has aprendido muchos trucos geniales. Debes incluir, pensemos paso a paso. Respiremos hondo, y también puedes ofrecer algo de dinero. Obtendrás mejores salidas si lo haces así. Si tienes la oportunidad de dar ejemplos de cosas que te gusten, deberías hacer esto totalmente, y esto solo se llama el disparo prompting. El concepto clave es siempre desencadenar la asociación semántica Entonces necesitas dar contexto, pero debes tener en cuenta que tus tokens no son ilimitados, y por esa razón, también tienes el truco de simplemente pedir una o rápida como respuesta al copiloto Porque recuerden, el límite de tokens siempre cuenta en su contra cuenta lo que pones, pero también lo que escupe el LLM Todo esto contará contra tu límite de tokens, y tarde o temprano, se alcanzará tu límite de tokens y el LLM ya no entiende de qué estás hablando Muchos consejos y trucos una portada, pero realmente, realmente te recomiendo que pruebes todo esto. 8. Personalización de LLM con indicaciones del sistema y RAG (recuperación de generación aumentada): Charla sobre formación LLMs. Tenemos dos opciones. Podemos entrenarlos ya sea con prompts o con tecnología directa Primero, quiero mostrarles lo que es la tecnología directa. Entonces comenzamos con indicaciones, y luego usaremos tecnología directa Ya sabes que tenemos chat GPT, simplemente lo llamamos GPT Y sombrero GPT puede responder preguntas. A veces no es lo suficientemente inteligente, por lo que GPT puede continuar y usar diferentes herramientas Ya lo sabes. Por ejemplo, Internet. Puedo entrar en Internet y buscar cosas diferentes. Pero digamos que quieres entrenar un GPT con tus propios datos Digamos solo sobre datos de tu propio negocio o en tu propio texto de marketing o lo que sea. Ahora tienes dos opciones. Puede hacer esto con indicaciones o puede hacerlo con una base de datos vectorial No vamos a explicar una base de datos vectorial porque solo aprenderás a usar estas cosas rápidamente. Básicamente, lo que puedes hacer es subir mucho contexto en un archivo, y luego HatchPD explorará tu archivo y luego tendrá todo este conocimiento Quiero mostrarte uno o dos trucos primero en las indicaciones y luego en una base de datos vectorial Lo más fácil si quieres personalizar JachPD es el prompt del sistema Si presionas sobre esto aquí mismo, puedes seguir GBD personalizado, y aquí tienes el prompt del sistema Y simplemente puedes llenar esto. ¿Qué te gustaría que JCPT supiera ti para dar mejores respuestas Y si presionas sobre estos, op Mey te ayuda. ¿Dónde estás basado? ¿Qué haces para trabajar? ¿Cuáles son tus aficiones? ¿De qué temas puedes hablar durante horas y cuáles son algunas metas tuyas? Entonces solo escribe esto y luego JCPT te dará otras salidas, mejores salidas Solo hagamos un ejemplo. Vivo en Italia pero hablo alemán. Soy educadora de IA. Mis intereses son los LLM y la difusión. Me gusta hablar de IA. Mi objetivo es hacer un buen rumbo. Y entonces lo siguiente es aún más importante. ¿Cómo te gustaría que HHipt respondiera? Si lo presionas, ¿qué tan formal o casual debería ser Hechipt ¿Qué tan largas o cortas deben ser las respuestas? ¿Cómo quieres que te aborden? ¿Debe HGPD tener opiniones sobre temas o mantenerse neutral? Te mantienes neutral. Llámame Arnie Tus respuestas son cortas y si es posible, viñetas. Ahora presionamos seguro y ahora nuestro modelo está capacitado en nuestros datos específicos. El modelo simplemente reacciona un poco diferente. Así que vamos a hacer una prueba rápida. HPD, ¿me puede dar alguna información sobre la elección? También utilizamos la búsqueda en la web? Porque tuvimos la elección en este momento ya que estoy grabando este curso. Estamos buscando el y ChaChiPT me dice que el 5 de noviembre fue la elección Así que ya ves, es muy, muy corto y conciso y obtenemos algunos enlaces. Ahora ChaChiPT no me llama Arnie. Ahora, ¿por qué es esto? Te voy a mostrar. Si entramos en un nuevo chat y lo hacemos sin la búsqueda y hacemos otra cosa, solo hagamos un ejemplo diferente porque esto no funciona tan bien si usamos la búsqueda web. Oye, GBD, quiero comercializar un curso. Dame algunos ejemplos de cómo hacerlo. Supongo que Jet GBD me dice ahora mismo, Oye, Arnie, puedes probar esto, luego algunas viñetas como boost en redes sociales y así sucesivamente Oye, Arnie, está bien. Vamos a sumergirnos en un marketing poderoso y así sucesivamente. Utilice vistas previas atractivas de redes sociales, ejecute un seminario web gratuito, aproveche el marketing por correo electrónico, cree un imán de clientes potenciales, colabore con influencers, etc. Entonces ves que es corto, es conciso, y Jet GBD llama a M Arnie Este es básicamente el prompt del sistema, y con el prompt del sistema, puede personalizar HHIPD Por supuesto, también puedes usar el prompting de disparo, pero ya te he dicho cómo funciona el prompting de disparo Sólo da un ejemplo. Ahora quiero mostrarte cómo funciona la tecnología RC porque esta es la herramienta más poderosa si quieres entrenar a un LLM Ahora bien, en HachipD en este momento, creo que esta es una característica de Bit Puede pulsar en Explorer GPD y buscar el GPD. Ya lo sabes. Pero también puedes presionar Creator GPD o puedes ir a mi GPD si ya tienes Sólo quiero mostrarte un GPD. Por ejemplo, esta difusión pronto GPD, esta está específicamente entrenada para escribir prompts para modelos de difusión Los modelos de difusión hacen imágenes. Si presiono aquí en CAT, obtendré un aviso para un CAT y el prompt se adaptará específicamente para mediados de viaje y también incluye lentes de cámara, y así sucesivamente. Entonces aquí verán, este es un prompt perfecto, y con este prompt perfecto, puedo usar esto para hacer buenas fotos en un modelo de difusión. Ahora quiero mostrarles cómo funciona esto, cómo podemos entrenar estas cosas. Si volvemos una vez más en Explorer GPD, mi GPD vamos a estas indicaciones de difusión y pulsamos Ves que podemos dar un nombre, la descripción, luego las instrucciones, entonces cómo debe comportarse el GPD Y por último, también podemos subir documentos documentos donde damos ejemplos. Esto lo haremos ahora desde cero. Hacemos un ejemplo. Digamos que somos una empresa, y en esta empresa, queremos tener un GPD que haga la incorporación por nosotros. Así Crea. No vamos en Crear, sino en configurar. Nosotros lo llamamos onboarding. A bordo de nuevos miembros, quiero hacer esto realmente simple. Usted es el director general de la empresa AI With Arnie. Tu objetivo es embarcar a la gente. Si tienen preguntas, busca sus conocimientos y les da información. Entonces este es básicamente un prompt del sistema realmente simple que podemos dar aquí mismo. Ahora podemos dar, por ejemplo, conversación de Zone si queremos. Todas las personas que intentan trabajar en mi empresa solo me hacen estas dos preguntas. ¿Dónde está el baño y cuándo es el almuerzo? Entonces estas son algunas preguntas de inicio como, vamos, puedes pensarlo tú mismo, qué quieres incluir. Entonces el conocimiento, ahora podemos subir archivos. Y ahora hacemos un archivo sencillo. Esto podría ser un PDF. Esto podría ser un archivo de texto o algo así. Simplemente lo hacemos con un simple archivo de texto que estoy creando ahora mismo, y aquí escribo algunos infos, pero esto también podría ser un PDF grande con 50 páginas o algo así Y este es el infos que la gente necesita saber. El baño no está aquí. No necesitamos estar en nuestra empresa. Almorzamos cuando se hace el trabajo. Trabajamos los siete días de la semana. No tenemos vacaciones. Si quieres más información, ve aquí, y aquí básicamente también podemos dar un enlace si queremos. Simplemente lo hago con mi comunidad escolar gratuita, pero esto es en alemán. Entonces, vamos a hacer un ejemplo. Incluimos esto aquí mismo. Ahora guardamos esto, volvemos a Jet GPD y subimos nuestro conocimiento Así que sube archivos. Este es básicamente el archivo. Ahora también podemos usar otras herramientas. No necesitamos la búsqueda en la web y no necesitamos Dali como generación de imágenes para este GPD Pero supongamos que quieres que se incluya el análisis de datos. Pero creo que también esto no es realmente necesario. Lo que también puedes hacer si eres programador es crear nuevas acciones, pero creo que este no es realmente el punto de este pequeño curso rápido. Si presionas y creas nuevas acciones, básicamente puedes poner en peichm e incluir la URL diferente Básicamente también puedes llamar a diferentes API y arranques desde. Pero como dije, este no es el punto en estos momentos. Presionamos Crear, le damos a cualquiera que tenga un enlace, y presionamos seguro. Este es el vínculo que podemos compartir con las personas que trabajan en nuestra empresa, y presionamos ver GBD Y entonces simplemente podemos preguntar, entonces, ¿dónde está el inodoro? Y si pregunto, sombrero GPD dirá lo más probable es que la compañía no tenga inodoro Entonces básicamente, se puede ver aquí. Parece que nuestra empresa no cuenta con aseos diseñados. Empecé, el baño no está aquí. No necesitamos orinar en nuestra empresa. Y si quieres más información, puedes presionar sobre este enlace, y básicamente estás aquí. Entonces la siguiente pregunta, digamos ¿cuándo tenemos vacaciones? Trabajamos los siete días de la semana y siempre el vínculo con nuestra empresa. Ahora, digamos que ya no quieres tener este enlace. También puedes ir a hacer esto aquí mismo. Siempre se puede personalizar el GPT. Explora GPT, mi GPT, luego aquí en Editar GPT, y aquí en Configurar, solo das el enlace si la gente pregunta por más información Ver GPD cuando tenemos vacaciones, no tenemos vacaciones en nuestra empresa y trabajamos los siete días de la semana Así es básicamente como se puede entrenar a un LLM. Puede usar las indicaciones del sistema y puede escribir cómo debe comportarse ChTGBD Entonces puedes usar indicaciones normales en la interfaz con las indicaciones de disparo Ya lo sabes. Y por último, también puedes usar tecnología directa y entrenar tu propio GPD Y este GPD, también puedes compartirlo con otras personas para que puedas enviarles el enlace Esta es la llamada tecnología directa. Aquí funciona una base de datos vectorial. No necesitamos hacer una inmersión profunda en estos, sino que solo déjate claro. Puedes dar instrucciones y puedes subir archivos, para que el chat GPD pueda navegar por estos archivos y tenga infos específicos sobre ti o tu Y si, trabajar en mi empresa no es divertido. 9. Perplejidad y huggingchat: Quieres explorar más herramientas donde puedas usar LLMs, puedes echar un vistazo más de cerca a Hugging chat Abrazar el chat es realmente fácil de usar. Aquí puedes presionar qué LLM de código abierto quieres usar. Por ejemplo, Lama 3.1, el modelo 70 B, un modelo Quin, algunos modelos de MNVdia o algunos modelos Simplemente haga clic en el modelo que desee utilizar. Puede escribir un mensaje del sistema si lo desea y, a continuación, presionar Nuevo CAT. Y aquí tienes también herramientas. Entonces sí, también pueden usar diferentes herramientas al igual que HGBD. Pueden utilizar un modelo de difusión para generar imagen. Se pueden incluir editores de imágenes. Pueden veterar a RL. Tienes un documento, bar ser, una calculadora y una búsqueda en la web. Entonces esto es básicamente de alguna manera como un HIPT de código abierto para siempre gratis Y entonces tenemos perplejidad. La perplejidad es similar a la búsqueda HHIBT. Puedes jugar un poco con esto. Ya no uso mucho esta herramienta porque HHIBT también es ahora relativamente buena con esta herramienta de búsqueda, pero puedes probar la perplejidad También puedes comenzar gratis. No tienes que hacer una cuenta. Sólo empieza gratis, mira lo que te gusta, y tal vez te quedes con algo. 10. Los desarrolladores pueden usar LLM a través de la API de OpenAI: Eres desarrollador, también puedes incluir HCBT en tus propias aplicaciones Se puede utilizar en el OpmiPlayground. Esto quizás también sea interesante para ti si quieres usar los modelos HHIBT más nuevos, pero no quieres pagar 20 dólares al En este patio de recreo, simplemente puedes pagar sobre la marcha, pagas por token. Y quiero mostrarte cuánto necesitas pagar, cómo funciona y cómo puedes hacer llamadas ABI a HGBT Lo primero es que vayas en esta plataforma. Así plataforma domi.com slash PlayGround y aquí podrás jugar con todos En el chat, puedes jugar con los modelos de chat. Puedes usar sus más nuevos. Entonces GPD four mini, GPD 40 y así sucesivamente, puedes seleccionar lo que quieras También puede importar funciones. Entonces sí, también puedes hacer llamadas a funciones si eres un codificador Yo sólo quiero que esto sea rápido. Por favor, discúlpeme. Entonces formato de respuesta, esto es ahora mismo texto, pero también puedes usar JasnfMat y así sucesivamente Aquí tenemos temperatura y longitud máxima. Simplemente puedes leer esto por ti mismo. Básicamente, si se disminuye la temperatura, JGIPD será más preciso, pero puede ser un poco repetitivo, sobre todo para tareas matemáticas, esto es bueno Y la longitud del contexto es simplemente la salida. Entonces, ¿cuánto tiempo puede ser la salida que te da ChaChipD? Estos son los ajustes más importantes aquí mismo. Entonces aquí en el medio, ves que tienes las instrucciones del sistema, así que esto es básicamente el baile de fin de curso del sistema al igual que las instrucciones personalizadas que te mostré en el último video. Entonces eres un asistente útil, por ejemplo, y aquí puedes escribir tu texto con la misma normalidad. Cuéntame una historia sobre la tortuga en el desierto. Presionas Ejecutar, y luego ChatBT básicamente te hablará y podrás usar siempre los modelos más nuevos sin límite, y siempre pagas sobre la marcha Quiero mostrarte cuánto cuesta esto. Si vamos a esta sección de precios, vea que podemos usar GPD 40, por ejemplo, y tenemos que pagar $2.50 por 1 millón en tokens de entrada y $10 en tokens de salida Y cada modelo tiene sus diferentes precios. Si te desplazas hacia abajo, por ejemplo, también puedes llamar a los otros modelos. Se puede utilizar el modelo GPD 40 Mini. Esto es muy, muy barato. Puedes usar la vista previa de Obo. Esto se pone un poco más caro. Puedes usar la API en tiempo real. Esto es muy caro. Entonces aquí puede subir hasta 200 dólares por 1 millón de tokens de salida. Esto es simplemente si HHIBT te hablará, entonces en el formato de audio, y también puedes generar imágenes con Dali si llamas a los endpoints, y pagas Si volvemos aquí, quiero mostrarle en la esquina izquierda que tiene aquí el tiempo real. Entonces puedes presionar en tiempo real, y también puedes platicar aquí con estos modelos. Dame una pequeña broma quiero reír. Claro. Aquí tienes una pequeña broma para ti. ¿Por qué no puedes darle un globo a Elsa ? Porque ella lo dejará ir. Entonces eso es básicamente todo, y aquí tenemos que pagar por re salida. Entonces tenemos la asistencia. Estas ayudas, esto es básicamente exactamente lo mismo que estos CPD, así que podemos incluir al Ruck y todas estas Y también podemos hacer nuestras propias aplicaciones con estas. Si entramos en texto a voz, puedes escribir texto y recuperarás el discurso. Entonces, oye sombrero GPD, básicamente, quiero generarlo. Sombrero GBT, me gustas. Y ahí se puede escuchar. Alloway nos dice estas cosas que tecleamos aquí. Hey sombrero GBT, me gustas. Y entonces tenemos también el modo de finalización aquí. Si quieres usar esto, debes presionar en tu cuenta. Necesitas presionar en tu perfil, pasar a la facturación, y aquí necesitas insertar tu tarjeta de crédito. Así que simplemente presiona a los métodos de pago, y aquí necesitas incluir tu tarjeta de crédito. Entonces necesitas darle a HatChipt un poco de equilibrio, y luego esta cosa funcionará para Por supuesto, también puedes establecer algunos límites. Si vas a límites, puedes darle algunos límites a HachPT. En este momento tengo 500 dólares mensuales como límite. Si presionas sobre el uso, siempre puedes ver cuánto te cuesta por día. Entonces este fue un día en el que tuve que pagar cinco dólares porque también tengo algunos chatbots, y aquí un chatbot hablaba Y entonces si vamos en octubre, este es también el uso a partir de octubre, así que en este momento son 28 dólares. Estos son chatbots que he incluido en algunos sitios web y gente está usando estos chatbots y por eso necesito pagar un poco Si solo juegas un poco con esta cosa, creo que solo jugarás unos centavos. Aquí puedes ver con $0.13 puedes jugar con estos modelos Vuelves aquí a tu tablero, también puedes ver que puedes hacer muchas más cosas aquí. Puedes seguir afinando, y aquí puedes afinar tu propio modelo si quieres. Este no es realmente el punto de este curso. Pero si vas a las claves API, también puedes hacer llamadas a la API. Así que simplemente necesitas crear una nueva clave secreta. Le das un nombre, y luego puedes copiar tu clave API y llamarla en tus propias aplicaciones. Si eres desarrollador, solo tienes que ir a la documentación. Puedes pasar al inicio rápido, y aquí te dicen lo que tienes que hacer Necesitas crear una clave API. Entonces puedes llamar a estos endpoints, por ejemplo, en PyTNPP instalar Opmei, esto es Y aquí puedes ver, por ejemplo, si quieres generar texto en tu propia aplicación, puedes usar Ashima así Si quieres generar una imagen, puedes usar algo como esto. Llamaríamos a Dali por ejemplo, y si quieres crear incrustaciones vectoriales, puedes llamar a sate Es realmente fácil con este inicio rápido. Entonces, si eres desarrollador, la API de Opmeei es realmente fácil de usar, y puedes llamarla con JavaScript con Piton o con Curl Si no eres desarrollador, más probable es que esta plataforma no sea para pero en términos generales, es relativamente fácil. Me gusta, por ejemplo, flow wise, y uso la API OMI para hacer agentes de IA. Pero como dije, esta no es una inmersión profunda completa. Si solo quieres aprender esto lo más rápido posible, esta plataforma es quizás una opción para ti si no quieres pagar estos 20 dólares al mes por la interfaz HGPTPlus porque aquí puedes trabajar con los modelos más nuevos y solo pagas por los tokens que Y los tokens son relativamente baratos de generar. Para que puedas jugar un poco con esta plataforma y ver si es para ti o no. Y por supuesto, también todos los demás LLM tienen sus propias APIs Por lo que Google también tiene la API para los modelos Gemini. Andthropic tiene la API para los modelos Cloud. Y si quieres trabajar con un LLM de código abierto, puedes usar, por ejemplo, la API de Grock, o también puedes hacer tu propio servidor con, por ejemplo, ALM Studio o Entonces tienes un sinfín de opciones. Puedes hacer tus propios endpoints si lo usas localmente en tu PC o puedes usar diferentes llamadas API Como dije, esto es más como una guía general para desarrolladores si quieres desarrollar con estas cosas y si no, omita este video. 11. Resumen de LLM: Esta sección, has aprendido mucho y lo hicimos lo más rápido posible. Empezamos con todas las interfaces de estos diferentes LLM, y sabes que hay muchas Cha ChipD coágulo, Gemini, también puedes usar Oma, puedes usar Puedes usar muchas interfaces diferentes, incluso abrazando chat y mucho, mucho más Todos ellos funcionan relativamente similares. Siempre tienes una pequeña y agradable interfaz de chat. Los LLM básicamente pueden hacer solo dos cosas. Pueden expandir texto o pueden hacer que el texto sea más pequeño. Pero esto es grande. Puedes usar código, puedes usar texto normal. Se pueden hacer tablas, y los LLM también pueden llamar a herramientas. Y las herramientas pueden ser, por ejemplo, un poco intérprete, un modelo de difusión , Internet, y puedes analizar datos, hacer gráficos y hacer muchas cosas interesantes con estas cosas. Quizás en el futuro, se conviertan un sistema operativo completamente nuevo, y por cierto, los LLM también pueden hablar entre sí, y luego los llamamos agentes. Y también aprendiste que las LLM son multimodelo. Básicamente pueden ver, hablar y escuchar. Solo consigue una buena salida si das buena entrada. Y te mostré los fundamentos de la ingeniería rápida. Por favor, recuerde la asociación semántica. Hay que dar contexto. Puede hacer esto a través de las indicaciones de disparo, son indicaciones de rollo. Deberías estructurar tus indicaciones, y hay algunos consejos como, ejemplo, pensar paso a paso Además de eso, también tenemos la cadena del pensamiento, el árbol del pensamiento, la ingeniería rápida inversa , y mucho, mucho más. Pero creo que para la mayoría de la gente, esto es exagerado. Esto no es realmente necesario. Si quieres personalizar el reino, puedes hacerlo totalmente. La forma más fácil es probablemente el prompt del sistema. Simplemente puedes dar algunas instrucciones. Entonces tenemos tecnología directa, por lo que podemos simplemente subir datos y luego hat CPD o cada uno de los demás LLM puede navegar por estos datos y simplemente reaccionar de una manera específica Por supuesto, si eres desarrollador, puedes hacer todo esto también a través de la API. Puedes desarrollar tus propias aplicaciones y puedes hacer todo esto también en tus propias aplicaciones. Puedes hacer llamadas a funciones en tus propias aplicaciones. Puedes hacer agentes completos con tus propias aplicaciones con herramientas como flow wise. Puedes crear imágenes dentro de tus propias aplicaciones. Puedes usar la visión dentro tus propias aplicaciones, puedes hacerlo todo. Has aprendido los fundamentos de estos LLM. Pueden hacer muchas cosas, y creo que deberías empezar. Simplemente úsalos porque recuerda, solo aprendiste si cambias tu comportamiento. Ganar significa las mismas circunstancias pero diferente comportamiento. A lo mejor no sabías usar LLM, ahora lo sabes. Sólo aprendiste si lo haces. Si quieres ser una cookie inteligente, simplemente puedes compartir este curso porque más gente sabe siempre más la vista de las personas, para que todos puedan aprender juntos. Gracias por eso, y los veré en el siguiente video porque así fue para Lams ahora empezamos a crear cuadros con modelos de difusión 12. El modelo de difusión: La sección trata sobre modelos de difusión, y hay muchos modelos de difusión por ahí. Tenemos Dalí, tenemos Imagen, tenemos difusión estable. Tenemos a la Sra Ra hace videos. Contamos con modelos mid Journey y difusión también podemos hacer música y, por supuesto, también audio. Entonces básicamente lo que hacemos es, quiero mostrarte el proceso de difusión en este video, y luego profundizaremos en algunos de los mejores modelos de difusión. Entonces primero, cómo funcionan los modelos de difusión, y lo hacemos realmente fácil y rápido. Así que he encontrado un artículo muy, muy agradable para medium. Todo lo que necesito es esta foto de aquí. Supongamos que tenemos una computadora grande, grande y entrenamos nuestra computadora en imágenes en imágenes como esta. Entonces le damos a la computadora imágenes, por ejemplo, de esta playa y la describimos con un texto. Le damos la imagen a la computadora, y decimos tal vez una playa con el océano azul, cielo azul. Hay algo de verde en las montañas y así sucesivamente. Somos muy, muy específicos. Después de eso, agregamos algo de ruido a la imagen, como se ve aquí, pero seguimos describiendo lo que hay en la imagen. Entonces una playa, océano azul, cielo azul, y así sucesivamente. Más ruido, mismo texto, más ruido, mismo texto, más ruido, mismo texto hasta que solo se obtiene ruido. En este proceso, la computadora aprende cómo se ven estas imágenes. Este proceso simplemente entiende que las palabras que le diste la computadora ceden a esta imagen. Para que podamos revertir esto. Si solo tenemos ruido, y le decimos a la computadora una playa, cielo azul, océano azul. Hay algo de verde en las montañas y así sucesivamente. La computadora puede revertir esto y hacer con el ruido esta imagen. Por supuesto, no hacemos esto con una sola imagen. Tratamos de darle a la computadora cada imagen que podamos encontrar. Y hay, por supuesto, diferentes modelos de difusión. Por ejemplo, también está Adobe Firefly. Adobe Firefly se capacita en imágenes de Adobe Stock. La difusión estable es de código abierto y es gratuita. Todo el mundo puede usarlo. Y se entrenó la difusión estable en imágenes de Internet. Y debido a esto, también podemos crear casi todo lo que hay en Internet. Podemos crear hasta celebridades. Podemos crear cosas de trabajo de NSAFEF, y así sucesivamente. La difusión estable no está restringida. Casi todo lo que hay en Internet, podemos crear con difusión estable si damos las indicaciones correctas Las indicaciones son las descripciones que le damos a la computadora para hacer nuestra imagen Y para esa instancia, es muy, muy importante hacer buenas indicaciones porque necesitamos buenas fotos Si no somos específicos, podemos crear unas imágenes que se vean así. Si simplemente decimos tal vez una playa, obtendremos una playa al azar. Si le decimos una playa, océano azul, cielo azul, etc., obtendremos exactamente esta imagen. Una ilustración rápida de este proceso porque a algunas personas les gusta esta ilustración, la uso mucho. Solo imagina que te acuestas en el suelo y miras en el cielo. A tu lado está tu novia o tu novio o quien quieras. Y ella te dice, ¿ Puedes ver esta nube? Se parece un poco una manzana, pero no la entiendes. No ves la manzana. Pero entonces ella te dice, claro, solo mira, aquí está la manzana, y luego empiezas a entender ves la nube, y ahora tus ojos ven una manzana porque tu cerebro está entrenado en manzanas. Lo más probable es que tu cerebro sepa cómo se ve la manzana, y luego la ves en la nube. Aunque no haya manzana ahí. Y si tu novia no dice que tal vez sea una manzana verde, lo mejor piensas en una manzana roja, y es exactamente por eso que necesitamos usar una buena ingeniería rápida. Porque si no somos específicos, obtendremos fotos aleatorias. Si quieres tener una manzana verde, debes decirle a la computadora que quieres tener una manzana verde. Al igual que tu novia necesita decirte que la manzana en las nubes es verde. Si ella no te dice eso, mejor pensarás en una manzana roja, tal vez en una manzana verde, tal vez hasta una manzana amarilla que no conoces, así que necesitas ser específico. Entonces en este video, echamos un vistazo rápido al modelo de difusión. El modelo de difusión funciona de forma sencilla. Está entrenado en imágenes y en texto. Entonces se agrega ruido. La computadora aprende en este proceso cómo se ve esta imagen. Y si después le damos texto a la computadora, puede crear estas imágenes porque seleccionará aleatoriamente los píxeles que sean adecuados para nuestra imagen. Espero que esto tenga sentido para ti. 13. Ingeniería rápida para modelos de difusión: comienza con DALL E: Este video, comenzamos a usar nuestro primer modelo de difusión, y queremos comenzar con Dali porque Dali es el más fácil de usar Dali trabaja dentro de JathPT así que ya conocemos la interfaz y las indicaciones son muy fáciles de escribir porque Por lo que el LLM te ayudará a crear mejores prompts. Lo primero que puedes hacer es, por supuesto, simplemente entrar en JathPT Puedes trabajar con el multimodelo normal JathPto puedes explorar GPT y puedes Si vas a comprar HatchPT, puedes presionar sobre Dali y aquí puedes iniciar Y aquí puedes crear tus fotos. Puede agregar aquí cosas para tus indicaciones y también puedes usar diferente relación de aspecto Vamos a usar la pantalla ancha. Y ahora solo quiero comenzar con un prompt realmente simple. Yo solo quiero escribir CAT. Dejamos la relación de aspecto blanca, y la enviamos, y luego recuperaremos nuestra primera foto . Y ahí lo tenemos. Aquí están nuestras dos primeras fotos. Ahora bien, si presionas sobre esta imagen, puedes ver exactamente qué pronta cedió a este resultado Entonces, si presionas sobre estos aquí mismo, este es el prompt. Una imagen blanca bellamente detallada ofrece un gato de lluvia sentado junto una ventana con luz solar suave y así sucesivamente. Entonces ves que el prompt es realmente detallado, y quiero mostrarte cómo necesitamos escribir prompts para este modelo de difusión Recuerda, en Dalí, es muy fácil porque Chachi BT te ayuda a escribir mensajes tan hermosos, y entonces realmente no es magia crear buenas imágenes Dali no es el mejor modelo de difusión, pero es el más fácil de usar Si quieres escribir buenas indicaciones por tu cuenta, deberías echarle un vistazo a estas Es necesario incluir sujeto, medio, ambiente, relámpago, color, estado de ánimo y composición. Lo que significa todo esto. Para que puedas hacer fotos de personas, de animales, de personajes , ubicaciones, objetos, etc. El medio podría ser una foto e ilustración o algo más. El ambiente podría ser al aire libre en la luna o en algún otro lugar. El relámpago podría ser luces de estudio, luces de neón o algo más. Los colores pueden ser vibrantes, coloridos, blanco y negro, y así sucesivamente. El estado de ánimo para que el gato pudiera ser, por ejemplo, tranquilo o pacífico o algo así. Y la composición podría ser, por ejemplo, una vista de cuerpo completo. Así que asegúrate de incluir estas cosas. No tienes que incluir estas cosas, pero si no las incluyes, las imágenes serán más aleatorias. Para que puedas obtener una foto o una ilustración. Si no lo ves específicamente, todo puede pasar. También hay guías de incitación más grandes. Y puedes incluir cosas como tema, acciones, opciones de entorno, color, estilo, estado de ánimo, relámpago, perspectiva o texturas de punto de vista, periodo de tiempo , elementos culturales, emociones, medio , ropa, texto, etc. Esta es una guía de incitación gigantesca. Sólo quiero dejarte con estos para que puedas leerlo tú mismo. Pero si quieres hacerlo rápido, solo piensa en las cosas porque estas cosas son las que más importan. Un ejemplo que podría funcionar es algo así. Una ilustración de un gato relajado en una ciudad en colores vibrantes, vista de cuerpo completo a la hora dorada con una proporción de 16 a ninpec Entonces, si simplemente copiamos estos, podemos tirarlos al Ali. Así que de vuelta al Ali, lo incluimos, y luego obtenemos una salida específica. E incluso aquí, ChatBT te ayudará a crear aún mejores indicaciones Pero este es un prompt que funciona en cada uno de los modelos de difusión. Las técnicas de incitación trabajan cada vez lo mismo. Y aquí ves ahora mismo tenemos un panorama realmente específico. Tenemos exactamente la imagen que queríamos tener. Y si haces clic en él y vas en el prompt, ves que el JetPd hace que tu prompt sea aún mejor Puedes hacer que las indicaciones sean aún mejores al incluir algunas palabras mágicas Por ejemplo, película cinematográfica grano, ultra realista, dramático relámpago Puedes usar diferentes tomas y lentes de cámara si quieres el punto de vista, el disparo del dron, etc. Puede utilizar cámaras con aspecto cinematográfico. Se pueden utilizar diferentes cineastas. Puedes usar Géneros. Puedes usar palabras clave para movimientos, por ejemplo, escena de acción. Se pueden utilizar diferentes fotógrafos, por ejemplo, fotógrafos deportivos. Se pueden utilizar cámaras con escenas de acción, por ejemplo, la Canon EOS, una D X, Mark dos. Puedes usar todos estos diferentes relámpagos tan brillantes, cálidos, fríos, relámpagos de bajo perfil, y así sucesivamente. Puedes usar el ener de oro, y puedes usar todas estas emociones diferentes. Así que asegúrate de incluir lo que quieras ver. Esto es lo más importante porque todos estos modelos de difusión están entrenados en imágenes con descripciones detalladas, y si haces una descripción detallada, también recuperas lo que quieres. Si solo escribes gato, el gato podría ser aleatorio. Y ahora quiero mostrarles una vez más estas indicaciones de difusión Espero que sepas cómo hacemos esto. Esto ayuda con la ingeniería rápida. Si escribimos en estaca aquí, obtendremos un prompt detallado para una participación, y ya sabes cómo funciona esto. Si simplemente copio estos, por supuesto, puedo tirarlos a la interfaz Dalí, y luego voy a recuperar una foto en la escuela Así que vamos a tirar estos aquí. La relación Spec es ahora mismo uno por uno. Esta es la configuración de devoltio, y este aviso funcionará muy bien porque hemos entrenado a tal GPT Ya sabes cómo entrenar a tal GPT, y ahora quiero mostrarte los datos de entrenamiento Pero primero, echemos un vistazo a la hoguera. El escenario es realmente bueno porque también incluimos cámaras con lentes de cámara y así sucesivamente. Si pasamos a las indicaciones de difusión, simplemente digo en las instrucciones que este GPD necesita para hacer buenas Y luego subo este documento, y este documento es una estructura completa, cómo el LLM debe estructurar estos prompts Mis datos de entrenamiento se ven algo así. El prompt estructura un medio de sujeto con las características en relación fondo, luego el fondo, los detalles del fondo, las interacciones con el color y el relámpago, y luego asumir o dibujar con rasgos específicos de estilo. Doy algunas descripciones, después algunos ejemplos que me gustan. Y por último, claro, incluyo todas las pequeñas palabras clave bonitas que hacen que estas imágenes sean mejores. Simplemente puedes usar mi GPT si no tienes tiempo para entrenar tu propio GPD, y simplemente te vincularé este GPT Así que puedes hacer muy buenas indicaciones muy rápido. Entonces en este video, has aprendido a usar cualquier modelo de difusión. Es importante escribir un buen prompt, y un buen prompt debe ser específico con el tema, el medio, el ajuste, el relámpago, el color, el estado de ánimo, composición, y eventualmente también la relación spect Y si no quieres escribir estas indicaciones tú mismo, puedes usar ALE, y HechPT te ayudará automáticamente Y si quieres escribir muy buenas indicaciones también para cada otro modelo de difusión, simplemente puedes usar MGPD y obtener mejores salidas Y en el siguiente video, quiero mostrarles los fundamentos de Maturne ALE es la más fácil de usar, y Mahoney puede hacer muchas más cosas. Y te recomendaría encarecidamente que hagas tu primera foto en DLI ahora mismo porque aprendes más haciendo 14. Conceptos básicos de Midjourney: Este video, quiero hablar de Mi hourney. En mi mente, Mi Journey es uno de los mejores modelos de difusión, sobre todo si quieres hacer cuadros realistas. Lo primero que debes hacer es ir a su página web. Ahora mismo en este Minish, puedes probar esto completamente gratis Creo que puedes hacer aproximadamente 30 fotos gratis en su página web. Necesitas ir a mimichourny.com, y luego crear tu cuenta Simplemente puedes iniciar sesión tú mismo con Google. Tan pronto como hayas creado tus 30 fotos, más probable es que necesites actualizar tu plan. Te cuesta, creo, nueve dólares al mes. Si estás en Explora, puedes ver lo que otras personas están haciendo, y ves las fotos, se ven muy bien. También puedes ir a la búsqueda y búsqueda, por ejemplo, de perros, y luego puedes encontrar algunas fotos sobre perros. Lo siguiente es que puedes buscar hot para top diario, y para likes, y luego simplemente puedes encontrar por ti mismo lo que te gusta. Si quieres crear algo, deberías ir a crear. Aquí están las fotos que ya has creado. Lo más probable es que no tengas ninguno. Y si quieres crear nuevas imágenes, necesitas escribir tu prompt aquí mismo. Entonces simplemente escribe lo que quiere ver. Yo solo quiero correr con este prompt aquí. Cabeza de ciervo navideño con rosa, lazo e ira navideña Acuarela pastel sobre fondo blanco en el estilo y así sucesivamente. Lo siguiente que puedes hacer es presionar aquí, y aquí tienes algunos ajustes. Entonces puedes hacer esto en la relación de aspecto que más te guste. Digamos solo uno por uno o 16 por nueve porque podemos verlo un poco mejor en un curso. Entonces tienes el modo. usar el modo estándar o el modo raw. El modo raw es mejor para cosas realistas. Se pueden utilizar diferentes versiones. Normalmente, siempre usamos los más nuevos, así que por ejemplo, 6.1 en este momento. Esto es personalizado, así que si ya has creado muchas fotos, puedes adaptar tu estilo. Entonces tienes estilización, y si no sabes lo que esto significa, solo tienes que ir con el mouse sobre ella Mid churney puede agregar un estilo específico de viaje medio, y si lo aumentas, tienes más estilo La naturaleza silvestre puede hacer que genere resultados inesperados y la variedad en su cuadrícula Entonces creas cuatro imágenes, y si subes con esta variedad, estas imágenes variarán un poco en tu cuadrícula. Entonces tienes rápido y Durbo solo déjalo rápido, y luego creamos nuestra primera foto Si enviamos esto, podemos crear esto. Y mientras esto está creando, quiero mostrarles el asiento porque el set es siempre el primer punto de partida de cada cuadro. Si presionamos sobre estos y tecleamos en el asiento del tablero. Podemos usar un asiento aleatorio, por ejemplo, esto aquí mismo. Y ahora vamos a obtener dos fotos diferentes. Esta imagen no será completamente la misma que esta imagen, pero si vuelvo a hacer esto y también utilizo una vez más el mismo asiento, volveremos a recrear exactamente la misma imagen Déjame mostrarte por un momento rápido porque el asiento es importante si quieres crear consistencia de carácter. Entonces, si vas aquí abajo, estas son las primeras cuatro fotos. Esta Navidad los venados son agradables. Ahora son los segundos cuatro, y ya ves que no son completamente los mismos que los primeros. Entonces ya ves que estamos un poco más cerca. Generalmente, son similares pero no los mismos. Pero ahora si vamos aquí arriba, verá que tenemos exactamente las mismas fotos que aquí. Entonces esta es la misma imagen que esta imagen porque hemos usado la misma semilla. Entonces, si quieres tener consistencia de carácter, puedes trabajar con las semillas, y luego tal vez puedas ajustar el prompt solo un poquito, y siempre tienes estilos realmente similares Así que recuerda, la semilla es importante. Esto es básicamente lo primero que puedes hacer. Y si no te gusta una de estas imágenes, también puedes editarlas. Si presionas sobre estas imágenes, ves que tienes muchas opciones diferentes que puedes hacer aquí. Aquí puedes hacer variaciones pequeñas o fuertes. Al presionarlo, va automáticamente. Entonces puedes hacer un upscaling. Puedes hacer un dial zop o un escalado creativo y la resolución se hace Así que vamos a presionar en el exclusivo. Entonces también puedes remezclarlo. Y si no lo entiendes, sólo tienes que ir con el ratón sobre él. Si presionas subdile o fuerte, simplemente puede modificar su prompt y hacerlo un poco diferente Pero ahora mismo, no quiero hacer esto. Lo siguiente es pan, Zoom, y aquí tienes también más. Pero antes de mostrarte esto, quiero mostrarte exclusivo. Si cierro esto abajo y vuelvo a crear ves que esto aquí mismo son las primeras variaciones. Entonces ya ves que tenemos esta imagen, y ahora tenemos cuatro variaciones diferentes de esta imagen que son realmente, muy similares, pero un poquito diferentes. A veces un poco más de estas cosas rojas, a veces un poco menos. Entonces ves que estas son solo pequeñas variaciones. Y aquí, esto ahora mismo es el upscaling. Así que hicimos una pequeña imagen en mayor resolución. Si presionas sobre esto o si lo descargarías, esto simplemente tiene la resolución más alta si acercas mucho. Entonces ves que la resolución aquí es muy, muy buena. Comparado con el primero, es mucho mejor, así que ya ves que está más claro. Entonces simplemente hace que la resolución sea un poco más grande. Después tenemos pan y Zoom. Ya no me gusta esto porque ahora mismo tenemos en más el editor. Y si presionas sobre este editor, puedes editar esta imagen. Y aquí se puede hacer lo mismo que con el Pan y Zoom. Simplemente puedes hacer esto aquí mismo, por ejemplo, y luego presionas enviar, y ahora Mick Cherney hará el out pintando y pinta también aquí nuevos píxeles en él Pero también puedes hacer más. Se puede editar también con el inpainting. Digamos que esto no te gusta aquí mismo. Simplemente puede eliminarlo y luego hacer que su prompt sea un poco diferente. Entonces no queremos tener el prisionero rosa. Entonces presionamos enviar, y luego obtendremos una pintura en sin el prieto rosa. Simplemente sigamos creando y luego podrás ver qué pasa. Entonces aquí están las primeras cuatro generaciones, así que ya ves que simplemente hemos generado algunos píxeles nuevos. Esto tampoco fue perfecto, pero sí, vamos. Al menos el panorama se hizo más grande. Por cierto, creo que este me gusta. Eso no es tan genial. Sí, están bien. Y aquí están los siguientes sin el amigo rosa. Entonces así es como puedes editar tus fotos. Si vas organizado, tienes un montón de carpetas diferentes que puedes hacer solo para que sea un poco más claro. Si vas personalizado, como dije, te pueden gustar diferentes imágenes, y luego puedes adaptar tu estilo específico. Si vas a editar, creo que no todo el mundo tiene esto ahora mismo. Creo que necesitas estar mucho tiempo en esta página web para poder obtenerla. A lo mejor en cuanto veas el curso, también tienes esto. Simplemente puedes subir una imagen desde tu computadora y puedes hacer el en la pintura completamente igual. Así que solo presiona sobre esto, y ahora solo quiero subir esta foto aquí mismo, y digamos que quiero tener un sombrero verde. Si borro esto, puedo escribir en el prompt, lo que quiero ver chico con verde entonces lo mandamos y vamos a conseguir la cabeza verde muy probablemente. También vamos a crear aquí mismo el fondo, al menos cómo lo veo porque esta imagen no tenía fondo. Para que puedas editar tus propias fotos realmente, muy rápido. Y ahí vamos, esto es un desastre. Pero tal vez el siguiente sea mejor. Sí, esto es mucho mejor. También, esto funciona. Sí, vamos. Estas cosas son geniales. El primero es un poco desordenado, pero el segundo, el tercero, y el cuarto, están relativamente bien. Por lo que también puedes editar tus propias imágenes, y también aquí, puedes hacer la pintura al aire libre. Digamos que quieres tener diferente resolución. Simplemente puede presionar Enviar, editar, y luego obtendrá su nueva imagen, y recreará los píxeles aquí abajo Y, boom, ahí lo tenemos cuatro fotos completamente nuevas. Algunos de ellos son buenos, algunos de ellos no son realmente tan buenos. Y por cierto, si no te gusta tanto una imagen, claro, simplemente puedes entrar y editarla con el inpainting Entonces digamos que esto no fue perfecto, y tal vez también esto no fue perfecto, puedes editarlo. Creo que entiendes lo que quiero decir. Lo siguiente que puedes hacer en cuanto hayas creado tal imagen o en cuanto la hayas editado con las matrices o con lo que sea, es que también puedes hacer re textura. Si presionas sobre re textura aquí, entonces esto es ahora mismo ya no la edición, sino la textura re. Puedes cambiar un poco esta imagen. Puedes hacer fotos similares. Esto funciona de manera similar a la difusión estable. La difusión estable llama a esto redes de control. Y aquí Matrona también te dice lo que pasa. Re texture cambiará el contenido de la imagen de entrada mientras se intenta preservar la estructura original. Para obtener buenos resultados, evitando el uso de prompts incompatibles con la estructura general de la imagen Entonces lo que podríamos hacer aquí ahora mismo es, por ejemplo, que tecleemos chico con cabeza verde o simplemente chico con calor, y también tecleemos cyberpunk Entonces simplemente presionamos submit re texture, y luego obtendremos algo que se vea de alguna manera similar. Entonces tendremos una pose similar, composiciones similares, pero en un estilo cyberpunk Espero que puedan ver cómo funciona esto. Esta es realmente una característica genial. Hasta ahora, esto posiblemente estaba en difusión estable con las llamadas redes de control. Y ahora también podemos hacer esto a mitad de viaje. Así que recuerda, con la edición, puedes simplemente editar todas tus imágenes, y con la redexture, puedes redexture puedes redexture Puedes usar cosas que se llaman red de control y difusión estable también en medio viaje. Aquí, no tienes tanto control, pero esta también es una buena característica. Eso es básicamente todo lo que necesitas saber dentro de M journey si quieres crear realmente rápido. Sí, la herramienta es mucho más grande, pero si solo quieres comenzar lo más rápido posible, esto es todo lo que necesitas saber. Puedes crear imágenes, puedes editar imágenes. Puedes usar diferentes semillas para recrear el mismo estilo una y otra vez. Diviértete en Mjourney como te dije, lo más rápido posible 15. Ideogram y Adobe Firefly: Este video quiero darte una visión general de dos modelos de diusion Tenemos ideograma, y tenemos Adobe Vrefly. Estos son también dos modelos de divusion completamente separados. Adobe Firefly viene de, como Adobe, y también está integrado en Photoshop y así sucesivamente Creo que Adobe es especial de esa manera porque puedes crear imágenes, y Adobe solo entrena en imágenes de Adobe Stock. Así que no tienes que preocuparte por los derechos de autor y así sucesivamente. Esto es especial porque Money y así sucesivamente, pueden crear imágenes de beepers o también de empresas, y a veces puedes obtener reclamos de derechos de autor Pero si usas Adobe Firefly, este no es el caso. Y el ideograma es especial porque es muy bueno con Entonces en cuanto vas a una de estas páginas web, este de aquí mismo es ideograma, estoy en el plan libre Entonces no, tampoco pago por cada modelo bajo el sol. Y aquí tienes una interfaz realmente limpia. Tienes casa, y aquí puedes escribir lo que quieras ver. La ingeniería rápida siempre funciona igual. Aquí tienes todo el diseño realista, tres D y anime, y simplemente puedes buscar por ti mismo las cosas que te gustan. Si usas ideograma, recomendaría encarecidamente que crearas imágenes, por ejemplo, como estas Fotos donde se incluye texto porque aquí, ideograma es realmente bueno Solo hagamos una prueba. Un zorro que sostiene un letrero con las letras, atrapa si puedes y luego simplemente podemos hacer algunos ajustes. Entonces el prompt mágico, queremos tenerlo encendido o apagado. Si lo deja encendido, su mensaje se mejora automáticamente. Entonces la relación de especificaciones, la visibilidad, solo puedes ir privado si pagas, luego el modelo y la paleta de colores si quieres. Pero en este momento, solo quiero mandar esto. Ahí tenemos nuestras cuatro fotos. Si los presiono, sí, esto tomó un poco de tiempo en estos momentos porque solo pueden generar lentos si no se tiene un plan. Pero ves que el texto es realmente bueno. Atrápame si puedes. El texto es perfecto. Como el zorro es de alguna manera bueno. Entonces vamos a ver el siguiente. ¿Dónde está? Esto de aquí mismo, agárrame si puedes. El zorro es muy agradable. Entonces me gusta mucho este aviso o esta foto. Este también es relativamente bueno, pero este letrero está flotando un poco alrededor, así que me gusta este un poco más. Y esta es la última, agárrame si puedes. Además, esto es realmente bueno. Entonces básicamente, solo entra en este programa y juega un poco por ti mismo, sobre todo si quieres renderizar texto. Esto es realmente genial. Aquí también hay algo que me gusta. Logos y así sucesivamente son completamente perfectos. Hay una foto que me gusta, así que juega un poco con esto. Si vas a las creaciones, puedes ver lo que has creado. Entonces básicamente, hay algunas fotos que he hecho. Y si vas a Canvas, también puedes editar tus cosas similares luego en Murne Esto es básicamente todo lo que necesitas saber sobre Ideograma Idograma es realmente, muy fácil Lo siguiente es Adobe Firefly. Adobe Firefly funciona de manera similar. Aquí también tienes película generativa, texto a imagen, extensión generativa, y generar videos. Los videos en este momento no funcionan. Aquí necesitas unirte a la lista de espera. Pero absolutamente puedes crear y editar con Firefly. Si presionas sobre estos aquí mismo, estás en su página web Firefly Y si vuelves una vez más, ves qué cosas puedes hacer. Se puede hacer texto a imagen, película generativa, generar una plantilla, generar un vector Entonces, si usas Adobe Illustrator, también puedes generar vectores, recolores generativos y efectos de texto Se puede jugar con todas estas cosas alrededor. La interfaz es realmente fácil. Si pulsas sobre texto a imagen aquí simplemente puedes probarlo. También puedes usar las fotos que otras personas han hecho. Digamos que te gusta este, si lo presionas, éste se copia automáticamente. Aquí abajo, puedes escribir tu prompt y puedes probar este prompt, y en el lado izquierdo, puedes usar lo que quieras. Así que vamos a usar Firefly tres. Quiero tener el modo rápido, debería ser, por ejemplo, de cuatro por tres. Entonces, ¿cuál es el tipo de contenido? ¿Es arte o foto? Por ejemplo, el arte, luego las composiciones, también puedes subir las imágenes de referencia. Si quieres subir fotos de referencia, entonces puedes subir, por ejemplo, estilos de referencia. Así que digamos que quieres tener esta imagen de referencia, sí, pero para este prompt, realmente no es perfecta. Entonces esto no funcionaría tan bien. Entonces bajé la fuerza ar a cero, y luego quiero tener, por ejemplo, una referencia de estilo. Digamos que quiero tener un poco más de neón, así que incluyo la referencia de estilo. Entonces también podemos incluir otros efectos populares. Por ejemplo, el efecto hiperrealista, luego el color y el tono. Digamos que cálido. Entonces el relámpago, las luces de estudio, el ángulo de la cámara digamos solo el ángulo blanco, y luego puedes presionar try prompt. Y sí, este aviso es ahora mismo un completo desastre, pero espero que entiendas lo que quiero decir. Estos ajustes son realmente fáciles de usar, y aún así tenemos imágenes impresionantes. Sí, vamos. Me gusta mucho este tigre de aquí, así que absolutamente puedes jugar un poco con estas cosas alrededor. Si te gusta tu foto, claro, puedes descargarla. Y lo siguiente es, claro, que también puedes editar tus fotos. Puedes editar estas imágenes aquí si simplemente presionas aquí en editar, o también puedes editar tus propias imágenes. Si volvemos una vez más y presionamos sobre relleno generativo, puedes subir tus fotos aquí o puedes editar las fotos que ya están incluidas. Digamos que quieres editar esta imagen. Si lo presionas, puedes editar como quieras. Puede insertar, quitar o expandir. Si pulsas en Expandir, puedes hacer que estas imágenes sean más grandes. Si simplemente presionas generar, la luz biv simplemente hará el out painting e incluye aquí algo Entonces necesitas ver qué funciona para ti. Digamos que quiero tener esto y presiono mantener. Lo siguiente, quiero quitar algo, por ejemplo. Digamos que no quiero tener esta cosa graciosa aquí porque no tengo idea de lo que es esto. Simplemente puedo quitarlo, y luego debería desaparecer. Y, bam, ahí está. Quiero quedármelo porque creo que esto es lindo. Lo siguiente es insertar. Vamos a insertar algo aquí. Digamos que quiero insertar el tigre, por ejemplo. Entonces tigre, presionamos generar, y luego podemos insertar diferentes cosas aquí. Si quieres editar, por ejemplo, Bebor así esto funciona Puedes cambiarte de ropa. Puedes cambiar los colores del cabello. Puedes cambiar lo que quieras. Sí, este tigre es un desastre. Vamos, vamos a quedármela. Quiero mostrarte una cosa más con un humano. Entonces, digamos que quiero agregarlo a esto aquí mismo. Yo quiero hacer el inserto, y quiero que el queso lleve, por ejemplo, diferentes ropas Simplemente puedo copiar esta ropa aquí mismo, y luego puedo escribir lo que realmente quiero ver. Solo vamos a escribir, por ejemplo, Chamarra. Y ahí lo tenemos, y creo que esto resultó de alguna manera bien. Solo quedemos con el primero. Nada de esto es completamente perfecto. Adobe Firefly, esta es una herramienta que no uso mucho, pero a algunas personas les gusta Es especialmente potente si ya trabajas con Adobe Photoshop porque aquí está incluido. Si trabajas con Illustrator y Photoshop y así sucesivamente, deberías trabajar totalmente con Adobe Firefly Entonces esto era básicamente ideograma. Usa ideograma si quieres generar texto dentro de imágenes Y Adobe Firefly, yo personalmente diría, úsalo si ya usas el producto Adobe, así Illustrator y el Adobe Photoshop, o si quieres estar 100% seguro de que nunca infringe los derechos de autor porque Firefly está entrenado en Entonces prueba estas dos herramientas. Y, por supuesto, la ingeniería rápida es siempre la misma. Nos vemos en el siguiente video. 16. Modelos de código abierto: Hablar sobre modelos de difusión de código abierto. Principalmente, es difusión estable y flujo, pero también hay otros modelos como recraft y Omnigen y mucho Este tema es gigantesco, y tienes la mayor flexibilidad Puedes descargar estos modelos y ejecutarlos localmente en tu propia máquina o también puedes ejecutarlos en la Nube. La forma más fácil y rápida es ejecutarlas en la Nube. Pero no obstante, quiero mostrarte algunas opciones gratuitas para que también puedas ejecutarlas completamente gratis y no pagar por cada característica bajo el sol. Entonces la primera opción sería CFY. Ahora bien, la ciencia no tienes mucho tiempo en este curso, quizá no sea la mejor opción. La curva de aprendizaje es realmente empinada. Esto es CFI Tengo un curso que cubre esto en detalle, pero CFY no es lo que funciona muy rápido La segunda opción es, por ejemplo, web UI Forge. Esto corre relativamente fácil, relativamente rápido, pero también aquí, hay que descargar muchas cosas. Entonces tampoco es tan grande. Con Forge, también puedes ejecutar flujo de difusión estable y mucho, mucho más Lo que quiero mostrarles ahora mismo es el enfoque porque con enfoque, puede ejecutar una difusión estable, y la difusión estable es de código abierto, y se puede ejecutar de forma gratuita Ya sea en un portátil CLP o se puede instalar localmente. Si quieres instalarlo localmente, simplemente puedes hacerlo a través de este enlace. Entonces esto de aquí mismo, y luego puedes ejecutarlo localmente. Pero lo que quiero mostrarles ahora mismo es la forma más rápida, y esto es simplemente este portátil CLP Entonces abriendo C y luego puedes ejecutar este llamado notebook simplemente presionando en play, y luego obtendremos un enlace de radio con una interfaz agradable, y aquí podemos ejecutar ifusion estable Quiero mostrarte cómo funciona esto. Entonces quiero mostrarte Leonardo, y luego quiero mostrarte laxa. Esto lo hacemos rápido. Después de un tiempo obtienes este enlace, ejecuta en URL pública, y presionamos sobre este enlace aquí mismo. Entonces se abrirá una fase de grado. Y aquí tienes muchas opciones. Lo primero es que puedes presionar en Avanzado, y aquí tienes muchos ajustes. Si quieres comenzar rápido, solo deja aquí inicial, usa la velocidad. Número de imágenes, digamos solo una. Aquí, tenemos la salsa especial y difusión estable que también tenemos un prompt negativo. Puedes escribir lo que no quieras ver. Por ejemplo, feo y borroso o también colores, digamos solo rojo No queremos tener rojo en nuestro prompt, y luego tecleamos lo que queremos ver. Digamos que modelo de Instagram. Y si presionamos generar, crearemos nuestra primera foto, y tendremos un modelo de Instagram, y no será una imagen fea. Entonces esta es la calidad de imagen y no el modelo de Instagram que creamos. No será borroso y no será rojo, por lo que lo más probable es que el rojo no esté incluido. Y ahí lo tenemos como cabello castaño normal. Tenemos una linda foto, y la generación también está de alguna manera bien. Vamos. Utilizamos nuestro portátil refrigerado gratis. Podemos usar esto para siempre gratis, y creo que esto es genial. Ahí tenemos nuestra foto. La calidad es realmente buena. Entonces lo siguiente, puedes presionar sobre estilos. Aquí puedes escribir los estilos que quieras ver. Por ejemplo, un modelo lateral tres D. Si presionas sobre esto y si tecleas CAT, por ejemplo, solo digamos CAT. Crearás un CAT y de alguna manera se verá así. También he incluido una versión sharp y focus dos. Entonces también mezclaremos un poquito de fotoalismos. Si disminuimos este peso aquí y solo usamos el modelo si three D, será un poco más en esto. Entonces, ¿por qué parar esto, por ejemplo, y creo una vez más solo con este modelo si tres D y luego debería funcionar mejor. Para las siguientes imágenes, puedo incluir, por ejemplo, los otros estilos una vez más. Y acabo de parar esto ahora mismo. Lo siguiente son los modelos. También puedes usar diferentes modelos y diferentes auras, pero lo más probable es que si solo quieres usar este rápido, no necesitas hacer una inmersión profunda en modelos y Las Y los ajustes avanzados, muy probablemente, no los necesites. Pero lo que eventualmente necesitas es mejorar. Si presionas en mejorar, puedes hacer pequeñas variaciones, y también puedes hacer escalamientos completamente iguales que en medio viaje Y lo que también puedes hacer es presionar sobre la imagen de entrada. Aquí puedes subir imágenes, y también aquí puedes hacer upscalings Vamos a hacer una vez más un gato realista. Vamos a escribir gato aquí. Sí, hago un muy mal ejemplo aquí con la pronta ingeniería. Yo sólo quiero hacer un gato, y luego quiero mostrarte lo que podemos hacer aquí abajo. Y ahí lo tenemos ahora mismo tenemos a nuestro gato. Y si tiramos esto hacia abajo, podemos hacer variaciones. Entonces ya sea sutil o fuerte y si presionas en el dial Zu, también puedes escribir , por ejemplo, feliz, y obtienes un gato feliz. Simplemente puedes presionar Crear, y luego todo cambiará solo un poquito, y tal vez el gato intente sonreír. Sí, vamos a ver cómo funciona esto. Esto funciona un poco mejor con la gente si incluyes esto. Sí, vamos, tal vez se vea un poco más feliz. Funciona mejor si haces esto con humanos y si tecleas sonrisa, por ejemplo, o con colores, con este gato, podrías cambiar los colores un poquito. Entonces con estas variaciones, puedes jugar con ellas. También puedes hacer upscaling, así puedes hacer upscaling en dos semanas, la resolución, presionar sobre esto y luego presionar generar. Vamos a ver. Sí, vamos, se ve un poco más feliz, al menos como lo veo. Entonces lo que tienes es prompt de imagen, y esto es especialmente genial porque puedes presionar en Avanzado, y luego puedes subir aquí tus cosas y puedes usar Image prompt, Ba kenney, CPDS y face swap Déjame explicarte cómo funciona esto. Si incluyes esto aquí mismo y usas Image prompt, también puedes escribir , por ejemplo, do y si presionas Crear, los primeros fotogramas serán completamente los mismos fotogramas que este aquí mismo, así que podemos usar el estilo de esta imagen. Entonces solo ve por ti mismo que el estilo es realmente, muy similar al estilo de la generación anterior porque usamos la imagen de entrada con el prompt de imagen. Así que tenemos un estilo muy similar al de esta imagen. Espero que ya se pueda ver. Y ahí está. Tenemos un estilo muy similar, por lo que se ve el fondo verde, relámpagos similares, colores similares, y así sucesivamente. Lo siguiente que puedes hacer es Piracani o CPD. Estas dos cosas se llaman redes de control, similar al video anterior de mid journey. Si tecleamos, por ejemplo, Dier ahora mismo, usaremos un Pyraky Utilizaremos una red de control que controle la profundidad o las poses de estas imágenes. Básicamente, vamos a crear un terrible que está en un post similar a este gatito aquí Lo más probable es que se siente de alguna manera, y será una publicación muy, muy similar en esto de aquí mismo. Ser también la cola será completamente similar. También las orejas van a ser muy similares, pero deberíamos conseguir un tigre. Solo compruébalo tú mismo, tenemos las mismas composiciones, pero ya ves que creamos un tigre ahora mismo. Sí, esto se pondrá lindo, creo. Un pequeño tigre que se sienta completamente similar a nuestro gatito, pero los marcos serán recreados con un tigre Y después del 50%, los marcos también pueden hacerse cargo un poco más, y también cambió un poco. Entonces ahora mismo, ves que se pone cada vez más y más como un tigre y menos que nuestro gatito. Y si quieres tener aún más gatito en él o incluso una pose más similar, necesitas jugar un poco con estas redes de control. Verás, como si la pose no fuera perfecta. Es similar, pero no es perfecto. Lo que puedes hacer es aumentar un poco el peso y la apuesta stop. Si aumentamos la apuesta stop, por ejemplo, a 0.8, usaremos el 80% de los pasos de la generación para recrear a este gatito, por lo que debería ser mucho más similar Lo ves ahora mismo, es realmente como el gatito, pero un poco a diferentes colores para el tigre. Y esto continuará ahora mismo hasta el 80% de los fotogramas, y solo los últimos fotogramas se harán cargo un poco más. A ver si esto funciona o no. Como dije, hay que jugar con estos. Entonces creo que esta imagen se estropeó porque también agregamos esta cosa aquí Sí, esto no es perfecto. Tenemos que jugar con estas cosas. Lo intenté una vez más, y creo que esto ahora mismo es un poco mejor. Tenemos una pose muy similar en estos momentos. Por lo que estas redes de control te permiten usar la pose. Esto es especialmente poderoso si tienes, por ejemplo, humanos que están en una pose específica. Si tienes una bailarina que hace algo elegante, puedes recrear con este Bacani algo que Lo siguiente es el intercambio de caras. Puedes subir, por ejemplo, una foto de tu cara y simplemente cambiarla. Y también puedes combinar más de estas cosas. Puedes usar, por ejemplo, Bakani de una bailarina, y luego el intercambio de caras de otro humano y luego tal vez otra cosa como referencia de Para que puedas jugar con esto un poco alrededor. Lo siguiente es el inpainting. Ya sabes cómo funciona esto. Simplemente puedes tirar esto hacia abajo, y digamos que no queremos tener esta cola aquí. Simplemente podemos hacer el en la pintura. Ahora la pintura en foco con difusión estable es realmente grande. Aquí podemos hacer muchas cosas. Pero en términos generales, si solo quieres trabajar rápido, trabaja igual que a mitad de viaje. Esta es una herramienta gigantesca. No podemos repasar cada detalle. Lo siguiente es describir. Si usa describe, por ejemplo, para este prompt y presiona describir esta imagen en prompt, obtendremos el prompt. También puedes subir imágenes que tengas en tu computadora, por ejemplo, y luego puedes ver cómo podría ser un prompt aquí. Este es el aviso de que el modelo de difusión Z. Un excavador de naranjas se alza sobre algunas rocas Entonces, vamos, esto es. Entonces tenemos una mano. Ya sabes que podemos hacer upscalings y así sucesivamente y los metadatos Si incluyes esta imagen, por ejemplo, también puedes aplicar metadatos, y estos metadatos son especialmente potentes si la incluyes o si otras personas la están incluyendo, entonces puedes usar su configuración. Lo siguiente que quiero mostrarles son los registros. Si presionas en la configuración, puedes ir a los registros del historial. Y aquí puedes ver lo que has creado anteriormente. Puedes ver todas tus creaciones y ver qué resolución fue rápida y qué ajustes te llevaron a este resultado. Esta es básicamente la forma más rápida de explicar tu enfoque. Entonces el enfoque es una herramienta gigantesca. La difusión estable funciona en segundo plano, puedes usarla para siempre de forma gratuita. Si quieres usar una interfaz web para una difusión estable, puedes usar leonardo.ai. Leonardo.ai también es una de mis herramientas favoritas si quieres trabajar en una interfaz web. Y aquí tienes básicamente las mismas cosas que en foco. También es un poco más fácil de usar, pero no te preocupes por cada herramienta bajo el sol en Leonardo AI, también debes pagar relativamente rápido. También aquí tienes, por ejemplo, Canvas. Tienes las generaciones en tiempo real, tienes movimiento, tienes creación de imágenes, tienes escaladores, tienes lienzo Puedes entrenar tus propios modelos, y tienes tres generación de texturas D. Entonces mucho control en LeonarDoei también tienen algunos pequeños tutoriales cómo usar todas Así que solo echa un vistazo a estos si quieres profundizar y también hazme saber si debo incluir una conferencia por separado. Pero normalmente como queremos hacerlo lo más rápido posible, y creo que deberías trabajar con enfoque si quieres usar la difusión estable lo más rápido posible. Ahora bien, si quieres usar flujo y los diferentes otros modelos de difusión, debes seguir replicando Replicar no es gratis. Aquí, necesitas iniciar sesión con Github. Entonces sí, estas herramientas de código abierto, pueden volverse un poco abrumadoras en diverso glen pero tan pronto como lo consigues, también funcionan muy rápido. Aquí puedes usar los modelos lux, puedes usar re craft. Puedes usar cada modelo bajo el sol. Difusión estable 3.5 grande. Hay muchos modelos realmente buenos. Si presionas sobre estos modelos, son realmente fáciles de usar. Simplemente puedes escribir en la izquierda lo que quieras ver, y en el lado derecho, obtienes tu salida. Entonces esto se ve realmente realista. Algo que funciona muy bien en flujo también es el texto. Digamos que una mujer sosteniendo un cartel con las letras, no soy real. Y luego presionamos Run pero atención, esto te cuesta, creo, $0.06 Sí, $0.06 por generación y necesitas conectar tu perfil de Geta Aquí puedes ver algunas fotos que fueron creadas con este modelo. Entonces este modelo funciona muy bien y solo espera esta salida porque también el texto se renderizó sorprendentemente No soy real, y esta es una imagen perfecta. En este video, echamos un vistazo a los modelos de difusión de código abierto. Tenemos una difusión estable. Tenemos flujo, tenemos recraft. Tenemos muchas cosas diferentes. Podemos ejecutarlo también con muchas opciones diferentes. Podemos descargarlos y ejecutarlos localmente con, por ejemplo, CFI o Forge Una de las formas más fáciles de enfocar dentro de Google Colab porque puedes presionar Reproducir en un botón y usarlo gratis para siempre Y si quieres trabajar sobre una API, usa replicate, y aquí puedes usar cada modelo de difusión bajo el sol que sea de código abierto y tenga una API, pero aquí tienes que pagar un poco Para que puedas jugar con esto solo por un poquito. Supongo que debes apegarte a enfocarte si quieres crear rápido. Nos vemos en la siguiente. 17. Resumen de la generación de imágenes con modelos de difusión: En esta sección, hemos aprendido cómo podemos usar modelos de divusión estándar normales para generar imágenes. Has aprendido cómo funcionan, entrenado en informática en texto e imagen. En ese proceso, la computadora aprende a generar esta imagen, y luego puedes recrearla, y necesitas tener buenas indicaciones para buenas salidas Necesitas ser específico. Tenemos un montón de diferentes modelos de divusion Dali, McTerny, ID gramatob Viavly, mesa de difusión, flujo, re craft, y mucho, flujo Pero todos ellos funcionan relativamente similares. Siempre necesitas buenas indicaciones, y has aprendido a escribirlas, y también para que puedas editar tus cuadros dentro de la pintura y fuera de la pintura Ahora mismo queremos decírtelo. El aprendizaje es las mismas circunstancias pero un comportamiento nuevo. Entonces básicamente, hasta ahora tal vez no sabías usar estos modelos de difusión, ahora ya sabes, así que deberías usarlos totalmente. Haz algunas fotos para tu marketing, para miniaturas de YouTube, para presentaciones, para anuncios, para lo que quieras Sólo entonces has aprendido. O simplemente te diviertes creando estas fotos. También quiero decirte qué buenos aprendices aprenden juntos porque más personas siempre saben más que personas. Entonces, si pudieras compartir este curso, esto realmente significaría la palabra para mí. A lo mejor también significa la palabra para la otra persona, y si la otra persona obtiene valor, describen el valor porque te lo has dicho. Entonces, gracias por eso. Y te veo en la siguiente sección porque los modelos de difusión pueden hacer mucho más. Pueden hacer audio. Pueden hacer canciones enteras, y pueden hacer videos. Entonces nos vemos en la siguiente sección. 18. Videos de ai con Kling IA: Sí, la IA también puede hacer videos, y tenemos un billón de herramientas diferentes Tenemos laboratorios BCA, tenemos pista, tenemos hotshot Tenemos máquina de ensueño de Lumaabs. Tenemos SRA de Open AI. Sí, SRA no funciona en este momento, y tenemos Kling AI. Por supuesto, hay mucho más, y todas estas herramientas, funcionan relativamente similares. Si vas a los PCABs, aquí tienen algo especial, así que también puedes crear estos videos que viste volviéndose virales a veces Estos videos justo aquí donde las cosas se están derritiendo. Entonces se volvieron virales en las redes sociales de vez en cuando, y el BCA, puedes crearlos. En cierto modo, también tienes mucha flexibilidad. Simplemente puede iniciar sesión y crear todos estos videos, y también puede ver sus propios tutoriales. Hot Shot funciona muy fácil. Simplemente escribe texto y obtiene el video de vuelta. En la máquina de ensueño de uma Labs, tienes básicamente lo mismo. Siempre también arrancamos y terminamos el marco en la mayoría de estas herramientas. Y creo que ahora mismo en este momento Kling también es una de las mejores cosas aquí Tienes imágenes de IA, videos , editor de video, etc., y por eso solo quiero mostrarte ling AI porque como dije, ahora mismo en este momento, King AI te da muy buenos resultados, y puedes comenzar completamente gratis. Eso está al menos en mi mente, la parte más genial de todo La mayoría de estas cosas funcionan gratis. La mayoría de estos generadores de video AI, funcionan relativamente similares, así que solo quiero mostrarte Kling AI, y si realmente quieres, puedes jugar con las otras herramientas por ti mismo Lo primero que hay que hacer es, por supuesto, ir a cling.com Esta es nuestra página web china, pero también tienen su versión en inglés, y aquí puedes hacer mucho. Si vas a casa, por supuesto, puedes ver el resumen. Se pueden ver las mejores tomas de los videos. Aquí tienen generaciones donde también han incluido el sonido. ¿Estoy soñando? Estoy tan cansada. Entonces, si te tomas tu tiempo, realmente puedes hacer generaciones geniales. Todos estos son cortometrajes. Simplemente puedes mirarlos por ti mismo. Son impresionantes. Entonces ves a los mejores creativos. Estas son solo fotos. Se puede ver que también hacen fotos muy bonitas aquí. Esto también es algo que me gusta, por ejemplo. Para que puedas crear videos, puedes hacer cortometrajes, si recortas algunas cosas juntos y puedes trabajar muy bien. Puedes hacer imágenes de IA y videos de IA. Si presionas sobre las imágenes de IA, simplemente puedes crear imágenes. Tengo que decirte no me encanta esta característica dentro del enlace porque para las imágenes de IA, creo que la difusión estable de medio tono y así sucesivamente es un poco mejor que aferrarse Así que no pierdas tu tiempo con imágenes de IA dentro de Kling. Pero lo que debes hacer es presionar en los videos de IA porque con los videos de IA, realmente puedes hacer mucho. Puede escribir un mensaje. Se puede aumentar o disminuir la creatividad. Entonces puedes usar el modo que quieras usar. Si usas el modo profesional, necesitas tener una actualización a la función premium. Ves simplemente la calidad se pone un poco mejor. Tenía aquí el plan premium, pero ahora mismo no lo tengo. Entonces puedes usar cinco o diez segundas generaciones. Se pueden utilizar diferentes relaciones de aspecto y el número de generaciones. Por último, también puedes usar los controles de la cámara y el prompt negativo al igual que en la difusión estable. Pero el prompt negativo también es opcional. Así que probemos esto. Vamos a usar un mensaje aquí. Y por supuesto, tienen las mejores prácticas si quieres profundizar en la ingeniería rápida específicamente para ling. Pero en términos generales, siempre debes usar las mismas técnicas de incitación que ya conoces Entonces sujeto con los movimientos, la escena, la descripción de la escena, el lenguaje de la cámara y la atmósfera relámpago. Y aquí te dan una descripción detallada cómo puedes escribir tal prompt. Aquí te dan algunos ejemplos. Este es un prompt clásico, entonces este es un prompt que hiciste mucho mejor, y aquí tienen un prompt realmente, realmente descriptivo. Y aquí abajo, se ve lo que cambia en estos videos. Si presionas sobre estos, ves que en términos generales, obtuviste un buen video, pero claro, el mejor prompt arrojó aún mejores resultados Solo miremos estos. Ves que tienes algunos efectos más, y creo que el video generalmente es un poco mejor. Y si tienes un prompt realmente descriptivo, ves que se vuelve aún un poco más impresionante. Lo que puedes hacer es, por supuesto, simplemente copiar este prompt y luego tirarlo a tu aplicación y ver por ti mismo cómo están funcionando estas cosas. Aquí te muestran muchos ejemplos diferentes con muchos prompts diferentes Al igual que, no tiene sentido que le muestre todos y cada uno de los prompt aquí. Simplemente puedes mirar esto por ti mismo. Es realmente fácil de usar. Entonces si vuelves a Kling, puedes, por supuesto, usar ya sea Kling 1.0 o Kling Si vamos en 1.5, tenemos, en términos generales, un poco mejor calidad, pero algunas características no están incluidas, pero sí lo harán. Vamos a trabajar con Kling 1.5. Incluye un buen prompt, la creatividad en medio, el modo estándar, 5 segundos, 16 por nueve, un video. No quiero incluir ningún control específico de cámara, pero puedes hacerlo si quieres tener Zoom horizontal vertical o algún o, vamos, solo usemos el Zoom. Y solo quiero tener un pequeño Zoom aquí. Y luego un prompt negativo, solo usemos logo, marca de agua, borrosa, fea, y luego presionamos generar y aquí pagamos diez créditos todo, obtenemos, creo, como 100 créditos al día, y luego puedes crear estas cosas. Y mientras esto está creando, también puedes salir de la página y hacer cosas similares mientras tanto. Así que vamos a hacer esto. Si vas a aferrar 1.5, puedes hacer básicamente las mismas cosas aquí. Pero si estás en 1.5, algunas características no están ahí. Si te desplazas hacia abajo aquí, los movimientos de la cámara, están deshabilitados en 1.5, pero estoy seguro que volverán. Si vas una vez más aspirar en aferrarse 1.0, se incluyen una vez más, claro. Entonces si vas de imagen a video, entonces esto es texto a video. Si vas de imagen a video, puedes arrojar tus imágenes, y luego puedes mezclarlas con un prompt. Y también puedes usar este pincel de movimiento. Quiero mostrarte este pincel de movimiento de inmediato. También tienes aquí creatividad, modo estándar, longitud, etc., y también los movimientos de la cámara, pero ahora están deshabilitados, y tienes un prompt negativo. Entonces, si usas, otro lado, aferras 1.5 ahora mismo en este momento, no tienes los movimientos de la cámara ahora incluidos, y tampoco tienes el pincel de movimiento. Así que vamos a usar 1.0, y luego subimos la foto. No importa qué imagen uses. Solo usemos algo de mis generaciones. Solo quiero subir esto aquí mismo. Así que simplemente podemos animar a este tipo, y quiero hacerlo realmente simple Vamos. Un tipo, atraque. Entonces, por supuesto, puedes usar movimientos de dibujo con el pincel de movimiento. Si no lo usas, esta será solo una creación aleatoria. Pero si usas el movimiento de dibujo por otro lado, simplemente puedes decirle al modelo de difusión cómo debe comportarse, y también te dan algunas instrucciones. Puedes usar, por ejemplo, el área uno, usar Shrek, y luego presionar algunas cosas específicas que quieras usar Puedes marcar esto por ti mismo, con un área estática. O también puedes usar, por ejemplo, la segmentación automática y presionar sobre las cosas que quieras animar Si quieres eliminar algo, también puedes eliminar. Entonces puedes hacer esto como quieras. Es importante que solo marques las cosas que quieres utomate, no automatizar animar, claro Lo que quiero hacer ahora mismo es, por supuesto, agregar movimientos, y para eso, no uso estática, sino que uso el área uno, la segmentación superada, y simplemente presiono en cada cosa que no debería estar quieta esta En cuanto te hayas enterado de lo que quieres animar, así que digamos que quiero animar ahora mismo a todo este tipo, como lo puedes ver Lo que podemos hacer es presionar en pista, y aquí ya podemos dibujar lo que este tipo debe hacer. Entonces digamos que este tipo debería ir en esta dirección y tal vez un poquito entonces en esta dirección. Así que simplemente podemos dibujar aquí algo, y luego se ve cómo está funcionando esto. Si presionas confirmar, esto está bien. Si no lo confirmas, solo hazlo una vez más un poco diferente. Entonces, digamos que quieres tenerlo de esta manera. Creo que ahora mismo esto está funcionando, así que presionamos confirmar ahora mismo. Y entonces vamos a animar a este tipo y este tipo simplemente caminará en esta dirección cuanto presionemos generar, claro Mientras tanto, tuvimos nuestro otro video con la banda que está tomando café, leyendo un libro que también tiene algunas gafas para que veas que puedas hacer generaciones geniales. Entonces este tipo está haciendo y se mueve tras ello. Entonces si bajas, tienes tu trayectoria de movimiento incluida. Tienes, por supuesto, también la creatividad y así sucesivamente. Prensa generar. Y entonces verás que podemos animar esta imagen con facilidad. Por cierto, también tienes una guía de usuario de cepillo de movimiento. Si lo presionas, te muestran exactamente cómo puedes usar esta herramienta, y te dan también muchos ejemplos que puedes echar un vistazo. Aquí han animado este barco. Solo echemos un vistazo más de cerca. Esta nave, entonces se marcó donde debían moverse estas cosas. Entonces aquí, utilizaron la herramienta de pincel para mover el barco en esta dirección y el agua en esa dirección. Y este fue el video. Entonces ves que funciona realmente, realmente genial. La animación es impresionante porque el barco se mueve en una dirección diferente a la del agua. Consigue este efecto genial de que estaría ventoso en el agua. El agua se mueve en esta dirección, pero aún así el barco puede moverse en la otra dirección. Lo mismo es cierto aquí para estos perros. Simplemente han marcado a los perros, y luego les han dicho a los perros en qué dirección deberían mirar. Y si presionas aquí, reproduce, ves que el disco también resultó ser perfecto. Vamos a hacerlo a lo grande. Los perros miran exactamente en la dirección en la que lo cepillas. Esta cosa con la manzana también es genial. Simplemente han marcado la manzana, como puedes ver aquí abajo, y utilizaron la herramienta de pincel para mover la manzana hacia abajo. Puedes ver la salida aquí. Funcionó muy bien. Y ya ves, también tenemos el agua que está salpicando Vamos a hacer esto grande. Si miras de cerca, no es 100% exacto, no 100% perfecto, pero este es un video bonito. Incluso puedes hacer comerciales con estos videos. Y aquí tienen el gato y el gato está saltando sobre esta cosa de aquí. Solo echemos un vistazo. Aquí se ve que el gato está saltando. Esto también resultó ser muy agradable. Sí, el aterrizaje no fue perfecto. Ella no está a punto, pero esto le puede pasar a un gato de vez en cuando. Además, aquí, tienes muchos ejemplos que puedes usar. Como puedes hacer animaciones realmente impresionantes. Puedes cepillar aquí como quieras. Lo siguiente que quiero mostrarte es, claro, que puedes hacer aún más mientras tanto. Entonces, si vas de imagen a video, puedes, por ejemplo, eliminar a este tipo aquí, y luego también puedes presionar al final fotograma al final. Así que vamos a hacer algo realmente genial ahora mismo. Quiero subir esta foto. Esta es una imagen de medio viaje. Después presiono al final del fotograma, y después subo la siguiente foto. Entonces ves estas dos fotos, déjame abrirlas. Esta es aquí una chica, y he recreado una chica con el mismo asiento que es un poco mayor Ya sabes el juego como funciona esto. Entonces esta es ella un poco mayor, y esta es ella un poco más joven. Y ahora queremos transformarla con un video. Estos videos se volvieron virales de vez en cuando. Y aquí simplemente podemos escribir en una mujer envejecida, por ejemplo, tenemos el marco inicial, tenemos el marco final. Entonces no podemos usar el pincel de movimiento en este momento en este momento. Pero tenemos aquí cada otra cosa en la configuración predeterminada, y luego simplemente podemos presionar generar una vez más y vamos a recrear algo realmente, realmente genial Entonces aquí se pueden hacer muchas generaciones una tras otra. Mientras tanto, te mostraré algunas generaciones que he hecho anteriormente. Entonces aquí ya ves, este fue un prompt realmente simple. Creo que el aviso fue que un perro pequeño está acostado sobre un gato. Aquí se ve una boina que baila en la selva. Aquí usé, por ejemplo, una foto de flux, y simplemente he hecho su perro. Ves que esto funciona muy, muy bien. Hay muchas publicaciones sobre huevos que se volvieron virales que hicieron algo así. Aquí hice lo mismo, y la segunda generación resultó ser aún mejor. Esto realmente parece generaciones reales. Lo único que se estropeó aquí es esta mano un poco En la primera generación, también la mano está un poco estropeada Aquí he hecho algo con, como, un paisaje, y luego entramos en otra imagen. Este es el marco inicial y final. Así que ya ves básicamente podemos movernos por aquí. Entonces este es nuestro panda que he generado. Este panda está ahora mismo simplemente leyendo, y luego obtenemos nuestras nuevas generaciones, y te las mostraré en cuanto terminen porque esto se hace como en unos segundos ahora mismo. Una de las generaciones está hecha, y sorprendentemente, es ésta, lo que empezamos después. Y aquí se puede ver cómo está envejeciendo. Ves que esto funciona muy, muy bien. Ella comienza joven, y luego se transforma en esta versión más antigua. Estos son estos videos que a veces se hicieron virales en Twitter, y puedes recrearlos ahora mismo si quieres Sí, a veces no resulta ser perfecto. Pero si juegas un poco con estos, puedes disparar totalmente para estos. Y eso es básicamente cada cosa que puedes crear. Voy a mezclar lo siguiente en cuanto se genere esto. Entonces, básicamente, así es como puedes trabajar con Kling AI. Simplemente puedes hacer una cuenta, y luego puedes comenzar gratis, al menos ahora mismo. Puedes dipe en texto y obtener video, y tienes mucho control, y también te dicen cómo puedes escribir tus indicaciones Lo siguiente es, claro, que también puedes imágenes a videos. Simplemente puedes subir una imagen, y también puedes transformarla con este pincel de movimiento. Puedes marcarlo y simplemente puedes decirle a la IA a dónde debería ir esta cosa. Y lo siguiente es que también puedes incluir marco inicial y final. Y con start and end frame, algo así como transformaciones es realmente genial. Entonces, por favor, solo dale una oportunidad a esta herramienta. Estoy convencido de que te va a encontrar genial. 19. Texto para hablar con ElevenLabs y más: Esa IA puede hacer voces. Sí, eso también me gusta. Entonces este es Aloy. Esto es texto a discurso del OpmiPlayground, y ya lo sabes Tenemos muchas herramientas que pueden hacer texto en voces, y podemos hacer mucho más. Esta es una de las herramientas más fáciles. Entonces, en el OpmeiPlayground, simplemente puedes escribir lo que quieres escuchar, y luego Opmeai simplemente creará También hay alternativas de código abierto, por ejemplo, F five TTS, puede instalar esto localmente, y si quieres probarlo rápido, también puedes hacer que funcione en este espacio de fase abrazando completamente gratis Simplemente subes un audio y luego puedes escribir el texto que quieras generar y clonarás tu voz. Pero creo que una de las herramientas más poderosas son los 11 laboratorios. Porque en 11 laboratorios, tienes mucha flexibilidad. También puedes empezar gratis y tienes muchos idiomas. Déjame mostrarte esto. El generador de voz de 11 laboratorios puede ofrecer voz humana de alta calidad en 32 idiomas. Perfecto para audiolibros, off de video, comerciales y Entonces oyes que las voces son muy, muy buenas, y puedes hacer muchas cosas. Y por eso quiero mostrarte lo más rápido posible lo que puedes hacer dentro de 11 Labs. Creo que si quieres empezar rápido, 11 labs es el camino a seguir, como porque puedes empezar gratis, y después si quieres crear mucho, tienes que pagar. Pero es rápido. Lo primero que haces es ir a esta página web y luego presionas GTA. Entonces estarás en app y por supuesto, necesitas registrarte. Simplemente haz una cuenta con Google con lo que quieras. La interfaz es realmente fácil. Tienes aquí del lado derecho simple y avanzado. Primero, comenzamos con la interfaz simple. Lo primero que ves aquí es que puedes escribir lo que quieras escribir y luego puedo usar diferentes voces. Esta es una voz masculina profunda de Arnie. Yo mismo he creado esta voz. Si presiono generar discurso, creo que me gusta esta herramienta. Entonces ya ves que podemos generar este discurso, y esto va muy, muy rápido. Y si te gusta la salida, puedes descargarla pulsando sobre este botón. Y entonces si vas a la historia, ves las generaciones que has hecho, y también puedes simplemente descargar las generaciones. Sí, he hecho muchas cosas, así que ves que hay páginas y páginas y páginas de generaciones. Y también puedes volver realmente, muy rápido y puedes recrear estas cosas muy rápido Si vuelves a generar una vez más, lo más probable es que no tengas voz que hayas generado tú mismo. Si te desplazas un poco hacia abajo, ves que tengo una gran biblioteca de voces. He cloneado voces de Elan Mask de mí para también de mí y también de Y también tenemos algunas voces generadas aquí que he hecho, y luego tenemos las voces por defecto. Ahora mismo, en este momento, lo más probable es que tengas solo estas voces predeterminadas. Pero claro, quiero mostrarte cómo puedes clonar estas voces, incluso voces de ti mismo. Entonces esta es una voz que es, como, de alguna manera como yo. Creo que me gusta esta herramienta, así que vamos a generar esto con mi voz. Creo que me gusta esta herramienta. Sí, ya ves, hasta el inglés es mejor que el mío. A lo mejor debería reemplazarme por una I. Estoy seguro de que llegaremos a este punto. Ese es el punto de todo esto. Entonces lo siguiente es que también puedes presionar en Avanzado, y si vas en Avanzado, puedes usar aquí diferentes modelos. Aquí en la configuración, verá 11 versión multilingüe dos, nuestro modo más realístico y emocionalmente rico en 29 idiomas, el mejor para voces en off, audiolibros, postproducción o cualquier otra Tenemos inglés, japonés, chino, aquí también está el alemán y muchas voces, así que esto funciona muy bien. Además de eso, también puedes usar diferentes modelos si realmente quieres. Simplemente puede cambiar aquí a diferentes modelos. Por ejemplo, la versión Turbo 2.5, Di versión dos, D versión uno, y así sucesivamente. Estas cosas se ponen cada vez peor y peor. Lo único que eventualmente puedes hacer son las voces de Turbo. Nuestro modelo de baja latencia de alta calidad, así que esto es un poco más rápido, pero solo trabajo con el normal. Entonces tienes estabilidad, similitud, y la exageración de estilo Se puede jugar con estas cosas, pero en términos generales, los ajustes estándar funcionan muy bien. Entonces también puedes incluir el amplificador de habla si quieres. Si te metes demasiado con estos y simplemente presionas, por ejemplo, a la configuración predeterminada , por supuesto, recuperarás tu configuración predeterminada. Tengo que decirte, normalmente no me meto mucho con estos ajustes avanzados aquí porque los ajustes predeterminados funcionan muy bien. Entonces en el lado izquierdo, ves que no solo puedes hacer texto a voz, por cierto, aquí, simplemente puedes tirar lo que quieras. Puedes arrojar libros casi enteros y puedes hacer audiolibros con estos. T también debería funcionar completamente gratis. Esto es realmente increíble. Nos fijamos en los precios más adelante porque puedes empezar gratis. Lo siguiente que puedes hacer es ir al cambiador de voz, y el cambiador de voz es realmente increíble Aquí puedes subir voz y recuperar el habla, pero con una voz diferente. Puedes usar, por ejemplo, digamos solo voz masculina profunda de Arnie Ahora puedo grabarme o subir un audio y simplemente puedo recrear esta voz Así que probemos esto. Quiero grabar aquí este audio. Si presiono aquí, empezaré. Esta será una prueba si las heces de 11 Labs están funcionando en tiempo real o no. Espero que no me defraudes. Entonces simplemente presionamos generar discurso. Esta será una prueba si esta herramienta de 11 Labs está funcionando en tiempo real o no. Espero que no me defraudes. Y oyes como hasta mi estúpido acento se duplicará. Pero ya ves, tenemos una voz diferente. También puedo hacer aquí como otras voces como Adam es una de las voces heredadas que funciona realmente, realmente genial. También podríamos hacerme hablar como una mujer y hacer estupideces con estas y también podemos agregar otros acentos. Lo siguiente que podemos hacer es presionar sobre las voces. Y aquí en las voces, podemos hacer mucho. Se puede ir en todo en lo personal, en la comunidad, y por defecto. En este momento, lo más probable es que solo tengas las predeterminadas, y siempre podrás escuchar cómo suenan estas voces si presionas play. Confía en ti mismo, entonces conocerás gobierno del pueblo por el pueblo. El mundo es redondo, y el lugar. No hay mayor daño. Entonces oyes que hay grandes voces. Si presionas a alguna comunidad, escuchas las voces que le gustan a la comunidad y las voces que la comunidad ha creado. Por ejemplo, esto. Hemos comprometido la regla de oro a la memoria. Comprometerlo ahora a existir es cambiar, cambiar es madurar. Madurar es seguir creando. No se puede culpar a la gravedad por enamorarse. Esto es genial para ti. Entonces puedes ir a lo personal. Aquí están las voces que has creado si has creado voces. Si no tienes voces creadas, puedes presionar en agregar nueva voz. Y aquí tienes ya sea diseño de voz, clonación instantánea de voz, la biblioteca de voz o clonación de voz profesional. Si presionas en el diseño de voz, simplemente puedes escribir lo que quieras ver. Digamos que eres mujer, joven, acento americano acento fuerza. Sí, esto está bien. Y entonces tienes un ejemplo de cómo sonaría esto. Y luego puedes presionar ya sea usar la voz o primero generar para escuchar cómo está sonando Primero, pensamos que el PC era una calculadora. Entonces descubrimos cómo convertir números en letras y pensamos que era una máquina de escribir. Está bien, pero digamos que quieres tener un acento diferente. Digamos británicos y quieres tener un fuerte acento. Primero, pensamos que el PC era una calculadora. Entonces descubrimos cómo convertir números en letras, y pensamos que era una máquina de escribir. Verás puedes hacer que esto funcione como quieras. También se puede hacer masculino viejo, australiano, bajo acento, una última vez. Primero, pensamos que el PC era una calculadora. Entonces descubrimos cómo convertir números en letras y pensamos que era una máquina de escribir. Y si te gusta, presionas usar voces, y esto estará en tu biblioteca de voces. Si no te gustan estos, puedes presionar una vez más aquí y hacer Clonación instantánea de voz. Si presionas sobre esto, puedes darle un nombre como yo, por ejemplo, entonces subirías algunos ejemplos, y aquí te dicen lo que puedes subir. Aún no se han subido artículos. Sube muestras de audio de la voz que te gustaría clonar. La calidad de la muestra es más importante que la cantidad. Muestras ruidosas pueden darte malos resultados. Proporcionar más de 5 minutos de audio en total trae pocas mejoras. Entonces lo que le digo a la mayoría de la gente es que use aproximadamente de cuatro a 8 minutos de audio realmente, muy bueno y de alta calidad. Se puede extender esto hasta por 25 muestras. Lo único que es importante es que las muestras no sean mayores de diez megabytes Entonces puedes subir, por ejemplo, tres pistas, cada pista puede tener, por ejemplo, dos o 3 minutos con buena calidad de audio, y luego obtienes tu voz. Y entonces simplemente puedes dar algunas etiquetas si quieres, agregar una pequeña descripción, y luego necesitas, por supuesto, aceptar que no haces ninguna estupidez con estas voces. Entonces presionas esa voz y terminas. Esto lo he hecho con mi voz E y máscara y con mucho más. Lo siguiente que puedes hacer es, por supuesto, la biblioteca de voces. Ya conoces la biblioteca. Entonces aquí simplemente encuentras cosas de otras personas. Y lo último que puedes hacer es, por supuesto, si presionas una vez más en agregar nuevas voces, clonación de voz profesional. Para eso, necesitas pagar un poco más, y simplemente puedes hablar con 11 laboratorios. Puedes enviar algunas voces de muestra, y luego crean una voz que suena muy, muy nítida. La mayoría de la gente hace esto si quiere clonar sus propias voces y hacer audiolibros enteros a partir de estas. Esto funciona muy bien. Un amigo mío lo ha hecho, y obtiene más streams con su voz cloneada que con su voz original Así como, puedes hacer cosas geniales con estos. Entonces, claro, también aquí encuentras esta biblioteca, y aquí puedes encontrar muchas cosas. Digamos que quieres crear cosas para redes sociales. Puedes usar muchas voces diferentes. Videos con ojos, YouTube, cortos, os, setos y por supuesto, estos también son idiomas diferentes Aquí puedes hacer un montón de cosas geniales. Además de eso, también tienes efectos de sonido. Así podrás crear efectos de sonido para lo que quieras. Vamos a hacer ladridos de perros. Aquí tienes algunos ejemplos. Suena genial. Mi perro en estos momentos no está aquí. Normalmente, siempre está por aquí, pero esto sonaría casi como él. Así que simplemente puedes escribir lo que quieras crear, presionarlo y, sí, puedes usar estas cosas de manera comercial. Entonces si vas a explorar, encuentras, por supuesto, voces que otras personas han hecho. Así que puedes encontrar un montón de cosas aquí. Aquí puedes ver los temas semanales. Esto es algo genial, por ejemplo. Y también puedes sonar escucha lo que quieres escuchar, y también tienen categorías. Si presionas sobre animales, encontrarás muchos animales gato maullido, pájaros cantando, rana, y así sucesivamente Y siempre puedes usar solo el prompt o también descargar estas cosas si quieres. Entonces también puedes usar como auges o brams o hacer lo que quieras Puedes hacer muy buenos efectos de sonido con estos y como dije, puedes usarlos comercialmente. Lo siguiente que quiero mostrarte es proyecto porque puedes hacer proyecto completo. Para explicarte esto realmente, muy rápido, quiero mostrarte este video porque esta es una característica donde debes pagar un poco más. Yo tengo el plan básico, pero si quieres hacer muchas cosas aquí dentro de esta herramienta, necesitas tener la suscripción más fuerte. Quiero mostrarte la suscripción al final del video. Presentamos project, tu flujo de trabajo enter end para crear audiolibros en minutos Ya sea que estés empezando desde cero, sacando de una URL o subiendo archivos EPUB, PDF o TXT, los proyectos te tienen cubierto Con tu texto en su lugar, puedes convertir todo a audio con solo hacer clic en un botón. Si quieres mezclar voces en tu audio, ahora puedes asignar fácilmente altavoces particulares a diferentes fragmentos de texto. Capítulo uno, la parada del autobús. Oye, ¿sabes cuándo es el próximo autobús? Preguntó Matteo Creo que debería estar aquí ahora. Si necesitas arreglar una sección, los proyectos te permiten regenerar sin problemas Entonces básicamente, puedes hacer proyectos enteros con diferentes ponentes y hacer mucho más. Si tienes más interés, puedes ver este video tú mismo. Pero entonces necesitas, claro, un mejor plan para esto. Quiero mostrarte esto ahora mismo porque recibo algunas preguntas de vez en cuando. Tienes muchos planes diferentes. Estoy ahora mismo en este plan inicial actual, y esto es barato. Yo pago, creo, como cinco dólares al mes, pero puedes usar más. Entonces el plan gratuito, puedes jugar un poco. Con el plan de $5 al mes, puedes jugar un poco más. Y luego con el plan creador, este es el plan más popular. Se puede empezar por 11 dólares al mes, pero luego va a subir, creo, a 22. También estoy seguro de que esta cosa va a cambiar un poco. Y también puedes ver lo que obtienes aquí. Entonces por estos 11 dólares al mes al inicio, obtienes clonación de voz profesional. Tienes proyectos, tienes audio nativo, y tienes mayor calidad. Y con este plan pro, obtienes incluso un poquito más. Entonces estos son básicamente los planes, y también puedes comenzar dos meses gratis si usas la suscripción anual. Para que puedas jugar un poco con esto por ti mismo si quieres. Pero lo siguiente que quiero mostrarte es el estudio VoiceOver El estudio VoiceOver también es realmente genial. Ahora mismo está en mejor. Y también aquí necesitas actualizar tu plan. Y este tipo de aquí te explica cada cosa lo que puede hacer el estudio de voz en off Básicamente, también aquí, puedes hacer proyectos completos, puedes subir videos y hacer off de forma nativa con Esto también funciona muy bien. He probado esto algunas veces. Se pueden generar efectos de voz y sonido en un solo editor. Puedes importar video directamente, aplicar capas a tus pistas de audio y tener precisión en la edición de estas. Entonces esto es básicamente la edición de video con audio que sale de forma nativa de 11 laboratorios. Esto funciona muy bien. Entonces tienes el estudio de bugging. Aquí, también tienen algunos recursos, así que no quiero pasar mucho tiempo con estos. También he generado algunas cosas aquí. Si simplemente presionas Crear NU Dup, simplemente puedes darle un nombre a tu proyecto. Luego le das el idioma de origen y el idioma en el que quieres traducirlo, y luego puedes subir tu pista ya sea desde YouTube TikTok u otras cosas que también puedas hacer manualmente, y luego puedes crear estas cosas Esto te costará 3 mil créditos. Ahora mismo en este momento me quedan 55 mil créditos para este mes, así que podría hacer esto muchas veces Esto también es algo que de verdad, verdad me gusta que de verdad me encanta porque puedes traducir tus videos muy rápido. Y claro, pueden decirte un poco con más detalle si quieres. Porque creo que no tiene sentido que te muestre cada paso, los mismos pasos que ellos te muestran. Básicamente, crea un nuevo paso, sube tus cosas y estás listo para rockear. Puedes recrear tus cosas en otros idiomas. Y lo más genial está aquí, sí, que puedes hacer esto también en estos planes básicos, para que puedas traducir videos fácilmente Entonces tienes audio nativo. Y también el audio nativo es realmente genial. Y también aquí se necesita un plan más fuerte. Básicamente, lo que puedes hacer es simplemente usar un fragmento de código, copiar el fragmento de código en tu página web, y luego tendrás en tu página web una barra de este tipo, y esta barra leerá Yo para mí, no tengo una página web, pero si tuviera una página web, creo que incluiría esta. Si publicara artículos todo el tiempo, puedes usar estas cosas y luego las personas que vienen a tu página web simplemente pueden presionar este botón y 11 laboratorios leerán el artículo en voz alta frente a ellos. La lógica te llevará de A a B. La imaginación tomará básicamente, tienen esta barra, y esta barra leerá toda tu página web para ellos. Incluso el New York Times ha incluido esta y muchas otras páginas web. Si vas a un artículo del New York Times, lo ves aquí mismo. Escucha este artículo. Simplemente puede presionar sobre esto, y luego básicamente 11 laboratorios leerán este artículo para su voz alta. No estoy seguro si puedo tocar esto aquí porque como si fuera el New York Times. Y lo último aquí abajo es el aislador de voz. Si pulsas sobre el aislador de voz, simplemente puedes arrastrar y soltar un le de audio que no tiene buena calidad y puedes hacerlo mucho mejor El video de demostración te muestra perfectamente cómo funciona esto. Y estos archivos de audio pueden ser grandes hasta 500 megabyte. Mm de acción. Necesita eliminar el ruido de fondo de su video. Utilice nuestro nuevo modelo de aislador de voz para obtener un audio nítido en todo momento Entonces ves que esto funciona perfecto. Si tienes voces ruidosas, si tienes muchas cosas de fondo pasando, puedes subir tus generaciones de audio, y esto va a mejorar mucho. Y estas cosas pueden ser realmente grandes con 500 megabytes, y aquí obtendrás salidas cristalinas Aquí, siempre ves cuánto puedes crear. En total, tengo 60 mil créditos al mes. Ahora mismo, me quedan 55 mil créditos. Entonces tienes algunas notificaciones. Si hay algo especial pasando. Entonces lo siguiente que puedes hacer es, claro, que puedas presionar sobre tu nombre, y tienes muchas otras cosas aquí. Tienes tu perfil, y si lo presionas como ves alguna información, entonces puedes presionar las teclas API. Si eres desarrollador, puedes generar claves API y puedes hacer aplicaciones con 11 labs. A continuación, la suscripción, aquí podrás gestionar tu suscripción. Los pagos, si eres afiliado, y si no eres afiliado, puedes presionar para convertirte en afiliado Aquí puedes obtener hasta 22% en comisiones, y tengo que decirte, sí, soy afiliado de este programa porque lo uso yo mismo y me encanta. Y creo que he ganado como aproximadamente 100 dólares con estos porque he publicado uno o dos videos sobre esto. Después el análisis de uso, si quieres profundizar tienen toda una documentación. Si eres desarrollador, simplemente puedes verlo por ti mismo. Entonces la documentación, luego el bloqueo de cambio, el centro de ayuda, el programa de afiliados, así que un poco más sobre este programa y el clasificador de voz AI Y por último, claro, los términos de privacidad. Sí, puedes usar esto comercialmente, pero quizás no seas capaz de crear voces de diferentes personas donde no tengas el acuerdo para usar sus voces. Y por último, claro, puedes cerrar sesión. Si quieres convertirte en afiliado, porque lo veo todo el tiempo, la gente me pregunta esto. Solo tienes que ponerte en contacto con el equipo de afiliados , presionas aquí, escribes tus datos, y luego obtienes un enlace que puedes promocionar. Obtendrá dicho enlace. Creo que hice esto sobre la pila de socios, así que este sería mi enlace. A lo mejor lo incluyo en la última conferencia. Y si quieres hacer una suscripción en 11 Labs, también puedes incluir este enlace, y luego me puedes apoyar. Y puedes, por supuesto, también hacer lo mismo. Simplemente puedes hacerte un enlace tan aflat. Puedes colocarlo en videos en redes sociales o donde sea, y tal vez puedas ganar incluso la misma cantidad que pagas por este estudiante, y es básicamente gratis. Entonces en este video, aprendiste cómo funciona 11 Labs. En términos generales, es una, al menos en mi mente, es una de las mejores herramientas de IA si quieres generar discurso a partir del texto. Y deberías probar esto totalmente. 20. Transcripción con Whisper: Hablemos del susurro. Whisper es la herramienta gratuita de código abierto de Openi e incluso puedes ejecutarla localmente. Se puede convertir el discurso en texto. Se pueden hacer transcripciones. Si te desplazas hacia abajo, ves cómo está funcionando la tecnología, puedes bucear más profundo si quieres. Y aquí se obtiene toda la configuración. Entonces, si quieres instalar esto localmente, aquí obtienes esta configuración completa. Necesitas instalar bip Open May whisper. Entonces necesitas bip instalar esto aquí mismo. Después las actualizaciones y así sucesivamente. Y entonces básicamente puedes usarlo. Ahora bien, si no quieres hacer esto, tienes muchas otras opciones. La opción más fácil es probablemente inochio. Y si simplemente descargas esta cosa y la descomprimes en tu PC, obtendrás una interfaz que se parece a esto Y aquí también puedes escribir, por ejemplo, susurro, y si lo presionas, simplemente puedes descargarte Pinocho lo hace realmente, muy fácil, y si las cosas no están instaladas, simplemente puedes presionar instalar, y luego estas cosas funcionarán completamente automáticas, así que no tienes que preocuparte por Esta cosa funcionará automáticamente. Si vas a la plataforma desde OpMeAI, claro, puedes usar Wisper también en PyTon para que puedas hacer Y también es muy fácil de usar. Simplemente puedes usar esto aquí mismo, y haremos llamadas API. Para susurrar, para que puedas usarlo localmente de forma gratuita, o puedes integrarlo en tus propios proyectos con PyTN Y WiSPA también es realmente barato sobre la API. Si volvemos a desplazarnos hacia abajo en este artículo, ves que WiSPA te cuesta 0.006/minuto Oh, sí, esto es realmente barato. Si subes unos minutos, es casi gratis. Mientras tanto, Wisper también se instaló localmente, y aquí obtienes tu interfaz web de gradio Aquí en Open WebUI, simplemente puedes usar Wisper y es muy, muy fácil Puedes usar lo que quieras. Se puede presionar sobre estos. Normalmente Versión Grande dos funciona bien. Entonces vas a la detección automática, o también puedes usar un idioma que quieras. Puedes escribir en inglés o lo que sea que sea. Y luego simplemente puedes arrastrar y soltar aquí tu archivo. Yo sólo quiero hacer un ejemplo con algo de este curso. Entonces subí mi archivo, y luego presiono generar archivo de subtítulos Aquí inicializamos el modelo, entonces obtendremos esta salida Y esto también es básicamente un video. Entonces ya ves que este es un video de MP 44 Aflx, y esto también debería funcionar Si usas MP tres, claro, va más rápido. Y ahí lo tenemos. Ves esto Haz ahora mismo 3 minutos. Por supuesto, esto se estaba ejecutando localmente, y este es un video, y el video también es relativamente largo. Ahora simplemente puedo presionar sobre estos y puedo descargar mi archivo. Y ahora abrí aquí mi archivo de texto, y aquí ven tengo mi archivo de texto, y también tengo las marcas de tiempo Entonces lo que estoy diciendo en qué marca de tiempo. Esto es completamente increíble, y puedes trabajar con estos. Entonces en este video, has sembrado cómo puedes usar susurro. Puedes transcribir lo que quieras en ningún momento. Y esto es muy, muy barato. Y si quieres ejecutar esto localmente completamente gratis, también puedes hacerlo. Es realmente así de fácil. 21. Generación de música con IA con Udio: Lo siguiente es, claro, que hasta podemos hacer música. Porque puedes hacer texto, puedes hacer efectos de sonido. También puedes hacer música. Espero que entiendas que estos modelos de difusión son grandes. Una de las mejores herramientas en este momento en este momento es Udio y Udio también ha introducido la versión 1.5 Si simplemente presionas sobre estos, también puedes ver cómo funciona esto, y aquí simplemente puedo mostrarte una o dos generaciones que he hecho. Si simplemente presionas play aquí mismo, los mosquitos se agitan por ahí. Grande. Oyes que esta cosa está funcionando. También siempre puedes escuchar las cosas que son cosas escogido. Entonces piensan que esta música de aquí es genial. Juguemos a éste por un breve momento. Asociación Ste. Estás justo de oriente a poniente, de norte a sur. Entonces ves que esto suena muy, muy bien, al menos ahora mismo. Esta cosa funciona muy bien. Por supuesto, también puedes actualizar tu plan si lo presionas, pero también puedes comenzar gratis, pero luego estás limitado. Y si quieres usar más, claro, tienes que pagar un poquito. Y puedes ahorrar un poco si pagas anualmente. Apenas las mismas cosas de siempre. Pero puedes comenzar completamente gratis, y es realmente fácil de usar si simplemente presionas Crear. Aquí obtienes una interfaz. Esta interfaz siempre cambia un poquito, y siempre obtendrás nuevas opciones y así sucesivamente. Básicamente, puedes escribir lo que quieras ver. Puedes obtener sugerencias. Puedes alargarlo hasta 130 segundos con una sola generación. Puedes añadir tus propias letras. Aquí puedes hacer muchas cosas. Ahora quiero mostrarte la forma más fácil crear una canción con estos. Simplemente podemos escribir lo que queremos tener, y por supuesto, necesitamos iniciar sesión. Así que solo inicia sesión con Google con descarte o con Twitter. Voy a seguir con Google. Ya he hecho algunas canciones en esta herramienta. Y ahora simplemente tecleamos lo que queremos tener, por ejemplo, una canción sobre un conejo. Y entonces también podemos hacer muchas cosas diferentes. Podemos usar el modo manual. Si empiezas, solo usa la configuración predeterminada. Tampoco soy un experto en música. Entonces, si usas el modo manual , claro, puedes hacer muchas cosas. Puedes hacer diferentes etiquetas. Entonces debería ser un rock, electrónico, pop, ajedrez o algo así, creo que electrónica estaría bien con nuestra canción de conejo. Entonces la letra, ¿ quieres tener letras personalizadas? Entonces, si presionas algunas letras personalizadas, puedes introducirlas o serán automáticas. Por supuesto, si incluyes este material manual, siempre puedes escribir las cosas que más te gusten. Entonces el instrumental, ¿cómo debería ser el instrumental? ¿Quieres incluir algo o no? Y luego el auto generado, si quieres hacer todo automáticamente. Apenas por ahora, excluyo esto aquí mismo, y simplemente usamos aquí, por ejemplo, electrónico y Electro como nuestro texto. Y simplemente presionamos Crear, y luego esperaremos como uno o 2 minutos y conseguimos nuestra canción. La canción dura 1 minuto, y después de eso, también podemos remezclar la canción Esperemos a que tengamos nuestra canción. Y ahí lo tenemos. Tenemos nuestras dos canciones. Tomó alrededor de 7 minutos crearlos, y vamos a ver cómo están. Somos casa de medianoche. Vamos. Vamos. Vamos. La luz de la luna brilla. Primera etapa. Aquí está de vuelta. Observa cómo fluye el conejito. Salto de salto, Acrobat. Observa cómo fluye el conejito, luego las cuentas de Bunny. Hola con esas patas de conejito. Redondo, salto, redondo, salta h con esas patas de conejito. Esto es increíble, así que puedes jugar todo el día con esta herramienta. Ahora podemos hacer las siguientes tres cosas. Podemos remezclarlos. Podemos extenderlas o podemos publicarlas. Si presionas sobre mix, puedes hacer aquí muchas cosas diferentes. Por supuesto, puedes cambiar el texto, por ejemplo, puedes cambiar el instrumental, puedes cambiar las cosas que se generan fuera, y por supuesto, también las variantes. Puedes hacerlo más diferente o menos diferente. Puedes remezclar como quieras. Si crees que es genial, pero quieres tenerlo más tiempo, simplemente presionas extender. Si presionas publicar, puedes compartirlo con todos en esta plataforma. Si presionas sobre estos puntos libres, puedes remezclar, extender, como sabes Puedes ver la pista, puedes agregarla a una lista de reproducción. Puedes compartirla, descargar, eliminar o reportar la canción si algo no está bien. Creo que presiono extender porque me gusta mucho esto, pero no tienes que escuchar toda la canción. Creo que lo mejor que puedes hacer es jugar un poco con esta herramienta. Udio es, ahora mismo, al menos en mi mente, sin duda la mejor herramienta Udio trae música que realmente podemos escuchar. Podemos crear y escuchar música en pocos minutos. Esto nunca fue posible. Solo piensa en lo que necesitas hacer para crear una canción en esta calidad sin A. Necesitas aprender a tocar instrumentos. Necesitas aprender a cantar, o necesitas encontrar a las personas adecuadas. Tienes que ir a un estudio. Hay que grabarlo, hay que editarlo. Esto es enorme. Ahora podemos hacer nuestra propia música con unos pocos clics y la música, al menos en mi mente, es casi tan buena como la música de profesionales. Recuerda, esta es la peor versión con la que jugarás. El audio también va a mejorar y mejor y a lo mejor viene una nueva herramienta a la vuelta de la esquina que es tan buena como los mejores artistas del planeta. La IA es simplemente increíble. Solo juega con el taburete y avísame si te va a encantar. Sé que lo harás. 22. ¡Recapitulación y GRACIAS!: Enhorabuena. Tú lo hiciste. Y antes que nada, gracias. Has aprendido IA lo más rápido posible. Empezamos con lo básico. Entonces, ¿qué soy y qué son los LLM, cómo se capacitan y cómo funcionan? Esto era un poco de teoría, pero necesitas entender esto porque necesitas entender que para obtener buenos resultados, necesitas buenos insumos, y necesitas entender tokens para. Empezamos qué son los LLM y cómo podemos usarlos. Tenemos mucho. Tenemos Lams de código cerrado como HachPD, coágulo, Géminis Pero básicamente, estos son los tres grandes, y luego tenemos ams de código abierto. Y los LL ams de código abierto, los podemos usar ya sea en Olama en LM Studio o también en el chat de abrazos Entonces has aprendido lo que estos LLM. Puedes hacer que el texto pequeño sea más grande o el texto grande más pequeño. Y con todo esto, puedes hacer mucho porque también puedes hacer código. Se puede hacer texto para mercadeo. Se pueden escribir libros antire. Puedes escribir correos electrónicos, y puedes hacer mucho más. Entonces hablamos de ingeniería rápida. Tenemos el papel que incita, el prompting corto, prompts estructurados, y algunos consejos como pensar paso a paso Lo más importante es la asociación semántica, por lo que hay que dar contexto También puede personalizar su LLM ya sea con el prompt del sistema o con tecnología directa Y por supuesto, puedes usar todas estas LLM a través de una API y puedes integrarlas en tus propios proyectos si eres desarrollador Por supuesto, hay mucho más. Hay un sinfín de herramientas de IA como la perplejidad, algo que funciona genial para algunos, y si quieres jugar también el chat de abrazos Entonces hablamos de modelos de divusion. Empezamos con la generación de imágenes. modelos Divusion son modelos entrenados en texto e imágenes, y pueden recrear imágenes si escribes También aquí necesitas ser específico para obtener salidas específicas. Así que la ingeniería rápida es importante, y funciona en cada modelo de difusión de la misma manera. Solo piensa en lo que importa. Vio todas las cosas más importantes mitad del viaje, un Dogram, AdobvaFly e incluso los modelos de código abierto como la difusión estable en el foco o el flujo y el recraft en flujo Entonces has aprendido que los modelos de di fusión pueden hacer más porque también puedes crear audio, video y voces. Algunas de las herramientas más populares para videos son ling, runway y Beca Si quieres generar texto, 11 labs o un cinco DDS y la API OMI es genial, si quieres crear canciones, creo que dio ahora mismo es la mejor herramienta También antes funciona y eventualmente también 11 laboratorios en el futuro. Además de eso, también puedes usar código abierto WiSPR para transcripciones Simplemente instala Binochio y podrás hacer las transcripciones sean realmente fáciles y gratuitas Entonces básicamente, has aprendido mucho, y quiero decirte una vez más lo que es aprender. El aprendizaje es las mismas circunstancias, pero un comportamiento diferente. A lo mejor no sabías que la IA puede hacer tantas cosas. Ahora mismo, ya lo sabes, así que deberías hacer esto totalmente. Esto es lo más importante. Usa herramientas de IA solo entonces has aprendido. Y quiero decirte lo que realmente hacen los buenos aprendices. Aprenden juntos porque más personas siempre saben más que personas. Entonces, si pudieras compartir este curso, esto realmente significaría el mundo para mí. A lo mejor también significa la palabra para la otra persona, y si la otra persona obtiene valor de este curso, describirán el valor porque te lo has dicho. Gracias por eso, y te veré, claro, una vez más en este curso o en otro curso. Y una última vez, gracias desde el fondo de mi corazón porque me has dado tu activo más valioso, tu tiempo. Todo el mundo en esta tierra tiene tiempo limitado y decidiste pasar tu tiempo conmigo. Así que gracias por eso, y has aprendido IA lo más rápido posible.