Transcripciones
1. Introducción: Tu Buzzy y yo lo entiendo. La IA puede parecer complicada y
quieres aprenderla lo más
rápido posible. Con un horario atrasado
y un trabajo de tiempo completo, no
tienes tiempo para
pasar por un curso de 50 horas. Solo quieres habilidades
prácticas de IA para aumentar la eficiencia en gráficos, texto, correos electrónicos, código y más. Si ese eres tú, entonces
este curso es perfecto. Imagínese impresionar a todos
con conocimientos de IA, bien, cuando cuenta Te cruzaste como un verdadero profesional. En este curso, obtienes
una comprensión clara de la IA, las LLM
y los modelos de difusión, cómo usar LLM como Chachi BT,
con ingeniería rápida,
explorando modelos multimodales
y de alto rendimiento, impulsando técnicas para modelos de difusión como
Dai AdaObviaFly, impulsando técnicas para difusión estable de media hora, de la IA, las LLM
y los modelos de difusión, cómo usar
LLM como Chachi BT,
con ingeniería rápida,
explorando modelos multimodales
y de alto rendimiento,
impulsando técnicas para modelos de difusión como
Dai AdaObviaFly,
difusión estable de media hora,
flujo y más. los conocimientos sobre videos,
voces e incluso la
creación musical impulsados por IA . Y por cierto, si te
preguntas quién soy mi nombre es Arnie, y doy clases de
IA antes de que ChiPT
incluso fuera una cosa Así que estoy relativamente
largo en el juego. También tengo un pequeño canal
alemán de YouTube, y eso es lo que hago.
2. ¿Qué es IA?: Podemos
profundizar en el mundo de la IA, necesitamos definir
qué es realmente la IA. Entonces la IA es simplemente un término
en ciencias de la computación. El objetivo es crear máquinas con inteligencia humana. Por ejemplo,
reconocimiento de patrones, toma de decisiones basada en datos
y también ejecución de tareas. Y no pienses en terminator. Se trata de tareas sencillas. También puede estar escribiendo algún
texto como lo hace Chachi Pit. ¿Cuál es el objetivo final? El objetivo final es AGI, por lo que la
inteligencia general artificial. Y eso simplemente significa aprender, comprender, resolver problemas
y procesos creativos, así o mejor que los humanos. Entonces, la inteligencia
general artificial es más inteligente que la mayoría de los humanos, y ese es un objetivo
y nadie sabe exactamente cuándo se
alcanzará esto. Y meta final y nadie sabe si esto
alguna vez sucede es ASI. Super inteligencia artificial. Esta IA sería
más inteligente que todos los humanos combinados. Y como dije, no pienses
en terminator ahora mismo. ¿Qué no es la IA? La IA no es todo saber, no
es segura de sí misma, no
tiene emoción, y
el objetivo actual es simplemente lograr una meta establecida. Dile a la IA, oye, escríbeme algún texto o hazme una foto y la
IA lo hará. Eso es por ahora, pero también
tenemos robótica y demás, pero ese no es el
tema principal en este curso Vamos a hacer algunos
ejemplos aquí mismo, y también puedo escribir esto. Entonces algunos ejemplos
tenemos asistente de voz, y la mayoría de ustedes conocen asistente de
voz. Entonces CiRIA s Google
Assistant pero también GPD voz y simplemente
entienden y responden
a los comandos de voz La voz GPT o la
API de WISPA es realmente genial. También nos sumergiremos en esto
más adelante en el curso. Entonces tenemos
sistemas de recomendación, y esto es viejo. Solo piensa en Netflix o
Spotify o incluso YouTube. Miras el video, y en
base a tu comportamiento, los algoritmos
encontrarán videos similares. Y luego también tenemos conducción
autónoma. Así que los autos autónomos usan IA para entender dónde están y luego conducen en
esa dirección. Y esto es simplemente IA real. Como el FSD de
Tesla, por ejemplo, es real AI, por lo que
no están programados para
conducir en esta carretera Miran el camino y
luego ajustan su comportamiento. Y por supuesto, tenemos
LLM y modelos de difusión. Tan grandes modelos de lenguaje
y modelos de difusión. Los modelos de lenguaje grande hacen que los modelos de
texto y de difusión hagan imágenes. Esto de aquí mismo es el núcleo. Y porque es el núcleo, comenzamos con LLM Entonces en el siguiente video, voy a ver y vamos a echar
un vistazo más de cerca a lo que son los LLM
3. Qué son los LLM como ChatGPT, Claude, Gemini, etc: De la gente conoce HachBD. JacPT es un LLM, y aquí puedes hacer
muchas cosas y
vamos a hacer una
inmersión profunda en Pero déjame decirte,
tenemos muchos más LLM. Básicamente, si
vas en este sitio web, el chatbot arena, ves que tenemos muchos
LLM diferentes Vienen de Opie, por lo que HaChipt viene de Opeie Entonces tenemos a Géminis.
Esto viene de Google. Tenemos a Grock. Esto viene
del XI, por lo que ELN Mask Tenemos nube, nube
viene de trópico. Sólo quiero decirles que
tenemos muchos LLM diferentes Y en este video,
quiero mostrarte cómo funciona
un LLM porque
necesitas entender los conceptos de tokens y así
sucesivamente para poder
usarlos correctamente porque tokens y la estructura
de un LLM es importante para que puedas usarlo
correctamente lo más rápido posible Básicamente, son
sólo dos archivos. Y hacemos sólo un
ejemplo sencillo con Lama dos. Para todos los que ya saben exactamente qué
es un LLM y cómo funciona, por
supuesto, pueden
saltarse la conferencia Básicamente, un LLM
son solo dos archivos. Tenemos un archivo, y este archivo es básicamente
el archivo de parámetros, y simplemente lo hago aquí como P. Esto significa parámetro. Y tenemos un segundo archivo, y el segundo archivo es sólo
para ejecutar estos parámetros. Yo sólo lo llamo ejecutar archivo. Este archivo de ejecución es la mayoría
de las veces escrito en C. C es un
lenguaje de programación o en PyTon Así que ambos pueden funcionar
eventualmente. Entonces lo que tenemos aquí mismo es el archivo de parámetros
y el archivo run. Y el archivo run la
mayor parte del tiempo son simplemente 500 líneas de código. Así que usamos 500 líneas de
código para ejecutar este archivo. Y este archivo es donde
ocurre la magia porque este
archivo es gigantesco Haz un ejemplo con un
LAM que sea de código abierto, y el LAM se llama ama two. Entonces ama es, por supuesto, el LLM de meta, y tienen diferentes modelos Y este Lama, también, donde
hacemos este ejemplo, este es el modelo 70 B. Entonces esto simplemente significa que
tenemos 70 mil millones de parámetros. Entonces sabes que este es un archivo relativamente grande
que tenemos aquí mismo. Entonces este archivo de parámetros tiene
70 mil millones de parámetros, y ¿cómo obtenemos todos
estos parámetros? Tenemos que entrenar este archivo y lo entrenamos
en mucho texto. Utilizamos 10 terabytes de texto
para entrenar este archivo. Entonces usamos diez textos de Theraby. Este es un texto de
todo Internet. Entonces esto podría ser artículos de
Wikipedia, sitios web, y mucho, mucho más. Y este archivo, podemos simplemente
comprimir este archivo hacia abajo, y este archivo sólo tiene
140 gigabytes de tamaño. Entonces este archivo es de
apenas 140 gigabytes tamaño y lo entrenamos en
10 terabytes Ya sabes, podemos
comprimirlo, mucho. Este archivo de parámetros, simplemente
puede pensar este archivo
como un archivo zip. Simplemente comprime todos
estos datos. Para comprimir estos datos, necesitamos mucha potencia de GPU. Entonces necesitamos mucha potencia de GPU para poder
comprimir estos datos. Y por eso también NVDA fue una gran acción en los
últimos años Si miras, por ejemplo, las acciones de NVIDIA, ya ves, tenemos una carrera gigantesca, y esto es básicamente
porque todos necesitan GPU Entonces ya ves que tenemos
una carrera gigantesca, pero esto no se trata de
acciones en estos momentos Entonces básicamente,
usamos mucha GPU. Esto lo hago muy sencillo. También tengo explicaciones más
detalladas, pero no creo que necesitemos
esto en este curso. Así que simplemente comprimimos diez textos Trabte en
un archivo de 140 gigabytes, y luego tenemos
el segundo archivo El segundo archivo es el archivo Run. Son sólo unas pocas líneas de código. Y si tenemos un código abierto, a una am igual que
Lama dos o incluso Lama tres o lo que sea de
código abierto como ese que quieras, podemos descargar este archivo y
podemos ejecutar estos archivos
localmente en nuestro PC Y esto nos trae la
máxima seguridad de los datos porque nada
pasa por Internet. Con estos dos archivos, son un poco
mágicos porque aquí trabaja la
arquitectura del transformador de fondo. Simplemente puedes
pensar en la red neuronal. No necesitamos bucear tan profundo. Pero básicamente, la
red neuronal ve palabras y predice qué
palabra siguiente viene más probable Entonces funciona básicamente así. Entrenamos en todos los textos, y así el LLM simplemente aprende
cómo se estructura el texto Si preguntamos, por ejemplo, qué debo comer hoy, el LLM simplemente predecirá qué palabras
escuchará muy probablemente un humano Esto en este momento esto simplemente
se llama el pre entrenamiento con
el pre entrenamiento, simplemente
alucinamos
cosas de este archivo Pero luego viene lo segundo. Lo segundo
es la afinación fina y con la afinación fina, le
damos al LLM muchos
ejemplos de cómo los humanos quieren
tener su respuesta Alimentaríamos, por
ejemplo, una pregunta. Qué debo comer hoy, y luego alimentaríamos una
respuesta que a los humanos les gusta. Por ejemplo, hoy podrías
comer bistec. Si alimentamos esto una
y otra vez, el LLM aprende cómo los humanos
quieren sus respuestas Esto se llama afinación divina, y esta es la segunda
parte para ejecutar LLM Entonces la última parte es el llamado aprendizaje por
refuerzo, y podemos desglosar esto
realmente muy simple. Después del pre entrenamiento
y afinación divina, simplemente
haremos este aprendizaje de
refuerzo. Esto básicamente significa
que hacemos una pregunta, obtenemos una respuesta,
y luego le decimos al LLM si esto es bueno o no Esto es básicamente el aprendizaje
de refuerzo. Entonces tenemos tres
fases de entrenamiento. El pre-entrenamiento,
simplemente usamos mucha GPU para comprimir mucho texto en un archivo más pequeño
llamado ZIP,
y podemos alucinar
texto fuera de
estos y podemos alucinar
texto fuera Para mejorar estas
alucinaciones,
hacemos fina Entonces alimentamos muchas preguntas con
respuestas estructuradas
de una
manera que a los humanos les gusta. Y en esta fase, D LLM aprende cómo los humanos quieren sus respuestas Y por último, el aprendizaje de
refuerzo, simplemente
echamos un vistazo, Oye, tiene este
sentido o no, yo sí, pulgares arriba, si no pulgares abajo, y LLM simplemente aprenderá más cómo queremos
nuestras respuestas Ahora lo siguiente
que es
realmente, muy importante es que ya lo
hayas aprendido. En esta
arquitectura transformadora, hay redes neuronales, y redes neuronales
funcionan con pesos. Básicamente,
trabajan con números. Y para que
tenga sentido para la red neuronal, por
supuesto, necesitamos
tener números. Entonces lo primero
es, por supuesto, si alimentamos una pregunta
en un LLM, el LLM hará números
a partir de estas preguntas, los llamados tokens Estas fichas son números, y con estos números, la red neuronal puede
hacer sus cálculos. ¿Qué palabra vendrá más
probablemente como la siguiente palabra? Quiero mostrarles simplemente cómo están estructurados
estos docons Si vamos en este
tokenizador, podemos verlo. Simplemente podemos escribir Qué
puedo comer hoy por ejemplo, y ahora ves que
tenemos cinco fichas,
20 caracteres, y las fichas
están estructuradas de esta manera. Si presionamos aquí en los identificadores de token, entonces esto es básicamente
lo que los LLMC El LMC son números, y con estos números, la red neuronal puede hacer sus cálculos y nos
da una buena respuesta Si presiono aquí mismo, por
ejemplo, en claro, una vez más, entonces voy a
mostrar ejemplo, ve un ejemplo más grande. Y aquí también se ve que no todas las
palabras son una sola ficha. Esto se divide un
poco diferente. Aquí ves invisible
es, por ejemplo, dos fichas, y aquí este
punto también es token separado. Entonces tenemos muchos tokens
diferentes, y si presionamos en token
en estos, ya ves, esto es básicamente
lo que ve el LLM y el LLM hace sus cálculos con
los Pero por qué te muestro
esto porque esto es importante porque
tenemos un límite simbológico. Cada LLM tiene
siempre un límite a la cantidad de tokens que puede
entender en este momento Si vamos a este artículo aquí
mismo, ¿qué son los tokens? Omei nos dice que una ficha tiene aproximadamente cuatro
caracteres en inglés Significa que 1,500 palabras
son aproximadamente 2048 fichas. Y esto es importante porque cada LAM tiene un límite de token
diferente. Se puede ver aquí abajo. Ahora mismo en este momento, GPD para Turbo y
también GPD para Omni, y muchos otros modelos,
tienen aproximadamente 128,000
tokens de tienen aproximadamente 128,000 También tenemos modelos que tienen límite de
2 millones de endocen. También tenemos un modelo de código
abierto más pequeño que solo
tienen un límite de 4,000
docenestocen, y lo importante
es que
entiendas que tan pronto como se alcance el límite de
dtcen, LLM ya no entenderá las cosas que hablaste anteriormente con
el Sólo quiero mostrarte
un ejemplo en el chat GPD. Simplemente le digo al LLM
escribir una historia sobre un zorro, y ahora nuestros primeros
tokens se generan Y en cuanto estemos
cerca del límite de tokens, así que en cuanto
hable, por ejemplo, otras cosas, ahora mismo, solo supongamos
que quiero tener diferentes historias
aquí mismo en este chat. Por ejemplo, cuéntame
una historia sobre una rana. Ahora mismo, por supuesto, se generan nuevos
tokens. Y en cuanto
lleguemos a nuestro límite de tokens, el LLM ya no sabrá
nuestra pregunta anterior y tampoco la respuesta
porque el LLM siempre solo conoce
los últimos En este caso de JCEPT, la ventana de contexto
es relativamente grande, por lo que conoce 128,000 Estas son aproximadamente 100 mil
palabras, aproximadamente, como dije. Y después de ello,
ya no conseguirá lo que
platicamos anteriormente. Entonces por favor, por
favor, por favor recuerde siempre los
últimos tokens cuentan, y todo lo que
haya terminado ya
no estará en el
conocimiento del LLM Se le puede llamar así. Por supuesto, tenemos muchas técnicas para incrementar
este conocimiento, por
ejemplo,
tecnología directa y así sucesivamente, hablaremos de esto más adelante. Pero por ahora,
hay
que entender que cada LLM tiene
un límite de token Eventualmente esto desaparecería. Eventualmente, el
límite de fichas será tan grande que ya no
necesitamos pensarlo, pero ahora mismo en este momento, tenemos estos límites y
necesitamos saber esto. Básicamente, si
alguna vez te preguntas por qué el LLM ya no sabe de lo
que hablabas anteriormente, es simplemente porque se alcanza el límite de
docen En este video, has
aprendido cómo funciona un LLM. Básicamente,
sólo tenemos dos expedientes. Tenemos un
archivo de parámetros y un archivo de ejecución. El archivo run es solo un código
para ejecutar el archivo de parámetros, y el archivo de parámetros es simplemente muchos textos
de Internet, pero se comprime en un pequeño archivo similar
a un archivo CIP Necesitamos mucha GPU para hacer esto. Este fue el pre entrenamiento. Después del pre entrenamiento
viene la afinación divina. Aquí alimentamos las preguntas y
respuestas de
LLM para que LLM pueda aprender
cómo queremos nuestras Y después de la afinación divina, el paso final es el aprendizaje de
refuerzo. Simplemente hacemos preguntas, obtenemos respuestas y calificamos las respuestas si
son buenas o no. Y con esta última fase, el LLM va a
mejorar en estas tareas También has visto que en el fondo funciona, la arquitectura
del transformador. Estas son redes
neuronales y redes neuronales hacen
cálculos con números. Por eso necesitamos
dividir nuestras palabras en fichas. Con estos tokens, podemos
hacer los cálculos y calcular qué palabra viene más probablemente como la siguiente
palabra lo que queremos tener. Es necesario entender
estos tokens porque cada LLM tiene un
llamado límite de tokens Tan pronto como se alcance el
límite de tokens, el LLM ya no sabrá qué cosas
perras anteriormente Siempre mira
los últimos tokens, y por supuesto, los
límites de tokens dependen del modelo. A veces son 4 mil tokens, pero puede subir
hasta los 2 millones. Y una última cosa, claro, es muy importante
qué
preguntas hacemos LLM porque con
buenas preguntas, obtenemos buenas respuestas A esto se
le llama ingeniería pronta, pero más sobre eso, por
supuesto, más adelante. Te veo en el siguiente video, sé que hicimos esto
un poco rápido, pero creo que este
detalle técnico es que todos simplemente
deberían tener una idea
de esto. Entonces lo hicimos rápido. Lo hicimos no con todo
detalle, pero esto es más que suficiente
para trabajar con este modelo. Necesitas estos detalles
técnicos para entender
que aquí
no tienes preguntas ilimitadas antes de que JGBT se olvide de las cosas, y también necesitas
entenderlas porque ingeniería
rápida es realmente importante para obtener buenos resultados,
y solo obtienes una buena salida
si das una buena entrada Se llama ingeniería rápida. Quiero hablar de ingeniería
rápida en la siguiente sección.
4. Las interfaces de los LLM: Este video quiere
mostrarte algunos de los LLM más importantes y, por
supuesto, también su interfaz Ahora, ya viste que
tenemos muchos LLM diferentes,
y podemos encontrar innumerables LLM y podemos encontrar innumerables en estas arenas
de chatbot Los más importantes son, al
menos cómo veo JetPT de Opmei, Clade de antrópico,
Gemini de Google, eventualmente
también modelos de código abierto, y podemos usarlos ya sea en Grock o también
podemos Ahora, queremos comenzar con HPT porque creo que este es
por lo menos ahora el mejor Sí, a algunas personas les encanta el coágulo porque Clot también es
muy bueno codificando Entonces básicamente, sí, también
pueden codificar. Quiero mostrarte
la interfaz en detalle de JCPT porque si entiendes JCPT
entiendes también todas las Esta justo aquí es la barra donde puedes escribir
tus preguntas. Y a estas preguntas las
llamamos las indicaciones. Y por supuesto, la
ingeniería rápida es el arte de escribir
las preguntas correctas. Si quieres subir cosas en HathIPT, tienes
esto aquí mismo. Se pueden adjuntar archivos. Puedes subir fotos o archivos PDF y esas cosas y
analizarlo. Esto de aquí mismo es la
búsqueda, el botón web. Si presionas sobre estos,
HatChipt buscará en la web. Vamos a
probar esto por una vez. Si presionamos en la búsqueda, podemos escribir el precio de
Bitcoin hoy. Entonces aquí básicamente puedes
ver que
recuperamos el texto y también obtenemos algunos enlaces donde
podemos hacer clic si queremos. Entonces estas son las fuentes, y si las presionas, podemos ver al HpD buscado en la web Utilizamos
capitalización de mercado de monedas y así sucesivamente. Ahora bien, si usas un
chat nuevo en la esquina izquierda, está vacío una vez más, y tus chats antiguos
están aquí mismo. Lo siguiente que
puedes hacer es, por supuesto, presionar en HatPd y
usar diferentes modelos Tenemos el GPD normal para
Omni genial para la mayoría de las tareas. Tener GPD cuatro oh con lona. Si presionas sobre estos, el
lienzo también es muy agradable porque
digamos que quieres
generar algún código. Dame el
código de mordedura para una serpiente. Chet GPD
abrirá este lienzo, y en este lienzo, podemos
editar un poco este código Esto es muy agradable. Así que aquí en el lado derecho,
puedes dar click. Puedes revisar el código, puedes portarlo a
otros lenguajes como JavaScript o
algo más. También puedes corregir errores. Puede agregar registros, y puede
agregar comentarios si lo desea. Para todo el mundo que codifica, espero que entiendas lo que quiero decir. Si generamos
texto normal con este lienzo, también
es agradable porque
también podemos editar nuestro texto
en este lienzo. O bien podemos sugerir ediciones, podemos ajustar la longitud, para
que podamos hacerlo, por
ejemplo, más corto
si quieres, y si lo enviamos, se
volverá a escribir pero Y ahí lo ves, tenemos básicamente el mismo texto
pero mucho más corto. Entonces podemos ajustar
el nivel de lectura. Entonces, por ejemplo, para la
escuela egresada o para el jardín de infantes. Lo siguiente es que
podemos añadir pulido final. Si presionamos sobre esto, JetPT lo
hará completamente
automático Simplemente lo reescribirá y
reestructurará un poco. A lo mejor hay algo mal
o un poco demasiado corto, y ves que obtienes
mejores salidas. Y lo último, claro, también
podemos agregar
imágenes si queremos. Y ahí tenemos
lindas imágenes pequeñas. Además de este lienzo,
tenemos también 01 avance. Vista previa abierta es el
modelo que piensa. Si le damos a JCPT una tarea difícil, JCPD es capaz de pensar un poco antes ¿Es este un buen título de YouTube? ¿A mí me gusta en Marte?
Piense en palabras clave, tasa de
clics y más. Y JCPT comenzará a pensar. Entonces ya ves que HHIPT está pensando. Se genera alguna ficha. Aquí se puede ver el proceso de
pensamiento, y luego se puede levantar con
mejores respuestas porque JCIPT se
da siempre nuevos
tokens para pensar, y ahí tenemos nuestra salida Además de la previa 01, también
tenemos el 01 Mini. Esto hace básicamente
lo mismo, pero es más rápido. Y si presionas en
más modelos, ahora mismo, tenemos GPD para O Mini
y GPD para modelo Legacy Si solo quieres
tener chats temporales, también
puedes incluirlos. Si vas en este signo de interrogación, ves que puedes reportar contenido
ilegal
puedes usar atajos. Tienes términos y
políticas, notas de la versión, guía de
ayuda y te ac, y este criterio es
simplemente tu nombre. En la esquina izquierda,
te *****. Entonces, si presionas sobre estos, puedes actualizar tu plan. Yo pago ahora mismo
20 dólares al mes, pero también puedes empezar gratis. Si usas el plan de negocios, debes pagar
25 dólares al mes. Básicamente, obtienes
lo mismo. Pero lo más
importante es que tus datos serán automáticamente
excluidos de la capacitación. Entonces esto es un poco más seguro. En el lado izquierdo, también
puedes cerrar la barra lateral y
devolverla a la vida. Se puede pulsar en los chats de búsqueda. Y aquí puedes
buscar los chats que ya
tuviste con hat GPD Y si presionas sobre
estos aquí mismo, nuevo chat como si tuvieras un NuCat Entonces tienes estas
cosas aquí mismo. Estos se llaman GPD y
quiero mostrarles
más sobre los CPD más Pero si presionas en Explorar GPD, básicamente lo que puedes
hacer es que puedas buscar GPD específicos que
otras personas hayan hecho Si quieres hacer,
por ejemplo, programación, puedes dar click en
Programación y encontrar GPDs
específicos que estén
a la medida para la programación Este es un GPD para PyTon y
si presionas sobre Sarchat, simplemente
puedes chatear
con este GPD,
y esto es, como dije, Esa es básicamente la interfaz
JaHipt. Si entramos en Cloud, básicamente
ves que la interfaz es
relativamente similar. Aquí puedes escribir
lo que quieras hacer. También puedes actualizar la Nube. Esta interfaz es un
poco más sencilla, pero básicamente hace lo
mismo que JaHipt pero más simple,
como te dije M código serpiente, y también coágulo me
dará código serpiente, y también coágulo agregará
algo en como lienzo Este de aquí mismo es Géminis. Ahora mismo, Géminis está
en alemán aquí para mí, Gemini también es un LLM normal, y también puede hacer básicamente lo mismo que
Chachi Bitty Esto de aquí es
Grock y en Grock básicamente
puedes usar LLM de código
abierto Y la interfaz
es minimalista. Puedes escribir tus cosas
aquí mismo o también puedes
hablar con estas cosas. Y por cierto, también puedes instalar hat ChiPT en tu PC, y lo tienes como aplicación, y también puedes instalarlo en tu smartphone y
puedes hablar con HatChipt Esta de aquí es
la aplicación HatchiPit, y si hablamos con la aplicación
hatchipit, Oye, Chat Chi Pit, cuéntame
una pequeña historia sobre un zorro. Érase una vez,
en un frondoso bosque, vivía un
zorro inteligente llamado Fiona Conocida por su ingenio rápido, Fiona le encantaba explorar y aprender sobre
todo lo que la rodeaba. Un día, se
topó con una trampa
colocada por cazadores
usando su astucia Ese es básicamente el modo
avanzado de voz. Creo que esto es
ahora mismo una función de pago. Entonces, si pagas por ChatBD y simplemente instalas la
aplicación en tu PC local, puedes usar este modo de voz
Avanzado Y lo último que
quiero mostrarte es Olama. Si descargas Oma, esto se ejecutará
localmente en tu PC. No te
preocupes si no quieres hacer esto. Sólo quiero
mostrarte cómo funciona. Simplemente presiona
Descargar aquí mismo, luego puedes ir a los modelos, y puedes buscar los
modelos que quieras. Y lo siguiente
que debes
hacer es entrar a tu terminal, y esta cosa
funcionará localmente. En tu terminal, puedes buscar los modelos
que quieras usar. Por ejemplo, Lama 3.2, simplemente
puedes presionar
O Lama ejecutar Lama Si copias estos y los
lanzas en tu terminal, puedes descargar estos
modelos de Lama o puedes ejecutarlos. Si ya están
instalados, puedes ejecutarlos. Entonces tengo esto instalado, y ahora también puedes hacer
estas cosas aquí mismo. Cuéntame una historia sobre el rock, y luego Lama me contará
una historia sobre la roca Esto de aquí es especialmente
genial para la privacidad de datos, pero por supuesto, no hay
una interfaz agradable en OLAM Puedes vincular esto junto con, por
ejemplo, cualquier cosa LLM, pero esto es demasiado grande
para este curso porque necesitamos
aprender estas cosas rápido Entonces básicamente, si quieres ejecutar las cosas localmente,
puedes hacerlo totalmente. Pero en su mayor parte,
si estás empezando, solo usa HaChipt en la interfaz
estándar Entonces en este video, viste todas las interfaces
que son importantes. Si desea ejecutar LLM
lo más rápido posible. En el siguiente video, quiero
mostrarles lo que pueden hacer los LLM.
5. ¿Qué pueden hacer los LLM?: Este video quiere darte una visión rápida de
lo que las LLM pueden hacer, y no importa
en qué LLM eres Básicamente, la mayoría de los
modelos fronterizos pueden hacer lo mismo, y también los
modelos de código abierto vendrán con el tiempo. Cada LLM puede
hacer que el texto sea más grande o código y hacer que el texto
o el código sean más pequeños Para que puedas resumir
texto o expandir texto. Solo hagamos un ejemplo. Puedes escribir un poco de palabras y obtener muchas palabras. Dame un texto de marketing para
mi sitio web, IA con Arnie. No, realmente no tengo
este texto de marketing. este momento,
utilizo el modelo de vista previa OO solo porque estaba activo. Ahora CHGPT piensa un poco qué texto de marketing
debería escribir, y luego obtendré mi respuesta Entonces aquí ves que convertimos un poco de texto
en mucho texto. Espero que entienda lo que quiero decir. A continuación, podemos resumir texto. Este aquí mismo es un artículo
en medio sobre LLM. Básicamente puedes simplemente
copiar un poco de texto. Se puede tirar a JTCPD
y decir resumir en balas. Entonces, básicamente,
se puede resumir el texto. Y ahí
lo tienes. Ahora tenemos algunas viñetas sobre este
texto. Lo mismo con el código. Se puede generar código. Podemos hacer básicamente
algo así. Podemos crear mucho
código muy rápido. Dame el código
para la página web HDML que tenga tres botones Sólo puedo encender dos de los
botones al mismo tiempo. Debe ilustrar que no
es posible estar quebrado, inteligente y ocupado
al mismo tiempo. Ahora generará
algún código HDML. Ahora está el código. Vamos a ver si funciona.
Copio el código. Hago un nuevo archivo de texto. Lanzo el código en el archivo de
texto y lo guardo. Ahora lo guardo como HDML HDML Sí. Y abro la página web
quebrada, inteligente, ocupada. No funciona porque,
como, piensa por ti mismo, sí, puedes ser inteligente y ocupado, pero entonces no estás en quiebra porque trabajas en
las cosas correctas. Si estás quebrado, no
puedes ser inteligente y ocupado porque si
fueras inteligente y ocupado, no
estarías quebrado, pero puedes estar, por
supuesto, quebrado. Y ocupado pero no inteligente. Si estás quebrado e inteligente, no
estás ocupado porque no haces nada porque simplemente no
funciona de esa manera. Y claro, si tienes
mucho código, por ejemplo, en una página web, también puedes
intentar hacer que el código sea más pequeño. Entonces sí, también puedes
resumir código si funciona. También puedes generar
algunas tablas si quieres. Entonces esta, por ejemplo, es una tabla sobre las
macros de un plátano. Entonces el texto puede ser,
por supuesto, también tablas. Y ahora viene la parte divertida porque los LLM también pueden usar herramientas, como una calculadora, un intérprete
Biton
o un modelo de difusión Un modelo de difusión
hace imágenes. Yo quiero mostrarte. ¿Qué es
tres veces 98 por 98? Si enviamos esto,
ves que estamos analizando. Entonces básicamente, utilizamos herramientas. Creo que JaHipt simplemente nos
escribirá más
guión PTN para hacer esto Si presionas sobre análisis de vista, ves que ChaChiPT usa un intérprete de Python
para darnos el resultado. Haz una foto sobre el plátano, y HCBT utilizará un modelo de difusión como Dali
para crear esta Y ahí tenemos el plátano. Por supuesto,
también podemos analizar cosas. Déjame mostrarte lo que
hay en el conjunto de datos. Eso es básicamente,
déjame mostrarte un conjunto de datos con algunas cosas de redes
sociales. Esto es básicamente
el uso de las personas, entonces donde están,
están en Snapchat,
****, muelle,
arresto de pin, y así sucesivamente. Y ves que esta es una mesa
muy, muy grande, y
podemos analizar estas cosas. Aquí me da una mesa. Disculpe,
ahora mismo, está en alemán, pero ahora mismo queremos hablar
en inglés. Y eso es básicamente también lo siguiente que
quería mostrarles porque, por
supuesto, los LLM
también pueden traducir cosas. Entonces aquí hay cosas en alemán. Simplemente puedes decirle a HathPT, traducir esto en inglés Y puedes hacerlo
también, viceversa. El conjunto de datos contiene 1,000 filas con las siguientes columnas. ID de usuario, app,
minutos diarios gastados, publicaciones por día, me gusta por
día, seguidores por día. Y aquí se obtiene de todo. Entonces ves Pinterest, Facebook,
Insta, **** Doc, y LinkedIn. Minutos diarios gastados,
publicación por día, me gusta por día, sigue por día. Hacer un gráfico a partir de esto porque podemos usar
herramientas, ya sabes. JGBT utilizará un gráfico BTN para
crear una gráfica agradable para nosotros. Y aquí lo tenemos, Facebook, Installink entonces,
Pinterest, y así sucesivamente Y claro, si
presionas sobre estos, podemos cambiar a un gráfico
interactivo. También podemos usar, por ejemplo, diferentes colores si
te gustan otros colores. Y luego si te gusta,
primero, puedes hacerlo más grande. Pero si te gusta, como te dije, también
puedes
descargarla por este botón. Y HGPT también entiende
el contexto de este chat. Hacer un cerdo que
ilustre el conjunto de datos. JCPT simplemente entenderá que se trata de redes sociales y lo más probable es que consigamos algunas personas que usen un teléfono
o algo así Al menos así es como
lo adivinaría. Y ahí lo tenemos. Esta
es una página de redes sociales. Y claro, con algunos datos
porque se trata de un conjunto de datos. Por cierto, esto se llama
llamada de función. No tenemos tiempo suficiente para sumergirnos tan
profundamente en estas cosas. Solo piénsalo de esa
manera que cada vez el CheBT o un LLM no
sea lo suficientemente inteligente, usarán diferentes
herramientas para hacer esto Andrew Karpathy también
le gusta decirnos que el LLM es nuestro nuevo sistema operativo como una computadora que puede
usar diferentes herramientas Y sobre el uso de la herramienta, por favor tampoco olvides que
pueden usar Internet. También pueden usar Internet para buscar información en vivo. Ya te mostré
esto en el último video. Y también importante antes de
hablar de capacitar a nuestros LLM, claro,
también son multimodelo Esto significa que pueden
escuchar, hablar y ver. Sobre escuchar y hablar, ya
viste esto.
En el último video. Sólo quiero mostrarte
que ellos también pueden ver. Si estás en ChaChiPT, puedes subir fotos Por ejemplo, esta,
esta es una imagen de Hugging Face sobre el aprendizaje por
refuerzo, y sí, esto parece complicado ¿Qué hay en lo grande? Explícalo como si tuviera cinco años. Y por cierto, sí,
la calidad es horrible. Vamos a ver si
JaHipt puede conseguirlo. Sí, lo consigue. Comienza
con el modelo de idioma. Imagina que la computadora
es como un niño que ya conoce algunas palabras
y frases y así sucesivamente. Entonces dale una recompensa, haz que realice estos pasos de aprendizaje
combinados Esto es refuerzo
aprendiendo de Hugging Face. Esta es básicamente esta imagen aquí
mismo de Hugging Face Esta es en estos momentos
la buena calidad. En HHIBT, he subido a
propósito la mala calidad, pero incluso con la mala calidad, ChaChipD puede verlo y
puede explicarlo como cinco Así que los LLM también pueden
ver hablar y escuchar. También se pueden entrenar
diferentes LLM. Podemos entrenar diferentes
LLM con indicaciones. Esta es la llamada Ingeniería
pronta. También podemos usar
tecnología directa o afinación fina. Quiero profundizar en
la ingeniería rápida en
el siguiente video porque la
ingeniería rápida es realmente importante. En este video,
has aprendido que los LLM pueden hacer muchas cosas Primero, pueden generar texto. Segundo, pueden resumir texto. Tercero, pueden crear código, también hacer que el código sea más pequeño, y pueden usar muchas herramientas
diferentes
para analizar datos, crear imágenes, usar una calculadora y hacer muchas cosas geniales. Solo piensa por ti mismo lo que
es más importante para ti. Puedes hacer
tareas completas con un LLM. Solo piénsalo de esa manera. Se puede escribir una historia sobre una empresa que hace el
bien, por ejemplo. Entonces puedes hacer
algunos cálculos, cómo les va en el futuro. Entonces puedes hacer algunas
mesas, cómo les va. Y por último, puedes hacer una
foto de un inversionista feliz. Esta es toda una presentación. Entonces JGBT y LLMs, realmente
pueden ayudarte mucho
6. Ingeniería rápida: Hablemos de ingeniería
rápida. Esta guía viene
directamente de Opie. Entonces la compañía detrás de JCPD. Y sí, JATCPT o
los modelos Op MI, también
están incluidos en
el Esto ahora mismo está en
alemán, pero claro, podemos usar copiloto también
en la versión en inglés, y sí, también podemos
usarlo con fondo blanco Este es simplemente el
tema que utilizo. Posteriormente, lo usaremos con
el fondo blanco. Volvamos a
la ingeniería rápida. La ingeniería rápida es importante porque si no
das buenos insumos, no
obtendrás buenos resultados. Y quiero mostrarte
la pronta ingeniería
en el copiloto de Microsoft, pero esto funciona
completamente igual Por supuesto, también en Jet CCPD y cada uno de los modelos bajo el sol porque estos
conceptos son siempre los mismos Este recurso, puedes leer
esto tú mismo si quieres, pero queremos hacerlo lo más rápido
posible. No tenemos tiempo para cada técnica de
ingeniería rápida, por lo que la hacemos rápida. Esto de aquí mismo, este es el ejemplo de un rápido
muy, muy malo. Dame un artículo
sobre smartphones. ¿Por qué es malo este aviso? Este prompt es malo porque no
damos ningún contexto. Entonces, si
enviamos esto y usamos, por
ejemplo, balance aquí mismo, lo más
probable es que obtengamos una respuesta, pero la respuesta no es específica porque no damos entradas
específicas. Y boom ahí
tenemos nuestra salida. Entonces aquí hay un artículo
del guardián. Y simplemente tenemos un artículo. Tenemos un enlace donde
podemos hacer click. Ahora bien, este es un mal aviso, y tenemos que esperar
obtener una mala salida. ¿Por qué esta salida es mala? No necesariamente diría que esto es realmente
un mal resultado. Es solo salida de
lo que preguntamos. Pedimos un artículo, y tenemos un artículo
que no es específico. A lo mejor tenías algo en mente que quieres
publicar en tu blog. Pero no puedes hacerlo
con este artículo. Esta salida es simplemente mala porque no
damos ningún contexto. Ahora, te diré
ahora mismo que es muy, muy fácil dar contexto. Y para dar contexto, sólo hay que entender
un principio clave. Este principio clave se llama asociación
semántica. ¿Qué significa
asociación semántica? Solo supongamos
que te digo una palabra o dos palabras
o diez palabras. Solo supongamos
que te digo, por ejemplo, dios griego. Con estas dos palabras, tienes inmediatamente
otras 100 palabras en tu cerebro. Otras 100 fotos quizá
también en tu cerebro. Tienes diferentes
dioses griegos en tu cabeza. Quizás también tengas en tu cabeza imágenes
diferentes de dioses griegos. Tienes quizá también como
la vieja Roma en tu cabeza. Tienes cosas como un
buen cuerpo en tu cabeza. Tienes diferentes
cosas en la cabeza. Y ese es básicamente todo
el concepto de ingeniería rápida. Tenemos que dar contexto. Necesitamos usar asociación
semántica porque todos estos
grandes modelos de lenguaje, así copiloto que usan HHIPT,
todos ellos, todos ellos, Entonces, si les decimos a estos LLM
solo una o dos palabras, tienen todas las otras
palabras en el fondo Tienen esto en
su conocimiento. Si decimos, por ejemplo, smartphone tienen
muchas palabras diferentes que son similares a los smartphones.
¿Por qué tienen esto? Porque están entrenados
en el texto, como ustedes saben. Simplemente
buscan el texto donde encuentran la palabra
smartphone muchas veces. Si les damos un
poco más de palabras, todas estas serán
más precisas. Podemos darles, por ejemplo, palabras como Apple o Android o artículo de
blog si quieres hacer un artículo de blog y
mucho, mucho más. El concepto clave está
aquí mismo que con unas pocas palabras, le darás mucho contexto
a los LLM porque
son asociativos Solo hagamos un ejemplo. Presionamos nuevo tema y
partimos de cero. Usamos una salida balanceada y le
digo al copiloto
algo así Esto sería un aviso
que tiene mucho sentido. Empezamos con
algo como esto. Eres un experto para
smartphones. ¿Por qué hacemos esto? Esto de aquí mismo, esto se
llama instigación de roles. Entonces le damos el modelo de
lenguaje grande. En este caso, copiloto
o Hechipt un papel. Por lo que es un experto
para smartphones. Y luego le damos un
poco más de contexto. Ya sabes, el Google Pixel
ocho pro al detalle. ¿Por qué es importante esto? Porque si le decimos
que es un experto para smartphones y conoce a detalle el
Google Bxeledp,
buscará en artículos
donde se incluya todo Así que conseguimos muy, realmente
expertas buenas salidas para smartphones y el LLM
buscará en artículos sobre
el Google BixeledP Y luego le decimos al LLM
exactamente lo que necesitamos. Necesitamos un artículo de 600 palabras por qué el pixel eight pro es bueno. Queremos tener un artículo
positivo. Esto también es clave. Esto de aquí mismo, esta es la asociación semántica de la
que hablé Por supuesto, todo esto está relacionado con la asociación
semántica,
pero esto especialmente Solo incluyo tres
palabras Gemini nano, LLM, y en dispositivo Estas son simplemente palabras libres, y si usamos estas palabras libres, el LLM buscará
artículos donde todo esto esté incluido porque
para mí, esto es importante Esta es una de las características clave que hace que al menos en mi mente, el Google Pixel Eight P. Tan bueno porque
tenemos Gemini nano, un modelo de lenguaje grande, un modelo de lenguaje pequeño, grande
que se ejecuta en el dispositivo. También podemos incluir cosas
como sin latencia si queremos. Así que no te preocupes si
no lo entiendes ahora mismo porque
vamos a conseguir un artículo. Entonces, si eres un experto
en cosas como esta, simplemente
puedes decirle al LLM que también el
LLM es un Simplemente le decimos que es un
experto en smartphones. Conoce el Google
Pixel ocho P, y luego le damos
algunas palabras que
necesitamos o queremos
incluir en nuestro artículo, y el LLM buscará
las cosas adecuadas para nosotros Entonces enviamos esto, y estoy relativamente seguro de que obtenemos una
salida que es mucho mejor. Por supuesto, también puedes
incluir cosas como escribir el artículo para un 10 años si
quieres que sea
realmente, muy simple
porque, claro, la Asociación semántica también
puede hacer eso Entonces buscaremos
artículos que sean
realmente, muy fáciles de entender. Pero ahora mismo no
quiero hacer esto. Simplemente envié esto y
vamos a conseguir un buen artículo. Esto tal vez podamos incluirlo
también en un sitio web. Y aquí tenemos nuestro artículo
y espero que veas que la salida es completamente
diferente a la anterior. Como experto en smartphones, te
puedo decir que
el Google BixeleightP es un excelente
dispositivo que ofrece
una gama de características y
capacidades que una gama de características y hacen que se
destaque Aquí hay alguna razón y así
sucesivamente, por lo que el diseño y la calidad de construcción, la cámara, el software, el Gemini nano y ALM Por lo que el BixeleightP es alimentado por Google Por supuesto,
también puedes ser más específico. Como, por ejemplo, hacer este artículo para
mi sitio web o hacer este artículo como un
hilo de Twitter o algo así. Haz el artículo para
un hilo de Twitter. Los lectores son estudiantes de
tecnología, por lo que incluyen detalles. Y obtendremos
cada detalle y el formato estará bien
para un hilo de Twitter. Entonces ahora ya ves,
tenemos muchos detalles. Entonces hablamos del software. Hablamos de la
cantidad de megapíxeles y sensores que tiene nuestra cámara
y mucho, mucho más Y también podemos hacerlo más sencillo. Digamos que quieres tener
este artículo para los 12 años Haz el artículo
para niños de 12 años. más probable es que excluyamos las palabras que son un poco
duras para nuestros chicos más jóvenes. Lo ves de inmediato. Una de las mejores cosas del Google es la
cámara y así sucesivamente. No usamos todas estas palabras duras y
obtenemos una salida más fácil. Y eso es básicamente todo lo
que necesitas entender si quieres empezar de inmediato
a escribir tus indicaciones. Necesitas hacer indicaciones
estructuradas. Esto de aquí mismo, por ejemplo, es un prompt de estructura porque
empezamos con un rol. Esto también se llama
roll prompting. En el siguiente video, te
daré algunos ejemplos más rápidos, rápidos. Empezamos con el rol,
así que eres un experto en X Y yZ y conoces
tal vez algunos detalles Luego usamos nuestro prompt de estructura para decirle al LLM lo que
necesitamos exactamente Quiere tener un artículo que aproximadamente 600 palabras de largo sobre
la sonda de píxeles ocho, y necesitamos saber
por qué es buena. Y luego desencadenamos la asociación
semántica solo con unas pocas palabras Para que no tengas que
usar estas palabras. Simplemente es importante que
incluyas algunas de estas palabras. Entonces este video fue sobre ingeniería
rápida. Sólo quiero
decirles que los LLM son relativamente
sencillos de entender porque solo pueden
hacer dos cosas si lo
desglosamos en los principios clave Pueden hacer que el texto sea más grande y
pueden hacer que el texto sea más pequeño, y necesitamos usar buenos prompts
para obtener buenos resultados Tenemos que activar la asociación
semántica. Esto lo podemos hacer con indicaciones
estructuradas. Podemos darle, por ejemplo, un rol que necesitamos para decirle
al LLM lo que queremos
tener exactamente, y necesitamos
asegurarnos de usar
unas palabras que sean similares
a las cosas que nos gustan Por supuesto, tenemos Cillian
diferentes conceptos incitadores. Tenemos la cadena del pensamiento, el árbol del pensamiento,
y mucho, mucho más. Tengo otros cursos que
cubren esto en detalle. Pero en este curso,
quiero que puedas usar lo más rápido y
eficiente posible. En el siguiente video, te
mostraré uno o dos trucos más que son importantes para la ingeniería
rápida, y luego estás listo para
rockear lo más rápido posible. Solo recuerda dar
contexto para obtener una buena salida.
7. Más consejos de ingeniería rápidos: Este video, quiero darte
algunos consejos y trucos más sobre cómo hacer prompts eficientes para CIPD o en este ejemplo, por
supuesto, para Entonces, veamos qué trucos tengo para que trabajes rápido. Por supuesto, ya
viste el papel incitando. Entonces solo dale un papel al LLM. Eres un experto en XYZ. Esto lo cubrimos en
el último video. Pero esto de aquí mismo
es completamente nuevo. El disparo incitando. En la toma que incita, simplemente
das ejemplos Ahora, ¿qué significa esto? Se puede decir, por ejemplo, que es un experto en copywriting, y aquí hay una copia que me gusta, y luego simplemente pegas
una copia y le dices al LLM hacer una
copia similar para X Y y Z. Y estas dos cosas aquí mismo,
son realmente, realmente geniales Respira hondo y
piensa paso a paso. ¿Por qué
funcionan estas dos cosas? Quiero explicarte. Respira hondo y
piensa paso a paso. También puedes juntar
esto. Esto funciona simplemente porque también el LLM pensará paso a paso Esto no sólo es mejor para
ti sino también para el LLM. Vamos a hacer
un ejemplo rápido. Supongamos que
quieres instalar BTn, por
ejemplo, pero no
sabes nada de PyTon Si simplemente escribe
cómo instalar BTN, la probabilidad es
relativamente grande de que obtenga una salida que comience en un punto que
no entiende A lo mejor empiezan
con un paso
que aún no entiendes. Esto no sólo es
problemático para ti, sino quizás también para el modelo de lenguaje
grande. Si el LLM no está entrenado
en el texto perfecto, siempre tiene sentido decirle
al LLM que piense
paso a paso porque el LLM comenzará con cosas como vamos a abrir
el navegador web Chrome Entonces este es el primer paso. Si le dices al LLM
que piense paso a paso, o tal vez también que respiren hondo, el LLM simplemente
comenzará en el primer paso, y el primer paso es más
probable que abra un navegador web Después de esto, necesitas escribir en Google, por
ejemplo, Python. Y si ves todo esto,
obtienes, antes que nada, una mejor salida, y el LLM siempre puede asociar más cosas porque también
el LLM tiene nuevas palabras El LLM comienza a
escribir cosas como Google Chrome como
buscar PyTon y así sucesivamente Y en esa instancia, el LLM tiene más cosas en
su propia ventana de contexto Esto es realmente,
muy práctico. Entonces este es un consejo que
realmente no puedo estresar lo suficiente. Respira hondo
y piensa paso a paso. Y por cierto,
no me lo invento. Hay estudios por ahí que demuestran que estas dos palabras, estas dos oraciones
mejoran la salida, y aquí viene una divertida. Algo así también
funciona muy, muy bien. Te doy 20
dólares, por ejemplo. Entonces le damos a Chachi PT, le
damos al copiloto, le damos
al LLM una pequeña propina agradable Le damos algo de dinero o
al menos le ofrecemos algo de dinero. Además, esta frase de aquí
mismo muestra que el LLM crea mejor salida si decimos que
simplemente damos algo de dinero Ahora no me preguntes
exactamente por qué funciona esto. Yo solo sé que funciona, y sé que
hay estudios por ahí que también
te dicen que esto funciona. Entonces necesitas entender
simplemente
agregando frases como
tomar una respiración profunda, pensar paso a paso, y te doy 20 dólares. Obtendrás una mejor
salida del copiloto. Así que anota esto. Esto es importante para mí. Y el papel que incita ya
entiendes. Para el disparo que incita, quiero darte un
ejemplo ahora mismo Tomamos tu nuevo tema, y vamos a asumir que
realmente quiero tener una
copia para algo. Podemos comenzar con
algo como esto. Eres un experto en copywriting. A mí me gusta este ejemplar. Entonces simplemente comenzamos
con nuestro papel. Le damos el papel de experto
en copywriting. A mí me gusta este ejemplar. Y ahora incluimos un
ejemplar que nos gusta, y lo hacemos de esta manera. Entonces estas cosas de
aquí que incluyo, esto es simplemente la copia o al
menos una parte de la copia
de mi curso todo de IA. Así que simplemente tenemos una
copia que de verdad, verdad me gusta porque como yo mismo
he escrito esta copia, y luego podemos decirle al LLM
muchas cosas diferentes. Hago esto un poco más corto solo para mostrarte de qué se trata todo
esto. Ahora mismo, también
te muestro un bonito truco. Contesta, solo con Bien. Esto se puede hacer siempre
para ahorrar algunas fichas. Para que podamos mandar esto y
obtendremos un bien de vuelta. Y después del ok, simplemente
podemos decirle
al LLM más cosas. Entonces ya ves, tenemos el ok de vuelta, y ahora puedo decirle al LLM
como lo que queremos ahora El LLM tiene la copia o
al menos una parte de la copia. Recuerde, los LLM son asociativos, por lo que entienden cómo se
estructura la copia Obtenemos nuestro o back para
ahorrar algunos tokens, y ahora le decimos al LLM lo que
queremos tener ahora mismo Dame una copia similar pero para un curso llamado
Microsoft Co Pilot. Esto es importante
porque uso esto
mucho solo para obtener más
ideas para mis copias. Esto es realmente,
muy práctico. Entonces primero, has
escrito una copia tú mismo o encontraste una copia en
Internet o lo que sea. Das esto como ejemplo, y le dices al LLM que
responda solo con bien. Obtén tu bien de vuelta, y ahora
puedes pedir la siguiente tarea. Por ejemplo,
dame una copia similar, pero para el curso llamado copiloto de
Microsoft Y aquí tenemos una copia similar. Así que bienvenido al curso de introducción a Microsoft Copilot, su viaje al mundo de la finalización de código impulsado por
IA Si nos desplazamos hacia arriba, esto comienza
similar a mi copia original. Bienvenido a toda la IA. GPD mid tourney Sabi fusión
y desarrollo de aplicaciones. Te adentras en el mundo
de la inteligencia artificial. Esta clase magistral es perfecta
para cualquier persona y así sucesivamente. Y esto también es
cierto aquí mismo. Este curso es
perfecto para cualquier persona. Entonces ya ves que usamos
un estilo similar, pero no exactamente las mismas palabras. Ahora bien, esto es
realmente genial, y esta es la
característica más fuerte del disparo que incita. Solo volvamos a esta cosita
linda de aquí. Entonces ya viste cómo funciona
la incitación del disparo. Simplemente damos ejemplos
y obtendremos una salida
similar pero
no la misma salida. Si usas disparos, no
necesitas
respirar hondo No es necesario usar
las cosas paso a paso. Y tampoco necesitas decir
que das dinero
porque tienes un buen ejemplo y
el LLM puede ser lo suficientemente
asociativo para
entender lo que necesitas Esto es más probable que sea cierto
si no usas ejemplos. Si usas las indicaciones normales
de
roles, entonces tendría mucho entonces tendría mucho sentido incluir
tomar una respiración profunda, pensar paso a paso, o te doy 20 dólares
al final de tu texto El concepto clave es siempre
que se necesita para dar contexto. momento no estoy seguro de cómo
escribir esto en inglés, lo mejor esto es un poco mejor. Y siempre
hay que entender que los tokens no
son ilimitados. Debido a esto, ya
viste en este pequeño ejemplo agradable que usamos algo
como el Bien, así que responde solo con o. esto es solo para
ahorrar algunas fichas. Así que no quieres
tanto un sinfín de ejemplos sinfín de cosas que
no tienen mucho sentido. Siempre necesitas entender que estos LLM son
asociativos y
obtendrás respuestas precisas o respuestas cortas si dices
respuesta solo con ok Y entonces puedes hacer
tu siguiente pregunta, y eso es básicamente todo. Entonces en este video, has
aprendido muchos trucos geniales. Debes incluir,
pensemos paso a paso. Respiremos hondo, y también puedes
ofrecer algo de dinero. Obtendrás mejores salidas
si lo haces así. Si tienes la oportunidad de dar ejemplos de cosas que te gusten, deberías hacer esto totalmente, y esto solo se llama
el disparo prompting. El concepto clave es siempre
desencadenar la
asociación semántica Entonces necesitas dar contexto, pero debes tener en cuenta que tus tokens no
son ilimitados, y por esa razón,
también tienes el truco de simplemente
pedir una o rápida como
respuesta al copiloto Porque recuerden, el límite de
tokens siempre cuenta en su contra
cuenta lo que pones, pero también lo que escupe el LLM Todo esto contará
contra tu límite de tokens, y tarde o temprano, se
alcanzará
tu límite de tokens y el LLM
ya no entiende de qué
estás hablando Muchos consejos y
trucos una portada, pero realmente, realmente
te recomiendo que pruebes todo esto.
8. Personalización de LLM con indicaciones del sistema y RAG (recuperación de generación aumentada): Charla sobre formación LLMs.
Tenemos dos opciones. Podemos entrenarlos ya sea con prompts o con tecnología
directa Primero, quiero mostrarles
lo que es la tecnología directa. Entonces comenzamos con indicaciones, y luego usaremos tecnología
directa Ya sabes que
tenemos chat GPT, simplemente lo llamamos GPT Y sombrero GPT puede
responder preguntas. A veces no es lo suficientemente inteligente, por lo que GPT puede continuar y
usar diferentes herramientas Ya lo sabes. Por
ejemplo, Internet. Puedo entrar en Internet
y buscar cosas diferentes. Pero digamos que
quieres entrenar un GPT con tus propios datos Digamos solo sobre datos
de tu propio negocio o en tu propio
texto de marketing o lo que sea. Ahora tienes dos opciones. Puede hacer
esto con indicaciones o puede hacerlo con
una base de datos vectorial No vamos a explicar
una base de datos vectorial porque solo
aprenderás a usar estas cosas rápidamente. Básicamente, lo que puedes hacer es subir mucho
contexto en un archivo, y luego HatchPD explorará tu archivo y luego tendrá
todo este conocimiento Quiero mostrarte
uno o dos trucos primero en las indicaciones y
luego en una base de datos vectorial Lo más fácil si quieres personalizar JachPD es
el prompt del sistema Si presionas sobre
esto aquí mismo, puedes seguir GBD personalizado, y aquí tienes
el prompt del sistema Y simplemente puedes
llenar esto. ¿Qué te gustaría que JCPT supiera ti para dar
mejores respuestas Y si presionas
sobre estos, op Mey te
ayuda. ¿Dónde estás basado? ¿Qué haces para trabajar?
¿Cuáles son tus aficiones? ¿De qué temas puedes hablar durante horas y cuáles son
algunas metas tuyas? Entonces solo escribe esto y luego JCPT te dará otras
salidas, mejores salidas Solo hagamos un ejemplo. Vivo en Italia
pero hablo alemán. Soy educadora de IA. Mis intereses son los
LLM y la difusión. Me gusta hablar de IA. Mi objetivo es hacer
un buen rumbo. Y entonces lo siguiente
es aún más importante. ¿Cómo te gustaría que
HHipt respondiera? Si lo presionas, ¿qué tan formal o casual debería ser Hechipt ¿Qué tan largas o cortas
deben ser las respuestas? ¿Cómo quieres que te aborden? ¿Debe HGPD tener opiniones sobre
temas o mantenerse neutral? Te mantienes neutral.
Llámame Arnie Tus respuestas son cortas y
si es posible, viñetas. Ahora presionamos seguro y ahora nuestro modelo está capacitado
en nuestros datos específicos. El modelo simplemente reacciona
un poco diferente. Así que vamos a hacer una prueba rápida. HPD, ¿me puede dar alguna
información sobre la elección? También utilizamos la búsqueda en la web? Porque tuvimos la elección en este momento ya que estoy
grabando este curso. Estamos buscando
el y ChaChiPT me dice que el
5 de noviembre fue la elección Así que ya ves, es muy, muy corto y conciso y
obtenemos algunos enlaces. Ahora ChaChiPT
no me llama Arnie. Ahora, ¿por qué es esto?
Te voy a mostrar. Si entramos en un nuevo
chat y lo hacemos sin la búsqueda y
hacemos otra cosa, solo
hagamos un
ejemplo diferente porque esto no
funciona tan bien
si usamos la búsqueda web. Oye, GBD, quiero
comercializar un curso. Dame algunos ejemplos de
cómo hacerlo. Supongo que Jet GBD me
dice ahora mismo, Oye, Arnie, puedes probar esto,
luego algunas
viñetas como boost en redes
sociales y así sucesivamente Oye, Arnie,
está bien. Vamos a sumergirnos en un
marketing poderoso y así sucesivamente. Utilice vistas previas atractivas de
redes sociales, ejecute un seminario web gratuito, aproveche el marketing por correo electrónico,
cree un imán de clientes potenciales, colabore con
influencers, etc. Entonces ves que es corto,
es conciso, y Jet
GBD llama a M Arnie Este es básicamente
el prompt del sistema, y con el prompt del sistema, puede personalizar HHIPD Por supuesto, también puedes
usar el prompting de disparo, pero ya te he dicho
cómo funciona el prompting de disparo Sólo da un ejemplo. Ahora quiero mostrarte cómo funciona
la tecnología RC porque esta es la herramienta
más poderosa si quieres entrenar a un LLM Ahora bien, en HachipD en este momento, creo que esta es una característica de Bit Puede pulsar en Explorer GPD y buscar el GPD.
Ya lo sabes. Pero también puedes presionar
Creator GPD o
puedes ir a mi GPD si ya
tienes Sólo quiero mostrarte un GPD. Por ejemplo, esta
difusión pronto GPD, esta está específicamente entrenada para escribir prompts para modelos de
difusión Los modelos de difusión hacen imágenes. Si presiono aquí en CAT, obtendré un aviso para un
CAT y el prompt se adaptará específicamente
para mediados de viaje y también incluye
lentes de cámara, y así sucesivamente. Entonces aquí verán, este
es un prompt perfecto, y con este prompt perfecto, puedo usar esto para hacer buenas fotos en
un modelo de difusión. Ahora quiero
mostrarles cómo funciona esto, cómo podemos entrenar estas cosas. Si volvemos una
vez más en Explorer GPD, mi GPD vamos a estas indicaciones de difusión
y pulsamos Ves que podemos dar
un nombre, la descripción, luego las instrucciones, entonces
cómo debe comportarse el GPD Y por último, también podemos subir documentos documentos
donde damos ejemplos. Esto lo haremos
ahora desde cero. Hacemos un ejemplo.
Digamos que somos una empresa, y en esta empresa, queremos tener un GPD que haga la incorporación por
nosotros. Así Crea. No vamos en Crear,
sino en configurar. Nosotros lo llamamos onboarding. A bordo de nuevos miembros, quiero
hacer esto realmente simple. Usted es el director general de la
empresa AI With Arnie. Tu objetivo es embarcar a la gente. Si tienen preguntas, busca sus conocimientos
y les da información. Entonces este es básicamente un prompt del sistema
realmente simple que podemos dar aquí mismo. Ahora podemos dar, por ejemplo, conversación de
Zone si queremos. Todas las personas que
intentan trabajar en mi empresa solo me hacen
estas dos preguntas. ¿Dónde está el baño
y cuándo es el almuerzo? Entonces estas son algunas preguntas de inicio
como, vamos, puedes
pensarlo tú mismo, qué quieres incluir. Entonces el conocimiento, ahora
podemos subir archivos. Y ahora hacemos un archivo sencillo. Esto podría ser un PDF. Esto podría ser un
archivo de texto o algo así. Simplemente lo hacemos con un simple archivo de texto que
estoy creando ahora mismo, y aquí escribo algunos infos, pero esto también podría ser un PDF grande con 50 páginas o algo así Y este es el infos que
la gente necesita saber. El baño no está aquí. No necesitamos
estar en nuestra empresa. Almorzamos cuando se hace el trabajo. Trabajamos los siete días de la semana. No tenemos vacaciones. Si quieres más información, ve aquí, y aquí básicamente
también podemos dar un enlace si queremos. Simplemente lo hago con mi comunidad escolar
gratuita, pero esto es en alemán. Entonces, vamos a hacer un ejemplo. Incluimos esto aquí mismo. Ahora guardamos esto,
volvemos a Jet GPD y subimos
nuestro conocimiento Así que sube archivos. Este
es básicamente el archivo. Ahora también podemos usar otras herramientas. No necesitamos la
búsqueda en la web y no necesitamos Dali como
generación de imágenes para este GPD Pero
supongamos que quieres
que se incluya el análisis de datos. Pero creo que también esto
no es realmente necesario. Lo que también puedes hacer si eres programador es
crear nuevas acciones, pero creo que este no es realmente el punto de este pequeño curso
rápido. Si presionas y
creas nuevas acciones, básicamente
puedes poner en peichm e incluir
la URL diferente Básicamente también puedes llamar a
diferentes API y arranques desde. Pero como dije, este
no es el punto en estos momentos. Presionamos Crear, le damos
a cualquiera que tenga un enlace,
y presionamos seguro. Este es el vínculo que
podemos compartir con las personas que trabajan
en nuestra empresa, y presionamos ver GBD Y entonces simplemente podemos preguntar,
entonces, ¿dónde está el inodoro? Y si pregunto, sombrero
GPD dirá lo más probable es que la compañía
no tenga inodoro Entonces básicamente,
se puede ver aquí. Parece que nuestra empresa no cuenta con aseos diseñados. Empecé, el
baño no está aquí. No necesitamos
orinar en nuestra empresa. Y si quieres más información, puedes presionar sobre este enlace, y básicamente estás aquí. Entonces la siguiente
pregunta,
digamos ¿cuándo tenemos vacaciones? Trabajamos los siete días de la semana y siempre el
vínculo con nuestra empresa. Ahora, digamos que ya no
quieres tener este enlace. También puedes ir a hacer
esto aquí mismo. Siempre se puede
personalizar el GPT. Explora GPT, mi GPT, luego aquí en Editar GPT, y aquí en Configurar, solo das el enlace si la gente pregunta por más
información Ver GPD cuando tenemos vacaciones, no
tenemos vacaciones en nuestra empresa y trabajamos los
siete días de la semana Así es básicamente como se
puede entrenar a un LLM. Puede usar
las indicaciones del sistema y puede escribir cómo debe comportarse ChTGBD Entonces puedes usar indicaciones
normales en la interfaz con las indicaciones
de disparo Ya lo sabes. Y por último, también puedes usar tecnología
directa y
entrenar tu propio GPD Y este GPD, también
puedes compartirlo con otras personas para que
puedas enviarles el enlace Esta es la llamada tecnología
directa. Aquí funciona una base de datos vectorial. No necesitamos hacer una inmersión
profunda en estos, sino que solo déjate claro. Puedes dar instrucciones
y puedes subir archivos, para que el chat GPD pueda
navegar por estos archivos y tenga infos específicos sobre
ti o tu Y si, trabajar en mi
empresa no es divertido.
9. Perplejidad y huggingchat: Quieres explorar más
herramientas donde puedas usar LLMs,
puedes echar un
vistazo más de cerca a Hugging chat Abrazar el chat es
realmente fácil de usar. Aquí puedes presionar qué LLM de
código abierto quieres usar. Por ejemplo, Lama 3.1, el modelo 70 B,
un modelo Quin, algunos modelos de MNVdia o algunos modelos Simplemente haga clic en el modelo
que desee utilizar. Puede escribir un
mensaje del sistema si lo desea
y, a continuación, presionar Nuevo CAT. Y aquí tienes también herramientas. Entonces sí, también pueden usar
diferentes herramientas al igual que HGBD. Pueden utilizar un
modelo de difusión para generar imagen. Se pueden incluir editores de imágenes. Pueden veterar a RL.
Tienes un documento, bar ser, una calculadora
y una búsqueda en la web. Entonces esto es básicamente de
alguna manera como un HIPT de código abierto para
siempre gratis Y entonces tenemos perplejidad. La perplejidad es similar
a la búsqueda HHIBT. Puedes jugar un poco con
esto. Ya no uso mucho esta
herramienta porque
HHIBT también es
ahora relativamente buena
con esta herramienta de búsqueda, pero puedes probar la
perplejidad También puedes comenzar gratis. No tienes que
hacer una cuenta. Sólo empieza gratis,
mira lo que te gusta, y tal vez te quedes
con algo.
10. Los desarrolladores pueden usar LLM a través de la API de OpenAI: Eres desarrollador, también
puedes incluir HCBT en tus propias aplicaciones Se puede utilizar en
el OpmiPlayground. Esto quizás también sea
interesante para ti si quieres usar los modelos HHIBT
más nuevos, pero no quieres
pagar 20 dólares al En este patio de recreo, simplemente
puedes pagar sobre la marcha, pagas por token. Y quiero mostrarte
cuánto necesitas pagar, cómo funciona y cómo
puedes hacer llamadas ABI a HGBT Lo primero es que
vayas en esta plataforma. Así plataforma domi.com slash
PlayGround y aquí podrás
jugar con todos En el chat, puedes jugar
con los modelos de chat. Puedes usar sus más nuevos. Entonces GPD four mini, GPD 40 y así sucesivamente, puedes seleccionar
lo que quieras También puede importar funciones. Entonces sí, también puedes hacer llamadas a
funciones si
eres un codificador Yo sólo quiero que esto sea
rápido. Por favor, discúlpeme. Entonces formato de respuesta,
esto es ahora mismo texto, pero también puedes usar
JasnfMat y así sucesivamente Aquí tenemos temperatura
y longitud máxima. Simplemente puedes leer
esto por ti mismo. Básicamente, si se
disminuye la temperatura, JGIPD será más preciso, pero puede ser un
poco repetitivo,
sobre todo para
tareas matemáticas, esto es bueno Y la longitud del contexto
es simplemente la salida. Entonces, ¿cuánto tiempo puede
ser la salida que te da ChaChipD? Estos son los
ajustes más importantes aquí mismo. Entonces aquí en el
medio, ves que tienes
las instrucciones del sistema, así que esto es básicamente
el baile de fin de curso del sistema al
igual que las instrucciones personalizadas que te mostré
en el último video. Entonces eres un
asistente útil, por ejemplo, y aquí puedes escribir
tu texto con la misma normalidad. Cuéntame una historia sobre la
tortuga en el desierto. Presionas Ejecutar, y luego
ChatBT básicamente
te hablará y podrás usar siempre los modelos más nuevos
sin límite, y siempre pagas sobre la marcha Quiero mostrarte
cuánto cuesta esto. Si vamos a esta sección de
precios, vea que podemos usar
GPD 40, por ejemplo, y tenemos que pagar $2.50 por 1 millón en tokens de entrada
y $10 en tokens de salida Y cada modelo tiene sus
diferentes precios. Si te desplazas hacia abajo, por ejemplo, también
puedes llamar a
los otros modelos. Se puede utilizar el modelo
GPD 40 Mini. Esto es muy, muy barato. Puedes usar la vista previa de Obo. Esto se pone un
poco más caro. Puedes usar la API en tiempo real. Esto es muy caro. Entonces aquí puede subir hasta 200 dólares por 1 millón de tokens
de salida. Esto es simplemente si HHIBT te
hablará, entonces en el formato de audio, y también puedes
generar imágenes con Dali si
llamas a los endpoints, y pagas Si volvemos aquí,
quiero mostrarle en la esquina izquierda que
tiene aquí el tiempo real. Entonces puedes presionar
en tiempo real, y también puedes platicar
aquí con estos modelos. Dame una pequeña
broma quiero reír. Claro. Aquí tienes una
pequeña broma para ti. ¿Por qué no puedes darle
un globo a Elsa ? Porque
ella lo dejará ir. Entonces eso es básicamente todo, y aquí tenemos que
pagar por re salida. Entonces tenemos la asistencia. Estas ayudas,
esto es básicamente exactamente
lo mismo que estos CPD, así que podemos incluir al Ruck
y todas estas Y también podemos hacer nuestras propias
aplicaciones con estas. Si entramos en texto a voz, puedes escribir texto y
recuperarás el discurso. Entonces, oye sombrero GPD, básicamente, quiero
generarlo. Sombrero GBT, me gustas. Y ahí se puede escuchar. Alloway nos dice estas
cosas que tecleamos aquí. Hey sombrero GBT, me gustas. Y entonces tenemos también el modo de
finalización aquí. Si quieres usar esto,
debes presionar en tu cuenta. Necesitas presionar
en tu perfil, pasar a la facturación, y aquí necesitas
insertar tu tarjeta de crédito. Así que simplemente presiona a los métodos de
pago, y aquí necesitas
incluir tu tarjeta de crédito. Entonces necesitas darle a HatChipt
un poco de equilibrio, y luego esta cosa
funcionará para Por supuesto,
también puedes establecer algunos límites. Si vas a límites, puedes
darle algunos límites a HachPT. En este momento tengo 500
dólares mensuales como límite. Si presionas sobre el uso, siempre
puedes ver
cuánto te cuesta por día. Entonces este fue un día en el
que tuve que pagar cinco dólares porque también
tengo algunos chatbots, y aquí un chatbot hablaba Y entonces si vamos en octubre, este es también el
uso a partir de octubre, así que en este momento son 28 dólares. Estos son chatbots que he incluido en algunos sitios web y gente está usando estos chatbots y por eso necesito
pagar un poco Si solo juegas un poco con
esta cosa, creo que solo
jugarás unos centavos. Aquí puedes ver con $0.13 puedes jugar
con estos modelos Vuelves aquí
a tu tablero, también
puedes ver que puedes
hacer muchas más cosas aquí. Puedes seguir afinando, y aquí puedes afinar
tu propio modelo si quieres. Este no es realmente el
punto de este curso. Pero si vas a las claves API, también
puedes hacer
llamadas a la API. Así que simplemente necesitas
crear una nueva clave secreta. Le das un nombre,
y luego puedes copiar tu clave API y llamarla
en tus propias aplicaciones. Si eres desarrollador, solo tienes que ir a la documentación. Puedes pasar al inicio rápido, y aquí te dicen
lo que tienes que hacer Necesitas crear una clave API. Entonces puedes llamar a estos
endpoints, por ejemplo, en PyTNPP instalar Opmei,
esto es Y aquí puedes
ver, por ejemplo, si quieres generar texto
en tu propia aplicación, puedes usar Ashima así Si quieres
generar una imagen, puedes usar algo como esto. Llamaríamos a Dali por ejemplo, y si quieres crear incrustaciones
vectoriales, puedes llamar a sate Es realmente fácil con
este inicio rápido. Entonces, si eres desarrollador, la API de Opmeei es
realmente fácil de usar, y puedes llamarla con
JavaScript con Piton o con Curl Si no eres desarrollador, más probable es que
esta plataforma no sea para pero en términos generales,
es relativamente fácil. Me gusta, por ejemplo, flow wise, y uso la API OMI
para hacer agentes de IA. Pero como dije, esta
no es una inmersión profunda completa. Si solo quieres aprender
esto lo más rápido posible, esta plataforma es quizás
una opción para ti si no quieres
pagar estos 20 dólares al mes por la
interfaz HGPTPlus porque aquí puedes trabajar con los
modelos más nuevos y solo
pagas por los tokens
que Y los tokens son relativamente
baratos de generar. Para que puedas jugar un poco
con esta
plataforma y ver si
es para ti o no. Y por supuesto, también
todos los demás LLM tienen sus propias APIs Por lo que Google también tiene la API
para los modelos Gemini. Andthropic tiene la API
para los modelos Cloud. Y si quieres trabajar
con un LLM de código abierto,
puedes usar, por ejemplo, la API de Grock, o también puedes hacer
tu propio servidor con, por
ejemplo, ALM
Studio o Entonces tienes un sinfín de opciones. Puedes hacer tus propios endpoints si lo usas localmente en tu PC o puedes
usar diferentes llamadas API Como dije, esto es más como una guía general
para desarrolladores si quieres desarrollar con estas cosas y si
no, omita este video.
11. Resumen de LLM: Esta sección, has
aprendido mucho y lo
hicimos lo más rápido
posible. Empezamos con
todas las interfaces de estos diferentes LLM, y sabes que hay muchas Cha ChipD coágulo, Gemini, también
puedes usar Oma,
puedes usar Puedes usar muchas interfaces
diferentes, incluso abrazando chat
y mucho, mucho más Todos ellos funcionan
relativamente similares. Siempre tienes una
pequeña y agradable interfaz de chat. Los LLM básicamente pueden
hacer solo dos cosas. Pueden expandir texto o pueden hacer
que el texto sea más pequeño. Pero esto es grande.
Puedes usar código, puedes usar texto normal. Se pueden hacer tablas, y los
LLM también pueden llamar a herramientas. Y las herramientas pueden ser, por ejemplo, un poco intérprete,
un modelo
de difusión , Internet, y
puedes analizar datos, hacer gráficos y hacer muchas cosas interesantes
con estas cosas. Quizás en el futuro, se conviertan un sistema operativo completamente nuevo, y por cierto, los LLM
también pueden hablar entre sí, y luego los llamamos agentes. Y también aprendiste que las
LLM son multimodelo. Básicamente pueden
ver, hablar y escuchar. Solo consigue una buena salida
si das buena entrada. Y te mostré los fundamentos
de la ingeniería rápida. Por favor, recuerde la asociación
semántica. Hay que dar contexto. Puede hacer esto a través de
las indicaciones de disparo, son indicaciones de rollo. Deberías estructurar
tus indicaciones, y hay algunos consejos como, ejemplo, pensar paso a paso Además de eso, también tenemos
la cadena del pensamiento, el árbol del pensamiento, la ingeniería
rápida inversa ,
y mucho, mucho más. Pero creo que para la mayoría de la
gente, esto es exagerado. Esto no es realmente necesario. Si quieres personalizar el reino, puedes hacerlo totalmente. La forma más fácil es probablemente
el prompt del sistema. Simplemente puedes dar
algunas instrucciones. Entonces tenemos tecnología directa, por lo que podemos simplemente subir
datos y luego hat CPD o cada uno de los demás
LLM puede navegar por estos datos y simplemente
reaccionar de una manera específica Por supuesto, si
eres desarrollador, puedes hacer todo esto
también a través de la API. Puedes desarrollar tus
propias aplicaciones y puedes hacer todo esto también en
tus propias aplicaciones. Puedes hacer llamadas a funciones
en tus propias aplicaciones. Puedes hacer agentes
completos con tus propias aplicaciones con
herramientas como flow wise. Puedes crear imágenes dentro
de tus propias aplicaciones. Puedes usar la visión dentro tus propias aplicaciones,
puedes hacerlo todo. Has aprendido los
fundamentos de estos LLM. Pueden hacer muchas cosas, y creo que deberías empezar. Simplemente úsalos
porque recuerda, solo aprendiste si
cambias tu comportamiento. Ganar significa las mismas circunstancias
pero diferente comportamiento. A lo mejor no sabías
usar LLM, ahora lo sabes. Sólo aprendiste si lo haces. Si quieres ser
una cookie inteligente, simplemente
puedes compartir este curso porque más gente sabe
siempre más la vista de las personas, para que todos puedan aprender juntos. Gracias por eso,
y los veré en el siguiente video
porque así fue para Lams ahora empezamos a crear cuadros con modelos de
difusión
12. El modelo de difusión: La sección trata sobre modelos de
difusión, y hay muchos modelos de
difusión por ahí. Tenemos Dalí, tenemos Imagen, tenemos
difusión estable. Tenemos a la Sra Ra hace videos. Contamos con modelos mid Journey
y difusión también
podemos hacer música y, por
supuesto, también audio. Entonces básicamente lo que hacemos es, quiero mostrarte el
proceso de difusión en este video, y luego
profundizaremos en algunos de los mejores modelos de
difusión. Entonces primero, cómo funcionan los modelos de
difusión, y lo hacemos realmente
fácil y rápido. Así que he encontrado un artículo muy, muy agradable para medium. Todo lo que necesito es esta
foto de aquí. Supongamos que tenemos una computadora grande, grande y entrenamos nuestra computadora en imágenes
en imágenes como esta. Entonces le damos a la computadora
imágenes, por ejemplo, de esta playa y la
describimos con un texto. Le damos la imagen a la computadora, y decimos tal vez una playa con
el océano azul, cielo azul. Hay algo de verde en
las montañas y así sucesivamente. Somos muy, muy específicos. Después de eso, agregamos algo de
ruido a la imagen, como se ve aquí, pero
seguimos describiendo lo que hay
en la imagen. Entonces una playa, océano azul, cielo
azul, y así sucesivamente. Más ruido, mismo texto, más ruido, mismo texto, más ruido, mismo texto
hasta que solo se obtiene ruido. En este proceso, la computadora aprende cómo se ven estas
imágenes. Este proceso
simplemente entiende que las palabras que le diste la computadora ceden
a esta imagen. Para que podamos revertir esto. Si solo tenemos ruido, y le decimos a la
computadora una playa, cielo
azul, océano azul. Hay algo de verde en
las montañas y así sucesivamente. La computadora puede revertir esto y hacer con el
ruido esta imagen. Por supuesto, no hacemos esto
con una sola imagen. Tratamos de darle a la computadora cada imagen que podamos encontrar. Y hay, por supuesto,
diferentes modelos de difusión. Por ejemplo,
también está Adobe Firefly. Adobe Firefly se capacita en
imágenes de Adobe Stock. La difusión estable es
de código abierto y es gratuita. Todo el mundo puede usarlo. Y se
entrenó la difusión estable en imágenes
de Internet. Y debido a esto, también podemos crear casi todo lo
que hay en Internet. Podemos crear hasta celebridades. Podemos crear cosas de
trabajo de NSAFEF, y así sucesivamente. La difusión estable no está restringida. Casi todo lo que
hay en Internet, podemos crear con difusión
estable si
damos las indicaciones correctas Las indicaciones son las
descripciones que
le damos a la computadora para
hacer nuestra imagen Y para esa instancia,
es muy, muy importante hacer buenas indicaciones porque
necesitamos buenas fotos Si no somos específicos, podemos crear unas imágenes
que se vean así. Si simplemente decimos tal vez una playa, obtendremos una playa al azar. Si le decimos una playa, océano
azul, cielo azul, etc., obtendremos
exactamente esta imagen. Una ilustración rápida de
este proceso porque a algunas personas les gusta esta
ilustración, la uso mucho. Solo imagina que te acuestas en el suelo y
miras en el cielo. A tu lado está tu novia o tu novio o
quien quieras. Y ella te dice, ¿
Puedes ver esta nube? Se parece un poco una manzana, pero no la entiendes. No ves la manzana. Pero entonces ella
te dice, claro, solo mira, aquí está la manzana, y luego empiezas a
entender ves la nube, y ahora tus ojos ven una manzana porque tu cerebro
está entrenado en manzanas. Lo más probable es que tu cerebro
sepa cómo se ve la
manzana, y luego la ves en la nube. Aunque no haya manzana ahí. Y si tu novia no dice que
tal vez sea una manzana verde, lo
mejor piensas en una manzana roja, y es exactamente por eso que
necesitamos usar una buena ingeniería
rápida. Porque si no
somos específicos, obtendremos fotos aleatorias. Si quieres tener
una manzana verde, debes decirle a la computadora que quieres
tener una manzana verde. Al igual que tu
novia necesita decirte que la manzana
en las nubes es verde. Si ella no te dice eso, mejor
pensarás en una manzana roja, tal vez en una manzana verde, tal vez hasta una
manzana amarilla que no conoces, así que necesitas ser específico. Entonces en este video, echamos un vistazo rápido al modelo de
difusión. El modelo de difusión
funciona de forma sencilla. Está entrenado en
imágenes y en texto. Entonces se agrega ruido. La computadora aprende en este proceso cómo se ve esta
imagen. Y si después le damos texto a la
computadora, puede crear estas
imágenes porque seleccionará aleatoriamente los píxeles que sean adecuados para nuestra imagen. Espero que esto tenga sentido para ti.
13. Ingeniería rápida para modelos de difusión: comienza con DALL E: Este video, comenzamos a usar
nuestro primer modelo de difusión, y queremos comenzar con Dali
porque Dali es el
más fácil de usar Dali trabaja dentro de
JathPT así que ya conocemos la interfaz y las
indicaciones son muy fáciles de escribir porque Por lo que el LLM te ayudará a
crear mejores prompts. Lo primero
que puedes hacer es, por
supuesto, simplemente
entrar en JathPT Puedes trabajar con el multimodelo
normal JathPto puedes explorar GPT y
puedes Si vas a comprar HatchPT, puedes presionar sobre Dali y
aquí puedes iniciar Y aquí puedes
crear tus fotos. Puede agregar aquí cosas para tus indicaciones y también puedes
usar diferente relación de aspecto Vamos a usar la pantalla ancha. Y ahora solo quiero comenzar
con un prompt realmente simple. Yo solo quiero escribir CAT. Dejamos la
relación de aspecto blanca, y la enviamos, y luego
recuperaremos
nuestra primera foto . Y ahí lo tenemos. Aquí están nuestras dos primeras fotos. Ahora bien, si presionas
sobre esta imagen, puedes ver exactamente qué
pronta cedió a este resultado Entonces, si presionas sobre estos
aquí mismo, este es el prompt. Una imagen
blanca bellamente detallada ofrece un gato de lluvia sentado junto una ventana con
luz solar suave y así sucesivamente. Entonces ves que el prompt
es realmente detallado, y quiero
mostrarte cómo necesitamos escribir prompts para
este modelo de difusión Recuerda, en Dalí,
es muy fácil porque Chachi BT te ayuda a escribir mensajes
tan hermosos, y entonces realmente no es magia
crear buenas imágenes Dali no es el mejor modelo de
difusión, pero es el más fácil de usar Si quieres escribir buenas
indicaciones por tu cuenta, deberías
echarle un vistazo a estas Es necesario incluir
sujeto, medio,
ambiente, relámpago,
color, estado de ánimo y composición. Lo que significa todo esto. Para que puedas hacer
fotos de personas, de animales, de personajes ,
ubicaciones, objetos, etc. El medio podría ser una foto e ilustración
o algo más. El ambiente podría ser al aire libre en la luna
o en algún otro lugar. El relámpago podría
ser luces de estudio, luces de
neón o algo más. Los colores pueden ser vibrantes, coloridos,
blanco y negro, y así sucesivamente. El estado de ánimo para que el gato pudiera ser, por ejemplo, tranquilo
o pacífico o algo así. Y la composición podría ser, por ejemplo, una vista de cuerpo completo. Así que asegúrate de
incluir estas cosas. No tienes que
incluir estas cosas, pero si no las incluyes, las imágenes
serán más aleatorias. Para que puedas obtener una foto
o una ilustración. Si no lo ves específicamente,
todo puede pasar. También hay guías de
incitación más grandes. Y puedes incluir
cosas como tema,
acciones, opciones de entorno, color, estilo, estado de ánimo, relámpago, perspectiva o texturas de punto de vista, periodo de
tiempo , elementos
culturales,
emociones, medio ,
ropa, texto, etc. Esta es una guía de
incitación gigantesca. Sólo quiero dejarte con estos para que puedas
leerlo tú mismo. Pero si quieres hacerlo rápido, solo piensa en las cosas
porque estas
cosas son las que más importan. Un ejemplo que podría funcionar
es algo así. Una ilustración de un gato relajado en una ciudad
en colores vibrantes, vista de cuerpo
completo a la hora dorada
con una proporción de 16 a ninpec Entonces, si simplemente
copiamos estos, podemos tirarlos al Ali. Así que de vuelta al Ali, lo
incluimos, y luego
obtenemos una salida específica. E incluso aquí, ChatBT te
ayudará a crear
aún mejores indicaciones Pero este es un prompt que funciona en cada uno de los modelos de difusión. Las técnicas de incitación
trabajan cada vez lo mismo. Y aquí ves ahora mismo
tenemos un panorama realmente específico. Tenemos exactamente la imagen
que queríamos tener. Y si haces clic en él
y vas en el prompt, ves que el JetPd hace que
tu prompt sea aún mejor Puedes hacer que las indicaciones sean aún mejores al incluir algunas palabras mágicas Por ejemplo, película
cinematográfica grano,
ultra realista, dramático relámpago Puedes usar diferentes tomas y lentes de
cámara si
quieres el punto de vista, el disparo del dron, etc. Puede utilizar cámaras con aspecto
cinematográfico. Se pueden utilizar diferentes
cineastas. Puedes usar Géneros. Puedes usar palabras clave
para movimientos, por ejemplo, escena de acción. Se pueden utilizar diferentes
fotógrafos, por ejemplo,
fotógrafos deportivos. Se pueden utilizar cámaras
con escenas de acción, por ejemplo, la Canon EOS, una D X, Mark dos. Puedes usar todos estos diferentes relámpagos
tan brillantes,
cálidos, fríos,
relámpagos de bajo perfil, y así sucesivamente. Puedes usar el ener de oro, y puedes usar todas
estas emociones diferentes. Así que asegúrate de incluir
lo que quieras ver. Esto es lo más
importante porque todos
estos
modelos de difusión están entrenados en imágenes con
descripciones detalladas, y si haces una descripción
detallada, también recuperas lo que quieres. Si solo escribes gato, el gato podría ser aleatorio. Y ahora quiero mostrarles
una vez más estas indicaciones de
difusión Espero que sepas
cómo hacemos esto. Esto ayuda con la ingeniería
rápida. Si escribimos en estaca aquí, obtendremos un
prompt detallado para una participación, y ya sabes
cómo funciona esto. Si simplemente copio
estos, por supuesto, puedo tirarlos a
la interfaz Dalí, y luego voy a recuperar
una foto en la escuela Así que vamos a tirar
estos aquí. La relación Spec es
ahora mismo uno por uno. Esta es la configuración de devoltio, y este aviso
funcionará muy bien porque hemos
entrenado a tal GPT Ya sabes cómo entrenar
a tal GPT, y ahora quiero
mostrarte los datos de entrenamiento Pero primero, echemos un
vistazo a la hoguera. El escenario es realmente
bueno porque
también incluimos cámaras con lentes de
cámara y así sucesivamente. Si pasamos a las indicaciones de
difusión, simplemente
digo en
las instrucciones que este GPD necesita
para hacer buenas Y luego subo este documento, y este documento es
una estructura completa, cómo el LLM debe
estructurar estos prompts Mis datos de entrenamiento se ven
algo así. El prompt estructura un
medio de sujeto con las características en relación fondo, luego el fondo, los detalles del fondo,
las interacciones con el color y el relámpago, y luego asumir o dibujar con rasgos
específicos de estilo. Doy algunas descripciones, después algunos ejemplos que me gustan. Y por último, claro, incluyo todas las pequeñas palabras clave bonitas que hacen que estas imágenes sean mejores. Simplemente puedes usar mi GPT si
no tienes tiempo
para entrenar tu propio GPD, y simplemente te
vincularé este GPT Así que puedes hacer muy
buenas indicaciones muy rápido. Entonces en este video,
has aprendido a usar cualquier modelo de difusión. Es importante
escribir un buen prompt,
y un buen prompt debe
ser específico con el tema, el
medio, el ajuste, el
relámpago, el color, el estado de ánimo, composición, y eventualmente
también la relación spect Y si no quieres
escribir estas indicaciones tú mismo, puedes usar ALE, y HechPT te
ayudará automáticamente Y si quieres escribir
muy buenas indicaciones también para cada
otro modelo de difusión, simplemente
puedes usar MGPD
y obtener mejores salidas Y en el siguiente video, quiero
mostrarles los fundamentos de Maturne ALE es la más fácil de usar, y Mahoney puede hacer
muchas más cosas. Y te
recomendaría encarecidamente que hagas tu primera foto en DLI
ahora mismo porque
aprendes más haciendo
14. Conceptos básicos de Midjourney: Este video, quiero
hablar de Mi hourney. En mi mente, Mi Journey es uno de los mejores modelos de
difusión, sobre todo si quieres
hacer cuadros realistas. Lo primero que debes
hacer es ir a su página web. Ahora mismo en este Minish, puedes probar esto
completamente gratis Creo que puedes hacer
aproximadamente 30 fotos gratis en su página web. Necesitas ir a
mimichourny.com, y luego crear tu cuenta Simplemente puedes iniciar sesión
tú mismo con Google. Tan pronto como hayas
creado tus 30 fotos, más probable es que necesites
actualizar tu plan. Te cuesta, creo,
nueve dólares al mes. Si estás en Explora, puedes ver lo que otras
personas están haciendo, y ves las fotos,
se ven muy bien. También puedes ir a la búsqueda
y búsqueda, por
ejemplo, de perros, y luego puedes
encontrar algunas fotos sobre perros. Lo siguiente es que puedes buscar hot para top diario, y para likes, y luego simplemente
puedes encontrar por
ti mismo lo que te gusta. Si quieres crear algo, deberías ir a crear. Aquí están las fotos que ya
has creado. Lo más probable es que no tengas ninguno. Y si quieres
crear nuevas imágenes, necesitas escribir
tu prompt aquí mismo. Entonces simplemente escribe
lo que quiere ver. Yo solo quiero correr
con este prompt aquí. Cabeza de ciervo navideño con rosa, lazo e ira navideña Acuarela pastel
sobre fondo blanco en el estilo y así sucesivamente. Lo siguiente que
puedes hacer es presionar aquí, y aquí tienes algunos ajustes. Entonces puedes hacer esto en la relación de
aspecto que más te guste. Digamos solo uno por uno o 16 por nueve porque podemos verlo un poco
mejor en un curso. Entonces tienes el modo. usar el modo estándar
o el modo raw. El modo raw es mejor
para cosas realistas. Se pueden utilizar diferentes versiones. Normalmente, siempre
usamos los más nuevos, así que por ejemplo, 6.1
en este momento. Esto es personalizado, así que si ya has creado
muchas fotos, puedes adaptar tu estilo. Entonces tienes estilización, y si no
sabes lo que esto significa, solo tienes que ir con el mouse sobre ella Mid churney puede agregar un estilo
específico de viaje medio, y si lo
aumentas, tienes más estilo La naturaleza silvestre puede hacer que genere resultados
inesperados y
la variedad en su cuadrícula Entonces creas cuatro imágenes, y si subes
con esta variedad, estas imágenes variarán un
poco en tu cuadrícula. Entonces tienes rápido y Durbo
solo déjalo rápido, y luego creamos
nuestra primera foto Si enviamos esto,
podemos crear esto. Y mientras esto está creando, quiero mostrarles el
asiento porque el set es siempre el primer
punto de partida de cada cuadro. Si presionamos sobre estos
y tecleamos en el asiento del tablero. Podemos usar un asiento aleatorio, por ejemplo, esto aquí mismo. Y ahora vamos a obtener dos fotos
diferentes. Esta imagen no será completamente la
misma que esta imagen, pero si vuelvo a hacer esto y también utilizo una vez más
el mismo asiento, volveremos a recrear exactamente la
misma imagen Déjame mostrarte por un momento
rápido porque el asiento es importante si quieres
crear consistencia de carácter. Entonces, si vas aquí abajo, estas son las primeras
cuatro fotos. Esta Navidad los venados son agradables. Ahora son los segundos cuatro, y ya ves que no son completamente los
mismos que los primeros. Entonces ya ves que estamos un
poco más cerca. Generalmente, son similares
pero no los mismos. Pero ahora si vamos aquí arriba, verá que tenemos exactamente
las mismas fotos que aquí. Entonces esta es la misma imagen que esta imagen porque
hemos usado la misma semilla. Entonces, si quieres tener consistencia de
carácter, puedes trabajar con las semillas, y luego tal vez puedas ajustar
el prompt solo un poquito, y siempre tienes estilos
realmente similares Así que recuerda, la
semilla es importante. Esto es básicamente
lo primero que puedes hacer. Y si no te gusta
una de estas imágenes, también
puedes editarlas. Si presionas sobre estas imágenes, ves que tienes muchas opciones
diferentes
que puedes hacer aquí. Aquí puedes hacer variaciones pequeñas
o fuertes. Al presionarlo,
va automáticamente. Entonces puedes hacer un upscaling. Puedes hacer un dial zop o un escalado creativo y
la resolución se hace Así que vamos a presionar en el exclusivo. Entonces también puedes remezclarlo. Y si no lo entiendes, sólo tienes que ir con el ratón sobre él. Si presionas subdile o fuerte, simplemente puede modificar su prompt y hacerlo
un poco diferente Pero ahora mismo,
no quiero hacer esto. Lo siguiente es pan, Zoom, y aquí
tienes también más. Pero antes de mostrarte esto,
quiero mostrarte exclusivo. Si cierro esto
abajo y vuelvo a crear ves que esto aquí mismo son
las primeras variaciones. Entonces ya ves que tenemos esta imagen, y ahora tenemos cuatro variaciones
diferentes de esta imagen que son
realmente, muy similares, pero un
poquito diferentes. A veces un poco
más de estas cosas rojas, a veces un poco menos. Entonces ves que estas son
solo pequeñas variaciones. Y aquí, esto
ahora mismo es el upscaling. Así que hicimos una pequeña imagen
en mayor resolución. Si presionas sobre esto o
si lo descargarías, esto simplemente tiene la resolución
más alta si acercas mucho. Entonces ves que la resolución
aquí es muy, muy buena. Comparado con el primero, es mucho mejor, así que ya
ves que está más claro. Entonces simplemente hace que la
resolución sea un poco más grande. Después tenemos pan y Zoom. Ya no me gusta esto porque ahora mismo tenemos
en más el editor. Y si presionas sobre este editor, puedes editar esta imagen. Y aquí se puede
hacer lo
mismo que con el Pan y Zoom. Simplemente puedes hacer
esto aquí mismo, por
ejemplo, y luego
presionas enviar, y ahora Mick Cherney hará el out pintando y pinta
también aquí nuevos píxeles en él Pero también puedes hacer más. Se puede editar también
con el inpainting. Digamos que esto
no te gusta aquí mismo. Simplemente puede eliminarlo y luego hacer que su prompt sea un
poco diferente. Entonces no queremos
tener el prisionero rosa. Entonces presionamos enviar, y luego obtendremos una
pintura en sin el prieto rosa. Simplemente sigamos creando y luego podrás
ver qué pasa. Entonces aquí están las primeras
cuatro generaciones, así que ya ves que simplemente hemos
generado algunos píxeles nuevos. Esto tampoco fue perfecto, pero sí, vamos. Al menos el panorama se hizo más grande. Por cierto, creo que este
me gusta. Eso no es tan genial. Sí, están bien. Y aquí están los siguientes
sin el amigo rosa. Entonces así es como puedes
editar tus fotos. Si vas organizado, tienes un montón de carpetas
diferentes que
puedes hacer solo para que sea
un poco más claro. Si vas personalizado,
como dije, te pueden gustar diferentes imágenes, y luego puedes adaptar
tu estilo específico. Si vas a editar, creo que no todo el mundo
tiene esto ahora mismo. Creo que necesitas
estar mucho tiempo en esta página web para
poder obtenerla. A lo mejor en cuanto veas el
curso, también tienes esto. Simplemente puedes
subir una imagen desde tu computadora y puedes hacer el
en la pintura completamente igual. Así que solo presiona sobre esto, y ahora solo quiero subir
esta foto aquí mismo, y digamos que quiero
tener un sombrero verde. Si borro esto, puedo
escribir en el prompt, lo que quiero ver
chico con verde entonces lo mandamos y
vamos a conseguir la
cabeza verde muy probablemente. También vamos a crear
aquí mismo el fondo, al
menos cómo lo veo porque esta imagen no
tenía fondo. Para que puedas editar tus propias
fotos realmente, muy rápido. Y ahí
vamos, esto es un desastre. Pero tal vez el
siguiente sea mejor. Sí, esto es mucho mejor. También, esto funciona. Sí,
vamos. Estas cosas son geniales. El primero es un poco
desordenado, pero el segundo, el tercero, y el cuarto, están relativamente bien. Por lo que también puedes editar
tus propias imágenes, y también aquí, puedes
hacer la pintura al aire libre. Digamos que quieres
tener diferente resolución. Simplemente puede
presionar Enviar, editar, y luego obtendrá
su nueva imagen, y recreará los
píxeles aquí abajo Y, boom, ahí lo tenemos
cuatro fotos completamente nuevas. Algunos de ellos son buenos, algunos de ellos no son realmente tan buenos. Y por cierto, si no te gusta
tanto una imagen, claro, simplemente
puedes entrar y
editarla con el inpainting Entonces digamos que
esto no fue perfecto, y tal vez también esto no fue
perfecto, puedes editarlo. Creo que entiendes lo que quiero decir. Lo siguiente que puedes hacer en
cuanto hayas creado tal imagen o en
cuanto la hayas editado con las
matrices o con lo que sea, es que
también puedes hacer re textura. Si presionas sobre re textura aquí, entonces esto es ahora mismo
ya no la edición,
sino la textura re. Puedes cambiar un poco esta
imagen. Puedes hacer fotos similares. Esto funciona de manera similar
a la difusión estable. La difusión estable llama a
esto redes de control. Y aquí Matrona también
te dice lo que pasa. Re texture cambiará
el contenido de la imagen de entrada mientras se
intenta preservar la estructura
original. Para obtener buenos resultados, evitando
el uso de prompts
incompatibles con la
estructura general de la imagen Entonces lo que podríamos hacer aquí
ahora mismo es, por ejemplo, que tecleemos chico con cabeza
verde o simplemente
chico con calor, y también tecleemos cyberpunk Entonces simplemente presionamos
submit re texture, y luego obtendremos algo que se vea de alguna manera similar. Entonces tendremos una pose similar, composiciones
similares, pero
en un estilo cyberpunk Espero que puedan ver
cómo funciona esto. Esta es realmente una característica genial. Hasta ahora, esto posiblemente estaba en difusión estable con
las llamadas redes de control. Y ahora también podemos hacer
esto a mitad de viaje. Así que recuerda, con la edición, puedes simplemente editar
todas tus imágenes, y con la redexture,
puedes redexture puedes redexture Puedes usar cosas que se llaman red
de control y
difusión estable también en medio viaje. Aquí, no tienes
tanto control, pero esta también es una buena característica. Eso es básicamente todo lo
que necesitas saber dentro de M journey si
quieres crear realmente rápido. Sí, la herramienta es mucho más grande, pero si solo quieres
comenzar lo más rápido posible, esto es todo lo
que necesitas saber. Puedes crear imágenes, puedes editar imágenes. Puedes usar diferentes semillas para recrear el mismo estilo una y
otra vez. Diviértete en Mjourney
como te dije, lo más rápido posible
15. Ideogram y Adobe Firefly: Este video quiero darte una visión general de dos modelos de
diusion Tenemos ideograma, y
tenemos Adobe Vrefly. Estos son también dos modelos de divusion completamente
separados. Adobe Firefly viene de, como Adobe, y también está integrado en
Photoshop y así sucesivamente Creo que Adobe es especial de
esa manera porque
puedes crear imágenes, y Adobe solo entrena en
imágenes de Adobe Stock. Así que no tienes que
preocuparte por los derechos de autor y así sucesivamente. Esto es especial porque
Money y así sucesivamente, pueden crear imágenes de beepers o también de empresas, y a veces puedes
obtener reclamos de derechos de autor Pero si usas Adobe Firefly,
este no es el caso. Y el ideograma es especial porque es muy
bueno con Entonces en cuanto vas a
una de estas páginas web, este de aquí mismo es ideograma, estoy en el plan libre Entonces no, tampoco pago
por cada
modelo bajo el sol. Y aquí tienes una interfaz
realmente limpia. Tienes casa, y aquí
puedes escribir lo
que quieras ver. La ingeniería rápida
siempre funciona igual. Aquí tienes todo el
diseño realista, tres D y anime, y simplemente puedes buscar por ti mismo
las cosas que te gustan. Si usas ideograma, recomendaría encarecidamente que
crearas imágenes,
por ejemplo, como estas Fotos donde se
incluye texto porque aquí, ideograma es realmente bueno Solo hagamos una prueba. Un zorro que sostiene un
letrero con las letras, atrapa si
puedes y luego simplemente podemos
hacer algunos ajustes. Entonces el prompt mágico, queremos
tenerlo encendido o apagado. Si lo deja
encendido, su mensaje se mejora automáticamente. Entonces la relación de especificaciones,
la visibilidad, solo
puedes ir
privado si pagas, luego el modelo y la paleta de
colores si quieres. Pero en este momento, solo
quiero mandar esto. Ahí tenemos nuestras cuatro fotos. Si los presiono, sí, esto tomó un poco de
tiempo en estos momentos
porque solo pueden generar lentos
si no se tiene un plan. Pero ves que el texto es realmente
bueno. Atrápame si puedes. El texto es perfecto. Como
el zorro es de alguna manera bueno. Entonces vamos a
ver el siguiente. ¿Dónde está? Esto de aquí mismo, agárrame si puedes. El zorro es muy agradable. Entonces me gusta mucho este
aviso o esta foto. Este también es
relativamente bueno, pero este letrero está flotando
un poco alrededor, así que me gusta este
un poco más. Y esta es la última,
agárrame si puedes. Además, esto es realmente bueno. Entonces básicamente, solo entra en este programa y juega un
poco por ti mismo, sobre todo si
quieres renderizar texto. Esto es realmente genial. Aquí
también hay algo que me gusta. Logos y así sucesivamente son
completamente perfectos. Hay una foto que me gusta, así que juega un poco con esto. Si vas a las creaciones, puedes ver lo
que has creado. Entonces básicamente, hay algunas
fotos que he hecho. Y si vas a Canvas, también
puedes editar tus cosas
similares luego en Murne Esto es básicamente todo lo
que necesitas saber sobre Ideograma Idograma es
realmente, muy fácil Lo siguiente es Adobe Firefly. Adobe Firefly funciona de manera similar. Aquí también tienes película
generativa, texto a imagen,
extensión generativa, y generar videos. Los videos en este
momento no funcionan. Aquí necesitas
unirte a la lista de espera. Pero absolutamente puedes crear
y editar con Firefly. Si presionas sobre
estos aquí mismo, estás en su página web
Firefly Y si vuelves una vez más, ves qué
cosas puedes hacer. Se puede hacer texto a imagen, película
generativa, generar una
plantilla, generar un vector Entonces, si usas Adobe Illustrator, también
puedes generar vectores, recolores
generativos
y efectos de texto Se puede jugar con todas
estas cosas alrededor. La interfaz es realmente fácil. Si pulsas sobre texto a imagen aquí simplemente puedes probarlo. También puedes usar las fotos que otras personas han hecho. Digamos que te
gusta este, si lo presionas, éste
se copia automáticamente. Aquí abajo, puedes escribir tu prompt y
puedes probar este prompt, y en el lado izquierdo,
puedes usar lo que quieras. Así que vamos a usar Firefly tres. Quiero tener el modo rápido, debería
ser, por
ejemplo, de cuatro por tres. Entonces, ¿cuál es el tipo de contenido? ¿Es arte o foto? Por ejemplo, el arte, luego
las composiciones, también
puedes subir las imágenes de
referencia. Si quieres subir fotos de
referencia, entonces puedes subir, por
ejemplo, estilos de referencia. Así que digamos que quieres
tener esta imagen de referencia, sí, pero para este prompt, realmente no
es perfecta. Entonces esto no
funcionaría tan bien. Entonces
bajé la fuerza ar a cero, y luego quiero tener,
por ejemplo, una referencia de estilo. Digamos que quiero
tener un poco más de neón, así que incluyo la referencia de
estilo. Entonces también podemos incluir
otros efectos populares. Por ejemplo, el efecto
hiperrealista, luego el color y el tono.
Digamos que cálido. Entonces el relámpago,
las luces de estudio, el ángulo de la cámara digamos solo el ángulo blanco, y luego puedes
presionar try prompt. Y sí, este aviso es
ahora mismo un completo desastre, pero espero que entiendas lo que quiero decir. Estos ajustes son
realmente fáciles de usar, y aún así tenemos
imágenes impresionantes. Sí, vamos. Me gusta mucho este tigre de aquí, así que absolutamente puedes jugar un poco con estas cosas
alrededor. Si te gusta tu foto,
claro, puedes descargarla. Y lo siguiente
es, claro, que también puedes
editar tus fotos. Puedes editar
estas imágenes aquí si simplemente
presionas aquí en editar, o también puedes editar
tus propias imágenes. Si volvemos una vez más y
presionamos sobre relleno generativo, puedes subir tus
fotos aquí o
puedes editar las fotos que ya
están incluidas. Digamos que quieres
editar esta imagen. Si lo presionas,
puedes editar como quieras. Puede insertar,
quitar o expandir. Si pulsas en Expandir, puedes hacer que estas
imágenes sean más grandes. Si simplemente presionas generar, la luz biv simplemente hará el out painting e
incluye aquí algo Entonces necesitas ver
qué funciona para ti. Digamos que quiero
tener esto y presiono mantener. Lo siguiente, quiero
quitar algo, por ejemplo. Digamos que
no quiero tener esta cosa graciosa aquí porque no tengo
idea de lo que es esto. Simplemente puedo quitarlo, y luego debería desaparecer. Y, bam, ahí está. Quiero quedármelo porque
creo que esto es lindo. Lo siguiente es insertar. Vamos a insertar
algo aquí. Digamos que quiero
insertar el tigre, por ejemplo. Entonces tigre, presionamos generar, y luego podemos insertar
diferentes cosas aquí. Si quieres editar, por ejemplo, Bebor
así esto funciona Puedes cambiarte de ropa. Puedes cambiar los colores del cabello. Puedes cambiar
lo que quieras. Sí, este tigre es un desastre. Vamos, vamos a quedármela. Quiero mostrarte una cosa
más con un humano. Entonces, digamos que quiero
agregarlo a esto aquí mismo. Yo quiero hacer el inserto, y quiero que el queso lleve, por ejemplo,
diferentes ropas Simplemente puedo copiar esta
ropa aquí mismo, y luego puedo escribir
lo que realmente quiero ver. Solo vamos a escribir,
por ejemplo, Chamarra. Y ahí lo tenemos, y
creo que esto
resultó de alguna manera bien. Solo quedemos con el primero. Nada de esto es
completamente perfecto. Adobe Firefly, esta es una
herramienta que no uso mucho, pero a algunas personas les gusta Es especialmente potente
si ya trabajas con Adobe Photoshop porque
aquí está incluido. Si trabajas con Illustrator
y Photoshop y así sucesivamente, deberías trabajar totalmente
con Adobe Firefly Entonces esto era básicamente ideograma. Usa ideograma si quieres
generar texto
dentro de imágenes Y Adobe Firefly, yo personalmente
diría, úsalo si ya
usas
el producto Adobe, así Illustrator y
el Adobe Photoshop, o si quieres estar 100%
seguro de que
nunca infringe los derechos de autor porque Firefly está entrenado
en Entonces prueba estas dos herramientas. Y, por supuesto, la
ingeniería rápida es siempre la misma. Nos vemos en el siguiente video.
16. Modelos de código abierto: Hablar sobre modelos de
difusión de código abierto. Principalmente, es
difusión estable y flujo, pero también hay
otros modelos como recraft y Omnigen
y mucho Este tema es gigantesco, y tienes la
mayor flexibilidad Puedes descargar
estos modelos y ejecutarlos localmente en tu propia máquina o también puedes
ejecutarlos en la Nube. La forma más fácil y rápida
es ejecutarlas en la Nube. Pero no obstante,
quiero mostrarte algunas opciones gratuitas para que también
puedas ejecutarlas completamente gratis y no pagar por cada
característica bajo el sol. Entonces la primera opción
sería CFY. Ahora bien, la ciencia no tienes mucho tiempo en este curso, quizá no
sea la mejor opción. La curva de aprendizaje es
realmente empinada. Esto es CFI Tengo un curso que
cubre esto en detalle, pero CFY no es lo
que funciona muy rápido La segunda opción es, por
ejemplo, web UI Forge. Esto corre relativamente fácil, relativamente rápido, pero también
aquí, hay que descargar
muchas cosas. Entonces tampoco es tan grande. Con Forge, también puedes ejecutar flujo de difusión
estable
y mucho, mucho más Lo que quiero
mostrarles ahora mismo es el enfoque porque con enfoque, puede ejecutar una difusión estable, y la difusión estable
es de código abierto, y se puede ejecutar de forma gratuita Ya sea en un portátil CLP o se
puede instalar localmente. Si quieres
instalarlo localmente, simplemente
puedes
hacerlo a través de este enlace. Entonces esto de aquí mismo, y luego
puedes ejecutarlo localmente. Pero lo que quiero mostrarles
ahora mismo es la forma más rápida, y esto es simplemente
este portátil CLP Entonces abriendo C y
luego puedes ejecutar este llamado notebook
simplemente presionando en play, y luego obtendremos un
enlace de radio con una interfaz agradable, y aquí podemos ejecutar ifusion
estable Quiero mostrarte
cómo funciona esto. Entonces quiero
mostrarte Leonardo, y luego quiero
mostrarte laxa. Esto lo hacemos rápido. Después de un tiempo obtienes este enlace, ejecuta en URL pública, y presionamos sobre este
enlace aquí mismo. Entonces se abrirá una fase de grado. Y aquí tienes
muchas opciones. Lo primero es que
puedes presionar en Avanzado, y aquí tienes
muchos ajustes. Si quieres comenzar rápido, solo deja aquí
inicial, usa la velocidad. Número de imágenes,
digamos solo una. Aquí, tenemos la salsa
especial y difusión
estable que
también tenemos un prompt negativo. Puedes escribir lo
que no quieras ver. Por ejemplo, feo y
borroso o también colores, digamos solo rojo No queremos tener
rojo en nuestro prompt, y luego tecleamos
lo que queremos ver. Digamos que modelo de Instagram. Y si presionamos generar, crearemos nuestra
primera foto, y tendremos un modelo de
Instagram, y no será
una imagen fea. Entonces esta es la calidad de
imagen y no el
modelo de Instagram que creamos. No será borroso
y no será rojo,
por lo que lo más
probable es que el rojo no esté incluido. Y ahí lo tenemos
como cabello castaño normal. Tenemos una linda foto, y la generación
también está de alguna manera bien. Vamos. Utilizamos nuestro portátil refrigerado
gratis. Podemos usar esto para
siempre gratis, y creo que esto es genial. Ahí tenemos nuestra foto. La calidad es realmente buena. Entonces lo siguiente,
puedes presionar sobre estilos. Aquí puedes escribir los
estilos que quieras ver. Por ejemplo, un modelo lateral
tres D. Si presionas sobre esto
y si tecleas CAT, por ejemplo, solo digamos CAT. Crearás un CAT y de alguna manera
se verá así. También he incluido una versión sharp
y focus dos. Entonces también mezclaremos un
poquito de fotoalismos. Si disminuimos este peso aquí y solo usamos el modelo
si three D, será un
poco más en esto. Entonces, ¿por qué parar esto, por ejemplo, y creo una
vez más solo con este modelo si tres D y
luego debería funcionar mejor. Para las siguientes imágenes,
puedo incluir, por ejemplo, los otros
estilos una vez más. Y acabo de parar esto ahora mismo. Lo siguiente son los modelos. También puedes usar diferentes
modelos y diferentes auras, pero lo más probable es que si solo
quieres usar este rápido, no
necesitas hacer una
inmersión profunda en modelos y Las Y los ajustes avanzados, muy
probablemente,
no los necesites. Pero lo que eventualmente
necesitas es mejorar. Si presionas en mejorar, puedes hacer pequeñas variaciones, y también puedes hacer escalamientos completamente iguales
que en medio viaje Y lo que también puedes hacer es
presionar sobre la imagen de entrada. Aquí puedes subir imágenes, y también aquí
puedes hacer upscalings Vamos a hacer una
vez más un gato realista. Vamos a escribir gato aquí. Sí, hago un muy mal ejemplo aquí con la
pronta ingeniería. Yo sólo quiero hacer un gato, y luego quiero mostrarte
lo que podemos hacer aquí abajo. Y ahí lo tenemos
ahora mismo tenemos a nuestro gato. Y si tiramos esto hacia abajo, podemos hacer variaciones. Entonces ya sea sutil o fuerte
y si presionas en el dial Zu, también
puedes escribir
, por ejemplo, feliz, y obtienes un gato feliz. Simplemente puedes presionar Crear, y luego todo
cambiará solo un poquito, y tal vez el gato
intente sonreír. Sí, vamos a ver
cómo funciona esto. Esto funciona un poco mejor con la gente si incluyes esto. Sí, vamos, tal vez se vea
un poco más feliz. Funciona mejor si
haces esto con humanos y si tecleas sonrisa, por ejemplo, o con colores, con este gato, podrías cambiar los colores un poquito. Entonces con estas variaciones,
puedes jugar con ellas. También puedes hacer upscaling, así puedes hacer
upscaling en dos semanas,
la resolución, presionar sobre esto y luego presionar
generar. Vamos a ver. Sí, vamos, se ve
un poco más feliz, al
menos como lo veo. Entonces lo que tienes
es prompt de imagen, y esto es especialmente genial porque puedes
presionar en Avanzado, y luego puedes subir aquí tus cosas y
puedes usar Image prompt,
Ba kenney, CPDS y face swap Déjame explicarte
cómo funciona esto. Si incluyes esto aquí mismo
y usas Image prompt, también
puedes escribir
, por ejemplo, do y si presionas Crear, los primeros fotogramas serán completamente los mismos fotogramas
que este aquí mismo, así que podemos usar el
estilo de esta imagen. Entonces solo ve por ti mismo que
el estilo es
realmente, muy similar
al estilo de la generación anterior
porque usamos la imagen de entrada con
el prompt de imagen. Así que tenemos un
estilo muy similar al de esta imagen. Espero que ya se pueda
ver. Y ahí está. Tenemos un estilo muy similar, por lo que se ve el fondo verde, relámpagos
similares,
colores similares, y así sucesivamente. Lo siguiente que puedes
hacer es Piracani o CPD. Estas dos cosas se
llaman redes de control, similar al video anterior de
mid journey. Si tecleamos, por ejemplo, Dier ahora mismo,
usaremos un Pyraky Utilizaremos una
red de control que controle la profundidad o las poses
de estas imágenes. Básicamente, vamos a
crear un terrible que está en un post similar
a este gatito aquí Lo más probable es que se siente de alguna manera, y será una publicación muy, muy similar en esto de aquí mismo. Ser también la cola
será completamente similar. También las orejas van a
ser muy similares, pero deberíamos conseguir un tigre. Solo compruébalo tú mismo, tenemos las mismas composiciones, pero ya ves que creamos
un tigre ahora mismo. Sí, esto se
pondrá lindo, creo. Un pequeño tigre que se sienta completamente
similar a nuestro gatito, pero los marcos serán
recreados con un tigre Y después del 50%, los marcos también pueden hacerse
cargo un poco más, y también cambió
un poco. Entonces ahora mismo, ves que se pone
cada vez más y más como un tigre y
menos que nuestro gatito. Y si quieres
tener aún más gatito en él o incluso
una pose más similar, necesitas jugar un
poco con estas redes de control. Verás, como si la
pose no fuera perfecta. Es similar, pero no
es perfecto. Lo que puedes hacer es aumentar un poco
el peso
y la apuesta stop. Si aumentamos la apuesta stop, por ejemplo, a 0.8, usaremos el 80%
de los pasos de la generación
para recrear a este gatito, por lo que debería ser
mucho más similar Lo ves ahora mismo, es
realmente como el gatito, pero un poco a diferentes
colores para el tigre. Y esto continuará
ahora mismo hasta el 80% de los fotogramas, y solo los últimos fotogramas se harán cargo un
poco más. A ver si
esto funciona o no. Como dije, hay que
jugar con estos. Entonces creo que esta
imagen se
estropeó porque también
agregamos esta cosa aquí Sí, esto no es perfecto. Tenemos que jugar
con estas cosas. Lo intenté una vez más, y creo que esto ahora mismo
es un poco mejor. Tenemos una pose muy
similar en estos momentos. Por lo que estas redes de control te
permiten usar la pose. Esto es especialmente
poderoso si tienes, por ejemplo, humanos que
están en una pose específica. Si tienes una bailarina
que hace algo elegante, puedes recrear con este Bacani algo que Lo siguiente es el intercambio de caras. Puedes subir, por ejemplo, una foto de tu cara
y simplemente cambiarla. Y también puedes combinar
más de estas cosas. Puedes usar, por ejemplo,
Bakani de una bailarina, y luego el intercambio de caras
de otro humano
y luego tal vez otra cosa como referencia de Para que puedas jugar con esto
un poco alrededor. Lo siguiente es
el inpainting. Ya sabes cómo funciona esto. Simplemente puedes tirar esto hacia abajo, y digamos que
no queremos tener esta cola aquí. Simplemente podemos hacer
el en la pintura. Ahora la pintura en foco con
difusión estable es realmente grande. Aquí podemos hacer muchas cosas. Pero en términos generales, si solo
quieres trabajar rápido, trabaja igual que a mitad de viaje. Esta es una herramienta gigantesca. No podemos repasar
cada detalle. Lo siguiente es describir. Si usa describe,
por ejemplo, para este prompt
y presiona describir esta imagen en prompt,
obtendremos el prompt. También puedes subir imágenes que tengas en tu computadora, por ejemplo, y luego puedes ver cómo
podría ser un prompt aquí. Este es el aviso de que
el modelo de difusión Z. Un excavador de naranjas
se alza sobre algunas rocas Entonces, vamos, esto es.
Entonces tenemos una mano. Ya sabes que
podemos hacer upscalings y así sucesivamente y los metadatos Si incluyes esta imagen, por ejemplo,
también puedes aplicar metadatos, y estos metadatos son
especialmente potentes
si la incluyes o si otras
personas la están incluyendo, entonces puedes usar su configuración. Lo siguiente que quiero
mostrarles son los registros. Si presionas en la configuración, puedes ir a
los registros del historial. Y aquí puedes ver lo
que has creado anteriormente. Puedes ver todas tus
creaciones y ver qué resolución fue rápida y qué ajustes
te llevaron a este resultado. Esta es básicamente la
forma más rápida de explicar tu enfoque. Entonces el enfoque es una herramienta gigantesca. La difusión estable funciona
en segundo plano, puedes usarla para siempre de forma gratuita. Si quieres usar una
interfaz web para una difusión estable, puedes usar leonardo.ai. Leonardo.ai también es una de mis herramientas favoritas si quieres
trabajar en una interfaz web. Y aquí tienes básicamente
las mismas cosas que en foco. También es un
poco más fácil de usar, pero no te preocupes por
cada herramienta bajo el sol en Leonardo AI, también
debes pagar
relativamente rápido. También aquí tienes,
por ejemplo, Canvas. Tienes las
generaciones en tiempo real, tienes movimiento, tienes creación de imágenes, tienes escaladores,
tienes lienzo Puedes entrenar tus propios modelos, y tienes tres generación de
texturas D. Entonces mucho control
en LeonarDoei también
tienen algunos pequeños tutoriales cómo usar todas Así que solo echa un vistazo a
estos si quieres
profundizar y también hazme saber si debo incluir una conferencia
por separado. Pero normalmente como queremos
hacerlo lo más rápido posible, y creo que deberías
trabajar con enfoque si
quieres usar la difusión estable lo más rápido
posible. Ahora bien, si quieres usar flujo y los diferentes
otros modelos de difusión, debes seguir replicando Replicar no es gratis. Aquí, necesitas iniciar
sesión con Github. Entonces sí, estas herramientas de código abierto, pueden volverse un
poco abrumadoras en diverso glen pero
tan pronto como lo consigues, también
funcionan muy rápido. Aquí puedes usar los modelos lux, puedes usar re craft. Puedes usar cada
modelo bajo el sol. Difusión estable 3.5 grande. Hay muchos modelos
realmente buenos. Si presionas sobre estos modelos, son realmente fáciles de usar. Simplemente puedes escribir en la
izquierda lo que quieras ver, y en el lado derecho,
obtienes tu salida. Entonces esto se ve realmente realista. Algo que funciona muy
bien en flujo también es el texto. Digamos que una mujer sosteniendo
un cartel con las letras, no
soy real. Y luego presionamos
Run pero atención, esto te cuesta, creo, $0.06 Sí, $0.06 por generación y necesitas conectar
tu perfil de Geta Aquí puedes ver algunas fotos que fueron creadas
con este modelo. Entonces este modelo funciona muy
bien y solo espera esta salida porque
también el texto se renderizó sorprendentemente No soy real, y esta es una imagen perfecta. En este video, echamos un vistazo a los modelos de
difusión de código abierto. Tenemos una difusión estable. Tenemos flujo, tenemos recraft. Tenemos muchas cosas
diferentes. Podemos ejecutarlo también con
muchas opciones diferentes. Podemos descargarlos y
ejecutarlos localmente con, por ejemplo, CFI o Forge Una de las formas más fáciles de
enfocar dentro de Google Colab porque puedes presionar Reproducir en un botón y
usarlo gratis para siempre Y si quieres trabajar
sobre una API, usa replicate, y aquí puedes usar
cada modelo de difusión bajo el sol que sea de
código abierto y tenga una API, pero aquí tienes que
pagar un poco Para que puedas jugar con esto
solo por un poquito. Supongo que
debes apegarte a enfocarte si quieres crear rápido. Nos
vemos en la siguiente.
17. Resumen de la generación de imágenes con modelos de difusión: En esta sección, hemos
aprendido cómo podemos usar modelos de divusión estándar
normales para generar imágenes. Has aprendido cómo
funcionan,
entrenado en informática en texto e imagen. En ese proceso, la computadora aprende a generar
esta imagen, y luego puedes recrearla, y necesitas tener buenas
indicaciones para buenas salidas Necesitas ser específico. Tenemos un montón de diferentes modelos de
divusion Dali, McTerny,
ID gramatob Viavly, mesa de difusión,
flujo, re craft, y mucho, flujo Pero todos ellos funcionan
relativamente similares. Siempre necesitas buenas indicaciones, y has
aprendido a escribirlas, y también para
que puedas editar tus cuadros dentro de la
pintura y fuera de la pintura Ahora mismo queremos decírtelo. El aprendizaje es las mismas circunstancias
pero un comportamiento nuevo. Entonces básicamente, hasta
ahora tal vez no sabías usar
estos modelos de difusión, ahora ya sabes, así que
deberías usarlos totalmente. Haz algunas fotos
para tu marketing, para miniaturas de YouTube,
para presentaciones, para anuncios, para lo que quieras Sólo entonces has aprendido. O simplemente te diviertes
creando estas fotos. También quiero decirte qué
buenos aprendices aprenden juntos porque más personas siempre saben más que personas. Entonces, si pudieras
compartir este curso, esto realmente
significaría la palabra para mí. A lo mejor también significa la
palabra para la otra persona, y si la otra
persona obtiene valor, describen el
valor porque
te lo has dicho. Entonces,
gracias por eso. Y te veo en
la siguiente sección porque los modelos de difusión
pueden hacer mucho más. Pueden hacer audio. Pueden hacer canciones enteras, y pueden hacer videos. Entonces nos vemos en la siguiente sección.
18. Videos de ai con Kling IA: Sí, la IA también puede hacer videos, y tenemos un billón de herramientas
diferentes Tenemos laboratorios BCA, tenemos pista, tenemos hotshot Tenemos máquina de ensueño
de Lumaabs. Tenemos SRA de Open AI. Sí, SRA no
funciona en este momento, y tenemos Kling AI. Por supuesto, hay mucho más, y todas estas herramientas,
funcionan relativamente similares. Si vas a los PCABs, aquí
tienen algo
especial, así que también puedes crear estos videos que viste
volviéndose virales a veces Estos videos justo aquí
donde las cosas se están derritiendo. Entonces se volvieron virales en las
redes sociales de vez en cuando, y el BCA,
puedes crearlos. En cierto modo, también tienes
mucha flexibilidad. Simplemente puede iniciar
sesión y crear todos
estos videos, y también puede ver
sus propios tutoriales. Hot Shot funciona muy fácil. Simplemente escribe texto
y obtiene el video de vuelta. En la máquina
de ensueño de uma Labs, tienes básicamente
lo mismo. Siempre también arrancamos y terminamos el marco en la
mayoría de estas herramientas. Y creo que ahora mismo en este momento Kling también es
una de las mejores cosas aquí Tienes imágenes de IA, videos , editor de
video, etc., y por eso solo
quiero mostrarte ling AI porque como dije, ahora mismo en este
momento, King AI te
da muy buenos resultados, y puedes comenzar
completamente gratis. Eso está al menos en mi mente, la parte más genial de todo La mayoría de estas cosas
funcionan gratis. La mayoría de estos generadores de
video AI, funcionan relativamente similares, así que solo quiero
mostrarte Kling AI, y si realmente quieres, puedes jugar con las otras
herramientas por ti mismo Lo primero que hay
que hacer es, por
supuesto, ir a cling.com Esta es nuestra página web china, pero también tienen
su versión en inglés, y aquí puedes hacer mucho. Si vas a casa, por supuesto, puedes ver el resumen. Se pueden ver las mejores
tomas de los videos. Aquí tienen generaciones donde también
han incluido el sonido. ¿Estoy soñando? Estoy tan cansada. Entonces, si te tomas
tu tiempo,
realmente puedes hacer generaciones geniales. Todos estos son cortometrajes. Simplemente puedes
mirarlos por ti mismo. Son impresionantes. Entonces
ves a los mejores creativos. Estas son solo fotos. Se puede ver que
también hacen fotos muy bonitas aquí. Esto también es algo
que me gusta, por ejemplo. Para que puedas crear videos, puedes hacer cortometrajes, si recortas algunas cosas juntos y puedes
trabajar muy bien. Puedes hacer
imágenes de IA y videos de IA. Si presionas sobre las imágenes de IA, simplemente
puedes crear imágenes. Tengo que decirte
no me encanta esta característica dentro del enlace porque
para las imágenes de IA, creo que la difusión
estable de medio tono y así sucesivamente es un poco
mejor que aferrarse Así que no pierdas tu tiempo con imágenes de
IA dentro de Kling. Pero lo que debes
hacer es presionar en los videos de
IA porque
con los videos de IA, realmente
puedes hacer mucho. Puede escribir un mensaje. Se puede aumentar o
disminuir la creatividad. Entonces puedes usar el modo
que quieras usar. Si usas el modo
profesional, necesitas tener una actualización
a la función premium. Ves simplemente la calidad
se pone un poco mejor. Tenía aquí el plan premium, pero ahora mismo no lo tengo. Entonces puedes usar cinco o
diez segundas generaciones. Se pueden utilizar diferentes relaciones de
aspecto y el número de generaciones. Por último, también puedes
usar los controles de la cámara y el prompt negativo al
igual que en la difusión estable. Pero el prompt negativo también
es opcional. Así que probemos esto. Vamos a usar un mensaje aquí. Y por supuesto, tienen las
mejores prácticas si
quieres profundizar en la ingeniería rápida
específicamente para ling. Pero en términos generales, siempre
debes usar las mismas
técnicas de incitación que ya
conoces Entonces sujeto con los
movimientos, la escena, la descripción de
la escena,
el lenguaje de la cámara y la atmósfera relámpago. Y aquí te dan
una descripción detallada cómo puedes escribir tal prompt. Aquí te dan
algunos ejemplos. Este es un prompt clásico, entonces este es un prompt que
hiciste mucho mejor, y aquí tienen un prompt realmente,
realmente descriptivo. Y aquí abajo, se ve lo que
cambia en estos videos. Si presionas sobre estos,
ves que en términos generales, obtuviste un buen video,
pero claro, el mejor prompt arrojó
aún mejores resultados Solo miremos estos. Ves que tienes
algunos efectos más, y creo que el video
generalmente es un poco mejor. Y si tienes un prompt realmente
descriptivo, ves que se vuelve aún un
poco más impresionante. Lo que puedes hacer es, por supuesto, simplemente copiar este prompt
y luego tirarlo a tu aplicación y ver por ti mismo cómo están funcionando estas
cosas. Aquí te muestran muchos ejemplos diferentes con
muchos prompts diferentes Al igual que, no tiene sentido que le muestre todos y
cada uno de los prompt aquí. Simplemente puedes
mirar esto por ti mismo. Es realmente fácil de usar. Entonces si vuelves a
Kling, puedes, por supuesto, usar ya sea Kling
1.0 o Kling Si vamos en 1.5, tenemos, en
términos generales, un poco mejor calidad, pero algunas características no están
incluidas, pero sí lo harán. Vamos a trabajar con Kling 1.5. Incluye un buen prompt, la creatividad en medio, el modo estándar, 5 segundos, 16 por nueve, un video. No quiero incluir ningún control
específico de cámara, pero puedes hacerlo
si quieres tener Zoom
horizontal vertical o algún o, vamos,
solo usemos el Zoom. Y solo quiero tener
un pequeño Zoom aquí. Y luego un prompt negativo, solo
usemos logo, marca de agua,
borrosa, fea, y luego
presionamos generar y aquí
pagamos diez créditos todo, obtenemos, creo, como 100 créditos al día, y luego puedes
crear estas cosas. Y mientras esto está creando, también
puedes salir de la página y hacer cosas
similares mientras tanto. Así que vamos a hacer esto.
Si vas a aferrar 1.5, puedes hacer básicamente
las mismas cosas aquí. Pero si estás en 1.5, algunas características no están ahí. Si te desplazas hacia abajo aquí,
los movimientos de la cámara, están deshabilitados en 1.5, pero estoy seguro que
volverán. Si vas una vez más
aspirar en aferrarse 1.0, se incluyen una
vez más, claro. Entonces si vas de
imagen a video, entonces esto es texto a video. Si vas de imagen a video, puedes arrojar tus imágenes, y luego puedes
mezclarlas con un prompt. Y también puedes usar
este pincel de movimiento. Quiero mostrarte este pincel de
movimiento de inmediato. También tienes aquí creatividad, modo
estándar,
longitud, etc.,
y también los movimientos de la cámara, pero ahora están deshabilitados, y tienes un prompt negativo. Entonces, si usas, otro lado, aferras 1.5
ahora mismo en este momento, no
tienes los
movimientos de la cámara ahora incluidos, y tampoco
tienes el pincel de movimiento. Así que vamos a usar 1.0, y luego subimos la foto. No importa
qué imagen uses. Solo usemos algo
de mis generaciones. Solo quiero subir
esto aquí mismo. Así que simplemente podemos
animar a este tipo, y quiero
hacerlo realmente simple Vamos. Un tipo, atraque. Entonces, por supuesto, puedes usar movimientos de
dibujo con
el pincel de movimiento. Si no lo usas, esta será solo
una creación aleatoria. Pero si usas el
movimiento de dibujo por otro lado, simplemente
puedes decirle al modelo de difusión
cómo debe comportarse, y también te dan
algunas instrucciones. Puedes usar,
por ejemplo, el área uno, usar Shrek, y luego presionar algunas cosas específicas
que quieras usar Puedes marcar
esto por ti mismo, con un área estática. O también puedes
usar, por ejemplo, la segmentación automática y presionar sobre las cosas que
quieras animar Si quieres eliminar
algo, también puedes eliminar. Entonces puedes hacer esto como
quieras. Es importante que solo marques las cosas que
quieres utomate, no automatizar animar, claro Lo que quiero hacer
ahora mismo es, por supuesto, agregar movimientos, y para eso, no uso estática,
sino que uso el área uno, la segmentación
superada, y simplemente presiono en
cada cosa que no debería estar
quieta esta En cuanto te hayas enterado de
lo que quieres animar, así que digamos que
quiero animar
ahora mismo a todo este tipo,
como lo puedes ver Lo que podemos
hacer es presionar en pista, y aquí ya podemos dibujar
lo que este tipo debe hacer. Entonces digamos que
este tipo debería ir en esta dirección y tal vez un poquito entonces en
esta dirección. Así que simplemente podemos
dibujar aquí algo, y luego se ve cómo está funcionando
esto. Si presionas confirmar,
esto está bien. Si no lo confirmas, solo hazlo una vez más un
poco diferente. Entonces, digamos que quieres
tenerlo de esta manera. Creo que ahora mismo
esto está funcionando, así que presionamos confirmar ahora mismo. Y entonces vamos a animar a
este tipo y este tipo
simplemente caminará en esta dirección cuanto presionemos
generar, claro Mientras tanto, tuvimos nuestro otro video con la banda
que está tomando café, leyendo un libro que también tiene algunas gafas para que veas que
puedas hacer generaciones geniales. Entonces este tipo está haciendo y
se mueve tras ello. Entonces si bajas, tienes
tu trayectoria de movimiento incluida. Tienes, por supuesto, también la creatividad y así
sucesivamente. Prensa generar. Y entonces
verás que podemos animar esta imagen con facilidad. Por cierto, también tienes
una guía de usuario de cepillo de movimiento. Si
lo presionas, te muestran exactamente cómo
puedes usar esta herramienta, y te dan también muchos ejemplos que
puedes echar un vistazo. Aquí han
animado este barco. Solo echemos un vistazo más de cerca. Esta nave, entonces se marcó donde debían moverse estas
cosas. Entonces aquí, utilizaron la
herramienta de pincel para mover el barco en esta dirección y el
agua en esa dirección. Y este fue el video. Entonces ves que funciona
realmente, realmente genial. La animación es impresionante porque el barco se mueve en una
dirección diferente a la del agua. Consigue este efecto genial de que
estaría ventoso en el agua. El agua se mueve en
esta dirección, pero aún así el barco puede moverse
en la otra dirección. Lo mismo es cierto
aquí para estos perros. Simplemente han
marcado a los perros, y luego les han dicho a los perros en qué dirección
deberían mirar. Y si presionas aquí, reproduce, ves que el disco también
resultó ser perfecto. Vamos a hacerlo a lo grande. Los perros miran exactamente en la dirección en la
que lo cepillas. Esta cosa con la
manzana también es genial. Simplemente han
marcado la manzana, como puedes ver aquí abajo, y utilizaron la herramienta de pincel
para mover la manzana hacia abajo. Puedes ver la salida aquí. Funcionó muy bien. Y ya ves, también
tenemos el agua
que está salpicando Vamos a hacer esto grande. Si miras de cerca, no
es 100% exacto, no 100% perfecto, pero
este es un video bonito. Incluso puedes hacer comerciales
con estos videos. Y aquí tienen
el gato y el gato está saltando sobre esta cosa de aquí. Solo echemos un vistazo. Aquí se ve que el gato está saltando. Esto también resultó
ser muy agradable. Sí, el aterrizaje no
fue perfecto. Ella no está a punto, pero esto le puede pasar a un
gato de vez en cuando. Además, aquí, tienes muchos
ejemplos que puedes usar. Como puedes hacer animaciones realmente
impresionantes. Puedes cepillar aquí como
quieras. Lo siguiente que quiero
mostrarte es, claro, que puedes hacer aún
más mientras tanto. Entonces, si vas de imagen a
video, puedes, por ejemplo, eliminar a este tipo aquí, y luego también puedes presionar
al final fotograma al final. Así que vamos a hacer algo
realmente genial ahora mismo. Quiero subir esta foto. Esta es una imagen de medio viaje. Después presiono al final del fotograma, y después subo
la siguiente foto. Entonces ves estas dos fotos, déjame abrirlas. Esta es aquí una chica,
y he recreado una chica con el mismo asiento
que es un poco mayor Ya sabes el
juego como funciona esto. Entonces esta es ella un
poco mayor, y esta es ella un
poco más joven. Y ahora queremos
transformarla con un video. Estos videos se volvieron
virales de vez en cuando. Y aquí simplemente podemos
escribir en una mujer envejecida, por ejemplo, tenemos el marco inicial,
tenemos el marco final. Entonces no podemos usar el pincel de movimiento en este
momento en este momento. Pero tenemos aquí cada otra cosa
en la configuración predeterminada, y luego simplemente podemos
presionar generar una vez más y vamos a recrear algo
realmente, realmente genial Entonces aquí se pueden hacer
muchas generaciones una
tras otra. Mientras tanto, te mostraré algunas generaciones que
he hecho anteriormente. Entonces aquí ya ves, este fue
un prompt realmente simple. Creo que el aviso fue que un perro
pequeño está acostado sobre un gato. Aquí se ve una boina que
baila en la selva. Aquí usé, por ejemplo, una foto de flux, y simplemente he hecho su perro. Ves que esto funciona
muy, muy bien. Hay muchas
publicaciones sobre huevos que se volvieron virales que hicieron
algo así. Aquí hice lo mismo, y la segunda generación
resultó ser aún mejor. Esto realmente parece generaciones
reales. Lo único que se estropeó aquí es esta mano un poco En la primera generación, también la mano está un poco
estropeada Aquí he hecho
algo con, como, un paisaje, y luego
entramos en otra imagen. Este es el marco inicial y final. Así que ya ves básicamente
podemos movernos por aquí. Entonces este es nuestro panda
que he generado. Este panda está
ahora mismo simplemente leyendo, y luego obtenemos nuestras
nuevas generaciones, y te las mostraré en
cuanto terminen porque esto se hace como en
unos segundos ahora mismo. Una de las generaciones está hecha, y sorprendentemente, es ésta, lo que empezamos después. Y aquí se puede ver cómo
está envejeciendo. Ves que esto funciona
muy, muy bien. Ella comienza joven, y luego se
transforma en esta versión más antigua. Estos son estos videos que a veces
se hicieron virales en Twitter, y puedes recrearlos
ahora mismo si quieres Sí, a veces no
resulta ser perfecto. Pero si juegas un
poco con estos, puedes disparar totalmente para estos. Y eso es básicamente
cada cosa que
puedes crear. Voy a mezclar lo siguiente en cuanto se genere esto. Entonces, básicamente, así es como
puedes trabajar con Kling AI. Simplemente puedes hacer una cuenta, y luego puedes comenzar
gratis, al menos ahora mismo. Puedes dipe en
texto y obtener video, y tienes mucho control, y también te dicen cómo
puedes escribir tus indicaciones Lo siguiente es, claro, que también puedes
imágenes a videos. Simplemente puedes subir una imagen, y también puedes
transformarla con este pincel de movimiento. Puedes marcarlo
y simplemente puedes decirle a la IA a dónde debería ir
esta cosa. Y lo siguiente
es que
también puedes incluir marco inicial
y final. Y con start and end frame, algo así como transformaciones
es realmente genial. Entonces, por favor, solo dale una oportunidad a
esta herramienta. Estoy convencido de que
te va a encontrar genial.
19. Texto para hablar con ElevenLabs y más: Esa IA puede hacer voces. Sí, eso
también me gusta. Entonces este es Aloy. Esto es texto a discurso
del OpmiPlayground, y ya
lo sabes Tenemos muchas herramientas que
pueden hacer texto en voces, y podemos hacer mucho más. Esta es una de las herramientas
más fáciles. Entonces, en el OpmeiPlayground, simplemente
puedes escribir
lo que quieres escuchar, y luego Opmeai simplemente creará También hay alternativas de
código abierto, por ejemplo, F five TTS, puede instalar esto localmente, y si
quieres probarlo rápido, también
puedes hacer que funcione en este espacio de fase abrazando
completamente gratis Simplemente subes un audio
y luego puedes escribir
el texto que
quieras generar y clonarás tu voz. Pero creo que una de las herramientas más
poderosas son los 11 laboratorios. Porque en 11 laboratorios, tienes mucha flexibilidad. También puedes empezar
gratis y
tienes muchos idiomas.
Déjame mostrarte esto. El
generador de voz de 11 laboratorios puede ofrecer voz humana de
alta calidad en 32 idiomas. Perfecto para audiolibros, off de
video,
comerciales y Entonces oyes que las
voces son
muy, muy buenas, y
puedes hacer muchas cosas. Y por eso quiero
mostrarte lo más rápido
posible lo que puedes
hacer dentro de 11 Labs. Creo que si
quieres empezar rápido, 11 labs es el camino a seguir, como porque
puedes empezar gratis, y después si
quieres crear mucho, tienes que pagar. Pero es rápido. Lo primero que
haces es ir a
esta página web y
luego presionas GTA. Entonces estarás en
app y por supuesto, necesitas registrarte. Simplemente haz una cuenta con
Google con lo que quieras. La interfaz es realmente fácil. Tienes aquí del
lado derecho simple y avanzado. Primero, comenzamos con
la interfaz simple. Lo primero que ves
aquí es que puedes escribir lo que quieras escribir y luego puedo usar diferentes voces. Esta es una
voz masculina profunda de Arnie. Yo mismo he creado
esta voz. Si presiono generar discurso, creo que me gusta esta herramienta. Entonces ya ves que podemos
generar este discurso, y esto va
muy, muy rápido. Y si te gusta la salida, puedes descargarla
pulsando sobre este botón. Y entonces si vas a la historia, ves las generaciones
que has hecho, y también puedes simplemente
descargar las generaciones. Sí, he hecho muchas cosas, así que ves que hay páginas y páginas y páginas de generaciones. Y también puedes volver
realmente, muy rápido y puedes recrear estas
cosas muy rápido Si vuelves a
generar una vez más, lo más probable es que
no tengas voz que hayas
generado tú mismo. Si te desplazas un poco hacia abajo, ves que tengo
una gran biblioteca de voces. He cloneado voces
de Elan Mask de mí
para también de mí y
también de Y también tenemos algunas voces
generadas aquí que he hecho, y luego tenemos
las voces por defecto. Ahora mismo, en este momento, lo más probable es que tengas solo
estas voces predeterminadas. Pero claro, quiero
mostrarte cómo puedes
clonar estas voces, incluso voces de ti mismo. Entonces esta es una voz que es,
como, de alguna manera como yo. Creo que me gusta esta herramienta, así que vamos a generar
esto con mi voz. Creo que me gusta esta herramienta. Sí, ya ves, hasta el
inglés es mejor que el mío. A lo mejor debería
reemplazarme por una I. Estoy seguro de que
llegaremos a este punto. Ese es el punto de todo esto. Entonces lo siguiente es que también
puedes presionar en Avanzado, y si vas en Avanzado, puedes usar aquí
diferentes modelos. Aquí en la configuración, verá 11 versión multilingüe
dos, nuestro modo más realístico y
emocionalmente rico
en 29 idiomas, el
mejor para voces en off, audiolibros, postproducción o cualquier otra Tenemos inglés,
japonés, chino, aquí también está el alemán
y muchas voces, así que esto funciona muy bien. Además de eso, también puedes usar diferentes modelos
si realmente quieres. Simplemente puede cambiar
aquí a diferentes modelos. Por ejemplo, la versión
Turbo 2.5, Di versión dos, D
versión uno, y así sucesivamente. Estas cosas se ponen cada vez peor
y peor. Lo único que eventualmente
puedes hacer son las voces de Turbo. Nuestro modelo de
baja latencia de alta calidad, así que esto es un poco más rápido, pero solo trabajo con
el normal. Entonces tienes estabilidad,
similitud, y la exageración de
estilo Se puede jugar con estas cosas, pero en términos generales, los ajustes
estándar
funcionan muy bien. Entonces también puedes incluir el amplificador de
habla si quieres. Si te metes
demasiado con estos y simplemente presionas, por ejemplo, a la configuración
predeterminada , por
supuesto, recuperarás
tu configuración predeterminada. Tengo que decirte, normalmente no
me meto mucho con estos
ajustes avanzados aquí porque
los ajustes predeterminados funcionan muy bien. Entonces en el lado izquierdo,
ves que no solo
puedes hacer
texto a voz, por cierto, aquí, simplemente puedes tirar lo que quieras. Puedes arrojar libros
casi enteros y puedes hacer
audiolibros con estos. T también debería funcionar completamente gratis. Esto es
realmente increíble. Nos fijamos en los precios más adelante porque puedes empezar gratis. Lo siguiente
que puedes hacer es ir al cambiador de voz,
y el cambiador de voz
es realmente increíble Aquí puedes subir voz
y recuperar el habla, pero con una voz diferente. Puedes usar, por ejemplo, digamos solo voz
masculina profunda de Arnie Ahora puedo
grabarme o subir un audio y simplemente puedo
recrear esta voz Así que probemos esto. Quiero grabar
aquí este audio. Si presiono aquí, empezaré. Esta será una prueba
si las heces de 11 Labs están funcionando
en tiempo real o no. Espero que no me defraudes. Entonces simplemente presionamos
generar discurso. Esta será una prueba
si esta herramienta de 11 Labs está funcionando
en tiempo real o no. Espero que no me defraudes. Y oyes como
hasta mi estúpido acento se duplicará. Pero ya ves, tenemos
una voz diferente. También puedo hacer aquí
como otras voces como Adam es una de las voces heredadas que
funciona realmente, realmente genial. También podríamos hacerme
hablar como una mujer y hacer estupideces con estas y también
podemos agregar otros acentos. Lo siguiente que podemos
hacer es presionar sobre las voces. Y aquí en las voces,
podemos hacer mucho. Se puede ir en todo en lo personal, en la comunidad, y por defecto. En este momento, lo
más probable es que solo tengas las predeterminadas, y siempre podrás escuchar cómo suenan estas voces
si presionas play. Confía en ti mismo, entonces
conocerás gobierno del
pueblo por el pueblo. El mundo es redondo,
y el lugar. No hay mayor daño. Entonces oyes que
hay grandes voces. Si presionas a alguna comunidad, escuchas las voces que le gustan a
la comunidad y las voces que la comunidad ha
creado. Por ejemplo, esto. Hemos comprometido la regla de
oro a la memoria. Comprometerlo ahora
a existir es cambiar, cambiar es madurar. Madurar es seguir creando. No se puede culpar a
la gravedad por enamorarse. Esto es genial para ti. Entonces puedes ir a lo personal. Aquí están las voces
que has creado si has
creado voces. Si no tienes voces
creadas, puedes presionar en agregar nueva voz. Y aquí tienes
ya sea diseño de voz, clonación
instantánea de voz, la biblioteca de voz o clonación de voz
profesional. Si presionas en el diseño de voz, simplemente
puedes escribir
lo que quieras ver. Digamos que eres
mujer, joven, acento americano acento
fuerza. Sí, esto está bien. Y entonces tienes un ejemplo de
cómo sonaría esto. Y luego puedes presionar
ya sea usar la voz o primero generar para escuchar cómo
está sonando Primero, pensamos que el
PC era una calculadora. Entonces descubrimos
cómo
convertir números en letras y pensamos que
era una máquina de escribir. Está bien, pero digamos que quieres tener un acento
diferente. Digamos británicos y
quieres tener un fuerte acento. Primero, pensamos que el
PC era una calculadora. Entonces descubrimos cómo
convertir números en letras, y pensamos que
era una máquina de escribir. Verás puedes hacer que esto
funcione como quieras. También se puede hacer masculino viejo, australiano, bajo
acento, una última vez. Primero, pensamos que el
PC era una calculadora. Entonces descubrimos
cómo
convertir números en letras y pensamos que
era una máquina de escribir. Y si te gusta,
presionas usar voces, y esto estará en
tu biblioteca de voces. Si no te gustan estos, puedes presionar una vez más aquí y hacer Clonación instantánea de
voz. Si presionas sobre esto,
puedes darle un nombre como yo, por ejemplo, entonces
subirías algunos ejemplos, y aquí te dicen
lo que puedes subir. Aún no se han subido artículos. Sube muestras de audio de la voz que te
gustaría clonar. La calidad de la muestra es más
importante que la cantidad. Muestras ruidosas pueden
darte malos resultados. Proporcionar más de 5 minutos de audio en total trae
pocas mejoras. Entonces lo que le digo a la mayoría
de la gente es que use aproximadamente de cuatro a
8 minutos de audio
realmente, muy bueno y de
alta calidad. Se puede extender esto hasta
por 25 muestras. Lo único que
es importante es que las muestras no sean
mayores de diez megabytes Entonces puedes subir, por ejemplo, tres pistas, cada
pista puede tener, por
ejemplo, dos o 3 minutos
con buena calidad de audio, y luego obtienes tu voz. Y entonces simplemente puedes dar
algunas etiquetas si quieres, agregar una pequeña descripción, y luego necesitas, por supuesto, aceptar que no haces ninguna estupidez
con estas voces. Entonces presionas esa
voz y terminas. Esto lo he hecho con mi voz E y máscara y con mucho más. Lo siguiente que
puedes hacer es, por
supuesto, la biblioteca de voces. Ya conoces la biblioteca. Entonces aquí simplemente encuentras
cosas de otras personas. Y lo último que
puedes hacer es, por supuesto, si presionas una vez más en agregar nuevas voces, clonación de
voz profesional. Para eso, necesitas
pagar un poco más, y simplemente puedes
hablar con 11 laboratorios. Puedes enviar algunas voces de muestra, y luego crean una voz que suena muy,
muy nítida. La mayoría de la gente hace esto
si quiere clonar
sus propias voces y hacer audiolibros enteros a partir de estas. Esto funciona muy bien. Un amigo mío lo ha hecho, y obtiene más streams con su voz cloneada que
con su voz original Así como, puedes hacer cosas
geniales con estos. Entonces, claro, también aquí
encuentras esta biblioteca, y aquí puedes encontrar
muchas cosas. Digamos que quieres
crear cosas para redes sociales. Puedes usar muchas voces
diferentes. Videos con ojos,
YouTube, cortos, os, setos y por supuesto, estos también son idiomas
diferentes Aquí puedes hacer un montón
de cosas geniales. Además de eso, también
tienes efectos de sonido. Así podrás crear
efectos de sonido para lo que quieras. Vamos a hacer ladridos de perros. Aquí tienes algunos ejemplos. Suena genial. Mi perro en estos
momentos no está aquí. Normalmente, siempre está por aquí, pero esto sonaría casi
como él. Así que simplemente puedes escribir
lo que quieras crear, presionarlo y, sí, puedes usar estas
cosas de manera comercial. Entonces si vas a
explorar, encuentras, por
supuesto, voces que
otras personas han hecho. Así que puedes encontrar un
montón de cosas aquí. Aquí puedes ver los temas semanales. Esto es algo
genial, por ejemplo. Y también puedes sonar escucha
lo que quieres escuchar, y también tienen categorías. Si presionas sobre animales, encontrarás muchos
animales gato maullido, pájaros cantando, rana, y así sucesivamente Y siempre puedes
usar solo el prompt o también descargar estas
cosas si quieres. Entonces también puedes usar como auges o brams o hacer
lo que quieras Puedes hacer muy buenos efectos de
sonido con
estos y como dije, puedes usarlos comercialmente. Lo siguiente que
quiero mostrarte es proyecto porque puedes
hacer proyecto completo. Para explicarte esto
realmente, muy rápido, quiero mostrarte este
video porque esta es una característica donde debes
pagar un poco más. Yo tengo el plan básico, pero si quieres hacer muchas cosas aquí dentro de esta herramienta, necesitas tener la suscripción
más fuerte. Quiero mostrarte la suscripción
al final del video. Presentamos project, tu flujo de trabajo enter end para crear
audiolibros en minutos Ya sea que estés
empezando desde cero, sacando de una URL
o subiendo archivos EPUB, PDF o TXT, los proyectos te tienen cubierto Con tu texto en su lugar, puedes convertir todo a audio con solo
hacer clic en un botón. Si quieres mezclar
voces en tu audio, ahora
puedes asignar fácilmente altavoces
particulares a
diferentes fragmentos de texto. Capítulo uno, la parada del autobús. Oye, ¿sabes cuándo es el
próximo autobús? Preguntó Matteo Creo que debería estar aquí ahora. Si necesitas arreglar una sección, los proyectos te permiten regenerar
sin problemas Entonces básicamente, puedes hacer proyectos
enteros con diferentes ponentes
y hacer mucho más. Si tienes más interés, puedes ver este
video tú mismo. Pero entonces necesitas, claro, un mejor plan para esto. Quiero mostrarte
esto ahora mismo porque recibo algunas preguntas
de vez en cuando. Tienes muchos planes
diferentes. Estoy ahora mismo en este plan inicial
actual, y esto es barato. Yo pago, creo, como
cinco dólares al mes, pero puedes usar más. Entonces el plan gratuito,
puedes jugar un poco. Con el plan de $5 al mes, puedes jugar un poco más. Y luego con el plan creador, este es el plan más popular. Se puede empezar por
11 dólares al mes, pero luego va a
subir, creo, a 22. También estoy seguro de que esta cosa
va a cambiar un poco. Y también puedes ver
lo que obtienes aquí. Entonces por estos 11 dólares
al mes al inicio, obtienes clonación de
voz profesional. Tienes proyectos,
tienes audio nativo, y tienes mayor calidad. Y con este plan pro, obtienes incluso un poquito más. Entonces estos son
básicamente los planes, y también puedes
comenzar dos meses gratis si usas la suscripción
anual. Para que puedas jugar
un poco con esto por
ti mismo si quieres. Pero lo siguiente
que quiero
mostrarte es el estudio VoiceOver El estudio VoiceOver
también es realmente genial. Ahora mismo está en mejor. Y también aquí necesitas
actualizar tu plan. Y este tipo de aquí te
explica
cada cosa lo que puede hacer el estudio de
voz en off Básicamente, también aquí,
puedes hacer proyectos completos, puedes subir videos y hacer off de forma nativa
con Esto también funciona muy bien. He probado
esto algunas veces. Se pueden generar efectos de voz y
sonido en un solo editor. Puedes importar video directamente, aplicar capas a tus pistas de audio y tener precisión
en la edición de estas. Entonces esto es básicamente la
edición de video con audio que sale de forma nativa de 11
laboratorios. Esto funciona muy bien. Entonces tienes el estudio de
bugging. Aquí, también tienen
algunos recursos, así que no quiero pasar
mucho tiempo con estos. También he generado
algunas cosas aquí. Si simplemente presionas
Crear NU Dup, simplemente
puedes darle un nombre a
tu proyecto. Luego le das el idioma de
origen y el idioma en el que
quieres traducirlo, y luego puedes subir
tu pista ya sea desde YouTube TikTok u otras cosas
que también puedas hacer manualmente, y luego puedes
crear estas cosas Esto te costará
3 mil créditos. Ahora mismo en este momento me quedan 55 mil créditos
para este mes, así que podría
hacer esto muchas veces Esto también es algo
que de verdad, verdad me gusta que de
verdad me encanta porque
puedes traducir tus
videos muy rápido. Y claro, pueden decirte un poco
con más detalle si quieres. Porque creo que no tiene sentido que te muestre
cada paso, los mismos pasos que ellos te muestran. Básicamente, crea un nuevo paso, sube tus cosas y
estás listo para rockear. Puedes recrear tus
cosas en otros idiomas. Y
lo más genial está aquí, sí, que puedes hacer esto también
en estos planes básicos, para que puedas traducir
videos fácilmente Entonces tienes audio nativo. Y también el audio nativo
es realmente genial. Y también aquí se
necesita un plan más fuerte. Básicamente, lo que puedes hacer es simplemente
usar un fragmento de código,
copiar el fragmento de código
en tu página web,
y luego tendrás en
tu página web una barra de este tipo,
y esta barra leerá Yo para mí,
no tengo una página web, pero si tuviera una página web, creo que incluiría esta. Si publicara
artículos todo el tiempo, puedes usar estas
cosas y luego las personas que vienen a
tu página web simplemente pueden presionar este botón
y 11 laboratorios
leerán el artículo en
voz alta frente a ellos. La lógica te llevará de A a B. La imaginación tomará
básicamente, tienen esta barra, y esta barra leerá
toda tu página web para ellos. Incluso el New York Times ha incluido esta y
muchas otras páginas web. Si vas a un artículo
del New York Times, lo
ves aquí mismo. Escucha este artículo. Simplemente puede presionar sobre esto, y luego básicamente 11 laboratorios
leerán este artículo
para su voz alta. No estoy seguro si puedo tocar esto aquí porque como si fuera
el New York Times. Y lo último
aquí abajo es el aislador de voz. Si pulsas sobre el aislador de
voz, simplemente
puedes arrastrar y
soltar un le de audio que no
tiene buena calidad y
puedes hacerlo mucho mejor El video de demostración te muestra
perfectamente cómo funciona esto. Y estos archivos de audio pueden
ser grandes hasta 500 megabyte. Mm de acción. Necesita eliminar el
ruido de fondo de su video. Utilice nuestro nuevo modelo de aislador de voz para obtener un
audio nítido en todo momento Entonces ves que esto funciona perfecto. Si tienes voces ruidosas, si tienes muchas cosas de
fondo pasando, puedes subir tus generaciones de
audio, y esto va a mejorar mucho. Y estas cosas pueden ser realmente
grandes con 500 megabytes, y aquí obtendrás salidas
cristalinas Aquí, siempre ves
cuánto puedes crear. En total, tengo 60 mil
créditos al mes. Ahora mismo, me quedan
55 mil créditos. Entonces tienes algunas
notificaciones. Si hay algo
especial pasando. Entonces lo siguiente que
puedes hacer es, claro, que puedas presionar sobre tu nombre, y tienes muchas
otras cosas aquí. Tienes tu perfil, y si lo
presionas como ves alguna información, entonces puedes presionar las teclas API. Si eres desarrollador, puedes generar claves API y puedes hacer aplicaciones
con 11 labs. A continuación, la suscripción, aquí podrás gestionar
tu suscripción. Los pagos, si
eres afiliado, y si no eres afiliado, puedes presionar para
convertirte en afiliado Aquí puedes obtener hasta 22% en comisiones, y
tengo que decirte, sí, soy afiliado de este programa porque
lo uso yo mismo y me encanta. Y creo que he ganado como aproximadamente 100 dólares con estos porque he publicado uno
o dos videos sobre esto. Después el análisis de uso, si quieres profundizar tienen toda una documentación. Si eres desarrollador, simplemente
puedes verlo por ti mismo. Entonces la documentación, luego el bloqueo de cambio,
el centro de ayuda, el programa de afiliados, así que
un poco más sobre este programa y el clasificador de voz
AI Y por último, claro,
los términos de privacidad. Sí, puedes
usar esto comercialmente, pero quizás no seas capaz de
crear voces de diferentes personas
donde no tengas el acuerdo para
usar sus voces. Y por último, claro,
puedes cerrar sesión. Si quieres
convertirte en afiliado, porque lo veo todo el
tiempo, la gente me pregunta esto. Solo tienes que ponerte en contacto con
el equipo de afiliados ,
presionas aquí, escribes tus datos, y luego obtienes un enlace
que puedes promocionar. Obtendrá dicho enlace. Creo que hice esto
sobre la pila de socios, así que este sería mi enlace. A lo mejor lo incluyo
en la última conferencia. Y si quieres hacer una
suscripción en 11 Labs, también
puedes incluir este enlace, y luego me puedes apoyar. Y puedes, por supuesto,
también hacer lo mismo. Simplemente puedes hacerte un enlace
tan aflat. Puedes colocarlo en videos
en redes sociales o donde sea, y tal vez puedas ganar incluso la misma cantidad que
pagas por este estudiante, y es básicamente gratis. Entonces en este video,
aprendiste cómo funciona 11 Labs. En términos generales, es
una, al menos en mi mente, es una de las mejores herramientas de
IA si
quieres generar
discurso a partir del texto. Y deberías probar esto
totalmente.
20. Transcripción con Whisper: Hablemos del susurro. Whisper es la herramienta gratuita de código
abierto de Openi e
incluso puedes ejecutarla localmente. Se puede convertir el discurso en texto. Se pueden hacer transcripciones. Si te desplazas hacia abajo, ves cómo está funcionando la tecnología, puedes bucear más profundo si quieres. Y aquí se obtiene toda
la configuración. Entonces, si quieres
instalar esto localmente, aquí obtienes esta configuración completa. Necesitas instalar bip
Open May whisper. Entonces necesitas bip
instalar esto aquí mismo. Después las actualizaciones y así sucesivamente. Y entonces
básicamente puedes usarlo. Ahora bien, si no
quieres hacer esto, tienes muchas otras opciones. La opción más fácil
es probablemente inochio. Y si simplemente descargas esta cosa y la
descomprimes en tu PC, obtendrás una interfaz que
se parece a esto Y aquí también puedes
escribir, por ejemplo,
susurro, y si lo presionas, simplemente
puedes descargarte Pinocho lo hace
realmente, muy fácil, y si las cosas no están instaladas, simplemente
puedes presionar instalar, y luego estas cosas
funcionarán completamente automáticas, así que no tienes que
preocuparte por Esta cosa
funcionará automáticamente. Si vas a la plataforma
desde OpMeAI, claro, puedes usar Wisper también en PyTon para que puedas hacer Y también es
muy fácil de usar. Simplemente puedes usar
esto aquí mismo, y haremos llamadas API. Para susurrar, para que puedas
usarlo localmente de forma gratuita, o puedes integrarlo en
tus propios proyectos con PyTN Y WiSPA también es realmente
barato sobre la API. Si
volvemos a desplazarnos hacia abajo en este artículo, ves que WiSPA te
cuesta 0.006/minuto Oh, sí, esto es realmente barato. Si subes unos minutos, es casi gratis. Mientras tanto, Wisper
también se instaló localmente, y aquí obtienes tu interfaz web de
gradio Aquí en Open WebUI, simplemente
puedes usar Wisper y
es muy, muy fácil Puedes usar lo que quieras. Se puede presionar sobre estos. Normalmente Versión
Grande dos funciona bien. Entonces vas a la detección
automática, o también puedes usar un
idioma que quieras. Puedes escribir en inglés
o lo que sea que sea. Y luego simplemente puedes arrastrar
y soltar aquí tu archivo. Yo sólo quiero hacer un ejemplo con algo de este curso. Entonces subí mi archivo, y luego presiono
generar archivo de subtítulos Aquí inicializamos el modelo, entonces obtendremos esta salida Y esto también es
básicamente un video. Entonces ya ves que este es
un video de MP 44 Aflx, y esto también debería funcionar Si usas MP tres, claro, va más rápido. Y
ahí lo tenemos. Ves esto Haz
ahora mismo 3 minutos. Por supuesto, esto se estaba
ejecutando localmente, y este es un video, y el video también es
relativamente largo. Ahora simplemente puedo presionar sobre estos y puedo
descargar mi archivo. Y ahora abrí
aquí mi archivo de texto, y aquí ven
tengo mi archivo de texto, y también tengo las marcas de tiempo Entonces lo que estoy diciendo
en qué marca de tiempo. Esto es completamente increíble, y puedes trabajar con estos. Entonces en este video, has
sembrado cómo puedes usar susurro. Puedes transcribir lo que quieras en ningún momento. Y esto es muy,
muy barato. Y si quieres ejecutar esto localmente completamente
gratis, también puedes hacerlo. Es realmente así de fácil.
21. Generación de música con IA con Udio: Lo siguiente es, claro,
que hasta podemos hacer música. Porque puedes hacer texto, puedes hacer efectos de sonido. También puedes hacer música. Espero que entiendas que estos modelos de
difusión son grandes. Una de las mejores herramientas en este
momento en este momento es Udio
y Udio también ha
introducido la versión 1.5 Si simplemente presionas sobre estos, también
puedes ver cómo funciona esto, y aquí simplemente puedo mostrarte una o dos generaciones
que he hecho. Si simplemente presionas
play aquí mismo, los mosquitos se agitan por ahí. Grande. Oyes que esta
cosa está funcionando. También siempre puedes escuchar las cosas que
son cosas escogido. Entonces piensan que esta música de
aquí es genial. Juguemos a
éste por un breve momento. Asociación Ste. Estás justo de
oriente a poniente, de norte a sur. Entonces ves que esto suena muy, muy bien, al menos ahora mismo. Esta cosa funciona muy bien. Por supuesto, también puedes actualizar tu plan si lo presionas, pero también puedes comenzar gratis, pero luego estás limitado. Y si quieres usar más, claro, tienes que
pagar un poquito. Y puedes ahorrar un
poco si pagas anualmente. Apenas las mismas cosas de siempre. Pero puedes comenzar
completamente gratis, y es realmente fácil de usar
si simplemente presionas Crear. Aquí obtienes una interfaz. Esta interfaz siempre
cambia un poquito, y siempre obtendrás
nuevas opciones y así sucesivamente. Básicamente, puedes escribir
lo que quieras ver. Puedes obtener sugerencias. Puedes alargarlo hasta 130 segundos con
una sola generación. Puedes añadir tus propias letras. Aquí puedes hacer muchas cosas. Ahora quiero
mostrarte la forma más fácil crear una canción con estos. Simplemente podemos escribir
lo que queremos tener, y por supuesto,
necesitamos iniciar sesión. Así que solo inicia sesión con Google
con descarte o con Twitter. Voy a seguir con Google. Ya he hecho algunas
canciones en esta herramienta. Y ahora simplemente
tecleamos lo que queremos tener, por ejemplo, una canción
sobre un conejo. Y entonces también podemos hacer
muchas cosas diferentes. Podemos usar el modo manual. Si empiezas, solo
usa la configuración predeterminada. Tampoco soy un experto en música. Entonces,
si usas el modo manual , claro, puedes
hacer muchas cosas. Puedes hacer diferentes etiquetas. Entonces debería ser un
rock, electrónico, pop, ajedrez o algo así, creo que electrónica estaría bien
con nuestra canción de conejo. Entonces la letra, ¿
quieres tener letras personalizadas? Entonces, si presionas
algunas letras personalizadas, puedes introducirlas o
serán automáticas. Por supuesto, si
incluyes este material manual, siempre
puedes escribir
las cosas que más te gusten. Entonces el instrumental, ¿cómo
debería ser el instrumental? ¿Quieres incluir
algo o no? Y luego el auto generado, si quieres hacer
todo automáticamente. Apenas por ahora, excluyo
esto aquí mismo, y simplemente usamos aquí, por
ejemplo, electrónico
y Electro como nuestro texto. Y simplemente presionamos Crear, y luego esperaremos como uno o 2 minutos y
conseguimos nuestra canción. La canción dura 1 minuto, y después de eso,
también podemos remezclar la canción Esperemos a que tengamos nuestra canción. Y ahí lo tenemos. Tenemos nuestras dos canciones. Tomó alrededor de 7 minutos
crearlos, y vamos a ver cómo están. Somos casa de medianoche.
Vamos. Vamos. Vamos. La luz de la luna brilla. Primera etapa. Aquí está de vuelta. Observa cómo fluye
el conejito. Salto de salto, Acrobat. Observa cómo fluye el conejito,
luego las cuentas de Bunny. Hola con esas patas de conejito. Redondo, salto, redondo, salta
h con esas patas de conejito. Esto es increíble, así que puedes jugar todo el
día con esta herramienta. Ahora podemos hacer las
siguientes tres cosas. Podemos remezclarlos. Podemos extenderlas o
podemos publicarlas. Si presionas sobre mix, puedes hacer aquí
muchas cosas diferentes. Por supuesto, puedes cambiar
el texto, por ejemplo, puedes cambiar el instrumental, puedes cambiar las cosas
que se generan fuera, y por supuesto,
también las variantes. Puedes hacerlo más
diferente o menos diferente. Puedes remezclar como quieras. Si crees que es genial, pero quieres tenerlo más tiempo, simplemente
presionas extender. Si presionas publicar, puedes compartirlo con
todos en esta plataforma. Si presionas sobre estos puntos libres, puedes remezclar, extender,
como sabes Puedes ver la pista,
puedes agregarla a una lista de reproducción. Puedes compartirla, descargar, eliminar o reportar la canción
si algo no está bien. Creo que presiono extender
porque me gusta mucho esto, pero no tienes que
escuchar toda la canción. Creo que
lo mejor que puedes hacer es jugar un
poco con esta herramienta. Udio es, ahora mismo, al
menos en mi mente, sin
duda la mejor herramienta Udio trae música que realmente
podemos escuchar. Podemos crear y
escuchar música en pocos minutos. Esto nunca fue posible. Solo piensa en lo
que necesitas hacer para crear una canción en esta
calidad sin A. Necesitas aprender a
tocar instrumentos. Necesitas aprender a cantar, o necesitas encontrar a
las personas adecuadas. Tienes que ir a un estudio. Hay que grabarlo, hay
que editarlo.
Esto es enorme. Ahora podemos hacer nuestra propia música con unos pocos clics y la música, al
menos en mi mente, es casi tan buena como la
música de profesionales. Recuerda, esta es
la peor versión con la
que jugarás. El audio también va a mejorar y mejor y a lo mejor
viene una nueva herramienta a la vuelta de la
esquina que es
tan buena como los mejores artistas del
planeta. La IA es simplemente increíble. Solo juega con el taburete y avísame si
te va a encantar. Sé que lo harás.
22. ¡Recapitulación y GRACIAS!: Enhorabuena. Tú lo hiciste. Y antes que nada, gracias. Has aprendido IA
lo más rápido posible. Empezamos con lo básico. Entonces, ¿qué soy y qué son los LLM, cómo se capacitan
y cómo funcionan? Esto era un poco de teoría, pero necesitas entender
esto porque
necesitas entender que
para obtener buenos resultados, necesitas buenos insumos, y necesitas
entender tokens para. Empezamos qué son los
LLM y cómo podemos
usarlos. Tenemos mucho. Tenemos
Lams de código cerrado como HachPD,
coágulo, Géminis Pero básicamente, estos
son los tres grandes, y luego tenemos ams de código
abierto. Y los LL ams de código abierto, los
podemos usar
ya sea en Olama en LM Studio o también
en el chat de abrazos Entonces has aprendido
lo que estos LLM. Puedes hacer que el texto pequeño sea
más grande o el texto grande más pequeño. Y con todo esto, puedes hacer mucho porque también
puedes hacer código. Se puede hacer texto para mercadeo. Se pueden escribir libros antire. Puedes escribir correos electrónicos, y puedes hacer mucho más. Entonces hablamos de ingeniería
rápida. Tenemos el papel que incita,
el prompting corto, prompts estructurados, y algunos consejos como
pensar paso a paso Lo más importante
es la asociación semántica, por lo que hay que dar contexto También puede personalizar
su LLM ya sea con el prompt del sistema o
con tecnología directa Y por supuesto, puedes usar
todas estas LLM a través de una API y puedes integrarlas en tus propios proyectos si
eres desarrollador Por supuesto, hay mucho más. Hay un sinfín de
herramientas de IA como la perplejidad, algo que funciona
genial para algunos, y si quieres jugar también
el chat de abrazos Entonces hablamos de modelos de
divusion. Empezamos con la generación de
imágenes. modelos Divusion son modelos
entrenados en texto e imágenes, y pueden recrear
imágenes si escribes También aquí necesitas ser específico para obtener salidas
específicas. Así que la ingeniería rápida
es importante, y funciona en cada modelo de
difusión de la misma manera. Solo piensa en lo que importa. Vio todas las cosas
más
importantes mitad del viaje, un Dogram, AdobvaFly e incluso los modelos de código
abierto como la difusión
estable en el foco o el
flujo y el recraft en flujo Entonces has aprendido
que los modelos de di fusión pueden hacer más porque también
puedes crear audio,
video y voces. Algunas de las herramientas más
populares para videos son ling,
runway y Beca Si quieres generar texto, 11 labs o un cinco DDS y
la API OMI es genial, si quieres crear canciones, creo que dio ahora mismo
es la mejor herramienta También antes funciona y eventualmente también 11
laboratorios en el futuro. Además de eso, también puedes usar código abierto
WiSPR
para transcripciones Simplemente instala Binochio
y podrás hacer las transcripciones sean realmente
fáciles y gratuitas Entonces básicamente,
has aprendido mucho, y quiero decirte una
vez más lo que es aprender. El aprendizaje es las mismas circunstancias,
pero un comportamiento diferente. A lo mejor no sabías que la
IA puede hacer tantas cosas. Ahora mismo, ya lo sabes, así
que deberías hacer esto totalmente. Esto es lo más
importante. Usa herramientas de IA solo entonces
has aprendido. Y quiero decirte lo que
realmente hacen los buenos aprendices. Aprenden juntos
porque más personas siempre saben más que personas. Entonces, si pudieras
compartir este curso, esto realmente
significaría el mundo para mí. A lo mejor también significa la
palabra para la otra persona, y si la otra persona obtiene
valor de este curso, describirán el valor porque
te lo has dicho. Gracias por eso, y te
veré, claro, una vez más en este curso
o en otro curso. Y una última vez, gracias
desde el fondo de mi corazón porque me has dado tu
activo más valioso, tu tiempo. Todo el mundo en esta tierra tiene tiempo limitado y
decidiste pasar
tu tiempo conmigo. Así que gracias por
eso, y has aprendido IA lo más rápido posible.