Inteligencia artificial para principiantes: crea una ChatGPT personalizada en 3 pasos, gratis

Alvin Wan, Research Scientist

Obtenga acceso ilimitado a todas las clases

Clases enseñadas por líderes de la industria y profesionales activos

Los temas incluyen ilustración, diseño, fotografía y más

Obtenga acceso ilimitado a todas las clases

Clases enseñadas por líderes de la industria y profesionales activos

Los temas incluyen ilustración, diseño, fotografía y más

Lecciones en esta clase

- 1.
  
  INTRODUCCIÓN
  
  1:14
- 2.
  
  Proyecto de alcance: texto a texto
  
  5:52
- 3.
  
  Proyecto del alcance: capacidades
  
  5:57
- 4.
  
  Proyecto del alcance: tarea y métrica
  
  5:32
- 5.
  
  Evalúa modelos: prueba los mejores
  
  6:22
- 6.
  
  Evalúa modelos: optimiza costos
  
  3:40
- 7.
  
  Evalúa modelos: de código abierto
  
  7:03
- 8.
  
  Demostración: ejecutar un modelo de código abierto
  
  4:32
- 9.
  
  Perfecciona la calidad: entradas de ingeniería
  
  4:25
- 10.
  
  Perfecciona la calidad: restringe las salidas
  
  9:18
- 11.
  
  Conclusión
  
  2:00

Nivel principiante

Nivel intermedio

Nivel avanzado

Todos los niveles

1098

Estudiantes

Proyectos

Acerca de esta clase

¿Te entusiasma usar IA en tu producto, pero te intimida toda la jerga y la complejidad? ¿La multitud de productos de terceros al azar? Vamos a cortar todo el peludo: permíteme mostrarte cómo personalizar una IA desde cero, y en 3 pasos rápidos.

Este curso está diseñado para emprendedores, desarrolladores, gerentes de productos y estudiantes curiosos que quieran crear aplicaciones de IA poderosas y personalizadas, sin costosas API ni suscripciones de terceros. Descubrirás los pasos fundamentales para crear soluciones de IA prácticas y personalizadas con herramientas totalmente gratuitas y de código abierto. Y lo más importante es que mejoraremos las capacidades de tu LLM sin ningún tipo de capacitación.

Qué aprenderás

Esto es lo que haremos, rápido:

Elige un problema real de texto en o fuera de texto que te interese.
Define la entrada, la salida y una métrica rápida para que podamos juzgar la calidad.
Prueba el modelo principal por chat, luego la API para obtener resultados repetibles y comprobaciones de costos.
Desciende hasta el modelo más barato que aún cumpla tu métrica.
Hazlo fiable con una estructura rápida y resultados restringidos (para que siempre devuelva el formato que espera tu aplicación).
Conecta un pequeño modelo de código abierto con GPU gratuitas y conéctalo para no estar limitado por el presupuesto.

No se requiere capacitación costosa y vamos un paso más allá de "sugerir ChatGPT".

¿A quiénes está dirigida esta clase?

No se requiere experiencia previa en IA ni en codificación, solo curiosidad y ganas de aprender. Tanto si eres principiante como si tienes algunos conocimientos técnicos, saldrás con conocimientos prácticos y la confianza para comenzar a crear soluciones de IA personalizadas. Dicho esto, aprovecharás más del curso si primero tomas mi clase Inteligencia artificial para principiantes: cómo aprender el aprendizaje automático e inteligencia artificial para principiantes: cómo funciona ChatGPT.

Recursos necesarios:

Computadora (Windows, macOS o Linux)
Navegador Google Chrome
Cuenta de Google
Sin API ni servicios de terceros de pago

¿Estás listo para profundizar aún más?

¿Te interesa el aprendizaje automático avanzado? Prueba mi curso Introducción a la visión artificial (ML aplicado).
¿Quieres codificar? Consulta Introducción a la programación (Python) o Introducción a la OOP (Python).
¿Te interesan los datos? Explora SQL 101 (diseño de bases de datos) o Data 101 (análisis).

Conoce a tu profesor(a)

Alvin Wan

Research Scientist

Top Teacher

Hi, I'm Alvin. I was formerly a computer science lecturer at UC Berkeley, where I served on various course staffs for 5 years. I'm now a research scientist at a large tech company, working on cutting edge AI. I've got courses to get you started -- not just to teach the basics, but also to get you excited to learn more. For more, see my Guide to Coding or YouTube.

Welcoming Guest Teacher Derek! I was formerly an instructor for the largest computer science course at UC Berkeley, where I taught for several years and won the Distinguished GSI (graduate student instructor) award. I am now a software engineer working on experimentation platforms at a large tech company. 4.45 / 5.00 average rating (943 reviews) at UC Berkeley. For more, see my Skillshare or Webs... Ver perfil completo

Habilidades relacionadas

IA e innovación IA para el desarrollo Fundamentos de la IA Prompts

Level: Intermediate

Proyecto de clase práctica

¡Construye tu ChatGPT personalizado! Sigue los pasos de este curso para esbozar tu proyecto y construir tu primera IA personalizada:

Proyecto de alcance
Evalúa modelos
Perfecciona la calidad

Analyse and tally 17 Reviews for a reginal hairdresser

Maria Charlton 9 me gusta

2 comentarios

Blake Acosta 8 me gusta

1 comentario

Lakshya Soni 6 me gusta

1 comentario

Ifeoluwa Oladeni 6 me gusta

1 comentario

Valoración de la clase

¿Por qué unirse a Skillshare?

Mira las galardonadas Skillshare Originals

Cada clase tiene lecciones cortas y proyectos prácticos

Tu membresía apoya a los profesores de Skillshare

Aprende desde cualquier lugar

Ve clases sobre la marcha con la aplicación de Skillshare. Progresa en línea o descarga las clases para verlas en el avión, el metro o donde sea que aprendas mejor.

Transcripciones

1. INTRODUCCIÓN: Capacitar a tu propio modelo es lento, costoso y excesivo para la mayoría de los proyectos El verdadero problema radica en saber por dónde empezar, cómo obtener resultados confiables sin quemar tiempo ni dinero. Hola, soy Alvin, científico investigador de una gran empresa tecnológica He enseñado a más de 60.000 estudiantes en Skillshare, y obtuve mi doctorado en IA de UC En esta clase, te daré un sencillo libro de jugadas repetible para construir un ChaChiPT personalizado para tu caso de Esto lo haremos en tres pasos. Paso número uno, alcance tu proyecto. Detecte cómo usar la IA manera más efectiva para su caso de uso. Paso número dos, evaluar modelos. Te mostraré cómo navegar por las grandes franjas de modelos patentados y de código abierto Paso número tres, refinar la calidad. Asegúrese de que el modelo devuelva exactamente lo que necesita cada vez. Al final de este curso, tendrás un proceso de tres pasos para usar en cualquier idea basada en IA. Este curso sí asume que has tomado mi IA para principiantes, cómo funciona el curso de Chat Tippit Pero más allá de eso, no se requiere ningún antecedente técnico. Todo lo que necesitas es una computadora portátil, Internet y una hora de tiempo. Empecemos. 2. Proyecto de alcance: texto a texto: Bienvenido a AI para principiantes. Construye un Custom Chachi BT en tres pasos. Antes de comenzar, repasemos alguna terminología. Voy a simplificar enormemente estas definiciones para transmitir la idea principal LLM o modelo de lenguaje grande es un modelo que genera texto Le das Tex como entrada, y el LLM produce salida de Texas IA o inteligencia artificial es generalmente un producto que utiliza un LLM HHIBT es específicamente el producto de IA de Open AI. Entonces la IA versus CIBT es como tejidos versus Kleenex. Los tejidos son el producto general, y Kleenex es un nombre de producto de marca específica Si lo encontraste confuso, está bien. Repaso esto con más detalle en IA para principiantes, cómo funciona HachBT, que puedes encontrar en este enlace Como ya estás suscrito, obtendrás este curso sin costo adicional También recomiendo encarecidamente llevar mi IA para principiantes herramientas para aprender machine learning, donde discuto un framework para recoger IA y ML. Puedes encontrar ese curso en este enlace. No es necesario escribir estos enlaces, ya que encontrarás todos los enlaces de esta lección en esta URL. Ahora construyamos tu Chachi BT personalizado en tres pasos. Estos pasos son para que todos tomen, aunque seas un profesional, aunque tengas un presupuesto masivo. Cualquiera que construya una IA personalizada necesita estos tres pasos. Paso uno, alcance su proyecto, determine qué hará su IA y cómo juzgará sus capacidades. Paso dos, evaluar modelos. Existen pautas sobre qué tipos de modelos usar cuando. Paso tres, refinar la calidad. No hay necesidad de entrenamiento, y te mostraremos dos métodos para mejorar la calidad. Ahora comencemos con el paso uno, alcance tu proyecto. El primer paso aquí es acotar tu enfoque a las tareas de texto a texto. Lo que significa que le das el AI Tex como entrada y obtienes texto como salida. Déjame explicarte por qué. Primero, por experiencia, sabemos que IA puede tomar mucho más que texto. Podemos dar imágenes de IA, PDF, sitios web, videos y más También puede generar más que texto. La IA puede producir imágenes, códigos, gráficos, audio y mucho, mucho más. Eso es un montón de medios diferentes. No obstante, recuerda lo que dijimos antes. La IA es un producto que utiliza un LLM, y un LLM es un modelo que toma entrada de Texas y genera texto como Así que volvamos a nuestro diagrama. Vamos a acercarnos. El producto de IA y mira el LLM subyacente. Observe que el LLM sólo toma texto. Todas las demás entradas se convierten primero en texto. Sabiendo esto, el caso ideal es dar el texto de la IA directamente y omitir ese proceso de conversión por completo. Esto se debe a que el texto transmite la mayor cantidad de información por palabra Déjame explicarte con el ejemplo. Digamos que hay una página web con resultados de un partido de fútbol reciente. ¿Cuántas palabras hay en esta página? IC uno, dos, tres, cuatro, cinco, seis, 789, diez, 11, 12. Entonces un total de 12 palabras. Podría darle a la IA este texto directamente, solo 12 palabras, o podría tomar una captura de pantalla de esa página web y darle esa imagen a la IA. La IA traduciría entonces esa imagen en la friolera de 2030 palabras visuales Eso es más de 170 veces más palabras por la misma cantidad de información. Entonces, en conclusión, Tex es más eficiente en la comunicación de información que las imágenes de texto. Como resultado de esto, por simplicidad, para tu proyecto, quédate con las tareas de texto y TextOut. Aquí hay otro ejemplo. Entonces quieres pedirle a HattBT comentarios sobre tus diapositivas. Tienes varias opciones para los formatos de descarga. , no descargues el slide deck como PDF Sin embargo, no descargues el slide deck como PDF y definitivamente no descargues como imágenes. En su lugar, descargue las diapositivas en formato de texto plano. Este formato de texto sin formato contiene solo el texto sin procesar para todas mis diapositivas sin ningún formato adicional o información innecesaria. Ahora puedo subir este archivo y pedirle a HattPT que proporcione comentarios sobre mis diapositivas Por suerte, mis diapositivas solo se proporcionan como texto sin procesar, lo que hace que sea eficiente para que Chat TPT procese En resumen, si desea alimentar un archivo a HachBT, exporte ese archivo en formato de texto sin formato cuando sea Hagamos un ejemplo más. Digamos que quiero preguntarle a HattBT sobre una entrada de blog que estoy leyendo No hagas capturas de pantalla de la página web. En su lugar, proporcione directamente a HattBT la URL de la página web, y encontrará que HTHBT realmente accederá a esa página web por nosotros, resumiendo esa Podemos verificar que HTPT acceda a la URL correcta haciendo clic en las fuentes Y en el lado derecho, veremos la página web original listada como cita. Esto significa que HatchBT pudo acceder al texto sin procesar en la página web y como antes, ingerir información de manera eficiente, ingerir información de manera eficiente En definitiva, dé direcciones URL de página web directamente para que HaChPT pueda acceder a la página web y extraer su contenido como texto sin procesar Para resumir esta lección en una comida para llevar, concéntrese en las tareas de texto a texto Esto significa alimentar datos de texto sin formato siempre que sea posible para nuestro proyecto. Y esto concluye ahora el primer subpaso del primer paso Hemos reducido nuestro proyecto centrándonos en las tareas de texto a texto En la siguiente lección, hablaremos sobre algunas tareas de texto a texto para las que la IA es más adecuada. Y si quieres obtener una copia de estas diapositivas y ver recursos adicionales, puedes acceder a esta URL. 3. Proyecto del alcance: capacidades: En esta lección, continuaremos discutiendo cómo enfocar tu proyecto. Ahora, para recapitular, actualmente estamos en el paso uno de un proceso de tres pasos Mi objetivo en este primer paso es ayudarte a reducir el alcance de tu proyecto. En la lección anterior, reducimos tu enfoque a las tareas de texto a texto Y en esta lección, voy a reducir aún más su enfoque a capacidades específicas de texto a texto. Primero, nuestro enfoque es construir una IA personalizada confiable y precisa para la producción. Entonces podríamos preguntar, ¿qué puede hacer la IA de manera confiable y precisa para la producción? Hay muchas tareas de este tipo, pero me enfocaré sólo en tres de ellas. Nuestra primera categoría es el resumen. Por ejemplo, Amazon utiliza la IA para resumir las reseñas de productos en una sección de clientes Slack usa IA para resumir canales, y Noon usa IA para resumir reuniones de Zoom por ti hay muchos ejemplos comerciales Solo hay muchos ejemplos comerciales de resumen. Ahora, probemos esto nosotros mismos. Digamos que diriges una panadería con cientos de reseñas. Te gustaría obtener información de esas reseñas para ayudar a que tu panadería crezca. En tu navegador, ve a chattbt.com. Verás una página como esta. Pegemos algunas reseñas y pidamos a HatchiBT que resuma esas Aquí está nuestro resumen. HattiBT dice que las opiniones sobre el croissant de almendra son mixtas, lo que parece una Puedes ver las reseñas tú mismo en esta URL para juzgar si estás de acuerdo o no. Entonces, en definitiva, la IA es bastante experta en el resumen. La IA también está lista para la producción para estructurar datos. Estructurar datos es una forma elegante de decir que la IA puede traducir globos de texto en tablas de datos bien organizadas Y a nivel de superficie, eso suena genial. Pero permítanme enfatizar, cool es un eufemismo. Ser capaz de tomar datos no estructurados y extraer datos estructurados limpios es en realidad una superpotencia de IA extremadamente útil Déjame explicarte con el ejemplo. Volvamos a nuestra panadería. De nuestras 671 opiniones, nos gustaría saber qué opinan nuestros clientes de nuestros productos horneados. Por ejemplo, ¿A los clientes les gustó el croissant de almendra? De hecho, primero preguntemos, ¿qué clientes incluso probaron el croissant de almendra Idealmente, tendríamos una tabla de datos bien organizada como esta, una lista de verdaderos para los que les gustó y falsos para los que no, no tenemos esa tabla. Tenemos globs y globs de reseñas como esta. Ahora necesitamos repasar y leer cada reseña, luego determinar qué críticas incluso mencionaron los croissants de almendra Hay muchas maneras de mencionar los croissants de almendra. En la revisión se podría decir croissant de almendra con almendra o pastelería de almendras Entonces podrías decir, solo busquemos la palabra almendra. Pero eso incluiría otros cruasanes, también, porque la panadería también vende croissants porque la panadería también vende chocolate y croissants de almendra de almendra de chocolate y croissants de almendra de arándanos. Entonces, en definitiva, detectar menciones de croissant de almendra es difícil, y eso se debe a que el texto desestructurado es realmente flexible Afortunadamente, sin embargo, la IA es perfecta para esto. Déjame mostrarte ir a chattbt.com. Vaya a esta URL para copiar el prompt. Después pega el prompt aquí. El aviso le da a ChachiBT una lista de reseñas de panadería y le pide que identifique a los amantes del Croissant de Alman Hit run, y obtienes una buena tabla de resultados. En lugar de leer las reseñas, podemos ver fácilmente qué clientes probaron el Croissant de enmienda Hay tres de esos revisores, y de esos tres, a dos les gustó. Como resultado, concluimos que 67% de los clientes que probaron el Croissant Amén les gustó Y con eso, podemos analizar fácilmente grandes cantidades de texto de esta manera, todo porque la IA puede convertir texto no estructurado en formatos estructurados Y ahora deberías poder ver lo valiosa que es estructurar los datos. Es una superpotencia para analizar datos. La tercera tarea para la que la IA está lista para la producción es la codificación y los pequeños pasos. Hay muchos casos de éxito en este espacio. Cursor mejora la productividad del desarrollador al ofrecer un editor de código basado en IA, que puede escribir y ejecutar código por usted. Lovable permite a cualquiera generar aplicaciones desde cero sin escribir ningún código ellos mismos Sin embargo, para tu primer proyecto, no pidas a AI que construya bases de código completas. Trata la IA como un ingeniero junior, tareas simples y pasos individuales. La IA es muy buena para generar fragmentos de codificación de inicio, para encontrar y corregir pequeños errores y agregar una característica que involucra solo unos pocos archivos. Veamos esto en acción. Ir a chattbt.com. Pidamos a HattBT para trazar un gráfico circular de Alman Croissant overs Según lo solicitado, ChachiBT comienza a escribir y escribir código, lo que ahora nos da un gráfico circular ChachiBT también nos da el código para la trama, que podríamos ejecutar En definitiva, la IA es muy capaz de escribir código en pequeños pasos. En resumen, la IA está lista para la producción para resumir, estructurar datos y codificar El resumen está integrado en los productos de Amazon, Slack y Notion estructuración de la información corporativa en un formato de búsqueda está dominada por la recopilación y el Intercom La codificación está dominada por el cursor y es amable. Por supuesto, la IA se puede aplicar de muchas otras formas diferentes. Pero aquí, nos enfocamos en capacidades que ya han encontrado éxito comercial. Ahora ha visto capacidades que los Tipts de chat personalizados pueden lograr con calidad de grado de producción Ahora hemos discutido varias capacidades de IA que ya han sido probadas comercialmente y repetidamente, lo que hace que estas capacidades sean razonables para confiar en nuestro primer proyecto. Puedes acceder a esta URL para todas las indicaciones que utilicé, enlazadas a las conversaciones de ejemplo completas y más recursos 4. Proyecto del alcance: tarea y métrica: En la última lección, vimos capacidades generales en las que la IA es mejor. Ahora, traduzcamos las capacidades generales en un proyecto específico. Para la primera parte, hemos reducido su enfoque al texto general de la tarea de texto En la última lección, limitamos aún más su enfoque a tres capacidades específicas, resumiendo, estructurando su enfoque a tres capacidades específicas, datos y codificando En esta lección, finalmente definiremos tu proyecto. Para tu proyecto, primero necesitas definir la tarea. ¿Qué hará la IA por ti? Después defina lo que tomará el LLM como entrada. Tomará reseñas, correos electrónicos, ensayos, y finalmente, definirá qué texto producirá el LLM como salida ¿Producirá resúmenes, tablas, viñetas? Veamos un ejemplo. A Busco un lugar para comer. Yummy cafe tiene una calificación baja, y quiero saber Mi primera reacción es que la IA resuma mis comentarios. Llenemos la plantilla del proyecto. Nuestra tarea es resumir las revisiones. Nuestro aporte serán revisiones, y nuestro resultado será un resumen. Esa no parece una definición útil. Entonces, seamos más específicos. La página web del restaurante, me desplazo por reseñas con calificaciones muy bajas. Una persona confundió este lugar con su restaurante hermano. Alguien más se quejó del orden en el que se sirvieron los platillos, y a la última revisión no le gustó la actitud del personal de espera Todas estas son preocupaciones válidas, pero personalmente solo me importa la comida. Entonces quiero filtrar las reseñas no alimentarias. Sabiendo que este es mi objetivo, ahora traduzcamos esto en un proyecto concreto. A nuestra plantilla. Me gustaría detectar críticas no alimentarias La entrada es una revisión de restaurante, y la salida es verdadera o falsa. Si la revisión deduce o no estrellas por razones no alimentarias. Ahora estamos en el negocio. Así de específica debe ser la definición de tu proyecto. Sin embargo, tenemos un componente más, la métrica. En un nivel alto, la métrica te indica si las salidas de la IA son buenas. Para comenzar, su primera métrica será, ¿encuentro razonables las salidas de la IA ? Evaluar primero a mano. Aquí hay una reseña que se queja del orden en que se sirvieron los platillos Preguntamos a la IA, ¿ esta opinión deduce estrellas por razones no alimentarias La IA hace una predicción. Sí. Ahora, ¿me parece razonable? Yo sí. La revisión está deduciendo estrellas por servicio, no comida La IA pasa esta primera comprobación. Aquí hay otra reseña que se queja de la frescura del pescado Preguntamos a la IA, ¿ esta opinión deduce estrellas por razones no alimentarias La IA hace una predicción. No. ¿No encuentro razonable? Yo sí. Esta revisión dedujo estrellas precisamente por razones alimentarias La IA pasa esta segunda comprobación. Aquí hay una reseña que muestra confusión sobre el nombre del restaurante. Preguntamos a la IA, ¿Esta opinión deduce estrellas por razones no alimentarias La IA hace una predicción. No. ¿No encuentro razonable? Esta vez, no lo sé. En la revisión se dedujeron estrellas por el nombre del restaurante, no por la comida La IA falla esta tercera comprobación. Aquí está el cuadro de mando de IA. Encontramos las salidas razonables dos de tres veces. Entonces, en conclusión, tu primera evaluación es que los resultados de la IA son en su mayoría razonables. Sin embargo, las mejores métricas cuantificarán la calidad. Entonces, seamos más específicos. Volviendo a nuestro cuadro de mando, encontramos que la IA era correcta dos de cada tres veces Entonces, decimos que la IA logró 67% de precisión. Ahora tu métrica es el porcentaje de revisiones que la IA clasifica correctamente Dicho de manera más sucinta, Nuestra métrica es precisión del modelo en las revisiones que hemos etiquetado como verdaderas o falsas Cierto de la revisión estrellas deductivas por razones no alimentarias. Ahora podemos tomar cualquier IA y calcular su precisión en nuestra tarea. Aquí está ahora nuestra definición de proyecto tonto. Hemos agregado la precisión métrica de la precisión con la que la IA predice verdadero o falso, en comparación con sus propias etiquetas en las reseñas de restaurantes Hagamos otro ejemplo. Digamos que estás organizando un Hackathon, y después de que el portal de envío en línea se cierre en la fecha límite, docenas de personas te envían por correo electrónico entradas tardías Su objetivo general es organizar las entradas tardías enviadas por correo electrónico. Más concretamente, tu tarea es detectar si un correo electrónico es una entrada de Hackathon La entrada es un correo electrónico. El resultado, sea o no el correo electrónico es en realidad un envío de Hackathon La métrica también es la precisión, cuántos correos electrónicos se clasifican correctamente como entradas o no. Ahora usando IA, podemos generar una tabla de datos y Voila. Ahora es mucho más fácil determinar qué envíos tardíos aceptar a escala sin tener que leer los 100 correos electrónicos para encontrar las entradas del Hackathon En resumen, defina la tarea, la entrada a tu IA, la salida de tu IA y la métrica, que determina qué tan buenas son las salidas de tu modelo. Con eso concluye esta lección. En esta lección, finalmente definimos tu proyecto después de bajar el alcance y eso concluye adicionalmente el primero de tres pasos Ahora has explorado tu proyecto y estamos listos para comenzar con él. Puede acceder a la CRL para obtener una copia de estas diapositivas y recursos adicionales 5. Evalúa modelos: prueba los mejores: Bienvenido de nuevo. En lecciones anteriores, redujimos nuestro enfoque a las tareas de texto a texto Luego capacidades específicas, luego defina la métrica de tarea. Esto completó nuestra primera tarea, abarcando el proyecto. Para nuestro segundo paso, evaluaremos modelos, para elegir el mejor modelo para nuestro caso de uso. Para elegir un modelo, evaluarás varios modelos en cuanto a su capacidad para completar tu tarea. Empezaremos con las mejores opciones porque queremos saber. ¿Alguna IA puede incluso completar nuestra tarea? Si la mejor IA no puede resolver tu tarea, entonces las IA menos inteligentes ciertamente tampoco lo harán. Entonces, comienza con la IA más inteligente. Según el sitio web de Open EI, si estás en los planes gratis o plus, GPD five thinking es tu modelo más inteligente Si estás en el plan Pro, GPD five Pro es tu modelo más inteligente Comencemos nuestras pruebas a través de chatbots, una interfaz simple para una prueba rápida Ir a chatbt.com. Verás una pantalla como esta. En la parte superior izquierda, expande el menú desplegable. A partir de este menú desplegable, verás rápidamente el modelo más rápido pero relativamente menos inteligente. Pensar, un modelo más inteligente. Usa esto si estás en los planes gratis o plus. Y por último, P, el modelo más inteligente. Usa esto si estás en el plan pro. Voy a usar GPT five thinking para que todos puedan reproducir mis resultados Ahora hemos seleccionado un LLM. Entonces, ¿qué debemos preguntar a Chat GBT? Usemos nuestro proyecto de la última lección. Recordemos, nuestro objetivo es filtrar las críticas no alimentarias. Los insumos son reseñas de restaurantes, y las salidas son verdaderas o falsas, verdaderas si las estrellas se deducen por razones no alimentarias Entonces para nuestro rápido, bien, dadas las opiniones de restaurantes, la salida es verdadera si una reseña deduce estrellas por razones no alimentarias Entonces incluyo tres reseñas. La primera reseña se queja del servicio, segunda se queja del sabor, y a la tercera le gusta la comida, pero sintió que el servicio era lento Esperamos que la IA luego devuelva verdadera porque la primera revisión deduce estrellas por servicio, false, porque la segunda reseña deduce star es precisamente para comida y La última revisión no deduce estrellas en absoluto. Probemos ahora este prompt. Primero, ve a esta UOL y copia el prompt. Después vuelve a chattbt.com. Pegar en el prompt. Golpeó a correr. ChattBTTS por unos segundos, luego le da respuesta, que es correcta, verdadera, falsa, falsa Como resultado, concluimos que IA puede completar nuestra tarea correctamente. Específicamente, GPT five completa nuestra tarea. Probar el chatbot no es suficiente porque los chatbots no son deterministas Esto significa que no devuelven los mismos resultados cada vez. Por ejemplo, vamos a pedirle a HathBT una broma de papá. Chat TBT hace una broma sobre espantapájaros. Hagamos esto de nuevo, exactamente el mismo prompt. HatchiBT hace una broma sobre el alfabeto. Haz esto una vez más. Charla TBT bromea sobre esqueletos Entonces, exactamente el mismo prompt arrojó diferentes respuestas cada vez Esto demuestra nuestro punto anterior que los chatbots no son deterministas Como resultado, necesitamos pasar de probar el chatbot a probar la API La API por defecto tiene mucha menos aleatoriedad inyectada. Entonces, si la IA completa la tarea una vez, podemos estar seguros de que la IA completará la tarea repetidamente. Ir a plataforma dotopen.com. Tu página web se verá así. Asegúrate de hacer clic en Iniciar sesión en la parte superior derecha si aún no lo has hecho. Luego haga clic en el tablero en la parte superior derecha. Nuestra página ahora se verá así. Haga clic en crear en el centro de la página. Ahora tu pantalla debería verse así. En la parte inferior derecha, haz clic en Borrar automático. Esto asegura que cada vez que presionamos Enviar, imitamos el mismo comportamiento que enviar llamadas API separadas Ahora pide un chiste de papá, pero antes de golpear Enter, ten en cuenta que este ejemplo específico puede costar hasta dos décimas de centavo Una vez que golpeas Run, JTBT hace una broma sobre el alfabeto. Pidamos otra vez una broma de papá. Asegúrate de que la opción Borrar automático en la parte inferior derecha esté seleccionada y envíala. JTBT hace exactamente la misma broma sobre el alfabeto con un cambio de puntuación menor Y lo intentamos de nuevo y obtenemos exactamente el mismo chiste del alfabeto. Los resultados son casi idénticos. Esto es mucho mejor que el chatbot, que cada vez devuelven respuestas completamente diferentes Por lo que podemos concluir que las llamadas API son en su mayoría deterministas, definitivamente mucho más que el chatbot Así que volvamos a probar nuestro prompt de proyecto de ejemplo a través de la API. Recuerda que este es nuestro aviso de antes. Esperamos que la IA devuelva verdadero, falso, falso. Vaya a esta URL para copiar de nuevo el prompt del proyecto de ejemplo. Luego de vuelta en plataforma hacer openai.com, pega ese prompt Antes de golpear Run, tenga en cuenta este ejemplo costará cuatro décimas de centavo La API GPD five primero devuelve tokens pensantes durante unos segundos. Entonces finalmente devuelve la respuesta definitiva, correcta, verdadera, falsa, falsa. Probemos una vez más. Y nuevamente, GPD five devuelve la respuesta correcta, verdadera, falsa, falsa Y una vez más. Y nuevamente, la respuesta correcta, verdadera, falsa, falsa. Entonces, como antes, GPD five completa correctamente nuestra tarea. Aún más importante, GPT five lo hace repetidamente. Esta es una gran victoria. Significa que nuestro proyecto ahora puede completar repetidamente nuestra tarea usando la API de GPD five En resumen, prueba primero la mejor, la IA más inteligente. Primero a través de los bots de chat para simplificar, luego a través de la API para la reproducibilidad, y eso concluye nuestras pruebas a través de la API Generalmente, en realidad hemos terminado de probar la mejor IA. Y la siguiente lección, optimizaremos los costos probando modelos más rápidos y económicos. En caso de que te estés preguntando cómo calculé el costo de una llamada API, explicaré e incluiré más recursos en el sitio web del curso en esta URL. 6. Evalúa modelos: optimiza costos: Bienvenida de nuevo. Como resumen, estás en el paso dos de tres Pero hasta ahora, solo has probado la mejor IA. Probamos la mejor IA vía chat, luego probamos vía API. Ahora es el momento de optimizar el costo y encontrar el modelo más barato que aún pueda completar nuestra tarea repetidamente. Recordemos de antes que GPD five completó nuestra tarea de proyecto de ejemplo exitosa y repetidamente, y costó alrededor de cuatro décimas de Incluiré todos los cálculos de costos en nuestro sitio web del curso si te interesa. Aquí está el costo de GPD five para nuestro ejemplo, junto con sus costos por token, según la página de precios de API de OpenAI Probemos el siguiente modelo más barato de nuestra lista, GPT five Mini su selector de modelo, seleccione GPD five Mini Tu pantalla ahora debería parecerse a la mía. Pega en el prompt del proyecto de ejemplo, y GPD five Mini responde true false false, completando correctamente la tarea Veamos el costo. Este ejemplo costó 700 de un centavo Y una vez que añadimos eso a nuestra mesa, podemos ver que hemos reducido cinco veces el costo de completar nuestra tarea. Probemos ahora nuestro modelo más barato, GPT five Nano. Desde el selector de modelos, elija GPT five Nano Tu pantalla ahora debería parecerse a la mía. Pegar en el prompt del proyecto de ejemplo, y una vez más, obtenemos true false false, la respuesta correcta. Mira el costo otra vez. El costo de nuestro ejemplo es ahora tres centésimas de centésimas Y en nuestra mesa, podemos ver que ahora hemos reducido el costo de completar nuestra tarea otras dos veces. Pero vamos a reducir aún más los costos. Hasta el momento, hemos seguido razonando en el nivel medio predeterminado. Ahora queremos establecer el razonamiento en mínimo en su lugar. Déjame mostrarte cómo hacer eso. De vuelta en esta página web, junto al nombre del modelo, haga clic en el icono de configuración. En el menú, seleccione esfuerzo de razonamiento. Esto te dará otro desplegable. Seleccione mínimo, que luego se verá así. Haga clic fuera de la ventana emergente. Luego pega en tu prompt de proyecto de ejemplo. Y lo suficientemente loco, GPT cinco Nana sin razonamiento todavía responde verdadero falso falso, completando la tarea a la perfección. Mira el costo ahora. El costo de nuestro ejemplo es ahora de 4000th de centavo, dándonos esta tabla final de resultados Reducimos aún más el costo en otras siete veces. Esa es una descabellada reducción de costos. Dados estos resultados, declaramos GPT five Nano sin razonar nuestro ganador Ahora que completa las tres partes en el paso dos, prueba vía chatbot, prueba vía API, y finalmente, encuentra el modelo más barato que aún funciona Esto produjo el modelo Open EI más barato que pudo resolver con éxito nuestra tarea GPT cinco Nano En resumen, prueba primero la mejor, la IA más inteligente. Primero a través de los bots de chat para simplificar, luego a través de la API para la reproducibilidad, luego pruebe la IA iterativamente más barata y más rápida Ahora hemos optimizado los costos con éxito, reduciendo los costos en más de 88 veces, y eso es todo para evaluar modelos. Esto concluye el paso dos en su mayoría. Hemos terminado con los modelos propietarios, pero ahora necesitamos repetir este proceso para otra amplia categoría de modelos de código abierto de opciones. Como de costumbre, puedes encontrar todos los cálculos, indicaciones y más recursos en esta URL 7. Evalúa modelos: de código abierto: Exploremos una categoría más de modelos, los modelos de código abierto. Actualmente estamos en el segundo de tres pasos donde estamos evaluando modelos para determinar cuál usar. Afortunadamente, hay un centro estandarizado para todos los modelos de código abierto en huggingface.co Visita esta URL y verás un montón de opciones. Es abrumador. Aquí hay algunas heurísticas, sin embargo, para navegar por este gran repositorio de modelos Regla número uno, usa modelos sintonizados con instrucciones. Por lo general, los modelos sintonizados por instrucción han instruido en el nombre en alguna parte La razón de esta regla es que los LLM se entrenan en tres etapas En la primera etapa llamada pre entrenamiento, LLM simplemente predicen la siguiente palabra En la segunda etapa llamada SFT o afinación fina supervisada, los modelos aprenden a responder preguntas En la última etapa llamada Refuerzo Aprendizaje con retroalimentación humana o RLHF, los modelos aprenden a alinear las respuestas con las preferencias humanas, siendo útiles, honestos e Técnicamente hablando, solo el segundo paso se llama sintonía de instrucción, pero prácticamente hablando, los modelos de código abierto sintonizados por instrucción han pasado tanto por SFT como por RLHF En cualquier caso, no quieres un modelo que solo haya pasado por pre-entrenamiento porque esos modelos auto completan preguntas, no responden preguntas. Entonces, en resumen, regla número uno, usa modelos sintonizados con instrucciones. Para la regla número dos, use modelos pequeños. Obviamente esta no es una regla dura y rápida, pero la recomiendo encarecidamente. Ahora, digamos que me ignoras. ¿Y si quieres usar modelos masivos de código abierto, los más grandes y los mejores? Bueno, veamos qué modelo de código abierto es el mejor. Aquí está la arena del chatbot. Los modelos Gemini Open AI y Grock four son todos propietarios. Por lo que el modelo de código abierto de mayor rango es Kimik. Vayamos al sitio web de Kimi K. Según esta página web, Kimi K es de 1 billón tan realista, necesitaríamos 16 H 100 GPU para ejecutar este modelo Primero, eso es caro. 16 H 100 GPU cuestan $64 por solo 1 hora de uso. Segundo, es complicado hacer inferencia para un modelo así de grande Todo esto para decir, si quieres usar modelos de código abierto de última generación, debes usar API que sirven modelos de código abierto porque sus precios se benefician de economías de escala. Es más barato para ti llamar a una API que para ti ejecutar estos modelos masivos tú mismo. Para más detalles, puedes ver esta entrada de blog, que voy a enlazar en nuestro sitio web del curso. Para usar modelos de código abierto de última generación, sigamos los mismos tres subpasos Prueba a través de chatbot, prueba vía API y optimiza costos. A partir del primer subpaso, probemos vía chatbot Ir a gpthss.com. Recuerda, este fue nuestro aviso de antes. Esperamos que la IA devuelva verdadero, falso, falso. Primero, vaya a esta URL y copie el prompt. Entonces verás una página web como esta. Elegí continuar con razonamiento visible, pero puedes elegir cualquiera de las dos opciones. Ninguna opción cambia la calidad de las respuestas de la IA. Pegar su mensaje y presionar Ejecutar. Entonces verás verdadero falso falso, la respuesta correcta. En la barra lateral izquierda, ahora haga clic en GBTOSS 20 mil millones, el más pequeño de los dos modelos de código abierto de Open AI Después en la parte superior derecha, haz clic en Nuevo chat. Tu pantalla entonces se verá así, pega en el prompt una vez más y pulsa Ejecutar. Entonces una vez más, verás verdadero falso falso, la respuesta correcta. Hemos visto que lo mejor de la IA de código abierto puede completar nuestra tarea. Ahora volvamos a probar vía API. En huggingface.co, muchos modelos de código abierto tienen una sección en la parte inferior derecha donde puede enviar mensajes uno fuera al LLM para probarlo Esto tampoco es gratuito técnicamente, pero puedes enviar solicitudes sin agregar información de facturación. Pegue en su prompt, y Deep Seek R one pass. Da como resultado verdadero falso falso. Eso significa que la IA de código abierto, como Deepsk también puede resolver nuestra tarea Deepsek R one habría costado un tercio de centavo para ejecutar este ejemplo Como antes, encontremos ahora el modelo más barato que pueda completar nuestra tarea. Probemos el siguiente modelo más barato. Deep Seek R un Lama 7 mil millones. Este modelo también obtiene la respuesta correcta, verdadera falsa falsa. Deep Seek Lama le costó un sexto de centavo, así que ahora hemos bajado nuestro costo a la mitad Ahora probemos el próximo Deep Seek V tres más barato. Técnicamente, Deep Seek V tres respondió verdadero falso falso correctamente. Simplemente lo hizo con mucho texto extra. Desafortunadamente, si Deep Seek genera diferentes formatos cada vez, nuestro código de proyecto no podría analizar la salida LLM de manera confiable Por suerte, tenemos una manera de arreglar esto, que te mostraré más adelante. Pero por ahora, Deep Seek V tres no pasa. Tiene la inteligencia pero no el formato. Probemos el siguiente más barato de nuestra lista, Lama 370 mil millones Abrazando a la Cara lamentablemente me sigue dando errores. Así que encontré otro sitio web al azar. No necesariamente avalo, pero cualquier sitio web servirá. Y parece que Lama 370 mil millones responde correctamente con verdaderas caídas falsas Entonces pasa Lama 370 mil millones. Probemos el siguiente modelo más barato de nuestra lista. Profundo Busca Quin. modelo destilado más pequeño de Deep Seek RO simplemente escupe una cadena infinitamente larga Entonces este es un duro fracaso. Quin fracasó catastróficamente, como vimos. Y con eso dicho, ya hemos completado nuestra tabla de resultados. Podemos volver a enumerar todos los precios y centavos, luego comparar los precios de Open AI con precios de código abierto para comparar inteligencia por dólar. Aquí están los ganadores de cada categoría. Observe la diferencia de costo. De acuerdo, podría haber probado modelos de código abierto más pequeños que son más baratos que 70 mil millones pero más capaces que Quinn, pero más pequeños, y pueden estar ejecutando tu propia máquina de forma gratuita, así que no tiene sentido probar sus API La API Open EI es 15 veces más barata para esta tarea específica para detectar correctamente críticas no alimentarias en base a nuestros resultados anteriores Generalmente, para la vanguardia de la clase de modelos de vanguardia, los modelos patentados superan a los modelos de código abierto en inteligencia por dólar Entonces, si estamos considerando el código abierto, alejémonos de la vanguardia y apegémonos a pequeños modelos de código abierto. Estos modelos en realidad pueden ser realmente económicos para funcionar por su cuenta. Entonces, en resumen, recomiendo usar pequeños modelos de código abierto. Al menos por ahora, para los grandes modelos de código abierto de última generación, hemos completado nuestros tres subpasos Esto completa la evaluación para grandes modelos de código abierto. En la siguiente lección, veremos pequeños modelos de código abierto, lo suficientemente pequeños como para funcionar gratis. Como de costumbre, puedes encontrar todos los enlaces, cuadernos y otros recursos en el sitio web del curso. 8. Demostración: ejecutar un modelo de código abierto: Ahora ejecutemos modelos de código abierto de forma gratuita. Actualmente estamos en el segundo de tres pasos. Ahora estamos probando pequeños modelos de código abierto. Por ahora, tratemos a Lama 3.28 mil millones como nuestro default. Este es un modelo de lenguaje diminuto que debería caber en su computadora portátil. Por supuesto, hay muchos otros modelos de código abierto. Pero antes de discutirlos, las próximas diapositivas se referirán a algunos términos como GPU, nodo, RAM y precisión. Si no estás familiarizado con esos términos, puedes ignorar con seguridad mi explicación y solo enfocarte en la comida para llevar También incluiré definiciones en el sitio web del curso en esta URL. Ahora bien, volviendo a la regla número dos, ya hemos dicho anteriormente que usemos modelos pequeños. Pero seamos más precisos sobre lo que significa pequeño. Por pequeño, me refiero a modelos de GPU individuales, que es mucho más simple que GPU múltiple y especialmente los múltiples nodos para la inferencia. Ahora que nos hemos reducido a código abierto de GPU única, ¿qué modelos de código abierto caben en una sola GPU? Bueno, eso depende de dos factores, la RAM que tenga tu GPU y la precisión de tu modelo. Pondré la explicación completa en la página web del curso. Pero por ahora, diremos que las LLM con 16 mil millones o menos de parámetros pueden caber en una sola GPU Usemos esto para encontrar un modelo de código abierto para usar. De vuelta en el sitio web de Hugging face, en el lado izquierdo, filtrar por talla de modelo Queremos 16 mil millones de parámetros o menos, pero 12 mil millones es el valor más cercano que podamos usar. Después la parte superior derecha, ordena los modelos por me gusta. Después de ambas modificaciones, verás una página como esta. Mirando el número de descargas, clicamente vemos a un ganador Lama 3.18 mil millones Instruct, que tuvo más de 9 millones de descargas en clicamente vemos a un ganador Lama 3.18 mil millones Instruct, que tuvo más de 9 millones de descargas en el último mes. Vamos a usar este modelo. Para nuestros experimentos de código abierto, utilizaremos un modelo de 8 mil millones de parámetros de la familia Lama de LLM Este es uno de los modelos más descargados durante el último mes de Hugging Face Y lo que es más importante, hemos determinado que este modelo se ajusta a las GPU que estamos usando Ve a esta URL para abrir el código de inicio que he escrito para ti. Deberías ver un cuaderno como éste. Ahora en la parte superior del archivo, haz clic en Ejecutar todo. Es posible que veas un error. Si ves un error como este, entonces tendrás que ejecutar cada paso manualmente. Para ejecutar manualmente, mueve el cursor para que se sitúe sobre el paso uno Aparecerá un botón Ejecutar. Haga clic en ese botón Ejecutar. Después de esto, aunque el paso uno todavía se esté ejecutando, inmediatamente puede pasar el cursor sobre el paso dos y hacer clic en su botón Ejecutar Entonces deberías ver líneas punteadas como esta que indican que el paso dos está en cola. Ya sea que presione ejecutar todo o ejecutó los primeros pasos manualmente, su computadora portátil ahora está instalando requisitos previos y descargando pesos Esto tomará de cinco a 10 minutos. Entonces durante ese tiempo, continúe viendo este video recorriendo. Después de unos minutos, el paso uno terminará. Si ve una marca de verificación verde, significa que el paso uno se completó correctamente Después de unos minutos más, paso dos debería terminar también. Nuevamente, deberías ver una marca de verificación verde que indica éxito Ahora, ya sea que hayas corrido o no el paso tres, al lado del paso tres, haz clic en Ejecutar. Después de unos segundos, veremos las salidas de Lama discutiendo el sentido de la vida. Ahora deberías ver el prompt. Ahora deberías cambiar el prompt a lo que desees y presionar el botón Ejecutar una vez más. Trata esto como un bot de chat personal. Puedes preguntar o decir lo que normalmente dirías a Chat GBT Por ejemplo, podemos hacer que Lama nos explique algunas matemáticas o que Lama nos cuente sobre nuestra plataforma de aprendizaje en línea favorita Esta es efectivamente tu propia IA ejecutándose en la Nube. Nadie más que usted está usando este LLM dedicado. Ahora es el momento de probar Lama en nuestro proyecto de ejemplo. Corre atropellado en la última celda de aquí para probar la capacidad de Lama para identificar críticas no alimentarias Pero desafortunadamente, Lama se equivoca, diciendo que tanto la primera como la tercera críticas son ciertas que ambas son críticas no alimentarias En otras palabras, Lama predice verdadero falso verdadero en lugar de verdadero falso falso Arreglaremos esto en la siguiente lección sin entrenar al modelo. Eso es. Ahora ejecutamos nuestro primer LLM de código abierto, y ahora finalmente hemos terminado el segundo de tres pasos Como mencioné antes, nuestro siguiente paso es refinar la calidad. En particular, mejoraremos esta capacidad de LLM de código abierto para completar nuestro proyecto de ejemplo 9. Perfecciona la calidad: entradas de ingeniería: En esta lección, vamos a mejorar nuestras capacidades de LLM cambiando nuestras entradas Generalmente, esto se llama ingeniería rápida. Ahora estamos en el tercero de tres pasos, y ahora estamos refinando la calidad. Aquí hay dos subpasos. El primero de los cuales es diseñar nuestros insumos. Si aún no lo has hecho, ve a esta URL para abrir el código de inicio que te he escrito. Si aún tienes tu libreta de la última lección abierta, usa la misma libreta. Si está abriendo este cuaderno por primera vez, en la parte superior del archivo, haga clic en Ejecutar todo. Los dos primeros pasos tomarán alrededor de cinco a 10 minutos, así podrás seguir viendo este paseo mientras tanto. Recordemos de nuestra lección anterior, Lama 8 mil millones no lograron completar nuestra tarea El formato de las salidas y la precisión fueron ambos apagados. Nuestro primer enfoque para solucionar esto es ser específicos. Suena como un consejo tonto, pero basta con especificar el formato. Por ejemplo, proporcione tres líneas de salida para cada línea, denote verdadero o falso, sin texto extra, sin formato He agregado esto a su libreta ya bajo una celda titulada tip one. En su cuaderno, desplácese hacia abajo hasta la sección de demostración de entradas de estructura, como se muestra aquí. cursor sobre la celda que dice tip uno, luego haga clic en el botón Ejecutar que aparece Después de unos segundos, deberías ver la siguiente salida, true, false, true. Las salidas siguen siendo incorrectas. Esperamos verdadero, falso, falso, pero arreglamos el formato con solo agregar algunas instrucciones al prompt. Nuestro siguiente enfoque es dar ejemplos. Vamos a agregar algunos. Ahora agreguemos tres ejemplos de reseñas. Cinco de cinco, el pollo estaba salado, pero bueno, tres de cinco, el marinero estaba demasiado agrio, tres de cinco, el servidor no fue paciente Y por último, agreguemos las salidas deseadas. Las dos primeras revisiones involucran críticas alimentarias, y la última revisión involucra una crítica no alimentaria Entonces esperamos falso falso verdadero. He agregado esto a su libreta ya en una celda titulada tip two. Desplázate hacia abajo y coloca el mouse sobre esta celda titulada Consejo dos Da clic en el botón Ejecutar a los pares, y después de unos segundos, verás verdadero, falso, verdadero. Desafortunadamente, las salidas siguen equivocadas, pero tenemos un truco más. Para el tercer enfoque, pediremos una cadena de pensamiento. En definitiva, pídele a Lama que muestre su obra. En nuestro prompt al modelo, simplemente le preguntaremos la primera razón paso a paso. Después especificamos el formato de salida con mucha precisión. Como de costumbre, ya he agregado esto a su libreta. Desplázate hacia abajo, coloca el cursor sobre este título de celda Consejo tres y haz clic en el botón Ejecutar que aparece Después de unos segundos, Lama finalmente predice correctamente. Vemos un bloque de pensamientos que pedimos y las salidas correctas true false false. Entonces ahora podemos decir que Lama 3.18 mil millones pueden completar nuestra tarea Resumen, aplicamos tres consejos. Sea específico, brinde ejemplos y pida una cadena de pensamiento. Estos tres juntos permitieron que nuestro modelo Lama identificara exitosamente críticas no alimentarias Ahora bien, ¿y si usamos este nuevo y mejorado prompt en nuestros modelos desde antes? Parece que Deep Seek V three ahora responde con éxito la pregunta con verdadero falso falso, pero Quin 1.5 mil millones todavía produce basura sin sentido Como resultado, nuestros resultados de código abierto ahora se ven así en un nivel alto al comparar IA abierta con los precios de código abierto, Pei sigue ofreciendo una inteligencia mucho mayor por dólar, aunque ahora tenemos un Lama en funcionamiento de 8 mil millones que puede producir respuestas correctas de manera confiable en hardware de nivel gratuito, incluso más barato que todos los anteriores En resumen, sé específico, da ejemplos y pide una cadena de pensamiento. Eso es todo para el primer subpaso ingeniería de nuestras entradas de modelos Entonces, en resumen, hemos mejorado con éxito la capacidad de Lama para completar nuestra tarea de ejemplo En la siguiente lección, haremos un conjunto final de mejoras para que nuestro modelo de código abierto funcione manera robusta en grandes cantidades de datos Como de costumbre, puedes encontrar todas las indicaciones y el código de inicio que utilicé en esta URL 10. Perfecciona la calidad: restringe las salidas: En esta lección, vamos a mejorar nuestras capacidades de LLM estructurando nuestros resultados Una palabra de advertencia. Esta lección cuenta con mucho código. Si te sientes incómodo con el código, solo concéntrate en las conclusiones que discuto en lugar del código en sí Este es nuestro tercero de tres pasos. En la última lección, diseñamos nuestros insumos para mejorar la calidad de las respuestas del modelo. En esta lección, mejoraremos la calidad limitando nuestros resultados Si aún no lo has hecho, ve a esta L para abrir el código de inicio que te he escrito. Si aún tienes tu libreta de la última lección abierta, usa la misma libreta. Si está abriendo este cuaderno por primera vez en la parte superior del archivo, haga clic en Ejecutar todo. Los dos primeros pasos tomarán alrededor de cinco a 10 minutos, así podrás seguir viendo este paseo mientras tanto. Recordemos de nuestra demostración de código abierto, Lama 8 mil millones no lograron completar nuestra tarea El formato de las salidas y la precisión fueron ambos apagados. Reproduzcamos de nuevo este resultado. En su notebook, desplácese hacia abajo hasta la demostración de salidas de estructura. Pase el cursor sobre el ejemplo A y haga clic en Ejecutar. Obtendrás este blob de texto. Es a la vez incorrecto e incorrectamente formateado. Queremos una lista de verdaderos o falsos. Arreglar esto, en la lección anterior, aplicamos tres consejos. Sea específico, brinde ejemplos y pida una cadena de pensamiento. Después de aplicar estos consejos, Lama produjo las salidas correctas true false false No obstante, la corrección llegó a un costo. El prompt original tomó 288 caracteres. Sin embargo, el nuevo prompt toma 1,312 caracteres. Esa es la friolera de entrada 4.5 veces más larga. Eso es un montón de insumos. Entonces, ¿podemos mejorar el formato de salida y la corrección sin aumentar el número de tokens de entrada? Y la respuesta es, claro, sí, déjame explicarte. Aquí está el LLM Toma texto como entrada y produce texto como salida. En este caso, nuestro insumo son nuestras frutas de banano. Y desgraciadamente, las salidas LLM. Esa ni siquiera es una respuesta válida a la pregunta. Para solucionar esto, forzamos al LLM a generar solo sí o no. De esa manera, aunque la salida sea incorrecta, al menos la salida es válida. Para ello, necesitamos modificar este paso al final, cómo los LLM traducen los resultados en palabras Vamos a acercarnos. El LLM en realidad primero genera una lista de números Estos números son en realidad probabilidades que corresponden a ciertas palabras En nuestro ejemplo, la primera probabilidad es la probabilidad de sí. El segundo, la probabilidad de no, el tercero a R, y el último a es. La probabilidad más alta es 60%, y la palabra correspondiente es R. Así que finalmente sacamos R. Así es como el LLM predice normalmente, pero nuestro objetivo es generar solo sí o Entonces hagamos algunos cambios. Primero, hacer caso omiso de todas las demás palabras. Considera solo sí o no. Y ahora tomamos la probabilidad mayor, 10%, lo que corresponde a sí. Por último, sacamos sí. Y con eso, hemos logrado constreñir nuestro LLM para generar solo sí o no, tomando la palabra válida de mayor probabilidad En este ejemplo, solo queríamos sí o no. Entonces usamos las probabilidades de estas dos palabras y simplemente elegimos la más probable de las dos Ahora nuestro LLM se ve obligado a generar sí o no, y lo que es más importante, lo hicimos sin cambiar el número de tokens de entrada Vuelva a su computadora portátil y desplácese hacia abajo hasta la configuración del paso cero. Pase el mouse sobre la celda y haga clic en Ejecutar. No verás ninguna salida para el paso. Ya estás listo. Para nuestro primer ejemplo, vamos a forzar verdadero o falso. Equivalentemente, podemos decir que vamos a forzar un booleano. Un booleano es un verdadero o falso. Por ejemplo, uno, pedimos a los M son frutos de banano y salida forzada a ser verdadera o falsa. Ahora, pase el cursor sobre el ejemplo uno y haga clic en Ejecutar. Esto generará un único verdadero booleano. Esto es correcto. Los plátanos son frutas. Para nuestro siguiente ejemplo, forzaremos a tres booleanos en lugar de solo uno Ahora, comprobamos si los plátanos, las almendras y las papas son frutas. Mueve el mouse sobre el ejemplo dos y presiona Ejecutar. Ahora verás las salidas true, false false. Esto es correcto. Ahora veamos si podemos usar esto para restringir el formato de salida para nuestras críticas no alimentarias Pase el cursor sobre el ejemplo B y, a continuación, haga clic en Ejecutar. Y esta salida son tres booleanos. El formato de salida es válido. Desafortunadamente, la salida sigue siendo incorrecta, sin embargo. Debe ser verdadero, falso, falso, no verdadero, falso, verdadero. Así que sigamos adelante. Para nuestro tercer ejemplo, obligaremos al modelo a razonar paso a paso. Para este paso, le pediremos al modelo que razone primero. Después fuerce al modelo a generar texto entre las etiquetas de pensamiento. Puedes elegir el formato que quieras para pensar. Este es solo el formato que elegí. Como antes, el aviso es verificar si los plátanos, las almendras y las papas son frutas. Mueva el mouse sobre el ejemplo tres y, a continuación, haga clic en Ejecutar. Esto tardará algún tiempo en correr unos 45 segundos más o menos. Entonces verás la salida final con el razonamiento correcto y aún mejor las salidas correctas true, false, false. Ahora, apliquemos las mismas salidas estructuradas a nuestro proyecto de ejemplo para críticas no alimentarias Pase el cursor sobre el ejemplo C y haga clic en Ejecutar. Verás el razonamiento así como la respuesta correcta al final. Ahora estructurando nuestras salidas, hemos mejorado la calidad de nuestro modelo y hemos forzado las salidas a coincidir con un formato específico. Eso es un triunfo. También hemos acortado drásticamente la longitud del prompt. El prompt original fue de 288 caracteres. De la última lección, necesitábamos 1,312 caracteres. De esta lección, solo necesitábamos 386 caracteres, junto con salidas estructuradas para lograr la respuesta correcta. Con una ingeniería rápida, necesitábamos un aviso 4.5 veces más largo para producir las salidas correctas. Con salidas estructuradas, tenemos un prompt mucho más corto, solo 1.3 veces más largo. Y estamos garantizados que la salida siempre será válida. Esto no quiere decir que uno sea mejor que el otro, pero quiero enfatizar que ingeniería rápida y las salidas limitantes en realidad se usarán juntas mayor frecuencia para maximizar la calidad del modelo Ahora, intentemos restringir las salidas para un modelo propietario, es decir, los modelos de IA abierta también Ir a platform.openi.com. Tu página web se verá así. Asegúrate de hacer clic en Iniciar sesión en la parte superior derecha si aún no lo has hecho. Luego haga clic en el tablero en la parte superior derecha. Haz clic en Crear en el centro de la página, y deberías ver una página como esta. Haga clic en el modelo Picker. En el menú desplegable, selecciona GPT five Nano y tu pantalla ahora debería verse así En la parte inferior derecha, asegúrate de seleccionar Borrar automático. Después, junto al nombre del modelo, da clic en el icono de Configuración. Esto abrirá un menú de configuración. Haga clic en el menú desplegable de formato de texto y, en el menú desplegable, puede hacer clic en Seleccionar esquema JSON Para que pueda configurar salidas restringidas. Asegúrate de que sea un esquema JSON y no un objeto JSON. Esto abrirá un diálogo como este. Pegue lo siguiente, que realmente obtendrá de esta URL. Copie el esquema JSON de salida restringido. Después pega aquí el esquema JSON. Desplázate hasta la parte inferior del cuadro de diálogo y haz clic en Guardar. Veremos el esquema JSON reflejado en el menú aquí. A continuación, haga clic fuera del menú. Desde esta URL, copie el prompt de ejemplo del proyecto de antes. Pegue el mensaje del proyecto de ejemplo aquí y presione Ejecutar. Y ahora tenemos la salida en formato JSON. Prueba los cambios aleatorios que quieras al prompt, el EPI siempre devolverá salidas en este formato Y con eso, ha restringido con éxito las salidas para hat GPT En resumen, la estructuración de salidas obliga a que la salida sea válida. Podemos forzar sí o no, podemos forzar números, podemos forzar cualquier formato en particular que queramos tanto para modelos de código abierto como propietarios. Hemos discutido cómo funciona, un ejemplo sencillo para identificar frutos y una mejora para nuestra detección de críticas no frutales Ese es ahora el final de nuestro tercer paso. Hemos visto dos formas de mejorar la calidad de nuestro modelo sin formación de ningún tipo, y esto concluye nuestra lección sobre la estructuración de resultados. Y de hecho, con eso concluye nuestro tercero de tres pasos. Y ahora solo terminas el inicio de tu viaje construyendo con IA. Estos son los primeros pasos que todos deben dar para un proyecto que involucre IA. Puede acceder a esta URL para obtener una copia del código de inicio, otras indicaciones y más recursos En la siguiente lección, concluiremos la clase. 11. Conclusión: Has llegado hasta el final del curso. Et cierra con un rápido resumen de lo que has aprendido. Primero, alcance tu proyecto. Para ello, lo desglosamos en tres subpasos. Reduzca su enfoque a la tarea general de texto a texto. Luego, reduce tu enfoque al texto probado comercialmente establecido a las capacidades de texto, resumen, estructuración de datos y codificación Finalmente, defina sus entradas, salidas, su tarea y su métrica. Como ejemplo, esta fue la descripción del proyecto para detectar críticas no alimentarias Para nuestro segundo paso, evaluar modelos, para que podamos elegir uno para usar. Para ello, nuevamente tenemos tres subpasos. En un nivel alto, parte de la mejor y más inteligente IA. Pruebe modelos a través de chat bot, las interfaces más simples y fáciles de usar, luego pruebe modelos a través de una API para que sus resultados sean más repetibles y reproducibles Finalmente, optimice por costo probando modelos más baratos y rápidos para ver si completan su tarea con éxito. Una vez que hemos escogido un modelo, refinamos la calidad. Para ello, teníamos dos subpasos. Comience a mejorar la calidad refinando sus insumos. A esto lo llamamos ingeniería rápida. Después, constreñir las salidas. Esto puede mejorar aún más la confiabilidad y la calidad de su modelo. Y eso completa nuestro proceso de tres pasos, que ahora puedes usar para construir cualquier proyecto que involucre IA. Esto es solo el comienzo, pero es una base sólida para comprender qué tan bien la IA puede lograr su tarea. Ahora, usando el proceso anterior como guía, aplique esto a su propio proyecto y publique el resultado en la pestaña Proyecto de cursos. Siéntete libre de usar uno de mis proyectos ejemplificados o crear uno propio Estoy muy emocionada de ver lo que creas. Si quieres saber más sobre las clases de seguimiento, sígueme en Skillshare y echa un vistazo a mis otros cursos Enhorabuena. Estoy llegando hasta el final del curso.

Inteligencia artificial para principiantes: crea una ChatGPT personalizada en 3 pasos, gratis

Alvin Wan, Research Scientist

Ve esta clase y miles más

Ve esta clase y miles más

Lecciones en esta clase

1.

INTRODUCCIÓN

1:14

2.

Proyecto de alcance: texto a texto

5:52

3.

Proyecto del alcance: capacidades

5:57

4.

Proyecto del alcance: tarea y métrica

5:32

5.

Evalúa modelos: prueba los mejores

6:22

6.

Evalúa modelos: optimiza costos

3:40

7.

Evalúa modelos: de código abierto

7:03

8.

Demostración: ejecutar un modelo de código abierto

4:32

9.

Perfecciona la calidad: entradas de ingeniería

4:25

10.

Perfecciona la calidad: restringe las salidas

9:18

11.

Conclusión

2:00

Acerca de esta clase

Conoce a tu profesor(a)

Alvin Wan

Habilidades relacionadas

Proyecto de clase práctica

Valoración de la clase

¿Por qué unirse a Skillshare?

Aprende desde cualquier lugar

Clases relacionadas

Transcripciones