Transcripciones
1. Introducción al curso: Hola, soy Dimple Sangui, y tengo más de 25 años de
experiencia liderando programas de transformación a gran escala He liderado estos programas en organizaciones de
Fortune 500
como Cognizant, HSBC, CAP Gemini, y
también he capacitado a miles de
profesionales en analítica, IA y lean También he realizado
capacitación de liderazgo a nivel global. En esta clase,
aprenderás a diseñar agentes de IA
efectivos. Usando patrones prácticos
como encadenamiento rápido,
enrutamiento, evaluadores
y orquestadores Estos se basan en principios de diseño de
agentes del mundo real. Esta clase es para profesionales y líderes de productos,
consultores y profesionales de IA
que desean ir más allá las indicaciones y crear flujos de trabajo de IA estructurados
y confiables No necesitas codificación avanzada, solo una comprensión básica de
cómo funcionan los modelos de lenguaje de gran tamaño. El proyecto de tu clase es diseñar un sistema de agentes de IA
que funcione como un diagrama
para una tarea real. Mapear el flujo de trabajo,
escribir indicaciones y reflexionar sobre
sus opciones de diseño He mencionado los detalles en la sección de descripción
del proyecto de Skillshare Si quieres entender cómo funciona realmente la IA
agéntica en la práctica, esta clase te dará un marco
claro y utilizable Empecemos. Te veo en
primera clase.
2. Desarrollo de LLM efectivo: Construyendo agentes efectivos.
Durante el último año, hemos trabajado con
docenas de team building grandes modelos lingüísticos,
agentes en todas las industrias. Consistentemente, las implementaciones más
exitosas no
fueron el uso de marcos complejos o bibliotecas especializadas. En cambio, estaban construyendo con simples patrones componibles ¿Qué son los agentes? Los agentes se definen
de varias maneras. Algunos clientes definen a los agentes como sistema
completamente autónomo que opera forma independiente durante períodos
prolongados utilizando diversas herramientas para
realizar tareas complejas. Otros usan el término que describe implementación
más prescriptiva que sigue flujos de trabajo
predefinidos En antrópico, categorizamos todas estas variaciones
como sistema agéntico, pero trazamos una importante distinción
arquitectónica entre flujos Los flujos de trabajo son sistemas
donde las LLM y las herramientas se orquestan a través de rutas de código
predefinidas Los agentes, por otro lado, son sistemas donde LLM dirige
dinámicamente
su propio proceso,
herramientas, usos manteniendo el control Cuándo y cuándo no usar agentes. Al construir
aplicaciones con LLM, recomendamos encontrar la solución
más simple posible Solo aumenta la
complejidad cuando es necesario. Esto podría significar no construir sistema
agéntico en absoluto. Los sistemas agénticos
a menudo negocian latencia, costo de un mejor rendimiento de la tarea Y debes considerar cuando
este intercambio tenga sentido. Cuando se
justifica más complejidad , los flujos de trabajo
ofrecen previsibilidad consistencia para tareas
bien definidas, mientras que los agentes son mejores
opciones cuando se necesita flexibilidad y toma de
decisiones basada en modelos a escala Para muchas aplicaciones, sin embargo, optimización de llamadas LLM individuales con recuperación en el
ejemplo de contexto suele ser suficiente Hay muchos frameworks
cuando se utiliza el sistema Augentic, más fácil de implementar el
gráfico Lang de la cadena Lang Marco de
agente de IA fundamental de Amazon, revertir un generador de flujo de trabajo
GIM de arrastrar y soltar,
Valm otro creador de GUI
para crear pruebas de flujo Valm otro creador de GUI para crear Estos marcos
facilitan el inicio y facilitan la simplificación de las tareas
estándar de bajo nivel, como llamar a LM, definir, alabar,
encadenar llamadas juntas Sin embargo, a menudo crean una capa
adicional de
abstracción que solo observa el
prompt y las respuestas subyacentes
mientras las hace
más difíciles de depurar Pueden hacer que sea tentador agregar complejidad cuando una
configuración más simple sería suficiente
3. Proceso de encadenamiento por instrucciones: Y echemos un vistazo más de cerca a un flujo de trabajo de encadenamiento rápido Muchos de ustedes han liderado proyectos de transformación
complejos donde el riesgo no está en
la visión grande, está en la ejecución y asegurando que se siga la
disciplina. Lo mismo sucede cierto. Entonces, el encadenamiento rápido no se
trata solo de pasar datos de
una llamada de IA a otra Se trata de incrustar
puertas de control entre cada escalón. Y cuando se incrustaría controles de riesgo de verificación de
cumplimiento y auditorías de calidad
en el proceso de negocio, la primera llamada LLM
crea un borrador de salida Este borrador no
fluye automáticamente hacia adelante. Se valida. Si pasa, el
flujo de trabajo continúa. Si falla, el sistema
sale o se intensifica. Así es como evitamos
los errores de composición. Para los ejecutivos, key
insight is chain nos
permite tratar la IA
como un proceso gestionado, no como una caja negra. Cada etapa se puede ajustar
ya sea extrayendo datos, aplicando reglas de cumplimiento o produciendo comunicación
orientada al cliente. Este diseño hace que la
IA sea predecible, auditable y más aceptable
para reguladores y placas Para conectarlo a tu mundo, piensa en las operaciones de los
proveedores de atención médica. Una IA extrae información
del paciente. El portón asegura que se sigan las reglas de la
HIPA. La segunda IA prepara
el resumen del tratamiento. El git valida
la codificación médica. Sólo entonces se
genera un nodo de alta para el paciente. Cada punto de control garantiza
precisión, cumplimiento y confianza. Es por ello que el encadenamiento rápido
es una base crítica. Convierte la experimentación en confiabilidad
de grado empresarial. ¿Cómo vemos el flujo de trabajo de
encadenamiento rápido? Piense en ello como una línea de montaje. En lugar de pedirle
a la IA que haga las cosas a la
vez, rompes el trabajo por etapas. Cada etapa es manejada
por una llamada AI separada, y la salida de una etapa se convierte en la entrada para la siguiente. Observe el amargo de la puerta. Ese es el punto de control de calidad. Si la salida de IA en una etapa
no pasa la validación, el proceso se detiene o retrocede. Si pasa, fluye hacia adelante. Las tareas complejas se vuelven manejables
con un flujo de trabajo de encadenamiento rápido Al igual
que en Sigma, no solo lo resuelves todo en un solo paso, lo desglosas. El control de calidad está incorporado. En lugar de confiar en una llamada de IA, validas antes de seguir
adelante Contención de errores. Si algo falla, lo coges temprano sin contaminar
la salida final Pensemos por un ejemplo
a partir de la liquidación de reclamos, paso uno, AI lee y
digitaliza el documento de reclamo La puerta verifica si todos los campos
requeridos están presentes. La IA prepara la
puntuación de riesgo para su liquidación. AI extrae los datos
financieros del solicitante. La marcha comprueba la regla de
cumplimiento como falta de información AIC En el paso tres, la IA redacta la evaluación de
elegibilidad del préstamo Paso uno, AI crea una respuesta. Paso dos, la puerta
verifica el tono, el lenguaje de
cumplimiento
y las reglas de SLA. Paso tres, AI finaliza el mensaje para la entrega
al cliente Piense en ello como una seguridad
aeroportuaria. No vas directo del
check in al abordaje. Pasas por puertas, cheques de
equipaje, escaneo
de seguridad, cheque de tarjeta de
embarque. Cada puerta asegura que la
siguiente etapa esté limpia. El encadenamiento rápido es la versión de IA del proceso de
control de calidad por etapas Ahora que hemos visto cómo el encadenamiento crea
confiabilidad, pasaremos al siguiente
y más avanzado flujo de trabajo, agente
autónomo donde la IA comienza a automejorarse
en entorno real Piense en ello como una carrera de relevos. Se
verifica una salida de IA en la puerta y solo si pasa
pasa al siguiente paso de IA. Si falla, sale temprano. Esto hace que el proceso sea
más seguro y confiable. Reclamación de motor. Un cliente sube los detalles del accidente en
las fotografías El LLM, hace
la comprobación del documento. AI extrae los detalles de la póliza y la descripción del accidente. La puerta hace la verificación
de cumplimiento. ¿La IA extrajo todos los campos requeridos si la fecha del accidente está dentro de
la póliza validada? Si pasa, pasa
al siguiente paso. Si falla, sale o
marca a una revisión manual. La llamada LLM dos verifica
la estimación de daños. AI elabora las estimaciones de costos
utilizando las pautas de reparación. LLM tres redacta
el reclamo final. Crea el
resumen de liquidación para el ajustador. Solo avanzan
las reclamaciones válidas que cumplen con la póliza, ahorrando tiempo y reduciendo el fraude. Ahora tomemos un ejemplo de
servicio al cliente. Un cliente VIP se queja, mi solicitud de préstamo está
atascada por diez días LLM one clasifica la IA identifica la consulta como una
escalada VIP sobre hipoteca. La comprobación de SLA
ocurre en la puerta. ¿Cumple con criterios
de escalada de 15 minutos? Si pasa, procede. Si falla, le da una
alerta al gerente. LLM dos, redactaremos la nota de escalada
para soporte de nivel dos LLM tres creará
una respuesta del cliente,
un correo electrónico personalizado
para el cliente,
y la salida es el
caso correcto se escalan rápidamente,
evitando incumplimientos de SLA y
4. El tiempo del flujo de trabajo del enrutamiento: Ahora entendamos
un flujo de trabajo de enrutamiento. El motor detrás de muchos sistemas de IA
augentic. Tiene una entrada,
tiene un enrutador LM y hay tres llamadas LLM
diferentes Entonces, cómo funciona,
el insumo viene,
digamos, una consulta de cliente, un formulario de reclamo o una solicitud de
préstamo. El sistema simplemente no
lo envía ciegamente a un modelo único. En cambio, primero
pasa por un enrutador de llamadas LLM. El enrutador decide qué modelo de
IA es el
más adecuado para esta tarea. A partir de esto, la solicitud se puede encaminar uno de varios modelos
especializados LLM call one podría manejar clasificación de
resumen estructurado Para manejar el razonamiento, análisis
pesados como la
detección de fraude y la puntuación de riesgo. Los tres podrían manejar tareas
creativas de comunicación como redactar la respuesta del cliente. Por último, el mejor resultado
se desvía como salida. Para ustedes, como líderes de
transformación, la comida para llevar no es la
flecha en las listas. Es la ventaja del negocio. En el servicio del proveedor de atención médica, el enrutador enviaría documentación
médica
a un modelo capacitado en lenguaje
clínico mientras enrutaba los datos de
facturación a un modelo centrado en el
cumplimiento. En un accidente
automovilístico de procesamiento de siniestros, fotos se enviarán a un modelo de visión para la estimación de
daños, mientras que el texto de la póliza
iría a un modelo de idioma para
la verificación de elegibilidad. En un servicio al cliente, preguntas frecuentes
rápidas se enrutarían al modelo ligero para la velocidad, mientras que la
escalada VIP sensible irá a un modelo que está
sintonizado para Este flujo de trabajo es importante porque evita un enfoque de
talla única. En cambio, asegura que se use
el modelo correcto
para el trabajo correcto, al
igual que la forma en que no
asignaría todas las tareas su organización
al mismo departamento. El enrutamiento es una
capa de gobierno para el flujo de trabajo de IA. Los hace eficientes, precisos y listos para el negocio. Ahora que entendemos el enrutamiento, queremos ver cómo múltiples agentes de
IA pueden trabajar juntos, coordinarse a través de
diferentes pasos en un proceso en lugar de
actuar de forma aislada. Piense en ello como un controlador
de tráfico. El sistema decide
qué carril es mejor para la solicitud entrante en lugar tratar cada
solicitud de la misma manera. Reclamación tramitando un reclamo de seguro de cliente
Pfizer Motors. El enrutador LLM decide qué
modelo de IA especializado podría manejarlo. Si se trata de un reclamo de riesgo de fraude, el enrutador, lo enrutará
al modelo de detección de fraude. Si se trata de un reclamo estándar de
bajo valor,
vítelo a la automatización
en lugar de a la liquidación. Si se trata de un reclamo médico complejo, encaminado al modelo de cumplimiento, cada reclamo toma
el camino correcto, reduciendo la
clasificación manual y los errores Perdí mi tarjeta de crédito. El enrutador LLM
lo enruta a la IA correcta, IA seguridad para bloquear
la tarjeta de inmediato FAI explica cómo
pedir un reemplazo. Una IA de escalada te conecta con
la mesa de fraude si se detecta
actividad inusual cliente obtiene la resolución
correcta en lugar de rebotar
entre los agentes Hazme una cita y
envíame los resultados del laboratorio. El enrutador LLM
dividirá la tarea. Programación de IA, reserva la cita con el
médico. WiCodeI recupera los resultados
del laboratorio IA de facturación verifica
la elegibilidad
y la cobertura del seguro paciente obtiene todas las
tareas completadas a través una interacción enrutada a través de
la IA correcta cada vez El enrutamiento se trata de eficiencia y precisión en lugar de obligar a
un sistema a hacer todo. Dirige el flujo de trabajo correcto a la IA correcta al igual que lo hace
el proceso lean. Reduce la reelaboración, clasificación errónea y
acelera la resolución
5. La paralelización: Ahora vamos a un flujo de trabajo de
paralelización. En el último modelo, vimos cómo el enrutamiento envía
tarea al mejor modelo. Aquí veremos un patrón
diferente, paralelización del flujo de trabajo Aquí, en lugar de
elegir una ruta, la entrada se envía a múltiples
modelos al mismo tiempo. Cada modelo aporta
una pieza al rompecabezas. Entonces el agregador combina el resultado en una salida final Piense en esto como
correr múltiples equipos en paralelo para resolver el mismo problema de
forma rápida y exhaustiva. ¿Por qué importa esto? Porque algún
problema de negocio se
beneficia de la velocidad y
diversidad de respuestas. Entendimos que la paralización está ejecutando múltiples llamadas LLM, y luego el agregador la resume Entonces digamos que el paciente
tiene fiebre, tos, antecedentes de viajes recientes
y alérgico a los antibióticos. El LLM recupera
EHR del paciente por padecimientos pasados. LLM dos verifica la pauta
para enfermedades infecciosas. LLM tres banderas
medicamentos de riesgo de alergia. El agregador luego se fusiona en una sugerencia de tratamiento seguro
para el médico El médico obtiene un
solo informe de asesoría no una visión fragmentada paralelización se trata de
velocidad y comprensión en lugar de esperar a que termine
un sistema
antes de que comience el siguiente, una IA múltiple se ejecuta en
paralelo y Es como ejecutar múltiples equipos de
especialistas en paralelo durante la reducción de costos de
transformación lean. Observamos el enrutamiento cuando el sistema decide
qué modelo usar. Paralezación cuando múltiples
modelos funcionan al mismo tiempo.
6. La orquestación y el enrutamiento: Observamos el enrutamiento cuando el sistema decide
qué modelo usar, parleización cuando múltiples
modelos funcionan al mismo tiempo Aquí estamos
hablando de orquestación. Cómo
va primero la entrada a la orquesta. Piense en esto como un gerente de
proyecto que luego está asignando trabajo a
diferentes agentes de IA La orquesta decide
qué tarea debe hacerse primero y qué
modelo debe realizarla. Cada modelo como LLM uno, dos, tres, aborda diferentes
partes del trabajo Pero en lugar de
trabajar de manera aislada, se
coordinan
como equipo multifuncional
en tu transformación. Finalmente, un sintetizador
vuelve a
unir todo en una
sola salida cohent. El valor del negocio es poderoso. Las notas de los pacientes
deben dividirse en interpretación
clínica, código de
facturación, mapeo y verificación de cumplimiento y luego sintetizarse en un informe de alta
completo. Pensemos en el reclamo del motor. Un modelo revisa el documento, el otro comprueba el fraude. El tercer borrador de la comunicación con el
cliente. Este sintetizador
luego los combina en un paquete de
decisión de reclamo listo para usar Et piensa en el negocio
hipotecario. Desea que la
verificación de ingresos, la puntuación de riesgos, las
verificaciones de cumplimiento
regulatorio ocurran en secuencia y se orquesten y
sintetizen en un solo resumen de aprobación de préstamo Una caída de nota de prensa
podría ser verificada por
un modelo adaptado en diferentes mercados
por otro y estilo por
canal social del tercero. Luego se sintetiza en paquete
multicanal. La orquestación se
trata de coordinar. No se trata de cómputos. Refleja la forma en que los líderes de
transformación ya ejecutan programas
funcionales.
7. Gracias por tu tiempo: Antes de que terminemos, quiero
compartir un poco más sobre mí y cómo
puedes mantenerte conectado. Tengo muchas ganas de compartir mis dos décadas de
experiencia con todos ustedes. Y la experiencia en la que
he ayudado a líderes y equipos a navegar a gran
escala en
proyectos de
transformación comercial, digital y artificial digital y artificial en India, EE. UU., Reino Unido, Australia
y Medio Oriente. el camino, he
capacitado a miles de profesionales en
analítica de datos, Lean Sig Sigma, inteligencia
artificial, ingeniería
rápida
y gestión del cambio, capacitación en
liderazgo, tanto como programas
corporativos como comunidades de aprendizaje
abierto Si estás viendo esto
como un aprendiz individual, me encantaría que te
mantuvieras conectado Encontrarás enlaces para unirte a mi grupo de Whatsapp o comunidad de
telegrama donde continuamente estaría publicando sobre diferentes
oportunidades. Regularmente comparto algunas ideas
prácticas, recursos de
aprendizaje y actualizaciones sobre análisis y
transformación de IA. También comparto algunos
estudios de caso sobre liderazgo. Si estás aquí como
gerente, consultor o líder de aprendizaje y
desarrollo,
y estás interesado
en el diseño personalizado, capacitación
corporativa en IA agéntica, ingeniería rápida, análisis de
datos o programa de
transformación, no
dudes en
comunicarte conmigo Trabajo en estrecha colaboración
con organizaciones para diseñar programas
hechos a la medida, que sean prácticos, contextuales
y enfocados en los negocios. Estoy dejando el enlace a Linden
en la sección de discusión. Gracias por aprender conmigo. Espero que esta clase te ayude a diseñar un sistema de IA
más pensativo, y espero
estar conectado contigo Gracias por su
tiempo. Feliz aprendizaje.