Transcripciones
1. Introducción a la lección 2: Hola, gracias por dar click en este
curso de gestión de productos A0. Mi nombre es Kristin. Llevo trabajando en
TI casi diez años y en ciencia de datos y visión por
computador, casi cinco. Hola, soy Lizzie y
bienvenido al curso. También he incluido en desarrollo de productos de
IA
en los últimos tres años, estado trabajando en la automatización del proceso de
verificación con machine learning y específicamente
con visión por computador. En este curso, vamos a
profundizar más en el desarrollo de
productos de IA. Discutiremos las
diferencias entre una mentalidad de desarrollo de software
y una mentalidad de
desarrollo de productos de IA. Además, veremos
por qué los productos de IA tardan tanto tiempo mantenimiento y por qué
se degradan con el tiempo. Lo último para este curso, iremos y
analizaremos los tres pasos que
necesitas para
asegurarte y empezar a pensar a la hora de crear
tu primer proyecto de Ai. Gracias.
2. Cambio de mentalidad en el desarrollo de IA: En la
lección anterior, platicamos sobre el hecho de que
existe la
capacidad de una computadora para realizar tareas que suelen ser
realizadas por personas. La mayoría de las aplicaciones de IA funcionan
con tareas realmente específicas. desarrollo de ai y
desarrollo de software procesos dedesarrollo de ai y
desarrollo de software
son muy diferentes. Estaremos discutiendo eso más a fondo esta
lección también. Hablamos sobre los requisitos de los
productos de IA y de lo que dependen. Y hablamos sobre los productos de IA y qué tipo de IA
actualmente incluye realmente. El tema de hoy es en qué tipo
de trabajo vivir realmente. En cuanto a datos. A veces es son
buenos si vivimos en un mundo donde todo
está destinado a estar, o en un mundo donde creamos su propio futuro con
nuestras propias decisiones. Entendemos que
hay tareas que conducen a un resultado específico y hay
decisiones que conducen a una sorpresa o un desenlace
inesperado. Este mundo puede describirse como un mundo determinista y
probabilístico. El término
mundo determinista significa que sabemos lo que va a pasar
si haces una cosa, otra cosa
definitivamente sucederá. problemas clásicos de
ingeniería de software Losproblemas clásicos de
ingeniería de softwareson así. Determinístico. Si haces clic en un botón, hace algo que
está programado para hacer. Quiero decir, claro
a menos que haya un bicho. Pero cuando hablamos productos de
IA o
funcionalidad NEA, nos estamos inclinando más
hacia lo no determinista, también llamado mundo probabilístico. Esto significa que no podemos estar
seguros de lo que hará el modelo. Esto es específicamente
importante para entender cuando las madres son puestas en una situación desconocida. Por ejemplo, cuando
los datos de entrada son ligeramente diferentes
de la norma regular. En la visión por computador, esto
significaría que la imagen incluye objetos o entornos los
que el modelo no está acostumbrado. Entonces expliquemos
esto con más detalle. Si
ocurre alguna actividad, por ejemplo, pulsar un botón o introducir una consulta o recibir
datos en un formulario. Siempre hay algún tipo de funciones
concretas
relacionadas con eso. Se hace clic en un botón, se abre la página
siguiente, o se ingresa la consulta, y luego se
busca el resultado y la base de datos. O tercer ejemplo, se
reciben datos y se
guardan automáticamente en la base de datos. Aunque las cosas
son deterministas. Pero luego
pasó el clic. Click es igual a true y luego se hace algo
predefinido. Pero ¿qué pasa con el mundo
probabilístico? Hay un balance de
estadísticas y conjeturas. Entonces no sabemos exactamente certeza que
algo va a pasar, pero podemos predecirlo con base
en patrones anteriores. Por ejemplo, si ves a un jugador de
perros ladrando sonido, o en detección de fraude, si parece, o campos que
el usuario X extrañamente luego envió, los
envió para una
mayor inspección. La principal diferencia con mundo
determinista
es que estamos un poco seguros
al 100% de que algo
pasó o va a pasar. No es como puede haber, qué es un clic de un botón, vamos a enviar los datos de todos modos. Pero nuestros algoritmos de IA, deterministas o probabilísticos,
podemos decir que son, es determinista
en el sentido de que sí sigue el
algoritmo o el modelo, pero probabilístico en el sentido de crear ese algoritmo. Entonces, cuando estamos entrenando un modelo, utiliza estadísticas para predecir el resultado, es decir,
es probabilístico. Pero cuando este
modelo de tren se
pone entonces en uso en un producto, predice exactamente
por las reglas o el, o el algoritmo
está entrenado para hacer. También podemos echar un vistazo rápido a los datos deterministas
y probabilísticos. Los datos probabilísticos son
datos que se
basan en eventos de comportamiento
como páginas vistas, el
tiempo dedicado a la página
son clics. Este tipo de datos se pueden
utilizar para modelos de predicción. Por ejemplo, se puede
utilizar para clustering. Los usuarios están sugiriendo
artículos a su cliente. Los datos deterministas están vinculados a algo que
identifica al usuario, como una dirección de correo electrónico
o un id de idea de cookie y lo más probable es que sea 100% cierto. Esto puede considerarse un hecho o una
característica de un usuario. Por ejemplo, si un
usuario se registra alguna plataforma y da
su edad actual, lo es, es un hecho
que al
año siguiente el cliente
será un año mayor. Pero el, pero si el mismo usuario usa la
plataforma diez veces menos desgarro, no
podemos estar seguros si usará la misma
plataforma el próximo año, 1110 o nueve veces. Si bien podemos hacer es agrupar y analizar a muchos usuarios
con un comportamiento similar el año
pasado y hacer una suposición o predicción de cómo él o ella
podría baraja el próximo año. Pero no lo sabemos con certeza. Entonces, cuando
hablamos de mentalidad, al crear nuestros productos, tenemos que entender que el mundo real
no es determinista. El mundo real no es blanco y
negro. Es, podemos decir, Cincuenta sombras de Grey. Entonces nos vamos en un
mundo probabilístico y tenemos que hacer todas esas
predicciones en base a eso, IA está resolviendo retos
probabilísticos. Cuando un gran día o productos, necesitamos darle sentido al mundo probabilístico y estructurarlo en datos que describan
el mundo que nos rodea de una
manera que tenga sentido para la IA. En la última lección, discutimos
la diferencia de procesos entre la ingeniería de software
y el desarrollo de productos. Pero, ¿cómo
influye este mundo
probabilístico
en el desarrollo con más detalle? Entonces, para los productos de
ingeniería de software, existe una alta probabilidad
de conocer el resultado. El tiempo de desarrollo se puede
estimar bastante bien. La gente usa
procesos Scrum y otras cosas para estimar más mejor. El objetivo puede ser descrito
por maquetas, análisis de especificaciones. Existen las
mejores prácticas establecidas el proceso
de ingeniería. Y los problemas del producto en
realidad no cambian tan a menudo. Y cuando la función está lista, es mayormente, lo más probable es que se quede así por mucho tiempo. Pero cuando
hablamos de productos de IA, no
podemos estar seguros
de nada realmente. Había una esperanza de un resultado. Quieres que el modelo
haga algo, pero no puedes estar seguro de si realmente
lo hará. Realmente no se puede estimar, pero se pueden realizar tareas de caja de tiempo. Por lo que es más o menos desconocido cuánto tiempo
tardará en reinventar la bicicleta. Entonces hay muchas
conjeturas sucediendo. El objetivo del
modelo se describe a través de ejemplos de datos
y métricas. Aún no se han establecido las
mejores prácticas sobre la gestión
del proceso de desarrollo de IA diurna. Entonces podemos decir que es
un poco desordenado. Y el entorno en
el que los datos, los modelos o las funciones de IA
utilizan el cambio muy a menudo. El
modelo es impresionante. Cuesta actualizaciones constantes. Tendríamos que seguir
manteniéndolos por mucho tiempo.
3. Mantenimiento consistente: ¿por qué? (nuevo): Y el mantenimiento de sistemas y
por qué es realmente necesario para los productos de
IA
depende realmente de dónde se aplique el
producto. Cuáles son los entornos a los
que se aplica. Porque si aplicas el modelo a un lugar diferente para el
que no fue entrenado, hay un cambio ambiental y necesitas hacer
actualizaciones para ello. Además, cuando el entorno que nos
rodea cambia, entonces también cambian los datos y
los patrones. Si la vida cambia,
entonces básicamente
necesitamos cambiar el modelo, el producto con él. Tomemos un ejemplo de corona. Cuando empezó Corona, la gente
empezó a usar máscaras faciales. Si tuvieras un modelo de detección de rostros que intentara detectar rostros. Ahora el ambiente
cambia, cambiado. Si antes tenías mucha gente
con mascarillas faciales, tendrás a cualquiera
básicamente con mascarillas faciales. Nuevos clientes. Si estás en un lugar donde
aplicas tu modelo a diferentes clientes,
diferentes entornos. Por ejemplo, primero
tienes un cliente en nosotros, luego tienes cliente en Europa. Que hay diferentes
patrones de comportamiento humano en el medio ambiente y cómo funciona
todo parece. Entonces hay un cambio de datos
a través de eso. Además, estamos haciendo un
mantenimiento constante porque aprendizaje
automático se
mueve muy rápido. Está creciendo año tras año. Y algunas otras
cosas que quizás no
seas así que no se pudieron vender el año pasado. Puedes resolver este
año y por lo tanto, solo
necesitas volver
a aplicar nuevos métodos. Cuando construyes un producto de
software, el entorno en el que
resuelves el problema
suele ser mucho
más estable que para los productos de IA. Al menos no aparece tan fácilmente cuando
creas un sitio web, lo general, por ejemplo, tienes entendido quiénes
son los principales clientes? ¿ Es para personas mayores, es para niños? Probablemente hará algunos cambios
dependiendo de a quién
esté destinado este producto para engañar a los desarrollos de
productos de IA. Sí, también estás pensando
con esto aplica, pero hay muchos más factores
diferentes que juegan en el rendimiento
de estos modelos. Los desarrollos de Ar están
optimizando específicamente solo un
conjunto de problemas
realmente pequeños si los problemas y
los cambios en el rendimiento también cambian. Tomemos un ejemplo. Entonces Algoritmo de
detección de animales forestales, el objetivo del mismo es que detectemos animales y clasifiquemos
qué animal es. Entonces aquí puedes ver el
ejemplo. Hay rápido. Decimos que es conejo. Si tiene que ver con la
escalera y decir lo que es. Ahora, estamos en el norte de Europa. Aquí es donde estamos
construyendo nuestros animales, pero aquí hay 20
animales en total. Entonces, en lo que primero nos vamos a
centrar al tratar construir un buen modelo de
aprendizaje automático es tomar el
grupo más grande que podamos hacer. El grupo más grande hoy en día es que son tan gruesos que
son correctamente. Podemos detectar siete
animales después de las 20. Nace el siguiente después de eso. Entonces tenemos cuatro tablas y
si las detectamos correctamente, ya
podemos adictos
por más animales. Después de eso, hay zorros. Para que podamos atrapar a tres
personas es increíble. Entonces esta es un poco la
distribución del medio ambiente. Con este ambiente
y con este modelo, capturamos 70% de los animales. Entonces con la detección de
carne de venado, las casillas de tictac ,
con el dictum por ahora, tenemos un cambio de que
alguien ha decidido que
debemos poner el mismo modelo y
usarlo en bosque tropical. Entonces lo que vamos a hacer es que
haya un nuevo entorno. Tenemos exactamente el mismo modelo. Entonces todo es igual. Pero para lo que
lo optimizamos es diferente. Entonces primero vamos a mirar querida, oh, ahí sólo hay uno. Así que lo atrapamos solo un animal. ¿ Qué otra cosa que
aprendimos a la baraja? Entonces ellos eran la junta, entonces tenemos tres tablas. Toman la dosis también
que son poros. A continuación detectamos zorros, al
menos eso es lo que aprendí
el modelo. No hay cajas detectadas. Entonces perdimos esa
clase por completo. Entonces aquí se puede ver el
cambio de ambiente. Muy claro. Cambiamos donde estamos usando la Urgencias y la
Urgencias no la entiende. Entonces, en bosque tropical, el algoritmo captura 20%
de los animales en general. Entonces no podemos afirmar que
el algoritmo es malo. Es más que donde lo estamos aplicando y
lo que estaba destinado a ser. Este es un
cambio realmente drástico en la vida real. Muchas veces no
tenemos cambios tan drásticos. Pero hay cambios de hasta el
10% e incluso cambios menores, pero traen a colación el problema
de la equidad y el sesgo. Así que todos estamos a favor
del aprendizaje automático.
4. Desarrollo de productos de IA: Entraremos en la parte de
desarrollo de productos. Entonces primero están los tres pilares a pensar antes de empezar a
trabajar en nuestras predicciones. Entonces realmente hay que pensar en
esos porque de lo contrario no se puede tener éxito
resolviendo el problema o, o creando el producto. Entonces primero, ¿qué problema
estás tratando de resolver? ¿ Cuáles son las cosas
que intentas resolver? ¿ Cuáles son las cosas que
estamos arreglando aquí
están mejorando? Segundo, ¿qué métricas
te importan? En serio, ¿cuáles son las
cosas que te importan? Y entraremos en más detalles. Verás los ejemplos. Y en tercer lugar,
¿de dónde sacas los datos? En el curso anterior, miramos a los animales. Vías que los datos
son realmente importantes y hay que
tener en cuenta de
dónde sacamos los datos? Porque los datos
que obtienen realmente determinan qué tan bien te
desempeñas en las métricas
que te importan. Hay dos tipos de
problemas o sobreimpulso. Básicamente, es todo
con el aprendizaje automático. Uno es automatizar el proceso, otro es estimar
un resultado. Al automatizar el proceso, nos referimos básicamente a
automatizar el trabajo humano, el trabajo de
fábrica, los clientes reportan el trabajo. Realmente hoy, una obra que
es realmente repetitiva. Somos buenos en
IA estrecha hoy en el mundo, no con el ARE general. Para que podamos automatizar tareas pequeñas. Estimar un resultado
también es algo que se hace. Es por ejemplo,
cuando quieres
estimar lo que le
gusta a la gente, como el marketing. O quieres estimar
cuánto tiempo lleva llegar de un lugar a
otro y mañana, porque mañana es lunes. Entonces algo así. Estimación y automatización,
el objetivo de ellos es diferente, pero los métodos detrás es nuestro mismo. Automatización.
Laautomatización es, como dije, ejemplo, es un trabajo de fábrica que guía tareas
repetitivas. Cómo entender qué
tarea trabajo cumplir. También podría haber tareas
realmente duras que se realizan en factores
o en el derivado. Algunos de ellos podrían ser un, enseñar a un niño a leer. Se trata de tareas repetitivas. Los maestros
lo están haciendo todo el tiempo, pero son tareas difíciles. Pero lo que
puede hacer el aprendizaje automático en la sala de emergencia es tareas más pequeñas, tareas de
1 segundo. Así que empieza a pensar en tu
problema como tareas de 1 segundo. ¿ Cuáles son las cosas que
puedes hacer en 1 segundo? Y esta es una tarea. Este es un problema que hay que solucionar. Si tienes un problema mayor, puedes dividirlo en
diferentes tareas de 1 segundo. Por ejemplo, si quieres,
um, a un robot que encuentra
basura y la tira, entonces primero es mirar a tu alrededor. Segundo, detectar basura. Tercero, acércate a la basura. Cuatro. Llévala, sigue y
sigue y luego tírala. Para que veas que son una tarea
muy pequeña. No se puede tener una tarea de
limpiar la habitación. Pero más fácil de tarea, más probable
es que se haga. Entonces todos entendemos eso. Y también los que controlan un poco de guía para
entender ¿cuáles son las cosas que se pueden hacer
o cómo deben dividirse? Si la tarea es básicamente
una muy pequeña, si es una tarea realmente fácil, es muy fácil resolverla si hay muchos detalles de tarea también muchas cosas a
tener en cuenta para hacer roles. Hay manera más difícil. Entonces cosas
realmente, muy simples que
podemos hacer en estos días para hacer. Y tu objetivo como
gerente de producto debe ser pensar una tarea para que
no sean atlas T2. Esto significa que es más fácil
para ti resolverlo. Estimaciones, tarea de estimación
es cómo son las personas,
quisiera estimar eso, um, y esto es básicamente que hoy en día se usa principalmente con fines de marketing. Y a básicamente en el lado
consumidor, consumidor. En segundo lugar, ¿qué tipo de
métricas te importan? Lo grande, grande
aquí es olvidar ser siempre un 100% correcto. Nunca se puede estar 100% correcto. La gente nunca puede
ser 100% correcta. Tampoco la IA. Hoy es, como dije, una vez, para resolver tareas realmente
pequeñas cosas. Entonces, la pregunta más grande
a responder es, ¿qué errores estás
dispuesto a hacer agua y hacer cosas que están
bien para confundir? Veamos algunos ejemplos. Por ejemplo, condición rara en una tienda. Entonces estamos en un espectáculo. Básicamente es la estimación
que intentaste entender. A la gente le gusta esa. O lo que puedes hacer es mostrar las longitudes de los clientes
de resplandores. Eso es muy bueno.
Nomuestres brillo. El cliente no miente. Es decir, no muestras
cosas que no les gustan. Son cosas realmente
buenas para hacer. Una de las cosas que podrías hacer, tu espectáculo brilla que
a los clientes no les gusta. Entonces esto significa que le muestras a los clientes cosas que
para ellos es basura. Ellos,
ven algo que no les importa. O también lo que
puedes hacer como error es no mostrar ropa
que le guste al cliente. Eso quiere decir que no se muestran las cosas
que realmente les gustan. Y tú, como comercializador vas a
tener ingresos perdedores porque no vendes aprieta
que el cliente compraría. Además, otro ejemplo es bueno. Así que las buenas tarifas, ya sabes, es una recomendación para los libros. Entonces aquí hay recomendaciones hechas y algunas de
las cosas tal vez,
tal vez como cosas de Salton. No. En cuarto lugar se recomienda que una persona
libro no miente y con fuerza no recomienda a
una persona libro le gusta. Entonces estos son los dos errores
que puedes cometer hoy. Entonces, ya sea que
no muestres libros, a la gente le guste, o básicamente les muestres
cosas que no frenan. Mirando este sistema hoy en día. Probablemente si obtuvieras montón de libros que te son
recomendados, pero no te gustan, entonces ya no vas a
usar ese servicio porque ves que la
recomendación no tiene sentido. Adicional, bueno.
¿Qué es más bien? No es recomendar una
explosión en los libros. A la gente le gusta recomendar la
mayoría de ellos. Entonces aquí puedes ver por qué
el primero no está bien. Pero el segundo es porque cuando lo primero
pasaba todo el tiempo, entonces el cliente
no usaría el servicio. Pero si ocurre el segundo, entonces Pip probablemente la gente
seguirá haciendo cola al servicio. Simplemente no lo hacen.
Conseguiremostodos los libros que serían recomendables
o buenos para ellos. Otro ejemplo en los aviones. Los aviones tienen mucho mantenimiento. Necesitan muchas reparaciones que les
hagan y necesitan seguir muchos
requisitos para volar. También, terroristas, básicamente
cálculos similares detrás de él. Declarar falsamente que una pieza
del avión no está bien. O declarar falsamente que
la pieza está bien. Entonces si somos los
primeros y decimos falsamente que una pieza del
equipo no está bien. Solo usamos más tiempo
para reparar el avión. Usamos más dinero para
reparar el avión. Pero no pasa nada malo. Si un cuatroquintas partes declara
que una pieza está bien. Esto quiere decir que falsamente declaramos que esa pieza es tu
k y dejamos volar el avión, obtendremos un avión defectuoso. Entonces hoy, en este caso, esto no es algo bueno. Algo malo podría pasar con un avión cuando lo dejamos volar. Por lo que se podía ver
antes que todas esas cosas están
dependiendo caso de uso. Pasemos a qué
tipo de datos tienes. Se trata de datos de
renovación restaurados duro. Primero, siempre hay que
tener algunas cosas, pero esto es algo claro. Es muy, muy, muy difícil empezar de un tema
completo. Pero también se cuestiona qué tipo de datos
necesitas. Y eso ahora
depende del problema que hayas anotado. Necesitas datos lo
más cercanos
posible a los datos
que tienes en la vida real. Lo mejor sería que
tengas datos de realmente, realmente el vivo, donde los
usarías. Volviendo al
ejemplo de bosque con animales, si vas a usar el
detector de animales en bosque tropical, lo mejor es tener la
sala de datos bosque tropical, no de algún otro
tipo de bosque. Así que realmente datos de exactamente donde va a utilizar
y el producto. Tomemos un ejemplo
de un detector de autos. Quieres que la IA sepa qué
es un auto y qué no. Entonces la pregunta
que aprendemos es, ¿qué es, es un auto? Entonces el lado izquierdo, es el lado derecho. No lo es, es una ronda de Googler. En busca de autos, verás toneladas de autos
diferentes alrededor. Lo que puedes ver aquí es
primero color diferente. Algunos son de fondo blanco,
algunos están conduciendo, algunos están en fondo
grisáceo Lakish. Esto es completamente
de lado. Esto es más en la parte superior y
no completamente en la parte superior. Esto es desde el frente. Entonces, si haces un detector de autos, ¿de qué lado
quieres ver el auto? ¿ Y está sobre el fondo blanco o negro
o los elementos? ¿ O es en la vida real, cerca de la playa
o en la calle? ¿ Necesitas
detectar autos aquí, estas fotos son
realmente diferentes, las que acabamos de tener
en la diapositiva anterior? ¿ O quieres ver
y detectar autos desde arriba? No teníamos las fotos de ningún
costo desde arriba y la imagen de arriba
es completamente diferente. Entonces realmente necesitas pensar desde qué ángulo también
quieres detectarlos. Porque si entrenas a un modelo para detectar los autos de lado, pero en realidad la cámara de
donde en un futuro con autos
detectores estás
mirando desde arriba, el modelo no realizará
AN fallará aquí. Por lo que los datos tienen que ser tan similares
al caso de uso que se
tiene en la vida real
desde la perspectiva del
rayo geográfico. Entonces nos sentamos en una habitación oscura, habitación
luminosa, en el tiempo. Tengo autos de 50 años. Autos ahora mismo, calles hace 50 años o hoy. Tal vez. Las cosas no cambian
tanto últimamente y no tienes tantas fotos
de los cincuenta. Pero básicamente, hay de vez cuando hay
cosas nuevas sucediendo. Así que el tiempo es realmente
importante para obtener los últimos datos y
puntos de vista y ángulos. Así que asegurándose de que
estás viendo objetos de manera tan similar a
como tú en el futuro. Uno para tener el caso de uso para.
5. Conclusión: Para mí, es como se indicó anteriormente, el
rendimiento del producto de IA depende enormemente de los
datos disponibles en los que tenga. Porque los datos que entran son básicamente el rendimiento
que sale. Entonces lo que estás
recopilando que estás obteniendo también de los datos del
cliente o tu real, donde estás usando los datos. Esto básicamente se
determina el apagado hacia desempeño de
este modelo porque esto depende de dónde
se aplique. Entonces, ¿dónde está el caso de uso real? Y es muy importante
que los datos que tienes en el uso disminuyan
los datos y los datos
disponibles que tengas al entrenar o lo más
similares posible. En conclusión, para el curso de
este día, verbos de
desarrollo junto
con el desarrollo de software, no
hay nada
que separe a esos 28 desarrollo es más riesgoso, conocido, desconocido,
mucho desconocido que así para el desarrollo
porque es investigación y desarrollo. Y además hay
muchas dependencias
de manera que vas
a usar ese modelo. El desarrollo es dependiente. Datos de niños. Podrían decirlo
o doloridos, listos. Los datos, lo que estás
usando para entrenar, cómo tiene que ser realmente similar a dónde lo vas a
usar en el futuro. Al igual que los datos determinan también
cómo se desempeñará. Ei prefiero formas es un eslabón de paso enormemente
en el medio ambiente. Así que los datos y el medio ambiente. Se ganaron Kiki, gracias. Gracias por escuchar el día de hoy. Nos vemos la próxima vez.