Amigas y amigos de la estocástica. Esta semana tenemos bastantes novedades en inteligencia artificial, un episodio en el que profundizamos en los problemas que tienen las IAs diseñadas con aprendizaje con refuerzo y un vistazo a lo que OpenAI parece planear. Vamos:
No es nada fácil explicar cómo funciona el aprendizaje por refuerzo sin medios visuales. E incluso con ellos, muchas personas estarían tentadas de hacer zapping.
No es nada fácil explicar cómo funciona el aprendizaje por refuerzo sin medios visuales. E incluso con ellos, muchas personas estarían tentadas de hacer zapping.
Así que enhorabuena, me ha gustado mucho la explicación. Aquí tenéis para próximas ocasiones ejemplos gráficos muy chulos sobre qué es diseñar una mala recompensa en RL https://towardsdatascience.com/how-learning-reward-functions-can-go-wrong-6e794e42f4fc.
Estamos aún muy lejos de emplear IA militar efectiva.