Los planes de Open AI para 2023-24 y las…

jun 9, 2023

Amigas y amigos de la estocástica.

1 comentario

Jun 16, 2023

No es nada fácil explicar cómo funciona el aprendizaje por refuerzo sin medios visuales. E incluso con ellos, muchas personas estarían tentadas de hacer zapping.

Así que enhorabuena, me ha gustado mucho la explicación. Aquí tenéis para próximas ocasiones ejemplos gráficos muy chulos sobre qué es diseñar una mala recompensa en RL https://towardsdatascience.com/how-learning-reward-functions-can-go-wrong-6e794e42f4fc.

Estamos aún muy lejos de emplear IA militar efectiva.

Responder

#nojs-banner { position: fixed; bottom: 0; left: 0; padding: 16px 16px 16px 32px; width: 100%; box-sizing: border-box; background: red; color: white; font-family: -apple-system, "Segoe UI", Roboto, Helvetica, Arial, sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol"; font-size: 13px; line-height: 13px; } #nojs-banner a { color: inherit; text-decoration: underline; } This site requires JavaScript to run correctly. Please turn on JavaScript or unblock scripts

monos estocásticos

Los planes de Open AI para 2023-24 y las…