Los planes de Open AI para 2023-24 y las claves del aprendizaje por refuerzo. La semana en inteligencia artificial

jun 09, 2023

Amigas y amigos de la estocástica. Esta semana tenemos bastantes novedades en inteligencia artificial, un episodio en el que profundizamos en los problemas que tienen las IAs diseñadas con aprendizaje con refuerzo y un vistazo a lo que OpenAI parece planear. Vamos:

La inteligencia artificial empieza a tener problemas con los sindicatos

Por un lado tenemos la huelga de moderadores de Stack Overflow / Stack Exchange. Específicamente, los moderadores ya no pueden eliminar las respuestas generadas por IA sobre la base de que fueron generadas por IA, fuera de circunstancias muy limitadas.

Sindicatos de Hollywood y estudios discuten sobre cómo se debe remunerar a los actores por el trabajo de sus "dobles digitales". El sindicato más grande de Hollywood, SAG-AFTRA, está comenzando discusiones sobre la remuneración en la era de la IA como parte de las negociaciones contractuales con los estudios. Están debatiendo cómo se debe remunerar a los actores por el trabajo de sus "dobles digitales".

Los periodistas de CNET se unen al Gremio de Escritores de América son huelgas para protestar contra las últimas políticas de IA de su web. Estas directrices permiten que la IA ayude a automatizar algunas partes de su trabajo para que puedan centrarse en las partes que “añaden un valor único”. Permiten que su IA, RAMP, genere contenidos como material explicativo (“basado en fuentes fiables”) que un humano podría comprobar y editar.

¿Son estos los planes de Open AI para 2023-24? ¿Es peor GPT-4 ahora?

Humanloop publicó lo que se suponía que era un resumen de comentarios de Sam Altman a desarrolladores en su gira europa. Ahora lo han borrado a petición de OpenAI pero tenemos lo publicado aquí.

A corto plazo, la empresa tendría previsto abaratar y acelerar GPT-4, crear ventanas de contexto más largas, mejorar su API y crear una API con estados que recuerde el historial de conversaciones. OpenAI tiene previsto introducir la multimodalidad de GPT-4 en 2024. Es probable que los plugins no lleguen pronto a la API. Adicional: su problema actual es la dificultad para acceder a GPUs y sus datos internos sugieren que aumentar el tamaño de los modelos seguirá mejorando el rendimiento.

Mientras debate incendiado: es posible que el ChatGPT haya sido debilitado recientemente de forma silenciosa. Hay quien dice que ha sido superado por Claude para tareas creativas.

La infeliz idea de la terapia psicológica con GPT-4

Hay startups que están utilizando ChatGPT para satisfacer la creciente demanda de terapia con chatbots. Reportaje en Semafor. Algunos usos de la IA para consejos de salud / ayuda terapéutica se están revelando como muy problemáticos (Gizmodo).

Apple no quiere decir “inteligencia artificial”

Apple tiende a favorecer expresiones que haya acuñado ella misma, o al menos a no usar las que se han vuelto especialmente populares, lo cual puede explicar esta diferencia. Explica Javier Lacort en Xataka. En Ars Technica un listado de los anuncios de Apple relacionados con la IA.

Relacionado:

Error500

La realidad mixta de las gafas de Apple frente a la inteligencia artificial para ser el nuevo modo de relacionarte con la tecnología

Hay, defiendo, una diferencia clave entre el lanzamiento de las gafas de realidad mixta (realidad aumentada y realidad virtual) de Apple y el momento del iPhone. Con el teléfono móvil se encontraron un hábito de consumo ya consolidado, el salto de los consumidores pioneros a parte del público masivo ya había sucedido. Aunque hay varias gafas en el merca…

3 years ago · 18 likes · Antonio Ortiz

Especial aprendizaje por refuerzo y el drone que mata a su operador

En el episodio de esta semana hacemos un hueco especial a explicar el aprendizaje por refuerzo y cómo el problema del modelado de recompensas está detrás de la no noticia de que un "Dron militar estadounidense controlado por IA mató a su operador durante prueba".

Relacionado: Deepmind ha aplicado aprendizaje por refuerzo al diseño de algoritmos Ha superado a los perfeccionados por científicos e ingenieros durante décadas en tareas como la ordenacación.

Breves

Runway deja probar su texto a video, Gen 2. Web oficial y nuestra primera prueba.

Meta lanza y comparte MusicGen, “un modelo simple y controlable para la generación de música”. Se puede probar en Hugginface.

Instagram está trabajando para incorporar agentes de IA (Bots) a sus chats para "una experiencia más divertida y atractiva". La idea es que los agentes de IA podrán responder preguntas y dar consejos. Se podrá elegir entre 30 personalidades diferentes.

Character.ai supera los 1,7 millones de instalaciones en una semana.

Se filtró tmucha información sobre el procesador del Pixel 8, el Tensor G3.

StyleDrop - Generación de texto a imagen en cualquier estilo. Este nuevo modelo puede dar lugar a una oleada de otras herramientas de imagen de IA. La anterior, DreamBooth de Google, servía para mantener la coherencia de los temas y muchos de los proyectos de avatares utilizaban DreamBooth entre bastidores. Esta hace lo mismo para mantener un estilo coherente, lo cual es una gran tarea para los diseñadores gráficos.

La aplicación de noticias Artifact ahora usa IA para reescribir el título de un artículo de clickbait.

"Lo que antes me llevaba días ahora son dos minutos": hablamos con los diseñadores encantados con la IA. Javier Lacort en Xataka.

Bruselas quiere que las plataformas digitales identifiquen los contenidos generados por IA para combatir la desinformación.

Automattic lanza Jetpack, un asistente de escritura de inteligencia artificial para WordPress.

Por favor, sé amable con la IA. Carlos Guardián.

Contra el riesgo existencial de la IA. Sánchez-Migallón.

Julian Estevez

Jun 16, 2023

No es nada fácil explicar cómo funciona el aprendizaje por refuerzo sin medios visuales. E incluso con ellos, muchas personas estarían tentadas de hacer zapping.

Así que enhorabuena, me ha gustado mucho la explicación. Aquí tenéis para próximas ocasiones ejemplos gráficos muy chulos sobre qué es diseñar una mala recompensa en RL https://towardsdatascience.com/how-learning-reward-functions-can-go-wrong-6e794e42f4fc.

Estamos aún muy lejos de emplear IA militar efectiva.

Responder

monos estocásticos

Discusión sobre este post

Por supuesto, sigue adelante.