Paul Mccartney y el gobierno japonés no pueden estar equivocados. La semana en inteligencia artificial
Una semana dura que no nos ha dejado grabar episodio. Mientras el finde intentamos recuperarnos, os dejamos con los temas de la semana en inteligencia artificial.
La IA es Big in Japan
La ciudad de Yokosuka en Japón adopta oficialmente el uso de ChatGPT para sus trabajadores en operaciones administrativas Si se continúa con el uso de ChatGPT, las horas de trabajo se pueden reducir en "al menos unos 10 minutos al día", estimó el gobierno municipal.
Nos comparten en Twitter esta imagen desde Japón, con unos grandes éxitos en librerías:
Este artículo “Japón va con todo: los derechos de autor no se aplican al entrenamiento de IA” se ha compartido mucho y hay quien lo ha puesto en cuestión: no aparece ninguna fuente local. De hecho parece que hay un debate fuerte en el país asiático al respecto y, aunque hay algún funcionario japonés que explica que la ley del país permite que los desarrolladores de IA entrenen modelos en obras protegidas por derechos de autor, técnicamente puede haber zonas grises y en todo caso un debate abierto de nuevo por algunos creadores y partidos minoritarios.
La clave: con Europa muy “pro control” es posible que se produzca una competencia mundial por hacerse fuerte en la industria de la inteligencia artificial con posiciones más facilitadoras. Japón parece política y socialmente muy abierta a adoptar la IA.
OpenAI lanza grandes actualizaciones de API para desarrolladores
Las novedades incluyen modelos de API más dirigibles, capacidades de llamadas a funciones, contexto más amplio y precios más bajos (pero no en GPT-4)
OpenAI explica que las llamadas a funciones permite a los desarrolladores describir funciones de programación para GPT-3.5-turbo y GPT-4 y hacer que los modelos creen código para ejecutar esas funciones. Por ejemplo, las llamadas a funciones puede ayudar a crear chatbots que respondan a preguntas llamando a herramientas externas, conviertan el lenguaje natural en consultas a bases de datos y extraigan datos estructurados del texto. Para entendernos: es similar a como funcionan los plugins, que le dicen al modelo que los utilice según lo que pida el usuario.
La clave: OpenAi cuenta prácticamente con un año de ventaja con la gran API sobre la que crear productos y servicios de inteligencia artificial. Antes del fin de 2023 debería haber acceso a abierto a las de Google y Claude.
Paul McCartney dice que ha usado inteligencia artificial para ayudar a crear lo que él llama "el disco final de los Beatles"
Peter Jackson fue quien aisló la voz de John Lennon de demo en una cinta, "Pudimos tomar la voz de John y hacerla pura a través de la IA".
El punto de inflexión se produjo con el documental Get Back, en el que el editor de diálogos Emile de la Rey entrenó a ordenadores para reconocer las voces de los Beatles y separarlas de los ruidos de fondo, e incluso de sus propios instrumentos, para crear un audio "limpio".
El mismo proceso permitió que Paul hiciera un "dúo" con Lennon en su reciente gira, y que el año pasado se crearan nuevas mezclas de sonido envolvente del álbum Revolver de los Beatles.
Jackson fue capaz de extraer la voz de John de un cassette de mala calidad". "Teníamos la voz de John y un piano y él pudo separarlos con IA. Le dicen a la máquina: 'Esa es la voz. Esto es una guitarra. Suelta la guitarra'"
"Así que cuando llegamos a hacer lo que será el último disco de los Beatles, era una demo que John tenía [y] pudimos tomar la voz de John y obtenerla pura a través de esta IA”.
La clave: movimientos como este pueden ser clave a la hora de “normalizar” el uso de inteligencia artificial en la creación musical.
Zuck y Meta reaccionan
Zuck tuvo un gran all-hands la semana pasada donde anunció el desarrollo de varias tecnologías de IA que se implementarán en los servicios de Meta, incluyendo:
Chatbots de IA para Messenger y WhatsApp
Prompts para modificar imágenes/stories de Instagram
Asistente de productividad
Interfaz experimental para interactuar con agentes de IA
Zuckerberg también volvió a comprometerse a publicar investigaciones y compartir tecnologías de IA con la comunidad de código abierto.
Un ejemplo de ello es MusicGen, su LLM musical de código abierto que genera música a partir de texto e indicaciones musicales. Para entrenarlo, le han suministrado la friolera de 20.000 horas de música con licencia, 10.000 pistas musicales y datos de Shutterstock. Se puede probar en Huggingface.
Yann LeCun, científico jefe de Meta, ha manifestado su escepticismo sobre el rumbo actual de la investigación en IA. Cree que es necesario un nuevo tipo de modelo. La primera versión de este nuevo tipo de modelo aprende “una sólida representación interna del mundo visual mediante la predicción condicional de fragmentos de imágenes”. Hay disponible una explicación de este modelo I-JEPA aquí.
La clave: Meta es la única de las grandes que sigue compartiendo mucho de lo investiga y desarrolla en IA. Si su modelo funciona, podemos tener una inteligencia mucho menos cerrada como triunfadora del mercado.
La otra clave: IA generativa en Instagram suena a una distancia aún mayor de la realidad que la visión que se comparte.
El Parlamento europeo aprueba la AI Act
Tras pasar la votación con amplia mayoría, ahora comenzarán las conversaciones sobre la forma final de la ley en el Consejo, junto a los países de la UE.
El objetivo es alcanzar un acuerdo a finales de este año. Aunque es probable que la Ley de IA no entre en vigor hasta 2025, las reacciones de las empresas para su cumplimiento deberían empezar ya. Recordemos que Sam Altman, CEO de OpenAI, dio marcha atrás el mes pasado en su amenaza de abandonar la UE por temor a que estuviera "sobrerregulando" la IA.
No parece haber novedades respecto al borrador que analizamos en el episodio 18 del podcast.
Relacionado: Google habría retrasado el lanzamiento en la UE de su chatbot de inteligencia artificial Bard después de que el regulador de privacidad plantee preocupaciones
Mientras en Reino Unido OpenAI, Google DeepMind y Anthropic se han comprometido a proporcionar "acceso temprano o prioritario" a sus modelos de IA al estado para “apoyar la investigación sobre evaluación y seguridad”.
La clave: Europa se posiciona como la más “garantista”, lo que a su vez puede significar un paso más en que perdamos el tren industrial de la tecnología clave de las próximas décadas.
Pixel Drop (Google empuja su móvil con un montón de funcionalidades IA)
Google anunció en el Pixel Drop de junio funciones como la posibilidad de programar un control de seguridad con Google Assistant, compartir la ubicación al instante con contactos de emergencia en caso de accidente de tráfico, un nuevo gesto de manos libres para hacer fotos y la monitorización de la saturación de oxígeno para el Pixel Watch. Por aquí con ganas de meterle mano al macro en vídeo para el Pixel 7 Pro.
Otro tema de debate esta semana:
Breves
Según el NYT los médicos están utilizando chatbots para mejorar su trato con los pacientes.
Llegó Adobe Firefly para empresas. Adobe confía tanto en la capacidad de Firefly para respetar las imágenes con derechos de autor de los creadores que compensará legalmente a las empresas si son demandadas por infracción de derechos de autor sobre cualquier imagen que cree su herramienta.
Mistral AI de Francia llega con una ronda inicial de 113 millones de dólares a una valoración de 260 millones para enfrentarse a OpenAI. Historia de la empresa: cuatro semanas. Mistral aún tiene que desarrollar su primer producto, y sus primeros empleados comenzaron a trabajar hace solo unos días. Planea lanzar a principios del próximo año un nuevo "modelo de lenguaje grande", similar al sistema de "IA generativa" que impulsa la aplicación ChatGPT de OpenAI.
OpenAI aún no ha empezado a entrenar al GPT-5, el sucesor del GPT-4. La empresa sigue trabajando en nuevas ideas para el modelo, y su director ejecutivo, Sam Altman, afirma que "desde luego no están cerca" de empezar el entrenamiento.
DALL-E vs Photoshop: ¿Cuál es mejor para ampliar fotos?. Petapixel.
Marc Andreessen sobre por qué la IA “salvará el mundo”; una respuesta a la contra aquí.