La Inteligencia Artificial da un nuevo salto en el inicio de un 2024 vertiginoso de la mano de OpenAI
El lanzamiento de la aplicación Sora para crear al instante videos con una simple frase es un golpe en la mesa de la compañía de ChatGPT que eclipsa la útima novedad de Google, Gemini 1.5
El 15 de febrero quedará marcado en la historia reciente de la Inteligencia Artificial. Google lanza ese día, jueves, Gemini 1.5, que próximamente estará disponible para el gran público, con una ventana de contexto de 1 millón de tokens para aquellos que paguen, y prometiendo dejar en ridículo a GPT-4 de OpenAI. Esta es la primera actualización de su modelo de IA de última generación, una semana después de la ‘defunción’ de Bard y del Asistente de Google, del renombramiento a Gemini y de la salida de Gemini Ultra 1.0. Gemini 1.5 Pro (Google) ofrecerá una ventana de contexto de 128.000 tokens, la misma que GPT-4 Turbo (OpenAI), pero habrá una variedad de precios hasta llegar al millón de tokens. Google explica que con ese millón Gemini 1.5 Pro puede procesar sobre la marcha "1 hora de vídeo, 11 de horas de audio y bases de código con 300.000 líneas de código o más de 700.000 palabras". La compañía asegura haber experimentado durante la investigación con hasta 10 millones de tokens, imagináos.
Google lanza Gemini 1.5 y destroza a OpenAI y GPT-4, tituló Hipertextual. Era la noticia del día y de la semana. Quizá la del primer mes y medio del año. O la noticia del primer trimestre de 2024. Pues bien. El mismo día, 15 de febrero, OpenAI y, dos minutos después Sam Altman, anuncian en Twitter (X) el lanzamiento de Sora, una aplicación que permite generar en segundos videos de un minuto con una simple instrucción escrita. La web de OpenAI trae algunos videos de Sora, que es como se llama esta nueva aplicacion de ‘text-to-video’. Un minuto después que Altman, Greg Brockman y, media hora después, Mira Murati también tuitean, pero Sam Altman empieza a colgar los videos que Sora generaba a partir de las peticiones escritas que sus seguidores en Twitter le iban lanzando.
OpenAI responde de golpe al órdago de Google con Gemini 1.5 y de Nvidia con Chat with RTX anunciando el lanzamiento de la aplicación que completa sa santísima Trinidad: texto (GPT), imagen (DALL·E) y video (SORA).
El impacto en redes sociales de la aparición de Sora es aún este fin de semana espectacular, hasta el punto que incluso los medios de comunicación tradicionales, tan reacios a estas novedades, lo convierten en noticia. De golpe, el gran público ha sabido de una nueva prestación que tendrá OpenAI, la compañía creadora de ChatGPT, de tal manera que estaremos ante lo que alguien ha descrito como la santísima Trinidad: GPT para texto, DALL·E para imagen, y SORA para video. Nadie duda que el audio, más fácil que la imagen y el video, está al caer, aunque paradojalmente sobre él puede pesar la hipocresía o el puritanismo imperante. Al audio no se le puede meter una marca de agua.
El mundo mundial, pues, sabe que cualquier persona podrá generar video en instantes escribiendo una simple frase. Y que ese video puede ser tan realista que parezca la grabación de una escena real. El mundo mundial, que no se había enterado de la noticia del lanzamiento de Gemini 1.5, para desesperación de Google, tiene un ataque de vértigo nuevamente de la mano de OpenAI y de Sam Altman. A Google, últimamente todo se lo amarga la compañía de ChatGPT. No solo por el producto sino también por la comunicación. Gemini 1.5 ha quedado eclipsado por Sora el mismo 15 de febrero, este pasado jueves, en los medios de comunicación tradicionales, digitales y especializados. Pero, lo que es peor, OpenAI ha ganado nuevamente la partida a Google en el impacto emocional en redes sociales entre el público más fan de la IA.
La ocupación del ‘time-line’ en Twitter y YouTube de los videos de Sora en detrimento del anuncio de Gemini 1.5 es la victoria de David contra Goliat como marca de la casa de la IA.
El festival de tuits y videos de Altman y los suyos, la rápida reacción de divulgadores como Carlos Santana, Jon Hernández y Xavier Mitjana detallando y comentando Sora. La ocupación de nuestro ‘time-line’ en Twitter y YouTube de los videos de Sora en detrimento del anuncio de Gemini 1.5 es, a mi entender, la victoria de David contra Goliat como marca de la casa de la Inteligencia Artificial. Las reglas del juego han cambiado, y la sensación de impotencia o frustración que experimentaron este jueves en Google debe ser indescriptible.
Una organización sin ánimo de lucro fundada en diciembre de 2015 por Ilya Sutskever, Greg Brockman, Trevor Blackwell, Andrej Karpathy, Sam Altman y Elon Musk, estos eran los miembros iniciales de la junta, está pasando la mano por la cara a Google. (Por cierto, también le pasa la cara por la mano a Elon Musk, que dejó su participación en OpenAI. Y, por cierto bis, esta semana Andrej Karpathy ha anunciado que también salía de la compañía para dedicarse a proyectos personales. Habrá que investigar los movimientos internos y recuperar ‘mini-culebrones’.)
El intento de troleo de Zuckerberg, la devolución de las Vision Pro y el ímpetu de Nvidia
El jueves yo estaba sufriendo porque en mi bloc de notas tenía anotadas algunas noticias y novedades para comentaros aquí, en Algoritmo Transparente. Tenía un material pobre para escribir un boletín que pudiera interesar al gran público y a los más interesados en la IA. La devolución de las primeras Vision Pro, las gafas de realidad virtual de Apple que salieron a la venta del 2 de febrero en Estados Unidos, por parte de algunos compradores. La aparición de unas gafas de pasta con IA que cuestan un 10% de los 3.500 dólares de las Vision Pro. Que Mark Zuckerberg se mofa de las Vision Pro y pretende aumentar las ventas de las Quest 3 de su Meta aprovechando el ‘hype’ de las gafas de Apple. Que ChatGPT tendrá memoria y recordará nuestras conversaciones anteriores con él. Que OpenAI quiere plantar cara a Google con un buscador propio. Que Nvidia desafía a OpenAI con Chat with RTX. Que Midjourney estrena web y facilita su uso entre el gran público fuera del entorno de Discord. Que en Estados Unidos han decidido que la IA no puede patentar inventos. Que la ciudad de Nueva York ha demandado a las cinco grandes redes sociales por perjudicar la salud mental de sus jóvenes. Que una pareja se casa gracias a que la IA les ha ayudado a superar sus barreras idiomáticas. Que Nvidia ha superado a Amazon en valoración de mercado. Que Sam Altman busca una cantidad de dinero ingente para fabricarse los chips y no depender precisamente de Nvidia. Que Joe Biden se ha estrenado en TikTok en año electoral a pesar de las propias advertencias por la (in)seguridad de esta red por parte de su administración. Que en España hay algún espabilado que está acumulando premios en concursos de carteles municipales gracias a la IA. O que a los fans de Estopa no les ha hecho gracia la imagen de una canción generada con IA (el cartel, no la música).
Con estos mimbres me las tenía que ingeniar para traeros esta semana un nuevo Algoritmo Transparente a la altura de las expectativas (que no son pocas, y ¡muchas gracias a los nuevos suscriptores!). Pero el duelo Google-OpenAI y el gran Sam Altman me han solucionado la papeleta y sacado de un apuro. Llevamos 40 días de 2024 y Sora es un golpe en la mesa de la Inteligencia Artificial. Lo que está por venir justifica seguir leyendo Algoritmo Transparente, compartirlo y recomendarlo a vuestras amistades o contactos profesionales. Aquí repasamos lo mejor y más relevante. Y lo explicamos para que lo puedan entender hasta aquellas personas que aún no han escrito un ‘prompt’. ¡Hasta la semana que viene!
[La Intel·ligència Artificial fa un nou salt a l’inici d’un 2024 vertiginós de la mà d’OpenAI, en catalán]
Algoritmo Transparente #20
Te voy a confesar algo: de lo del lanzamiento del Gemini de Google casi que me he enterado por aquí (apenas vi un titular). Soy de los ‘absorbidos’ por el impacto de Sora. ☺️
Ha sido espectacular, Juan Carlos. ¡Saludos!