
ReALM: Apple presenta un modelo de IA comparable al GPT-4 – MacMagazine
A Manzana presentado [PDF] un nuevo modelo de inteligencia artificial que promete revolucionar las capacidades de Cangrejo – se llama Reino (Resolución de referencia como modelado de lenguajeo resolución de referencia como modelado de lenguaje).
Al ejecutarse en el dispositivo, busca hacer que Siri sea más inteligente, permitiendo que el asistente comprenda “entidades” en la pantalla del usuario, así como conversaciones y procesos en segundo plano, como alarmas y música, para responder con mayor precisión.
Son ellas: Pantalla (lo que se muestra), Conversacional (datos relevantes de la conversación, de interacciones anteriores o del asistente virtual) y Abajo (procesos en segundo plano, que influyen en el contexto de la interacción).
Un artículo de investigación publicado recientemente explora ReALM y demuestra que puede superar a los sistemas existentes, respaldando su eficacia para mejorar la utilidad de Siri a través del modelado de lenguaje avanzado.
Demostramos mejoras importantes con respecto a un sistema existente con funcionalidad similar en diferentes tipos de referencias, y nuestro modelo más compacto logró ganancias absolutas de más del 5 % para las referencias en pantalla. También realizamos comparaciones con GPT-3.5 y GPT-4: nuestro modelo más compacto logró un rendimiento comparable al GPT-4 y nuestros modelos más grandes lo superaron sustancialmente.
Además, las pruebas punto de referencia en comparación con ChatGPT 3.5 y ChatGPT 4.0 de OpenAI muestran que ReALM logra un rendimiento comparable al de GPT-4, y los modelos más grandes lo superan considerablemente.
Nuestro objetivo es que ambas variantes predigan una lista de entidades de un conjunto disponible. En el caso de GPT-3.5, que solo acepta texto, nuestra entrada consiste solo en el mensaje; sin embargo, en el caso de GPT-4, que también tiene la capacidad de contextualizar imágenes, proporcionamos al sistema una captura de pantalla para la tarea de resolución de puntos de referencia en pantalla, lo que descubrimos que ayudó a mejorar sustancialmente el rendimiento.
Incluso con menos parámetros que GPT-4, todo indica que ReALM lo supera en tareas textuales y comprensión de comandos del usuario, a pesar de que GPT-4 tiene la capacidad de contextualizar imágenes.
Es muy probable que veamos novedades relacionadas con estas tecnologías el próximo mes de junio, a las WWDC24. Este año, al fin y al cabo, se espera que el evento ponga especial énfasis en la integración de funciones de inteligencia artificial en los principales sistemas operativos de Apple. ¡Esperemos!
vía 9to5Mac