Olvídese de Gemini: el iPhone realmente necesita una tienda LLM – MacMagazine

Puntuación0
Puntuación0

Reflexionando sobre la columna de la semana pasada, en la que escribí sobre cómo la hipótesis de que el Google Géminis Tener presencia en el iPhone puede ser más positivo que malo, llegué a una nueva conclusión: ¿es mejor tener Gemini en el iPhone que no tener nada? Sin duda. ¿Pero sabes qué es mejor que tener Gemini en tu iPhone? Tener acceso a todo los otros LLM 1Grandes modelos de lenguajeo modelos de lenguaje grandes. también.

Lo que voy a proponer no es algo probable, y va en contra de todo lo que Apple ha estado haciendo en iOS (hasta el punto de generar innumerables demandas por prácticas anticompetitivas), pero imagínense: ¿y si iOS nos permitiera acceder de forma nativa a uno? ¿O más LLM de nuestra elección, en lugar de simplemente depender de Gemini de manera fija?

La mala noticia es que, más allá de lo improbable, la historia nos demuestra que incluso cuando Apple decide hacer algo como esto, lo hace de una manera poco práctico o útil.

Si usas lo esencial Expansor de texto, tú sabes de qué estoy hablando. En macOS, simplemente instale TextExpander y le permitirá usar atajos de teclado en cualquier contexto de escritura, en cualquier parte del sistema. dosSí, macOS e iOS han hecho que los atajos de teclado estén disponibles durante años, pero la funcionalidad que ofrece la característica nativa no es una fracción de las posibilidades que ofrece TextExpander..

En el iPhone, el sistema no permite este tipo de integración. Por lo tanto, le correspondía a TextExpander iniciar una aplicación que se comporta como un teclado de terceros y, dentro de ella, proporcionar atajos de teclado. Este flujo de uso es, como saben los usuarios de TextExpander, terrible.

Teclado personalizado TextExpander en iOS.

Y la culpa, por supuesto, no es de TextExpander, sino del yeso que Apple aplica a iOS bajo la (importante, pero a veces exagerado) velo de seguridad. Al mismo tiempo que protege a las personas que caerían en estafas que se aprovecharían de esta apertura del sistema, frustra a quienes buscan algo más allá de lo básico en la intersección entre funcionalidades nativas y recursos de productividad complementarios.

Bien, pero ¿qué pasa con los LLM?

Pues bien. La idea sería la siguiente: de la misma manera que es posible registrar diferentes proveedores de correo electrónico en la aplicación Mail, si iOS 18 permitiera a los usuarios iniciar sesión en ChatGPT, Perplexity, Google Gemini, You, Microsoft Copilot, Mistral, in Claude y otros directamente en la configuración del sistema como fuentes complementarias de Siri, ¿tal vez a través de una aplicación? 👀 —, iOS podría permitir la integración nativa entre el usuario y sus LLM favoritos, en lugar de obligar a la persona a buscar el LLM en Safari o en una aplicación aislada del resto del sistema.

Esto sería especialmente útil para quienes ya se han familiarizado con un LLM específico o lo han ajustado a sus preferencias y necesidades, lo que para un uso frecuente se traduce en una inmensa ganancia en productividad y asertividad del modelo.

Tomemos ChatGPT como ejemplo. Cualquiera que se suscriba al plan pago de la plataforma tiene acceso a una función de personalización que permite al usuario proporcionar información importante sobre su contexto de uso, además de permitirle ajustar la forma en que ChatGPT debe comportarse en todas las conversaciones.

Interfaz de instrucciones personalizadas ChatGPT.

En la práctica, esta función abre posibilidades como, por ejemplo, que un médico pueda decir “la mayoría de las veces te utilizaré para enviar artículos científicos en otros idiomas”. Por lo tanto, al traducir o generar respuestas, tenga siempre presente el contexto de los términos médicos o científicos y ofrezca una traducción más precisa. Y siempre que me traigas afirmaciones, enumera las referencias con la cita en estilo Vancouver”.

Un usuario que quiera practicar inglés puede indicarle a ChatGPT que siempre formule respuestas utilizando las palabras del vocabulario más frecuentes, o pedirle al modelo que siempre lo corrija cuando cometa un error ortográfico o gramatical a lo largo de la conversación.

¿Podría un LLM creado por Apple ofrecer algo similar? Sin duda. Pero primero, para empezar, debe proporcionar algo que esté al nivel de ChatGPT y, dada la posibilidad de asociación con Google, esto parece tan improbable como la tienda LLM.

¿Qué pasa con la privacidad?

Aquí, como siempre, las cosas se vuelven más confusas, ya que a veces LLM se utilizaría en contextos que involucran la privacidad no solo del usuario, sino también de uno o más interlocutores. Piense, por ejemplo, en un intercambio de mensajes grupales. La persona que utiliza el LLM puede sentirse cómoda con la idea de copiar y pegar el historial de mensajes al formular una respuesta, pero ¿qué pasa con los demás participantes? ¿O qué tal su uso en entornos corporativos, con historiales de correo electrónico que contienen información confidencial?

Es cierto que, en todos estos casos, nada impide al usuario copiar y pegar los textos en ChatGPT. Por otro lado, aquí suele ser donde Apple dice “sí, y soy diferente a mi competidor. Si quiere permitir esto, ese es su problema. No lo permitiré”. Volvamos a la charla sobre el yeso.

Dicho esto, Apple también tiene ya una solución a este problema, y ​​se llama notarización. Si hubiera un proceso de aprobación para controlar qué LLM podrían tener acceso a iOS 3¡Hola antimonopolio!Apple tendría la posibilidad de revocar el acceso de un mal actor que resultó no ser confiable, o que cambió sus términos de uso hasta el punto de volverlos inseguros.

Es más, al subcontratar básicamente esto (muy importantepor supuesto) aspecto de iOS si bien no es capaz de ofrecer una buena solución por sí solo, Apple tendría más tiempo para trabajar y tratar de resolver cuestiones delicadas relacionadas con los sesgos de los modelos, las alucinaciones y el siempre controvertido tema de los datos utilizados en el entrenamiento.

Y para ser claros: ofrecer un LLM multimodal eficiente y privado es lo mínimo que esperamos de Apple, y es impensable que el futuro de iOS y macOS no incluya algo como esto. Pero si a estas alturas las alternativas son subcontratar y ofrecer la opción entre proveedores que ya saben lo que están haciendo, o no ofrecer un LLM nativo útil por quién sabe cuánto tiempo, definitivamente preferiría la primera opción.

Resumen de ópera

Como dije la semana pasada, si Apple permite que Google Gemini acceda al iPhone, imagino que será justo hasta el modelo Nano, diseñado para venir instalado en el sistema y no requerir internet para nada. Esto hace que la funcionalidad sea menos útil que el acceso a un modelo 10 o 20 veces más grande que se encuentra en la web, como es el caso del Gemini Pro, pero puede hacer que la idea de tener Google más presente en nuestros iPhones sea más aceptable.

Desde un punto de vista práctico y útil de los LLM, existe una grande diferencia entre mostrar de vez en cuando media docena de correos electrónicos a Google Gemini para que recuerde momentáneamente tu forma de escribir, comparado con tener, por ejemplo, un LLM nativo y que (pensando en la privacidad) use mensajes, fotos, ubicación, archivos, navegación. historial y más como parte de la personalización permanente de la plantilla.

Algo como esta segunda situación haría del iPhone la herramienta de IA personalizada más útil del mundo de la noche a la mañana, y creo que eso es lo que esperamos de Apple en el futuro.

Sin embargo, incluso los más optimistas deben reconocer que las posibilidades de que esto suceda pronto son muy bajas, especialmente considerando que, si Apple está hablando con Google, probablemente sea para cubrir una necesidad que ya sabe que no podrá resolver por su cuenta. propio en el corto plazo. .

Si realmente la idea de Apple es ceder y ceder ante Gemini Pro para ofrecer funcionalidades de IA, en este caso no veo esta solución como nada más eficiente que permitir al usuario integrarse con su LLM de elección o confianza, especialmente considerando que existen LLM más eficientes que Gemini en el mercado.

Sólo en la última semana, por ejemplo, el Claude 3 Opus desde el antrópico superó a ChatGPT-4 y se convirtió en el nuevo líder del ranking HuggingFace. En este mismo ranking, Gemini Pro ocupa el cuarto lugar. Nano, por supuesto, ni siquiera aparece en la lista.

Notas a pie de página

Estaremos encantados de escuchar lo que piensas

Deje una respuesta

Lucas Laruffa
Logo