Google continúa apostando fuerte por la integración de su inteligencia artificial, Gemini, y ahora pone el foco en el escritorio de macOS. Según recientes hallazgos en versiones de prueba, la compañía trabaja en un par de herramientas que podrían cambiar radicalmente la forma en que interactuamos con nuestras computadoras, buscando reducir la dependencia del teclado y el mouse en tareas cotidianas.
Control por voz con “Speak to Window”
Una de las funciones más esperadas es “Speak to Window”, un sistema de dictado avanzado diseñado para simplificar la interacción con Gemini. Imaginate que, mientras estás en cualquier aplicación, simplemente mantenés presionada la tecla FN de tu teclado y podés dictar instrucciones directamente al asistente. Esto te permitiría pedirle que redacte un correo electrónico, resuma un texto, genere contenido o incluso cree imágenes mediante IA, todo sin necesidad de escribir una sola palabra.
La clave de esta función radica en que Gemini no solo escucharía tu comando, sino que también interpretaría el contexto de la ventana activa. Esto significa que la IA tendrá acceso a la aplicación que estás utilizando en ese momento, brindando respuestas y ejecuciones mucho más precisas. Es un paso gigante hacia un asistente que realmente colabora con vos durante tu jornada laboral.
“Magic Pointer”: la IA sigue tu cursor
La segunda gran novedad, y quizás la más impactante, es la función “Magic Pointer” o “Puntero mágico”. Esta herramienta permitirá a Gemini seguir los movimientos de tu cursor en tiempo real, identificando exactamente qué elemento estás observando en la pantalla. Pensalo así: si rodeás una sección específica de una página web, un documento o una imagen con el cursor, la IA podría interpretar automáticamente esa información y ejecutar acciones relacionadas.
Con “Magic Pointer”, Gemini podría, por ejemplo, resumir el texto seleccionado, explicar una imagen o modificar contenido basándose en el área que vos le señalás. Esta innovación busca resolver uno de los mayores desafíos de los asistentes de IA actuales: la comprensión precisa del contexto visual al que se refiere el usuario cuando da instrucciones verbales. Es una muestra clara de cómo Google quiere que Gemini se integre de forma permanente y contextual en tu sistema operativo.
Si bien estas funciones fueron descubiertas en versiones preliminares para macOS y todavía no hay una fecha oficial de lanzamiento, reflejan una tendencia clara en la industria tecnológica. La voz y el contexto visual están tomando un rol cada vez más importante, y empresas como Google, Microsoft y Apple buscan que sus asistentes puedan observar lo mismo que el usuario para ofrecer asistencia en tiempo real. ¿Y vos qué pensás de esta evolución? ¿Creés que el mouse y el teclado tienen los días contados?








