Interacción Multi-modal

06 julio, 2006

El Observatorio de Internet Móvil: Interacción Multi-modal » OIM


Las posibilidades actuales de interacción con una aplicación informática han sido especialmente pensados y diseñados para el PC: teclado, ratón, pantallas táctiles. Ninguno de estos modos de interacción resultan adecuados para un dispositivo móvil.

Uno de las áreas de investigación más prometedoras para mejorar la usabilidad de Internet Móvil es precisamente encontrar nuevos modos de interacción que faciliten el control de la aplicación al usuario desde un dispositivo móvil. La idea es permitir a la gente interaccionar con las aplicaciones web mediante una combinación de nuevos modos de interacción más adecuados para los dispositivos móviles: visual, aural y tactil.

El futuro marco de aplicaciones web debe resolver el problema multi-dispositivo. La fragmentación y diversidad de dispositivos que podrán acceder a Internet irá en aumento, no en descenso. La adaptación inteligente se vislumbra como el único camino viable para solucionar este problema. La futura Web Ubicua necesita encontrar nuevos modos de interacción con el usuario.

Modo Aural

La voz resulta un modo de interacción muy natural para los usuarios cuando acceden a las aplicaciones desde un teléfono. La Industria está trabajando en distintas direcciones para averiguar cómo hacer que los navegadores actuales entiendan órdenes habladas.

Existen dos alternativas para el procesamiento del habla en las aplicaciones web atendiendo a dónde resida el peso del reconocimiento del habla:

  • Red
  • Terminales
Ambas opciones presentan ventajas e inconvenientes, siendo la latencia de la red uno de los factores determinantes para esta modalidad de interacción. En este sentido, cabe destacar que la latencia no es necesariamente un factor negativo en este entorno y puede tener incluso un papel positivo a la hora de gestionar adecuadamente el uso de la palabra entre la aplicación y el usuario. Probablemente ambas opciones sean necesarias y coexistan en el futuro.

Por otra parte, AJAX jugará un papel importante en este área gracias a su capacidad de intercambiar información con la Red en segundo plano.

En un terreno más empírico, el Glasgow Interactive Systems Group (GIST) de la Universidad de Glasgow es un grupo multi-disciplinar dedicado a la investigación de la computación ubicua y la interacción multi-modal. Sus trabajos se centran no sólo en la tecnología sino también en la experiencia del usuario, por ello cuenta entre sus miembros con especialistas tanto en tecnología como en Psicología. Dentro de la investigación multi-modal, una de las principales áreas de trabajo de este grupo es la mejora de la interacción hombre-máquina mediante el uso de sonidos, earcons o iconos sonoros, para facilitar información acústica al usuario sobre el resultado de una petición o acción.

Modos Visual y Tactil

Las interacciones visual (gestos, movimientos, expresiones) y táctil parecen más indicadas para las aplicaciones de escritorio, pero pueden jugar su papel en el área de autenticación de usuario, pudiendo ser una alternativa interesante a incorporar por los dispositivos móviles del futuro.

Por cierto, una inmejorable visión de lo que pueden ser las aplicaciones multi-modales del futuro la encontramos en la magnífica película de Steven Spielberg Minority Report, donde podemos ver a Tom Cruise manejando el ordenador central de la brigada de pre-crimen, mediante una combinación de órdenes habladas y movimientos de sus manos.

Mercado Potencial

Ya existen pequeñas compañías que están poniendo a prueba el mercado con un abanico de aplicaciones muy sencillas. V-Enable comercializa una solución que permite a los usuarios acceder a contenido personalizado utilizando la voz como modo de interacción. Ejemplos de uso de esta solución incluyen la búsqueda de tonos de llamada simplemente diciendo el nombre del artista, o bien, decir el nombre de una película para obtener las salas donde se proyecta y los horarios.

Kirusa ofrece una solución que permite a los usuarios responder vía voz a mensajes de texto, es decir, permite componer un mensaje de texto sin necesidad de teclearlo.

Motorola también trabaja en aplicaciones multi-modales para sus terminales, utilizando DMSP, un protocolo propietario, para acoplar el interfaz visual con la aplicación VoiceXML ejecutándose en la Red.

Las soluciones multimodales actuales requieren la instalación de software en el terminal, normalmente aplicaciones Brew o J2ME, pero ya empiezan a emerger navegadores multi-modales. Los navegadores multi-modales serán los catalizadores para la adopción masiva del uso de aplicaciones multi-modales, ya que elimina el engorroso paso de tener que descargar e instalar una aplicación en el dispositivo usuario, lo que para la mayoría de mortales resulta una barrera infranqueable.

Aparte de la búsqueda y el relleno de formularios como aplicaciones más obvias, la autenticación de usuario será un aspecto de la web móvil que se beneficiará sustancialmente del uso de tecnologías multi-modales, tanto en el aspecto puramente operacional, eliminando la necesidad de tener que teclear identificador y clave, como en el aspecto de seguridad. IBM propone una aplicación de autenticación de usuario segura mediante el uso combinado de técnicas biométricas e interacción visual.

Desarrollo de Estándares

Como es normal en cualquier tecnología emergente, las soluciones actuales son todas propietarias. Sin embargo, a medio y largo plazo, el objetivo es establecer un marco estándar para favorecer el desarrollo de este mercado y hacer realidad todo su potencial.

El Grupo de Trabajo Multimodal Interaction del W3C (MMIWG) trabaja ya sobre los futuros estándares que permitirán a los usuarios interactuar con las aplicaciones mediante una combinanción de modos que abarcan el uso del habla, puntero, teclado y escritura.

Etiquetas:


Hay 1 comentario(s) a esta entrada:

  1. Anonymous Anónimo  

    pues como avance tan rapido como las videoconsolas que han tardado siglos en avanzar en los mandos desde la NES hasta la WII... vamos listos


Búsquedas


Llévatelo al Móvil

QR Code temporalmente no disponible