Descubre La Mejor Plataforma Low-Code
8 Min.

Reinventando la Experiencia del Usuario con IA: Explorando la Sinergia entre las Heurísticas de Nielsen y los Patrones de Interacción impulsados por la IA

Introducción

Desde la aparición de los Modelos Base, varias organizaciones han comenzado a intentar aprovechar su poder. Lo hacen utilizando la Ingeniería de Instrucciones, el Ajuste Fino, LoRA (Adaptación de Rango Bajo), RLHF (Aprendizaje por Reforzamiento a partir de Retroalimentación Humana), o una combinación de estas técnicas.

Desde la perspectiva de la experiencia de usuario (UX), está claro que la introducción de ChatGPT cambiará las interfaces que necesitamos crear. ChatGPT ha demostrado un nivel de interacción de IA nunca antes visto. Si bien las interfaces conversacionales ya existían, el impacto de ChatGPT lo convierte en la aplicación revolucionaria que se recordará como el inicio de una revolución.

Otro aspecto crucial de esta revolución es la provisión de APIs de OpenAI para el acceso programático a los Modelos Base, que es comparable a Apple y Google permitiendo a los desarrolladores construir aplicaciones en sus sistemas operativos móviles. Esta exposición de API representa un logro de ingeniería quizás tan significativo como los propios modelos.

En este artículo, exploraremos cuatro patrones de interacción emergentes en la UX que aprovechan estas nuevas tecnologías.

Chat to Explore (Exploración de Contenido a través de Chat)

Problema:

Buscar algo en particular y responder preguntas sobre grandes cantidades de información (documentos, PDF, artículos, etc.) no es una tarea fácil.

Existe una creciente demanda de una interfaz similar a ChatGPT que se pueda adaptar a dominios de conocimiento específicos, ya sea que involucren información privada o pública. Sin embargo, es crucial desarrollar esta interfaz de manera que garantice la privacidad y permita controlar la salida del modelo de lenguaje, abordando específicamente cualquier problema potencial de alucinaciones en sus respuestas.

Solución:

Este patrón fue adoptado rápidamente por gigantes de búsqueda como Google (Bard) y Microsoft (Bing). El patrón «Chat to Explore» implica realizar una búsqueda inicial y luego refinarla utilizando un modelo de chat.

Este enfoque estrecha el alcance de la interacción con el modelo de chat al proporcionar contexto desde la búsqueda inicial. Tanto Google como Bing utilizan sus motores de búsqueda para contextualizar los modelos, intentando así «domar a la bestia» que hay detrás de ellos.

En Globant, ya estamos aplicando este patrón en varios proyectos. Es increíble cómo este patrón coincide con el modelo mental de cómo interactuar con la información para casi cualquier usuario.

Combinando las heurísticas de experiencia de usuario (UX) de Jakob Nielsen con el patrón «Chat to Explore»:

  1. Visibilidad del estado del sistema: La interfaz de chat puede proporcionar a los usuarios comentarios en tiempo real a medida que refinan su consulta de búsqueda, asegurando que estén al tanto del estado y progreso del sistema. El estado del sistema se muestra al usuario directamente en el hilo de la conversación.
  2. Control y libertad del usuario: Los usuarios pueden cambiar entre interacciones de búsqueda y chat a voluntad, lo que les permite explorar información y navegar por el sistema de una manera más intuitiva. En este patrón, el usuario tiene la libertad de chatear, pero al mismo tiempo siente que tiene el control porque la interfaz le presentará al usuario las fuentes de las respuestas. Al mismo tiempo, el usuario puede volver a intentar diferentes preguntas para refinar una respuesta inicial.
  3. Consistencia y estándares: Al aprovechar un lenguaje de diseño consistente tanto para los componentes de búsqueda como para los de chat, los usuarios podrán comprender y predecir el comportamiento del sistema de manera más efectiva. Con millones de usuarios que utilizan interfaces similares a Bard, Bing y ChatGPT, podemos garantizar cierta consistencia en cómo interactuar con la empresa siguiendo interfaces similares.
  4. Flexibilidad y eficiencia: El patrón «Chat to Explore» permite a los usuarios acceder rápidamente a la información deseada, ya sea a través de la funcionalidad de búsqueda o participando en una conversación con el modelo de IA.

Chat to Analyze (Chat para Analizar)

Problema:

Los usuarios están visualizando una entidad, documento o hoja de cálculo en una página o aplicación y tienen preguntas sobre lo que ven.

Solución:

Una heurística clave de interacción es que la visualización del sistema se corresponda con el modelo mental del usuario. Por ejemplo, enumerar las especificaciones técnicas de un producto no es suficiente para ayudar a los usuarios a comprender cómo se ajusta a sus necesidades. Con modelos más potentes, podemos entablar conversaciones utilizando términos que el usuario comprenda.

Este patrón se puede implementar en interfaces de productividad, como Office 365, que utilizan ventanas de herramientas para presentar un asistente para consultas contextuales. Este patrón se utilizará en ERPs y otras interfaces web tradicionales, como la creada en K2B ERP.

Incorporando las heurísticas de Nielsen en el patrón «Chat to Analyze»:

  1. Coincidencia entre el sistema y el mundo real: La interfaz de chat permite a los usuarios interactuar con el sistema utilizando lenguaje natural, cerrando la brecha entre el modelo mental del usuario y la representación de información del sistema.
  2. Diseño estético y minimalista: Al integrar la interfaz de chat como una herramienta complementaria, la interfaz principal puede mantenerse libre de desorden, centrándose en el contenido esencial y reduciendo la carga cognitiva. 
  3. Ayudar a los usuarios a reconocer, diagnosticar y recuperarse de errores: La interfaz de chat puede ayudar a los usuarios a comprender los errores, proporcionar sugerencias y guiarlos en el proceso de recuperación. 
  4. Ayuda y documentación: El patrón «Chat to Analyze» permite proporcionar ayuda contextual, brindando a los usuarios la información que necesitan sin salir de la interfaz actual.

Intention-based UI Navigation (Navegación de la interfaz de usuario basada en la intención)

Problema:

Los usuarios a menudo ingresan a un sistema empresarial con la intención de realizar una tarea específica o obtener información específica, pero estos sistemas tienden a crecer en funcionalidades con el tiempo, lo que conduce a una navegación compleja y disminuye la eficiencia del usuario.

Solución:

Se utilizarán Modelos de Lenguaje de Aprendizaje (LLMs) para el descubrimiento progresivo basado en las intenciones del usuario, combinando la productividad de las interfaces de manipulación directa con las conversacionales. La navegación se volverá híbrida en ciertos contextos, permitiendo a los usuarios descubrir nuevas partes del sistema utilizando lenguaje natural y guiándolos hacia las áreas más productivas.

Mejorando las heurísticas de Nielsen con el patrón de Navegación Basada en la Intención:

  1. Reconocimiento en lugar de recordar: Al utilizar el procesamiento de lenguaje natural para comprender las intenciones del usuario, este patrón reduce la necesidad de que los usuarios recuerden rutas de navegación específicas o comandos.
  2. Prevención de errores: Al comprender la intención del usuario, el sistema puede guiarlo hacia el destino deseado, reduciendo la probabilidad de cometer errores de navegación.
  3. Flexibilidad y eficiencia: La Navegación Basada en la Intención ofrece una forma más personalizada y eficiente de navegar sistemas complejos, ya que se adapta a las necesidades y preferencias individuales de los usuarios.
  4. Consistencia y estándares: Al incorporar el mismo modelo de lenguaje en todo el sistema, los usuarios pueden esperar respuestas y guías consistentes, sin importar en qué parte de la aplicación se encuentren.

Magic Auto-complete (Auto-Completado Mágico)

Problema:

El contenido generado por humanos a menudo requiere resumir, editar y formatear, lo que puede llevar mucho tiempo.

Solución:

Los modelos de IA están empujando los límites de completar, resumir, formatear y comparar contenido en varias interfaces. Esto va más allá de las simples funciones de autocompletado que se encuentran en entornos de programación.

Al diseñar interfaces, debemos preguntarnos si es necesario completar o escribir algo. Si es así, debemos considerar la interfaz de Auto-Completado Mágico que mejor sirva al propósito.

Por ejemplo, en StarMeUp hay varios lugares donde estamos utilizando este patrón, para generar contenido de imágenes, reseñas, etc. En las herramientas para desarrolladores, hay varias herramientas que aplican este patrón para completar código, resumir documentación, etc. Las herramientas de productividad como Google Apps y Office 365 aplican este patrón en todas partes.

Integrando las heurísticas de Nielsen en el patrón de Auto-Completado Mágico:

  1. Prevención de errores: Auto-Completado Mágico ayuda a los usuarios a evitar errores al proporcionar sugerencias contextualmente relevantes y reducir la probabilidad de errores de entrada. 
  2. Flexibilidad y eficiencia: Este patrón se adapta tanto a usuarios principiantes como expertos, ya que ofrece sugerencias inteligentes para ahorrar tiempo sin comprometer el control del usuario sobre la creación de contenido.
  3. Diseño estético y minimalista: Al integrar sin problemas el Auto-Completado Mágico en la interfaz existente, no se agregan elementos innecesarios, manteniendo un diseño limpio y enfocado. 
  4. Reconocimiento en lugar de recordar: Auto-Completado Mágico ayuda a los usuarios a recordar información relevante al proporcionar sugerencias y completar en función de su entrada y el conocimiento del sistema, reduciendo la necesidad de que los usuarios recuerden detalles específicos.

Conclusión

En conclusión, creemos que la convergencia de los LLMs y la aparición de API para el acceso programático a estos modelos representa un punto de inflexión similar al lanzamiento del iPhone (que introdujo las interfaces táctiles de uso general) y más tarde las herramientas de desarrollo para crear aplicaciones para esa plataforma. La experiencia de usuario del software cambió de la noche a la mañana, y esto también sucederá en el escenario actual de la IA.

La aparición de los LLMs ha llevado al desarrollo de varias técnicas como Prompt Engineering, Fine Tuning, LoRA y RLHF. Las API de OpenAI para el acceso programático a estos modelos representan un logro técnico tan significativo como los propios modelos.

Creemos que estos patrones emergentes de interacción de UX (Chat para Explorar, Chat para Analizar, Navegación Basada en la Intención y Auto-Completado Mágico) satisfacen las necesidades de los usuarios, proporcionando formas personalizadas y eficientes de navegar sistemas complejos, completar y mejorar el contenido, y nuevas formas de encontrar información y respuestas. Al incorporar las heurísticas de Jakob Nielsen, los diseñadores pueden garantizar que estos patrones sean utilizables, eficientes y fáciles de aprender. ¡Y solo son la punta del iceberg!

A medida que los modelos de base continúen evolucionando y volviéndose más poderosos, y sigamos aprendiendo cómo aplicarlos mejor, es emocionante imaginar qué nuevos patrones de interacción de UX permitirán.

¡Trabajaremos arduamente para crear este nuevo futuro, y ustedes también deberían hacerlo!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Volver al incio