
Introdução

Desde o surgimento dos Modelos Fundamentais, várias organizações começaram a tentar aproveitar seu poder. Elas fazem isso usando Engenharia de Prompt, Ajuste Fino, LoRA (Adaptação de Baixa Classificação) RLHF (Aprendizado por Reforço a partir do Feedback Humano) ou uma combinação dessas técnicas.
Do ponto de vista da experiência do usuário (UX), está claro que a introdução do ChatGPT mudará as interfaces que precisamos criar. O ChatGPT demonstrou um nível de interação de IA nunca antes visto. Embora as interfaces conversacionais já existissem, o impacto do ChatGPT o torna o aplicativo revolucionário que será lembrado como o início de uma revolução.
Outro aspecto crucial dessa revolução é a disponibilização de APIs pela OpenAI para acesso programático aos Modelos Fundamentais, o que é comparável à Apple e ao Google permitindo que os desenvolvedores construam aplicativos em seus sistemas operacionais móveis. Essa exposição da API representa uma conquista técnica talvez tão significativa quanto os próprios modelos.
Neste artigo, exploraremos quatro padrões emergentes de interação de UX que aproveitam essas novas tecnologias.
Chat to Explore Contents (Chat para Explorar Conteúdos)
Problema:
Procurar algo específico e responder a perguntas sobre grandes quantidades de informações (documentos, PDFs, artigos, etc.) não é uma tarefa fácil.
Existe uma crescente demanda por uma interface semelhante ao ChatGPT que possa ser adaptada a domínios de conhecimento específicos, seja envolvendo informações privadas ou públicas. No entanto, é crucial desenvolver essa interface de maneira que garanta privacidade e permita o controle sobre a saída do modelo de linguagem, abordando especificamente quaisquer problemas potenciais com alucinações em suas respostas.
Solução:
Este padrão foi rapidamente adotado por gigantes de busca como o Google (Bard) e a Microsoft (Bing). O padrão Chat para Explorar envolve realizar uma busca inicial e depois refiná-la usando um modelo de chat.
Essa abordagem reduz o escopo da interação com o modelo de chat, fornecendo contexto a partir da busca inicial. Tanto o Google quanto o Bing usam seus mecanismos de busca para contextualizar os modelos, tentando assim “domar a fera” por trás deles.
Na Globant, já estamos aplicando esse padrão em vários projetos. É incrível como esse padrão se adequa ao modelo mental de como interagir com informações para quase qualquer usuário.
Combinando as heurísticas de UX de Jakob Nielsen com o padrão Chat para Explorar:
- Visibilidade do status do sistema: a interface de chat pode fornecer aos usuários feedback em tempo real conforme eles refinam sua consulta de busca, garantindo que estejam cientes do status e do progresso do sistema. O status do sistema é mostrado diretamente ao usuário na linha da conversa.
- Controle e liberdade do usuário: os usuários podem alternar entre interações de busca e chat à vontade, permitindo que explorem informações e naveguem no sistema de maneira mais intuitiva.
- Nesse padrão, o usuário tem a liberdade de conversar, mas ao mesmo tempo sente-se no controle porque a interface vai apresentar ao usuário as fontes das respostas. Ao mesmo tempo, o usuário pode tentar diferentes perguntas para refinar uma resposta inicial.
- Consistência e padrões: aproveitando uma linguagem de design consistente para os componentes de busca e chat, os usuários serão capazes de entender e prever o comportamento do sistema de forma mais eficaz. Com milhões de usuários usando interfaces como Bard, Bing e ChatGPT, podemos garantir certa consistência na forma de interagir com empresas, seguindo interfaces semelhantes.
- Flexibilidade e eficiência: o padrão Chat para Explorar permite que os usuários acessem rapidamente as informações desejadas, seja por meio da funcionalidade de busca ou por meio de uma conversa com o modelo de IA.
Chat to Analyze (Chat para Analisar)
Problema:
Os usuários estão visualizando uma entidade, documento ou planilha em uma página ou aplicativo e têm dúvidas sobre o que veem.
Solução:
Uma heurística fundamental de interação é combinar a exibição do sistema com o modelo mental do usuário. Por exemplo, listar as especificações técnicas de um produto não é suficiente para ajudar os usuários a entender como ele atende às suas necessidades. Com modelos mais poderosos, podemos realizar conversas usando termos que o usuário entende.
Esse padrão pode ser implementado em interfaces de produtividade, como o Office 365, que utilizam janelas de ferramentas para apresentar um assistente para consultas sensíveis ao contexto. Esse padrão será usado em ERPs e outras interfaces web tradicionais, como a criada no K2B ERP.
Incorporando as heurísticas de Nielsen no padrão Chat para Analisar:
- Correspondência entre o sistema e o mundo real: A interface de chat permite que os usuários interajam com o sistema usando linguagem natural, aproximando o modelo mental do usuário da representação de informações do sistema.
- Design estético e minimalista: Ao integrar a interface de chat como uma ferramenta complementar, a interface principal pode permanecer livre de desordem, focando no conteúdo essencial e reduzindo a carga cognitiva.
- Auxiliar os usuários a reconhecer, diagnosticar e se recuperar de erros: A interface de chat pode ajudar os usuários a entender os erros, fornecendo sugestões e orientando-os no processo de recuperação.
- Ajuda e documentação: O padrão Chat to Analyze permite uma ajuda sensível ao contexto, fornecendo aos usuários as informações necessárias sem sair da interface atual.
Intent-based UI Navigation (Navegação de UI Baseada em Intenção)
Problema:
Os usuários frequentemente acessam um sistema empresarial com a intenção de realizar uma tarefa específica ou obter uma informação específica, mas esses sistemas tendem a crescer em funcionalidades ao longo do tempo, levando a uma navegação complexa e resultando em diminuição da eficiência do usuário.
Solução:
Os LLMs serão usados para descoberta progressiva com base nas intenções do usuário, combinando a produtividade das interfaces de manipulação direta com as conversacionais. A navegação se tornará híbrida em certos contextos, permitindo que os usuários descubram novas partes do sistema usando linguagem natural e os guiando para as áreas mais produtivas.
Aprimorando as heurísticas de Nielsen com o padrão de Navegação Baseada em Intenção:
- Reconhecimento em vez de lembrança: Ao utilizar processamento de linguagem natural para entender as intenções do usuário, esse padrão reduz a necessidade de os usuários lembrarem caminhos de navegação específicos ou comandos.
- Prevenção de erros: Ao compreender a intenção do usuário, o sistema pode guiá-lo até o destino desejado, reduzindo a chance de cometer erros de navegação.
- Flexibilidade e eficiência: A Navegação Baseada em Intenção oferece uma maneira mais personalizada e eficiente de navegar em sistemas complexos, pois atende às necessidades e preferências individuais dos usuários.
- Consistência e padrões: Ao incorporar o mesmo modelo de linguagem em todo o sistema, os usuários podem esperar respostas e orientações consistentes, independentemente de onde estejam na aplicação.
Magic Auto-Complete (Auto-Completar Mágico)
Problema:
O conteúdo gerado por humanos frequentemente requer resumos, edições e formatações, o que pode consumir muito tempo.
Solução:
Os modelos de IA estão ampliando os limites da conclusão, resumo, formatação e comparação de conteúdo em várias interfaces. Isso vai além das simples funcionalidades de autocompletar encontradas em ambientes de programação.
Ao projetar interfaces, devemos nos perguntar se é necessário preencher ou escrever algo. Se sim, devemos considerar a interface de Auto-Completar Mágico que melhor servirá ao propósito.
Por exemplo, no StarMeUp, há vários lugares onde estamos usando esse padrão, para gerar conteúdo de imagens, avaliações, etc. Nas ferramentas de desenvolvedor, existem várias ferramentas que aplicam esse padrão para completar código, resumir documentação, etc. Ferramentas de produtividade como Google Apps e Office 365 estão aplicando esse padrão em todos os lugares.
Integrando as heurísticas de Nielsen ao padrão Auto-Completar Mágico:
- Prevenção de erros: O Auto-Completar Mágico ajuda os usuários a evitar erros, fornecendo sugestões sensíveis ao contexto e reduzindo a probabilidade de erros de entrada.
- Flexibilidade e eficiência: Esse padrão atende tanto a usuários novatos quanto a especialistas, pois oferece sugestões inteligentes para economizar tempo sem comprometer o controle do usuário sobre a criação de conteúdo.
- Design estético e minimalista: Ao integrar perfeitamente o Auto-Completar Mágico na interface existente, ele não adiciona elementos desnecessários, mantendo um design limpo e focado.
- Reconhecimento em vez de lembrança: O Auto-Completar Mágico auxilia os usuários a lembrar informações relevantes, fornecendo sugestões e completando com base em sua entrada e no conhecimento do sistema, reduzindo a necessidade de os usuários lembrarem detalhes específicos.
Conclusão:
Em conclusão, acreditamos que a convergência dos LLMs e o surgimento de APIs para acesso programático a esses modelos representam um ponto de inflexão paralelo ao lançamento do iPhone (que trouxe as interfaces de toque para o público em geral) e posteriormente as ferramentas de desenvolvedor para criar aplicativos para essa plataforma. A experiência de UX do software mudou da noite para o dia, e isso também acontecerá no cenário atual de IA.
O surgimento dos LLMs levou ao desenvolvimento de várias técnicas, como Engenharia de Prompt, Ajuste Fino, LoRA e RLHF. As APIs da OpenAI para acesso programático a esses modelos representam uma conquista de engenharia tão significativa quanto os próprios modelos.
Acreditamos que esses padrões emergentes de interação de UX (Chat para Explorar, Chat para Analisar, Navegação Baseada em Intenção e Auto-Completar Mágico) atendem às necessidades dos usuários, oferecendo maneiras personalizadas e eficientes de navegar em sistemas complexos, completar e aprimorar conteúdo e encontrar informações e respostas de novas maneiras. Ao incorporar as heurísticas de Jakob Nielsen, os designers podem garantir que esses padrões sejam utilizáveis, eficientes e fáceis de aprender. E eles são apenas a ponta do iceberg!
À medida que os modelos fundamentais continuam a evoluir e se tornar mais poderosos, e continuamos a aprender como aplicá-los melhor, é empolgante imaginar quais novos padrões de interação de UX eles possibilitarão.
Estaremos trabalhando arduamente para criar esse novo futuro, e você também deveria!