Projetando interfaces de voz

02/06/2018
a imagem mostra a alexa, assistente de voz da amazon

Olá pessoas, tudo bem?

Cada vez mais dispositivos controlados por voz, como o Apple HomePod e o Amazon Echo, estão invadindo o mercado. Os dispositivos de voz estão ajudando a melhorar a experiência dos usuários, e alguns acreditam que 50% das pesquisas serão feitas por voz até 2020. Neste artigo, listei pontos relevantes para a prototipação e criação de interfaces de voz.

A inteligência artificial (IA) usada para dispositivos de voz já soluciona muitos problemas nos dias de hoje num piscar de olhos. Alguns exemplos de ações simples que podem ser perguntadas a Siri, por exemplo:

– Qual a próxima reunião agendada?
– Chame um Uber para o Maracanã.
– Quero ouvir Coldplay no Apple Music.

Todas as cinco gigantes da tecnologia – Microsoft, Google, Amazon, Apple e Facebook – desenvolveram (ou estão desenvolvendo atualmente) dispositivos controlados por voz. A Siri, assistente dos dispositivos Apple e do HomePod, está ajudando mais de 40 milhões de usuários por mês e, de acordo com a ComScore, um em cada dez residências nos EUA já possui uma caixa se som inteligente hoje.

eacho spot da amazon

O Echo Spot, da Amazon

O que os usuários podem fazer com os comandos de voz?

A Alexa é o assistente de voz para dispositivos Amazon. Com a caixa se som inteligente Echo Spot e o tablet Kindle Fire – a Amazon está atualmente liderando o mercado de tecnologia de voz (em termos de vendas).

Na Alexa store, você pode adquirir apps e alguns dos mais populares (os skills) são focados em entretenimento, tradução e notícias, embora os usuários também possam realizar ações como solicitar uma corrida de Uber, tocar algumas músicas no Spotify ou até mesmo pedir uma pizza na Domino’s.

A ComScore afirmou que mais da metade dos usuários que possuem uma caixa se som inteligente usam o dispositivo para fazer perguntas gerais, verificar o clima e ouvir música, seguido de perto pelo alarme, lista de tarefas e calendário (observe que essas tarefas são razoavelmente básicas por natureza).

Como você pode ver, muitas dessas tarefas envolvem fazer uma simples pergunta.

 

Pesquisa que o mostra o uso dos alto-falantes com assistente de voz nos EUA. Fonte: comscore.com

Pesquisa mostra o uso das caixas de som com assistente de voz nos EUA. Fonte: comscore.com

 

O que os usuários procuram com a pesquisa por voz?

As pessoas geralmente usam a pesquisa por voz ao dirigir, embora qualquer situação em que o usuário não consiga tocar na tela (por exemplo, quando estiver cozinhando, se exercitando ou tentando fazer várias tarefas ao mesmo tempo no trabalho) ofereça uma oportunidade de interação por voz. Veja o infográfico da HigherVisibility.

 

inforgrafico mostrando Quando e por que as pessoas usam a pesquisa de voz.

Quando e por que as pessoas usam a pesquisa de voz. Fonte: highervisibility.com

 

Realizando pesquisa de usuário para dispositivos controlados por voz

Embora seja útil saber como os usuários geralmente usam a voz, é importante que os UX designers conduzam sua própria pesquisa de usuário específica para o aplicativo de voz que estejam criando.

Ciclo de vida do cliente

A pesquisa com o usuário é importante para a compreensão das necessidades, comportamentos e motivações do usuário através da observação e feedback. Um mapa do ciclo de vida do cliente (Customer Journey Mapping, em inglês) que inclua voz como canal pode não apenas ajudar os pesquisadores a identificar as necessidades dos usuários nos vários estágios do envolvimento, mas também ajudá-los a ver como e onde a voz pode ser um método de interação.

No cenário em que um mapa do ciclo de vida do cliente ainda não foi criado, o designer deve destacar onde as interações de voz influenciariam o fluxo do usuário (isso pode ser destacado como uma oportunidade, um canal ou um touchpoint). Se um mapa do ciclo de vida do cliente já existir para a empresa, os designers devem verificar se o fluxo do usuário pode ser melhorado com interações de voz.

Por exemplo, se os clientes sempre fazem uma determinada pergunta por meio das mídias sociais ou do bate-papo, talvez seja uma conversa que possa ser integrada ao aplicativo de voz.

Em suma, o design deve resolver problemas. Quais frustrações os usuários encontram durante o ciclo de vida do cliente?

Análise da concorrência

Por meio da análise de concorrentes, os designers devem tentar descobrir se e como os concorrentes estão implementando interações de voz. As principais perguntas a fazer são:

– Qual é o caso de uso do aplicativo deles?
– Quais comandos de voz eles usam?
– Como os clientes estão avaliando os aplicativos e o que podemos aprender com isso?

Levantamento de requisitos

Para criar um aplicativo com interface de voz, primeiro precisamos definir os requisitos dos usuários. Além de criar um mapa do ciclo de vida do cliente e conduzir uma análise de concorrentes (como mencionado acima), outras atividades de pesquisa, como entrevistas e testes com usuários, também podem ser úteis.

Para o projeto de interface de voz, os requisitos escritos são ainda mais importantes, pois englobam a maioria das especificações de projeto para os desenvolvedores. O primeiro passo é capturar os diferentes cenários antes de transformá-los em um fluxo de diálogo “conversacional” entre o usuário e o assistente de voz.

Um exemplo de cenário para um aplicativo de notícias poderia ser:

“Quero que o assistente de voz leia as notícias mais recentes para que eu possa me atualizar sem ter que olhar para a minha tela.”

Com esse cenário em mente, podemos projetar um fluxo de diálogo para ele.

O uso do comando de voz vem aumentando com o passar dos anos

O uso do comando de voz vem aumentando com o passar dos anos

A anatomia de um comando de voz

Antes que um fluxo de diálogo possa ser criado, os designers precisam primeiro entender a anatomia de um comando de voz. Ao projetar interfaces e dispositivos de voz, os designers precisam constantemente pensar sobre o objetivo das interações de voz (ou seja, o que o usuário está tentando realizar nesse cenário?).

O comando de voz de um usuário consiste em três fatores principais: a intenção, a expressão e o slot.

Vamos analisar a seguinte solicitação: “Quero ouvir uma música relaxante no Apple Music.

Intenção (o objetivo da interação de voz)

A intenção representa o objetivo mais amplo do comando de voz de um usuário, e isso pode ser de baixa necessidade ou uma interação de alta necessidade.

Uma interação de alta necessidade consiste em realizar uma tarefa muito específica, como solicitar que as luzes da sala sejam desligadas ou que o chuveiro esteja com uma certa temperatura. O design dessas solicitações é simples, pois é muito claro o que se espera do assistente de voz.

Solicitações de baixa necessidade são mais vagas e difíceis de decifrar. Por exemplo, se o usuário quisesse saber mais sobre a França, primeiro teríamos que verificar se isso se encaixa ou não no escopo do serviço e depois fazer mais perguntas ao usuário para entender melhor a solicitação.

No exemplo dado, a intenção é evidente: o usuário quer ouvir música.

Expressão (como o usuário formula o pedido)

Um enunciado reflete como o usuário formula seu pedido. No exemplo dado, sabemos que o usuário quer tocar música no Apple Music dizendo “Quero ouvir uma música…“, mas essa não é a única maneira de um usuário fazer essa solicitação. Por exemplo, o usuário também pode dizer: “Toque alguma música…“.

Os designers precisam considerar todas as variações de expressão. Isso ajudará o assistente a reconhecer a solicitação e vinculá-la à ação ou resposta correta.

Slots (as variáveis ​​necessárias ou opcionais)

Às vezes, uma intenção sozinha não é suficiente e mais informações são necessárias do usuário para atender à solicitação. A Alexa chama isso de “campo” (do inglês, slot) e os slots são como os campos de formulários tradicionais, no sentido de que podem ser opcionais ou obrigatórios, dependendo do que for necessário para concluir a solicitação.

No nosso caso, o slot é “relaxante”, mas como o pedido ainda pode ser concluído sem ele, esse slot é opcional. No entanto, no caso em que o usuário deseja reservar um táxi, o slot necessário seria o destino. Entradas opcionais sobrescrevem qualquer valor padrão; por exemplo, um usuário solicitando um táxi para chegar às 16h ao destino substituiria o valor padrão de “o mais rápido possível”.

Prototipando a interface de voz usando fluxos de diálogo

Os designers precisam pensar como um roteirista e desenhar fluxos para cada um desses requisitos. Um fluxo de diálogo descreve o seguinte:

– Palavras-chave que levam à interação
– “Caminhos” que representam onde a conversa pode levar
– Exemplos de diálogo para o usuário e o assistente

Um fluxo de diálogo é um script que ilustra a conversa de ida e volta entre o usuário e o assistente de voz. Funciona como um protótipo, e pode ser descrito como uma ilustração (como no exemplo abaixo), ou existem aplicativos de prototipagem que podem ser usados ​​para criar fluxos de diálogo, como o Adobe XD, por exemplo.

 

Fluxo mostrando a intenção, slot e todo o processo.

Fluxo mostrando a intenção, slot e todo o processo. Fonte: toptal.com

 

Dicas práticas para a criação de interfaces de voz

Mantenha a comunicação simples e “conversacional”

Ao projetar aplicativos e sites para dispositivos móveis, os projetistas precisam pensar sobre quais informações são primárias e quais informações são secundárias (ou seja, não são tão importantes). Os usuários não querem se sentir sobrecarregados, mas, ao mesmo tempo, precisam de informações suficientes para concluir sua tarefa.

Com a voz, os designers precisam ser ainda mais cuidadosos, porque as palavras são tudo o que há para se comunicar. Isso torna especialmente difícil no caso de transmitir informações e dados complexos. Isso significa que menos palavras são mais eficazes e os designers precisam garantir que o aplicativo atenda ao objetivo dos usuários e permaneça estritamente voltado para a conversa, não fazendo com que o usuário precise digitar algo para ser atendido.

Confirmar quando uma tarefa foi concluída

Ao projetar um fluxo de checkout de um e-Commerce, uma das telas principais será a confirmação final. Isso permite que o cliente saiba que a transação foi registrada com sucesso.

O mesmo conceito se aplica ao design de uma interface de voz. Por exemplo, se um usuário estivesse na sala de estar solicitando ao seu assistente de voz para desligar as luzes do banheiro, sem uma confirmação, ele precisaria entrar na sala de estar e conferir, derrubando totalmente o conceito “hands-off” (mãos livres).

Nesse cenário, uma resposta “As luzes do banheiro foram desligadas” seria o suficiente.

Crie uma estratégia para o erro

Como designer, é importante ter uma estratégia de erro pronta. Sempre projete para o cenário em que o assistente não entende ou não ouve nada. Algumas das principais perguntas a serem feitas ao verificar caixas de diálogo alternativas:

– Você identificou o objetivo da interação?
– O assistente pode interpretar a informação dita pelo usuário?
– O assistente requer mais informações do usuário para atender a solicitação?
– Somos capazes de entregar o que o usuário pediu?

Pense na segurança

A Google Assistente, Siri e Alexa agora podem reconhecer vozes individuais. Isso é um ponto de segurança semelhante à ID de identificação facial ou de toque. O software de reconhecimento de voz está melhorando constantemente e está ficando cada vez mais difícil imitar uma voz. No entanto, neste momento, pode não ser seguro o suficiente e uma autenticação adicional pode ser necessária. Ao trabalhar com dados confidenciais, os designers podem precisar incluir uma etapa de autenticação extra, como impressão digital, senha ou reconhecimento facial. Isto é fundamental no caso de mensagens pessoais e transações bancárias.

É só o começo

Os dispositivos controlados por voz chegaram e serão integrados em mais e mais produtos nos próximos anos. Alguns prevêem que daqui a 10 anos não usaremos mais teclados para interagir com computadores.

Ainda assim, quando pensamos em experiência do usuário, tendemos a pensar sobre o que podemos ver e tocar. Como consequência, a voz como método de interação raramente é considerada. No entanto, voz e visual não são mutuamente exclusivos ao projetar experiências de usuário – ambos agregam valor.

A pesquisa com usuários precisa responder a pergunta: a voz melhorará ou não a experiência do usuário? Considerando a rapidez com que a participação de mercado dos dispositivos de voz está aumentando, essa pesquisa pode valer a pena e aumentar significativamente o valor e a qualidade de um produto. O importante é sempre atender a necessidade do usuário.

Cya!