Inteligência Artificial – interfaces e atrito.

Inteligência Artificial – interfaces e atrito.

mar 17, 2017

Celulares e, depois, smartphones, vêm engolindo outros produtos já faz um bom tempo ─ tudo, de relógios a câmeras e players de música, foi transformado de hardware para um app. Mas esse processo também acontece de forma reversa algumas vezes ─ você pega parte de um smartphone, coloca em uma caixa de plástico e a vende como uma coisa nova. Isso aconteceu primeiro de uma forma bem simples, com empresas vasculhando a cadeia de suprimentos dos smartphones para criar novos tipos de produtos com os componentes que ela produzia, sendo o fruto mais óbvio a GoPro. Agora, porém, existem alguns pontos extras sobre os quais podemos pensar.

Primeiramente, às vezes estamos separando não apenas componentes, mas também apps, especialmente partes de apps. Pegamos um input ou um output de um app em um smartphone e os levamos para um novo contexto. Então, onde uma GoPro é uma alternativa à câmera do smartphone, um Amazon Echo pega um pedaço do app da Amazon e o coloca por perto enquanto você lava as roupas. Ao fazer isso, ele muda o contexto e também muda o nível de atrito. Você poderia tirar suas mãos das roupas, encontrar seu smartphone, selecionar o app da Amazon e buscar por sabão em pó, mas aí você estaria fazendo o trabalho do computador  ─ passar por uma série de etapas intermediárias que não tem nada a ver com a sua necessidade. Ao usar a Alexa, a assistente pessoal da Amazon (Inteligência Artificial), você tem efetivamente um link profundo e direto com a tarefa que você quer, sem nada de atrito ou o trabalho para chegar lá.

Em seguida, e novamente removendo o atrito, estamos removendo ou mudando a forma como utilizamos botões de liga/desliga, teclas e baterias. Você não liga ou desliga o Amazon Echo ou o Google Home, nem os AirPods, o Chromecast ou um Apple Watch. A maioria desses aparelhos não tem um botão liga/desliga e, se eles têm, você não os usa normalmente. Você não precisa fazer nada para acordá-los. Eles estão sempre lá, presentes e esperando por você. Você diz “Ok Google”, ou você olha para seu Apple Watch, ou você coloca seus AirPods na orelha e é isso. Você não precisa dizer a eles que você os quer. (Parte disso é “ambient computing”, mas o termo não descreve tão bem o smartwatch ou os fones de ouvido.)

Em paralelo, para aqueles aparelhos que têm baterias, carregá-los é hoje algo bem diferente. Estamos indo de aparelhos com grandes baterias que duram horas ou no melhor cenário um dia e levam um tempo significativo para carregar, para aparelhos com baterias minúsculas que carregam muito rapidamente e duram um longo tempo – dias ou semanas. A relação de tempo de uso para tempo de recarga da bateria é diferente. Mesmo o Apple Watch, ridicularizado como “um relógio que precisa recarregar a bateria!”, já aguenta dois dias de uso normal, o que na prática significa que, presumindo que você o tira durante a noite, você jamais pensa em bateria. Novamente, isso é tudo sobre atrito ou, talvez, sobre a carga mental. Você não precisa pensar sobre cabos, gerenciamento de energia, botões e ligar o aparelho – você não tem que fazer a rotina de gerenciar seu computador (Isso é também um dos pontos de se usar um iPad em vez de um notebook).

Um excelente exemplo polarizador dessa tendência são os AirPods da Apple, no qual o atrito está sendo movido em vez de removido. Você pode reclamar que precisa recarregar os fones de ouvido, mas você também pode dizer que em vez de plugá-los toda vez que for ouvir alguma coisa (e reclamando consigo mesmo enquanto desenrola o cabo), pode simplesmente colocá-los nas suas orelhas; com 30 horas de autonomia entre os fones e o seu estojo, você tem aí uma ou duas semanas de uso. Você precisa usar um cabo e plugá-los para carregar duas vezes ao mês ao invés de toda vez que você vai usá-los. A Apple espera que isso seja menos atrito ─ o que ainda veremos, mas é certamente diferente do modelo anterior.

Um ponto comum ligando todos esses pequenos dispositivos é uma tentativa de se livrar do gerenciamento, ou do atrito, ou, pode-se dizer, do trabalho administrativo. Isso conecta o Apple Watch, o Chromecast, o Amazon Echo e o Google Home, os Spectacles do Snapchat, os AirPods e talvez até mesmo o Apple Pencil. Eles tentam reduzir o trabalho administrativo que um computador ou um dispositivo digital te obriga a fazer antes de poder usá-lo ─ carregar, ligar, reiniciar, acordar, conectar, escolher um app e por aí vai. A interface de um smartphone reduz o gerenciamento que você faz dentro do software (gerenciamento de arquivos, configurações etc), mas esses novos aparelhos são muito mais sobre mudar o quanto você precisa lidar com o próprio hardware. Há uma mudança na direção de manipulação e interação diretas ─ menos abstrações de botões entre você e a coisa que você quer. Eles não fazem perguntas que apenas importam ao computador (“Você quer que eu acorde agora? Eu tenho carga o suficiente?”). O dispositivo é transparente para a função.

Claro, perguntas podem ser uma forma de atrito, mas elas também são escolhas. Se não é só um microfone, mas é uma extremidade para um serviço de nuvem, é também uma extremidade exclusiva para os serviços de nuvem do Google ou da Amazon (e se eu disser à Alexa para “comprar sabão em pó”,  que marca ela seleciona, e por quê?). Se a GoPro é só uma câmera mas os Spectacles do Snapchat são só uma extremidade para o Snapchat, eles só servem para o Snapchat. Como plataformas, a Alexa e o Google Home são como um celular com uma plataforma transportadora, ou como um decodificador da TV à cabo ─ um aparelho selado e subsidiado com serviços controlados e centralizados. A sua escolha por um assistente de voz se dá quando você escolhe comprar um Amazon Echo ou um Google Home, não depois disso (assumindo que você não comprará ambos e assumindo que eles não vão brigar entre si na sua cozinha).

Isso tudo significa que estamos falando sobre reduzir o atrito, sim, mas também sobre ampliar o alcance das empresas de nuvem e de serviços web, e como elas veem um universo mais amplo no qual a web no PC é cada vez menos relevante, o sistema operacional do smartphone é a plataforma e a plataforma é quase sempre controlada por seus concorrentes, e de que outras formas elas podem criar serviços para além de se encaixarem em um modelo de API de smartphones que alguém definiu. É uma investida das grandes empresas com um desejo estratégico, no mínimo na mesma medida que é uma demanda dos consumidores. O Google Home é uma extremidade para o Google Assistant, tal qual é o app Allo, um Android Watch ou mesmo qualquer smartphone Android. O Facebook ainda não tentou fazer um dispositivo (além da Oculus, que é uma conversa muito diferente, e uma parceria com celulares simples há um bom tempo), mas assim como o Google ele vem circulando em torno da discussão sobre qual rotina ou ponto de toque pode estar além dos apps, mais recentemente com a plataforma de bots do Messenger.

A primeira coisa a se pensar aqui é quantos desses dispositivos são controlados por alguma forma de inteligência artificial. A manifestação óbvia disso está nos assistentes de voz, que não precisam de uma UI (User Interface) além do microfone e do alto-falante e, assim, teoricamente podem ser “transparentes”. Mas como ainda não temos um HAL 9000 de fato ─ nós não temos uma IA em níveis humanos, generalista ─, assistentes de voz podem às vezes se parecerem como uma URA ou uma linha de comando ─ você só pode fazer alguns tipos de perguntas, mas não há uma indicação de quais. A carga mental aqui poderia até mesmo ser maior. Foi aqui que a Apple errou com a Siri ─ ela levou as pessoas a acreditarem que a Siri poderia responder a qualquer pergunta, quando na verdade ela não é capaz. Da mesma forma, parte do sucesso da Amazon com a Alexa, acho, está em comunicar o quão estreito é realmente o alcance dela. Daí, o paradoxo ─ a voz parece ser a interface definitiva, ilimitada, de propósitos gerais, mas na verdade ela só funciona se você consegue limitar o seu domínio.

É algo que vai melhorar com o tempo, mas além disso, não devemos pensar na voz e no som como a única interface baseada em IA ─ nós ainda não tentamos realmente enxergar como um modelo de utensílios poderia se aplicar a imagens, por exemplo. Isso se torna especialmente interessante quando se pensa que, por exemplo, um motor de reconhecimento facial (ou de voz, ou de linguagem) poderia ser embarcado em um aparelho pequeno e barato, com os próprios dados nunca saindo do dispositivo. Então um sensor de alarme poderia ser um sensor de pessoas, em vez de um sensor infravermelho, que apenas enviaria um sinal binário “sim/não” sobre a presença de pessoas. Ele poderia ser alimentado por uma bateria e durar anos.

Dash: configure um botão físico, aperte-o e receba o produto em casa.

Nos EUA, a Amazon já vende um sensor pequeno e alimentado à bateria que envia apenas um sinal muito simples ─ o botão Amazon Dash (acima). É mais fácil colocar um Echo na sua área de serviço ou um Dash? Temos aqui um belo contraste ─ esses dispositivos são ou muito inteligentes ou muito burros. Eles representam por um lado o ápice das pesquisas em IA (talvez localmente, talvez como uma extremidade da nuvem) ou o aparelho mais simples possível, e às vezes representam os dois ao mesmo tempo, e ambos te trazendo mais sabão em pó.