Hoje nós controlamos as máquinas um dia elas nos controlarão.

IMAGEM: JACK DEMPSEY / AP
por Karen Hao 11/01/2019.

Um dia, sua voz controlará todos os seus aparelhos e eles controlarão você. Tudo o que você possui no futuro será controlado pela sua voz. É isso que a CES deste ano, a maior bonança anual de gadgets do mundo, deixou bem claro.

O Google e a Amazon estão em uma competição acirrada para colocar seus assistentes em sua TV, em seu carro e até em seu banheiro. Tudo veio à tona esta semana em Las Vegas, onde a linha completa de produtos habilitados por voz ressaltou o escopo das ambições de cada empresa.

Talvez pareça um desperdício do efeito colateral do capitalismo que agora você pode pedir à Alexa para levantar a tampa do vaso sanitário (ou talvez não), mas há mais na onipresença das interfaces de voz do que uma série interminável de empresas de hardware pulando. no bandwagon.

Está ligado a uma idéia que o especialista em AI Kai-Fu Lee chama de OMO, online-merge-of-offline. OMO, como ele descreve, refere-se à combinação de nossos mundos físico e digital de tal forma que cada objeto em nosso ambiente circundante se torne um ponto de interação para a internet – assim como um sensor que coleta dados sobre nossas vidas. Isso dará força ao que ele chama de “terceira onda” de inteligência artificial: nossos algoritmos, finalmente tendo uma visão abrangente de todos os nossos comportamentos, serão capazes de hiper-personalizar nossas experiências, seja na mercearia ou na sala de aula.

Mas essa visão exige que tudo esteja conectado. Ele exige que seu carrinho de compras saiba o que está na sua geladeira, para que ele possa recomendar a lista de compras ideal. Ele exige que sua porta da frente conheça suas compras on-line e se você está esperando uma entrega em casa. É aí que entram as interfaces de voz: instalar o Alexa em sua geladeira, sua porta e todas as suas outras propriedades díspares os vinculam a um único ecossistema de software. É bem o esquema inteligente: ao vender a poderosa e perfeita conveniência dos assistentes de voz, o Google e a Amazon avançaram lentamente até se tornar a plataforma central de todos os seus dados e o mecanismo principal para agilizar a vida de forma algorítima.

Independentemente de você confiar ou não em uma empresa com tanto controle, esse empreendimento grandioso será limitado pelo que os assistentes de voz podem entender. E comparado com outros subcampos da IA, o progresso no processamento e na geração de linguagem natural ficou meio atrasado.

Mas isso pode estar prestes a mudar. No ano passado, várias equipes de pesquisa usaram novas técnicas de aprendizado de máquina para obter avanços impressionantes na compreensão da linguagem. Em junho, por exemplo, a OpenAI, uma organização sem fins lucrativos de pesquisa, desenvolveu uma técnica de aprendizado não supervisionada para treinar sistemas em textos não estruturados, em vez de limpos e etiquetados. Isso reduziu drasticamente os custos de aquisição de mais dados de treinamento, aumentando assim o desempenho do sistema. Alguns meses depois, o Google lançou um algoritmo ainda melhor, não supervisionado, tão bom quanto os seres humanos para completar frases com respostas de múltipla escolha.

Todos esses avanços estão nos aproximando de um dia em que máquinas que realmente entendem o que queremos dizer podem tornar obsoletas as interfaces física e visual – e inaugurar todo o potencial de um mundo OMO. Para melhor ou pior.