Os robôs sociais que conseguem entender o comportamento não verbal serão comunicadores consideravelmente mais eficazes.
Título e referência do artigo original:
Autores: Jin Joo Lee and Brad Knox and Cynthia Breazeal MIT Media Lab 20 Ames st. E15-468 Cambridge, MA 02142 {jinjoo, bradknox}@mit.edu, cynthiab@media.mit.edu
Resumo
Descrevemos pesquisas para a criação de um modelo computacional para reconhecer a confiança interpessoal nas interações sociais. Descobrimos que quatro sinais gestuais negativos - inclinar-se para trás, tocar o rosto, tocar as mãos e cruzar os braços - juntos, são preditivos de níveis mais baixos de confiança. Três sinais gestuais positivos - inclinar-se para a frente, os braços no colo e os braços abertos - são preditivos de níveis mais altos de confiança. Nós treinamos um modelo gráfico probabilístico usando dados de interação social natural, o “ Trust Hidden Markov Model/ Modelo de Markov Confiável Escondido” que incorpora a ocorrência desses sete gestos importantes ao longo da interação social. O modelo Trust HMM prevê com precisão de 69,44% se um indivíduo está disposto a se comportar de forma cooperativa ou não com seu novo parceiro, comparativamente a um modelo de gestos ignorante, que atinge 63,89% de precisão. Tentamos automatizar esse processo de reconhecimento, detectando esses comportamentos relacionados à confiança por meio da tecnologia de captura de movimento 3D e algoritmos de reconhecimento de gestos. Nosso objetivo é, eventualmente, criar um sistema hierárquico - com reconhecimento de gestos de baixo nível para reconhecimento de confiança de alto nível - capaz de prever se um indivíduo acha que outro é um parceiro confiável ou não confiável por meio de suas expressões não verbais.
Introdução
Sinais honestos são sinais sociais primitivos comunicados entre as pessoas por meio de comportamentos inconscientes que contêm informações sobre intenções, objetivos e valores (Pentland, 2008). Ao observar esses comportamentos inconscientes, podemos ter uma ideia de como está indo um encontro (Pentland 2008) e com que êxito será feito um acordo (Maddux, Mullen e Galinsky, 2007).
Esse trabalho sugere que, como grande parte de nossa comunicação está além das palavras, os robôs sociais que conseguem entender o comportamento não verbal serão comunicadores consideravelmente mais eficazes. Os robôs têm um imenso potencial para ajudar pessoas em domínios como cuidados com a saúde, e seu sucesso depende muito de sua capacidade de se comunicar e interagir efetivamente conosco.
À medida que os robôs começam a trabalhar em estreita colaboração conosco, devemos considerar alguns fatores importantes de mediação que podem afetar o resultado da interação humano-robô.
Variáveis interpessoais como confiança, simpatia, engajamento, relacionamento e conforto devem ser projetadas de maneira apropriada em diferentes contextos. Em um contexto como assistência médica, onde robôs estão sendo usados para coletar informações pessoais e sensíveis de pacientes, a confiança, em particular, é uma variável essencial a ser considerada (Wilkes et al. 2010).
Estudos demonstraram que o aumento dos níveis de confiança facilita a comunicação aberta e leva a mais compartilhamento de informações (por exemplo, Maddux, Mullen e Galinsky 2007). Assim, quando os robôs coletam informações médicas, é possível obter uma comunicação e troca de informações mais eficazes, estabelecendo um senso apropriado de confiança com o paciente.
Ao projetar para essas interações, precisamos responder como um robô pode: 1) obter o nível apropriado de confiança de um indivíduo (ou seja, o sinal de controle) 2) interpretar quanto um indivíduo confia no robô (ou seja, sinal de feedback).
O trabalho apresentado aqui é um esforço para responder a esta segunda questão de como um robô pode entender ou detectar se um indivíduo o considera um parceiro confiável ou não. Este trabalho preliminar descreve o design e a implementação de um modelo computacional para reconhecer a confiança interpessoal nas interações sociais.
Ao investigar primeiro sinais inconscientes, como sinais gestuais, identificamos como esse comportamento não-verbal é preditivo de resultados cooperativos ou de confiança posteriores. Em seguida, projetamos um modelo gráfico probabilístico em torno das sugestões preditivas resultantes e, através da tecnologia de captura de movimento 3D, tentamos automatizar esse reconhecimento de confiança, rastreando as sugestões não-verbais relacionadas à confiança.
Estudo 1: Identificando pistas gestuais
Iniciamos nossa investigação com um estudo exploratório para encontrar pistas gestuais preditivas de comportamentos confiáveis. O estudo consistiu em duas partes. Os participantes começaram se envolvendo em uma interação social com outro participante em um período de 5 minutos para “se conhecerem”.
Na segunda metade do experimento, cada participante jogou individualmente o "Give Some Game" (um jogo do tipo dilema do prisioneiro para medir a confiança em termos de comportamentos cooperativos ou não cooperativos representados pelo número de tokens trocados (Van Lange e Kuhlman 1994)) em salas separadas e, em seguida, responderam alguns questionários.
Um total de 43 interações diádicas, ou 86 indivíduos, participou do Estudo 1 (34 homens e 52 mulheres estudantes de graduação). Esse experimento produziu dados de interação, que consistem nos vídeos brutos do experimento, anotações totalmente codificadas em vídeo dos comportamentos do participante (face e corpo) e questionários que incluíam itens que avaliavam - em uma escala Likert de 7 pontos - quanto o participante confiou e gostou do seu parceiro. Consulte o nosso trabalho anterior (Desteno et al. 2012) para mais detalhes.
Resultados
Descobrimos que um conjunto de quatro pistas - tocar o rosto, cruzar os braços, inclinar-se para trás e tocar a mão - são juntos preditores de comportamento de desconfiança. Por meio de uma análise de regressão linear multinível, descobrimos que quanto mais um participante exibia esses comportamentos, menos tokens eles davam ao parceiro. Além disso, quanto mais um parceiro exibisse esses comportamentos de desconfiança, menos tokens o outro participante ofereceria a ele (Desteno et al. 2012).
Também descobrimos um conjunto adicional de três pistas - inclinar-se para a frente, braços no colo e braços abertos - que, juntas, são preditivas de níveis mais altos de confiança [b = 0,047, p <0,031] em uma análise de regressão linear ( Lee 2011). Essas análises sugerem que as observações dessas sete dicas identificadas podem ajudar a prever a avaliação de um indivíduo sobre a confiabilidade do parceiro.
Modelando a confiança usando o HMM
Ao observar essas sete dicas durante toda a interação social de cinco minutos, procuramos prever com precisão o quanto um participante confiará em seu parceiro - com o número de tokens que um participante decidiu dar a seu parceiro representando quanto ele confiava no parceiro para jogar cooperativamente. Especificamente, criamos dois modelos ocultos de Markov (HMMlow e HMMhigh) para determinar se um indivíduo exibirá níveis baixos ou altos de confiança em relação a seu novo parceiro, cada sugestão gestual que ocorre durante uma interação social altera o estado oculto do HMM.
No final da interação, a previsão é a classe correspondente ao HMM para o qual a probabilidade de log dos dados de observação gestual é mais alta. Por meio de uma validação cruzada excluída, nosso melhor resultado com 1 estado para HMMlow e 5 estados para HMMhigh teve uma precisão de reconhecimento de 69,44% com uma linha de base de 63,89% (uma modelo ignorante de gestos que sempre prediz a classe mais comum). Portanto, esse modelo de confiança é capaz de diferenciar, com precisão acima da linha de base, se um indivíduo terá julgamentos de confiança baixos ou altos de seu novo parceiro, observando a sequência de sinais preditivos que ele / ela emite.
Estudo 2: Capturando dados de gestos 3D
Nosso modelo preliminar tenta prever se uma pessoa confia ou não em seu novo parceiro, se comportando de forma cooperativa em um jogo Give Some Game econômico, observando um conjunto de pistas gestuais informativas que se desdobram em uma interação social. Supondo que possamos melhorar nossa precisão de previsão, um método automatizado de detectar esses sinais gestuais de interesse - em vez de uma codificação manual rigorosa - permitirá a avaliação automatizada da confiança.
Figura 1: O Kinect fornece um mapa de profundidade e um mapa de imagem RGB de uma cena, e o algoritmo NITE do OpenNI rastreia os movimentos de uma pessoa através do rastreamento do esqueleto.
Usamos a tecnologia de captura de movimento 3D e algoritmos de reconhecimento de gestos para detectar quando essas dicas não verbais estão sendo comunicadas. Para coletar dados, replicamos o cenário no Estudo 1, mas adicionamos sensores Kinect no ambiente. Um total de 28 interações diádicas, ou 56 indivíduos, participaram deste estudo 2. Ao treinar várias máquinas de vetores de suporte (SVMs), conseguimos detectar com segurança quando um indivíduo se inclina para a frente, se inclina para trás ou não, com um reconhecimento médio precisão de 83,7%. No entanto, os cinco gestos preditivos restantes foram detectados de maneira não confiável.
Trabalho contínuo
No momento, estamos trabalhando para melhorar as taxas de precisão dos sistemas de reconhecimento de confiança e gesto. Esperamos, eventualmente, mostrar um sistema hierárquico - com reconhecimento de gestos de baixo nível para reconhecimento de confiança de alto nível - que seja capaz de prever, a partir de expressões não verbais, se um indivíduo acha que outro é um parceiro confiável ou não.
Referências
Desteno, D.; Breazeal, C.; Frank, R. H.; Pizarro, D.; Baumann, J.; Dickens, L.; and Lee, J. J. 2012. Detecting the Trustworthiness of Novel Partners in Economic Exchange. Psychological Science.
Lee, J. J. 2011. Modeling the Dynamics of Nonverbal Behavior on Interpersonal Trust for Human-Robot Interactions. Masters thesis, Massachusetts Institute of Technology.
Maddux, W.; Mullen, E.; and Galinsky, A. 2007. Chameleons bake bigger pies and take bigger pieces: Strategic behavioral mimicry facilitates negotiation outcomes. Journal of Experimental Social Psychology 44(2):461–468.
Pentland, A. S. 2008. Honest Signals. MIT Press. Van Lange, P. A. M., and Kuhlman, D. M. 1994. Social value orientations and impressions of partner’s honesty and intelligence: A test of the might versus morality effect. Journal of Personality and Social Psychology 67(1):126–141.
Wilkes, D. M.; Franklin, S.; Erdemir, E.; Gordon, S.; Strain, S.; Miller, K.; and Kawamura, K. 2010. Heterogeneous Artificial Agents for Triage Nurse Assistance. 2010 10th IEEERAS International Conference on Humanoid Robots 130–137.
Comments