O Alibaba Group lançou um novo modelo de inteligência artificial que, segundo a empresa, é capaz de ler emoções, em uma aparente tentativa de superar o modelo mais recente da OpenAI. Em duas demonstrações, pesquisadores do Tongyi Lab do Alibaba mostraram o novo modelo de código aberto, o R1-Omni, inferindo o estado emocional de uma pessoa em um vídeo, além de oferecer descrições sobre suas roupas e ambiente.

Isso adiciona uma nova camada de compreensão à chamada visão computacional e é uma versão aprimorada de outro modelo de código aberto, o HumanOmni, desenvolvido pelo mesmo pesquisador, Jiaxing Zhao.

A iniciativa da Alibaba para se posicionar como líder em IA foi impulsionada pelo lançamento de destaque da DeepSeek em janeiro. Agora, o gigante do e-commerce está acelerando o lançamento de novas ferramentas e aplicativos de IA em várias áreas.





O grupo comparou seu modelo Qwen ao da DeepSeek, fechou uma parceria importante com a Apple para integrar IA nos iPhones e, agora, parece estar enfrentando diretamente a OpenAI.

O R1-Omni está disponível gratuitamente para download na plataforma Hugging Face. O Alibaba Group, envolvido em uma guerra de preços para conquistar clientes na China, não está cobrando nada e está disponibilizando seu novo modelo gratuitamente. As demonstrações mostraram que o R1-Omni identifica apenas descrições emocionais gerais, como “feliz” ou “irritado”, mas sua suposta capacidade de extrair essas informações a partir de pistas visuais é significativa.

Reconhecer e responder a sentimentos humanos

As tentativas de alcançar inteligência emocional — permitindo que computadores reconheçam e respondam aos sentimentos humanos — já estão amplamente difundidas. Tecnologias capazes de identificar o estado mental e o bem-estar de uma pessoa estão sendo usadas para ajudar chatbots de atendimento ao cliente a detectar frustrações e para que carros da Tesla, de Elon Musk, identifiquem motoristas sonolentos.

A OpenAI lançou seu modelo GPT-4.5 no início deste ano, alegando que ele é melhor na identificação e resposta a sinais sutis nas interações escritas dos usuários. No entanto, o modelo tem um preço alto: está disponível inicialmente apenas para usuários que pagam US$ 200 (R$ 1.167) por mês.

O CEO da empresa, Eddie Wu, disse a analistas em fevereiro que a inteligência artificial geral (AGI) - que em tese rivalizaria com a inteligência humana - é agora o “objetivo principal” do Alibaba. A inteligência emocional é um passo fundamental nesse caminho.

