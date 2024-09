A- A+

Os chatbots online, como o ChatGPT da OpenAI e o Gemini do Google, às vezes enfrentam dificuldades com problemas matemáticos simples. O código de computador que eles geram muitas vezes é cheio de bugs e incompleto. De vez em quando, eles até inventam coisas.

Na quinta-feira, a OpenAI revelou uma nova versão do ChatGPT que pode aliviar essas falhas. A empresa afirmou que o chatbot, sustentado por uma nova tecnologia de inteligência artificial chamada OpenAI o1, poderia "raciocinar" em tarefas que envolvem matemática, codificação e ciência.

“Com modelos anteriores como o ChatGPT, você faz uma pergunta e eles começam a responder imediatamente”, disse Jakub Pachocki, cientista-chefe da OpenAI. “Este modelo pode levar o seu tempo. Ele pode pensar sobre o problema — em inglês — e tentar dividi-lo e procurar ângulos em um esforço para fornecer a melhor resposta.”





Em uma demonstração para o The New York Times, Dr. Pachocki e Szymon Sidor, um membro técnico da OpenAI, mostraram o chatbot resolvendo um acróstico, um tipo de quebra-cabeça de palavras que é significativamente mais complexo do que uma palavra cruzada comum. O chatbot também respondeu a uma pergunta de nível de doutorado em química e diagnosticou uma doença com base em um relatório detalhado sobre os sintomas e o histórico de um paciente.

A nova tecnologia faz parte de um esforço mais amplo para construir uma IA que possa raciocinar em tarefas complexas. Empresas como Google e Meta estão desenvolvendo tecnologias semelhantes, enquanto a Microsoft e sua subsidiária GitHub estão trabalhando para incorporar o novo sistema da OpenAI em seus produtos.

O objetivo é criar sistemas que possam resolver problemas de maneira cuidadosa e lógica através de uma série de etapas discretas, cada uma se baseando na anterior, semelhante ao raciocínio humano. Essas tecnologias podem ser particularmente úteis para programadores de computador que usam sistemas de IA para escrever código. Elas também poderiam melhorar tutores automatizados para matemática e outras disciplinas.

A OpenAI disse que sua nova tecnologia também pode ajudar físicos a gerar fórmulas matemáticas complicadas e auxiliar pesquisadores de saúde em seus experimentos.

Com a estreia do ChatGPT no final de 2022, a OpenAI mostrou que as máquinas poderiam lidar com solicitações de maneira mais parecida com as pessoas, responder a perguntas, escrever trabalhos acadêmicos e até mesmo gerar código de computador. Mas as respostas às vezes apresentavam falhas.

O ChatGPT aprendeu suas habilidades analisando enormes quantidades de texto retiradas de toda a internet, incluindo artigos da Wikipédia, livros e registros de bate-papo. Ao identificar padrões em todo esse texto, ele aprendeu a gerar texto por conta própria.

Como a internet está cheia de informações falsas, a tecnologia aprendeu a repetir as mesmas inverdades. Às vezes, ela inventava coisas.

O Dr. Pachocki, o Sr. Sidor e seus colegas tentaram reduzir essas falhas. Eles construíram o novo sistema da OpenAI usando o que é chamado de aprendizado por reforço. Através desse processo — que pode durar semanas ou meses — um sistema pode aprender comportamento por meio de extensos testes e erros.

Ao trabalhar em vários problemas matemáticos, por exemplo, ele pode aprender quais métodos levam à resposta correta e quais não. Se repetir esse processo com um número enormemente grande de problemas, ele pode identificar padrões. Mas o sistema não necessariamente pode raciocinar como um humano. E ainda pode cometer erros e "alucinar".

“Não será perfeito”, disse o Sr. Sidor. “Mas você pode confiar que ele trabalhará mais arduamente e terá muito mais probabilidade de produzir a resposta correta.”

O acesso à nova tecnologia começou na quinta-feira para consumidores e empresas que assinam os serviços ChatGPT Plus e ChatGPT Teams da empresa. A empresa também está vendendo a tecnologia para desenvolvedores de software e empresas que estão construindo suas próprias aplicações de IA.

A OpenAI disse que a nova tecnologia teve um desempenho melhor do que as tecnologias anteriores em certos testes padronizados. No exame qualificatório para a Olimpíada Internacional de Matemática, ou I.M.O. — a principal competição de matemática para estudantes do ensino médio — sua tecnologia anterior marcou 13%. O OpenAI o1, segundo a empresa, marcou 83%.

Ainda assim, os testes padronizados nem sempre são uma boa medida de como as tecnologias se comportarão em situações do mundo real, e embora o sistema possa ser bom em uma questão de teste de matemática, ele ainda pode ter dificuldade para ensinar matemática.

“Há uma diferença entre resolver problemas e oferecer assistência”, disse Angela Fan, cientista pesquisadora da Meta. “Novos modelos que raciocinam podem resolver problemas. Mas isso é muito diferente de ajudar alguém com seu dever de casa.”

