A OpenAI anunciou o lançamento do modelo o1, que representa um marco em sua busca por inteligência artificial (IA) mais avançada. O o1 — conhecido internamente como Strawberry — é descrito como um modelo de raciocínio que se destaca por sua capacidade de resolver questões complexas, oferecendo duas versões: o1-preview e o1-mini.
Ambas estarão disponíveis para assinantes do ChatGPT Plus e Team a partir desta quinta-feira (12), com usuários das versões Enterprise e Edu recebendo acesso na próxima semana.
Uma das inovações do o1 é sua habilidade de “pensar” antes de fornecer respostas, o que, segundo a OpenAI, ajuda o modelo a reduzir erros de raciocínio comuns em inteligências artificiais. Ele utiliza um processo de raciocínio chamado “cadeia de pensamento”, que simula a análise humana passo a passo para resolver problemas. Essa funcionalidade o torna particularmente eficaz em tarefas complexas, como programação e matemática.
O modelo foi desenvolvido como parte de um projeto interno da OpenAI chamado Q*, que foca em raciocínio avançado. Além de fornecer respostas, o o1 consegue se auto-verificar, revisando suas próprias soluções para minimizar erros.
O treinamento do o1 utiliza um novo algoritmo de otimização e aprendizado por reforço, uma técnica que ensina o sistema por meio de recompensas e punições. Isso permite ao o1 resolver problemas por conta própria.
Esse método inclui o uso de dados voltados ao raciocínio, como literatura científica, tornando o modelo ideal para tarefas que envolvem várias etapas, como a análise de e-mails confidenciais ou a formulação de estratégias de marketing.
Testes indicam que o o1 supera o GPT-4o em tarefas como análise de petições jurídicas e jogos de lógica, além de ter um desempenho excepcional em exames de matemática. Em uma prova da Olimpíada Internacional de Matemática, o o1 obteve 83% de acertos, enquanto o GPT-4o ficou em 13%, segundo a empresa.
A OpenAI está focada em expandir as habilidades de raciocínio do o1 para além de suas capacidades atuais. A empresa planeja desenvolver futuras versões capazes de raciocinar por períodos mais longos — horas, dias ou até semanas —, visando criar sistemas autônomos ainda mais eficientes em tarefas complexas e em áreas como medicina e engenharia.
Fonte: Olhar Digital / Por Ana Luiza Figueiredo
Copyright © 2023. Todos os direitos reservados. Ascenda Digital Mídia LTDA.