OpenAI lança modelo o1 e mais ferramentas para desenvolvedores

A OpenAI anunciou, nesta terça-feira (17), um conjunto significativo de atualizações para desenvolvedores, com destaque para o lançamento do modelo OpenAI o1, melhorias na API em tempo real, uma nova técnica de ajuste fino chamada Preference Fine-Tuning e SDKs para as linguagens Go e Java.

OpenAI o1: novo padrão de raciocínio avançado

  • O modelo o1 foi projetado para lidar com tarefas complexas de várias etapas, prometendo maior precisão e eficiência;
  • Com funcionalidades, como chamadas de função, geração de saídas estruturadas e capacidades de visão, o o1 está preparado para aplicações que exigem integração com APIs externas, análise visual e personalização contextual;
  • O modelo apresenta latência reduzida, utilizando, em média, 60% menos tokens para responder a uma solicitação, em comparação ao seu antecessor, o o1-preview;
  • Desenvolvedores também podem ajustar o “esforço de raciocínio” do modelo, controlando o tempo que ele leva para gerar uma resposta;
  • Além disso, o novo snapshot do o1, também lançado nesta terça-feira (17), traz melhorias com base no feedback dos usuários, oferecendo maior eficiência e custo-benefício;
  • A OpenAI afirmou que o modelo superou benchmarks de última geração em diversas métricas.
openAI
Modelo o1 foi projetado para lidar com tarefas complexas de várias etapas (Imagem: Svet foto/Shutterstock)

Outras novidades

Melhorias na API em tempo real

A API em tempo real agora suporta WebRTC, padrão aberto que facilita a criação de produtos de voz responsivos em todas as plataformas. Essa integração permite maior qualidade de áudio, supressão de ruído e controle de congestionamento, tornando-a ideal para assistentes de voz, sistemas de suporte ao cliente e tradutores ao vivo.

A OpenAI também reduziu os preços de entrada e saída de tokens de áudio. Por exemplo, o modelo GPT-4o mini, opção econômica, agora, está disponível na API em tempo real por um décimo do custo do GPT-4o.

Entre os novos recursos, destaca-se a possibilidade de configurar respostas simultâneas fora de banda e aumentar a duração máxima de sessão para 30 minutos, oferecendo maior controle aos desenvolvedores.

Preference Fine-Tuning: personalização avançada

Segundo a OpenAI, uma das inovações mais promissoras é o Preference Fine-Tuning, que permite personalizar modelos com base nas preferências dos usuários. Essa técnica, baseada na otimização direta de preferências (DPO, na sigla em inglês), ensina o modelo a distinguir entre respostas preferidas e não preferidas. A empresa aponta que essa abordagem é especialmente eficaz em tarefas subjetivas, como ajustar tom e estilo.

Parcerias iniciais já teriam demonstrado resultados impressionantes. A Rogo AI, por exemplo, utilizou a técnica para melhorar seu assistente financeiro, elevando a precisão do modelo de 75% para mais de 80%, segundo comunicado da empresa de Sam Altman.

ChatGPT 4o e um smartphone
ChatGPT está, atualmente, em sua versão GPT-4o (Imagem: mundissima/Shutterstock)

SDKs para Go e Java

Ampliando seu suporte para diferentes linguagens, a OpenAI lançou SDKs para Go e Java. Essas bibliotecas, ainda disponíveis na versão beta, facilitam o uso das APIs da OpenAI em projetos de backend e desenvolvimento empresarial, complementando as opções já existentes para Python, Node.js e .NET.

Com essas novidades, a OpenAI afirma que busca expandir as possibilidades de desenvolvimento, permitindo maior personalização, eficiência e acessibilidade. Seja criando assistentes de voz, ferramentas de tradução ou aplicações de análise, as novas ferramentas “prometem impulsionar a inovação“.

Os desenvolvedores interessados podem acessar as atualizações completas e a documentação técnica no site oficial da OpenAI.

Olhar Digital