No começo do mês de maio, a OpenAI, desenvolvedora do ChatGPT, anunciou o GPT-4o, a nova versão do modelo de inteligência artificial (AI) de linguagem de grande escala, prometendo um avanço revolucionário.
A novidade é o primeiro modelo da empresa criado para combinar textos, imagens e áudios em tempo real, e por conta própria. De acordo com a OpenAI, o GPT-4o conta com mais capacidade para entender os conteúdos do que o modelo anterior GPT-4, de março de 2023, que é pago.
A atualização está sendo liberada de forma gradual para todos os usuários, até mesmo quem utiliza a versão gratuita. Confira abaixo quais as principais diferenças e avanços propostos pela nova versão do Chat GPT.
Quais as diferenças entre o GPT-4 e o GPT-4o?
O nome da nova versão vem de ChatGPT 4 Omni, no qual “omni” é um radical de origem latina, que significa “tudo”. No nosso idioma, ele costuma aparecer como o prefixo “oni”, como em onisciente (ciente de tudo)
O novo GPT-4o melhora a capacidade do GPT-4, por inovar na forma em que interage com os usuários. A principal diferença é a possibilidade de responder a comandos através de áudio, “visão” e texto em tempo real.
Sendo assim, o GPT-4o pode entender uma combinação feita com áudio, texto e imagem, e responder utilizando os mesmos meios de comunicação. De forma prática, o usuário consegue manter uma conversa com o chatbot de maneira mais parecida a uma entre duas pessoas.
As versões anteriores precisavam de ferramentas diferentes para analisar textos, imagens e áudio, como extensões para navegadores, ou GPTs personalizados. Porém, o novo modelo foi treinado para processar todos os formatos em uma só rede neural.
Além disso, o novo GPT-4o possui mais uma diferença: a rapidez em que se consegue processar comandos de voz. Em média, ele é capaz de responder a estas entradas em 320 milissegundos, um tempo parecido com o que uma pessoa leva para responder em uma conversa real.
O novo modelo também apresenta um desempenho superior em áreas como velocidade de saída, qualidade das respostas e idiomas suportados, que não existiam em sem antecessor. O atual consegue gerar resultados com mais qualidade, gramaticalmente corretos e concisos, em inglês e outras línguas.
Diferente dos modelos antecessores, o GPT-40 utiliza uma única rede neural em vez de redes neurais separadas, para processar diferentes dados de entrada. Sendo assim, a nova versão pode detectar ruídos de fundo, multi-falantes e tons emocionais nas entradas, e adicioná-los ao processo de geração de saída.
Entre todas as novidades e mudanças, uma delas também é a possibilidade de ser usado como Assistência Virtual Avançada, graças à sua capacidade de processar entradas de voz, texto e imagem.
Com isso, é possível ter um assistente pessoal capaz de agendar compromissos, fazer pesquisas, passar instruções passo a passo e até mesmo analisar documentos ou imagens enviados pelo usuário.
Quando o GPT-4o estará disponível? Será gratuito?
O novo GPT-4o vai estar disponível gradualmente para os usuários do ChatGPT, sendo que as funções de texto e imagem já começaram a ser implementadas no lançamento do modelo, em 13 de maio.
De acordo com a OpenAI, nas próximas semanas, uma nova versão do Modo de Voz alimentado pelo GPT-4o vai estar disponível logo menos para os usuários, mas em fase alpha – etapa inicial de lançamento, ainda precisando de testes.
Ainda de acordo com a empresa, os desenvolvedores podem acessar o GPT-4o na API como modelo de texto e visão, uma vez que a tecnologia é mais rápida e barata do que a usada atualmente, o GPT-4 Turbo.
Além disso, a OpenAI deve lançar em breve um suporte para novas capacidades de áudio e vídeo, exclusivamente para um pequeno grupo de parceiros a princípio.
A desenvolvedora ainda afirmou que o GPT-4o está disponível para todos os usuários, até os que não assinam nenhum plano pago. Entretanto, a interação terá um limite de mensagens, que ainda não foi divulgado.
Provavelmente, os usuários de planos pagos também terão um limite para usara a ferramenta, mas a disponibilidade será de cinco vezes mais em comparação ao plano grátis. Os clientes do plano Plus também tiveram acesso ao GPT-4o antecipadamente.
Olhar Digital