Tudo começou com o ChatGPT. Quando o chatbot de IA da OpenAI, alimentado pelo modelo de linguagem GPT, chegou ao mercado, as big techs correram para não ficarem para trás na briga da inteligência artificial (IA). Agora, entre os principais, temos o modelo avançado GPT-4o, o Gemini do Google, o Copilot da Microsoft, o Claude da Anthropic… e a lista continua.
No entanto, pode ser que os grandes modelos de linguagem da IA não sejam o futuro do setor. Na verdade, conforme a tecnologia avança, empresas estão indo na contramão e optando por modelos menores e mais específicos.
Futuro da IA pode estar nos modelos de linguagem menores
Imagine uma empresa de contabilidade que usa IA para otimizar o trabalho diário, como a criação de planilhas. Essa companhia usa o modelo de linguagem GPT-4o no ChatGPT, o mais avançado que a OpenAI lançou até agora. Porém, ela não precisa que a IA saiba tudo sobre todas as coisas, apenas que seja boa (e muito) em uma tarefa específica: criar planilhas.
Ou seja, parte do que o ChatGPT pode fazer acaba não sendo aproveitado. Diante disso, o The Wall Street Journal percebeu uma tendência: os modelos menores, mais baratos e treinados com menos dados estão fazendo sucesso no mercado da IA.
O exemplo acima foi o de uma empresa de contabilidade, mas isso vale para outras companhias: para que investir mais em um modelo maior se as potencialidades não serão aproveitadas por boa parte dos usuários corporativos?
Para se ter uma ideia, o GPT-4 da OpenAI custou mais de US$ 100 milhões (R$ 554,47 milhões, na conversão direta) para ser desenvolvido e usa mais de um trilhão de parâmetros em seu banco de dados.
Desenvolvedoras estão mudando o rumo na “guerra da IA”
Não que as desenvolvedoras tenham parado de investir em seus grandes modelos de linguagem, mas, segundo o jornal estadunidense, big techs, como a Microsoft e o Google, e startups de IA, como Mistral, Anthropic e Cohere, já estão se movimentando para oferecer mais tipos de modelos.
Diretores de informação do setor já reconhecem que, para alguns casos de uso da IA, como tarefas repetitivas que precisam de constância (tais como classificar documentos), modelos de linguagem menores e de médio porte fazem mais sentido do que os mais robustos.
A diversificação no portfólio vem em cenário no qual as empresas aumentam as potencialidades das IAs, mas têm que lidar com os gastos de uma tecnologia cara de manter.
Oliver Parker, vice-presidente de IA generativa global para entrada no mercado no Google Cloud, disse ao Journal que observou companhias migrando para modelos de médio porte nos últimos três meses porque essas soluções atendem melhor os critérios do mundo corporativo.
Equilíbrio entre modelos de linguagem maiores e menores pode ser saída
- Há também empresas que mesclam seu portfólio de soluções de IA. O TD Bank, famoso banco estadunidense, é um deles;
- A instituição tem assinatura da família GPT da OpenAI para ajudar funcionários do call center a responder consultas dos clientes mais rapidamente;
- Recentemente, o banco também firmou parceria com a startup Cohere para receber modelos menores ou de médio porte para tarefas mais específicas;
- A empresa vai analisar a adesão de ambos modelos de linguagem em termos de custo, precisão e latência;
- Isso não significa que uma IA mais robusta seja descartável. O ChatGPT é a solução ideal para ler todos os livros de Shakespeare ou responder perguntas simples. Mas não é disso que algumas empresas precisam.
Olhar Digital