LLMs x SLMs: as múltiplas linguagens de IA Generativa no futuro dos negócios

Artigo por Jonatas Leandro
23/07/2024 06:07:37
0 Comentários

Big techs e empresas de diversos tamanhos seguem firmes na corrida pela melhor e mais completa plataforma de Inteligência Artificial (IA). Por trás desta busca estão os Grandes Modelos de Linguagem (LLMs, na sigla em inglês), que são mais do que nunca estratégicos quando levados para o ambiente dos negócios. Há diferenças importantes, porém algumas tendências estão mais do que claras.

Acompanhei alguns bons debates e tive conversas interessantes sobre isso durante a Febraban Tech 2024, o maior evento de tecnologia bancária da América Latina, realizado no fim do mês passado em São Paulo (SP). O uso da IA Generativa norteou boa parte das discussões entre executivos e especialistas em tecnologia e muito ainda paira no ar em torno das escolhas dos melhores modelos funcionais.

Quando falamos nos LLMs, temos que nos lembrar que, há dois anos, tratava-se de um tema mais teórico do que prático, bem diferente do cenário em ebulição atual. O lançamento do ChatGPT, em novembro de 2022 e considerado o grande marco nesta corrida de bilhões de dólares em torno das plataformas de IA Generativa, tratou de reforçar o quão impactante eles podem ser em múltiplos setores, como as redes sociais e o jornalismo profissional. E, na mesma esteira, o quanto torna-se imprescindível treiná-los com o máximo de dados disponíveis.

No ambiente bancário, o qual me inspirou neste artigo, há uma demanda latente por esteiras de trabalho em TI que primem pela flexibilidade, que permitam mudanças com base nas estratégias de momento. Não que eficiência e custo tenham perdido importância: na verdade, esses dois elementos seguem sendo chave para melhores entregas de ofertas e soluções para os clientes, em um ambiente desafiador para desenvolvedores.

Um bom arcabouço de um ambiente de LLMs encampados pela IA Generativa permite uma infinidade de tarefas, da geração de conteúdo em diversos formatos (texto, foto, vídeo), oportunidades de classificações de grandes bases de dados, chegando ao atendimento ao cliente por meio de chatbots que se aproximam, cada vez mais, da interação humana. A própria inspiração de um LLM é essa: trata-se de uma rede neural artificial, treinada em conjuntos de dados massivos de texto e código, aprendendo padrões e regras da linguagem humana.

Não por acaso, temos visto que o mundo corporativo já se debruça em torno da possibilidade não de usar apenas uma plataforma de LLM, mas sim de múltiplos LLMs que interajam entre si, buscando assim extrair o melhor de cada uma. Há uma procura por resultados cada vez mais precisos e robustos, com processos de validação cruzada, de melhora constante da assertividade. Em um ambiente crítico como o financeiro, tais aspectos são essenciais.

Todavia, como toda tecnologia nova e ainda em desenvolvimento, é preciso reconhecer que existe muito trabalho a ser feito. Os LLMs ainda apresentam respostas incorretas ou pouco coerentes, podendo ser utilizados para fins nada positivos (preconceito, desinformação e falta de interpretabilidade são alguns dos fatores a serem ajustados). Há também os aspectos de gastos e consumo, algo que abre espaço para alternativas.

Ao contrário dos LLMs, os Pequenos Modelos de Linguagem (SLMs, na sigla em inglês) são menos complexos. Eles também contam com milhares ou milhões de parâmetros, porém são treinados em conjuntos de dados menores, o que os torna mais rápidos e eficientes. Ao se focarem em tarefas mais específicas, tornam-se mais baratos, ainda que mais limitados. Entretanto, usos setorizados podem ter um ganho expressivo também com os SLMs.

Indo para além dos bancos, o fato concreto que temos é que a escolha entre um LLM e um SLM depende das necessidades específicas da aplicação de cada empresa ou ramo de atuação. E a decisão sobre qual modelo seguir deve considerar fatores como o tamanho do modelo, a capacidade desejada, o custo, a interpretabilidade e a generalização. Como consultor experiente, vejo que os LLMs ainda seguirão com algum protagonismo. Até quando? Não sabemos.

O que não muda é a procura por soluções estratégicas e eficientes que sejam compostas por projetos sustentáveis, investimentos tangenciáveis e mensuração de informações de ponta a ponta. E neste sentido, os debates na Febraban Tech 2024 indicam que bons ventos já sopram para todos os players envolvidos, não importando qual seja a sua linguagem de preferência.

*Jonatas Leandro é VP de Inovação da GFT Technologies no Brasil.