O laboratório francês de inteligência artificial, Mistral, está se lançando no desenvolvimento de modelos de raciocínio.
Na manhã de terça-feira, a Mistral anunciou o lançamento do Magistral, sua primeira família de modelos de raciocínio. Semelhante a outros modelos do tipo — como o o3 da OpenAI e o Gemini 2.5 Pro do Google — o Magistral aborda problemas passo a passo, proporcionando maior consistência e confiabilidade em tópicos como matemática e física.
Os modelos Magistral são oferecidos em duas versões: Magistral Small e Magistral Medium. O Magistral Small conta com 24 bilhões de parâmetros e pode ser baixado na plataforma de desenvolvedores de IA Hugging Face sob uma licença permissiva Apache 2.0. (Os parâmetros são os componentes internos de um modelo que orientam seu comportamento.) Já o Magistral Medium, um modelo mais potente, está em prévia nas plataformas Le Chat, da Mistral, e na API da empresa, além de nuvens de parceiros.
“[O Magistral é] adequado para uma ampla gama de casos de uso empresarial, desde cálculos estruturados e lógica programática até árvores de decisão e sistemas baseados em regras,” afirma a Mistral em seu comunicado. “[Os modelos estão] ajustados para lógica em múltiplos passos, melhorando a interpretabilidade e proporcionando um processo de pensamento rastreável na linguagem do usuário.”
Fundada em 2023, a Mistral é um laboratório de modelos de ponta que constrói uma variedade de serviços baseados em IA, incluindo o mencionado Le Chat e aplicativos móveis. A empresa conta com o apoio de investidores de risco como a General Catalyst, tendo arrecadado mais de €1,1 bilhão (aproximadamente $1,24 bilhão) até o momento.
Apesar de ter recursos impressionantes, a Mistral ficou atrás de outros laboratórios de IA líderes em algumas áreas, incluindo o desenvolvimento de modelos de raciocínio. O lançamento do Magistral não parece ser competitivo, pelo menos se levarmos em conta os próprios benchmarks da Mistral.
Em testes como GPQA Diamond e AIME, que avaliam as habilidades de física, matemática e ciências de um modelo, o Magistral Medium teve um desempenho inferior ao Gemini 2.5 Pro, além do Claude Opus 4 da Anthropic. O Magistral Medium também não conseguiu superar o Gemini 2.5 Pro em um benchmark popular de programação, o LiveCodeBench.
Talvez por isso a Mistral destaque outras qualidades do Magistral em seu comunicado. De acordo com a Mistral, o Magistral oferece respostas “10 vezes” mais rápidas do que os concorrentes no Le Chat e suporta uma ampla gama de idiomas, incluindo italiano, árabe, russo e chinês simplificado.
“Construindo sobre nossos modelos principais, o Magistral foi projetado para pesquisa, planejamento estratégico, otimização operacional e tomada de decisões baseadas em dados,” destaca a empresa em sua postagem. “Seja na execução de avaliação de risco e modelagem com múltiplos fatores, ou no cálculo de janelas de entrega ideais sob restrições.”
O lançamento do Magistral chega após a Mistral apresentar um cliente de “vibe coding”, chamado Mistral Code. Algumas semanas antes, a Mistral lançou vários modelos voltados para programação e disponibilizou o Le Chat Enterprise, um serviço de chatbot voltado para empresas que oferece ferramentas como um construtor de agentes de IA e integra os modelos da Mistral com serviços de terceiros, como Gmail e SharePoint.