A IA Mistral desafia a grande tecnologia com o modelo de raciocínio

A IA Mistral recuou a cortina no magistral, seu primeiro modelo criado especificamente para tarefas de raciocínio.

O magistral chega em dois sabores: uma versão de faixa aberta de 24b, chamada Magistral Small, com a qual qualquer pessoa pode mexer e uma edição mais robusta da Enterprise, Magistral Medium, destinada a aplicações comerciais, onde os recursos avançados de raciocínio são mais importantes.

“O melhor pensamento humano não é linear – tece através da lógica, insight, incerteza e descoberta”, explica a IA Mistral.

Esse é um ponto justo, os modelos existentes geralmente lutam com a maneira de bagunçar os humanos que os humanos realmente pensam nos problemas. Eu testei inúmeros modelos de raciocínio e eles geralmente sofrem de três limitações -chave: eles não têm profundidade em domínios especializados, seu processo de pensamento é frustrantemente opaco e o desempenho é inconsistente em diferentes idiomas.

O raciocínio do mundo real da IA Mistral para os profissionais

Para profissionais que hesitaram em confiar na IA com tarefas complexas, o magistral pode mudar de idéia.

Águias legais, pessoas financeiras, profissionais de saúde e trabalhadores do governo apreciarão a capacidade do modelo de mostrar seu trabalho. Todas as conclusões podem ser rastreadas através de etapas lógicas – cruciais quando você está operando em ambientes regulamentados, onde “porque a IA disse isso” simplesmente não o corta.

Os desenvolvedores de software também não foram esquecidos. A magistral afirma brilhar no tipo de pensamento estruturado que contribui para um melhor planejamento de projetos, design de arquitetura e engenharia de dados. Tendo lutado com alguns modelos que produzem soluções técnicas plausíveis, mas falhas, estou ansioso para ver se os recursos de raciocínio do Magistral entregam nessa frente.

Mistral afirma que seu modelo de raciocínio também se destaca em tarefas criativas. A empresa relata que o magistral é “um excelente companheiro criativo” para escrever e contar histórias, capaz de produzir narrativas coerentes e – quando exigido – conteúdo mais experimental. Essa versatilidade sugere que estamos indo além da era de ter modelos separados para tarefas criativas versus lógicas.

O que separa magistral do resto?

O que separa os modelos de idiomas magistral dos montes é a transparência. Em vez de simplesmente cuspir respostas de uma caixa preta, ela revela seu processo de pensamento de uma maneira que os usuários podem seguir e verificar.

Isso importa enormemente em contextos profissionais. Um advogado não quer apenas uma sugestão de cláusula de contrato; Eles precisam entender o raciocínio legal por trás disso. Um médico não pode confiar cegamente em uma sugestão de diagnóstico sem ver a lógica clínica. Ao fazer seu raciocínio rastreável, a magistral poderia ajudar a preencher a lacuna de confiança que retira a adoção da IA em campos de alto risco.

Tendo conversado com desenvolvedores de IA não ingleses, ouvi frustração consistente sobre como os recursos de raciocínio deixam dramaticamente fora do inglês. O magistral parece enfrentar isso de frente com suporte multilíngue robusto, permitindo que os profissionais raciocinam em seu idioma preferido sem penalidades de desempenho.

Não se trata apenas de conveniência; É sobre equidade e acesso. À medida que os países implementam cada vez mais os regulamentos de IA que requerem soluções localizadas, as ferramentas que o motivo são efetivamente entre os idiomas terão uma vantagem significativa sobre os concorrentes centrados em inglês.

https://www.youtube.com/watch?v=0NC-WM3HBGS

Colocando suas mãos no magistral

Para aqueles que desejam experimentar, o Magistral Small está disponível agora sob a licença Apache 2.0 por meio de Hugging Face. Os interessados na versão média mais poderosa podem testar uma visualização através da interface do LE Chat da Mistral ou por meio de sua plataforma de API.

https://www.youtube.com/watch?v=_IMWDFQGBLY

Os usuários corporativos que procuram opções de implantação podem encontrar meio magistral no Amazon Sagemaker, com as implementações IBM Watsonx, Azure e Google Cloud Marketplace em breve.

À medida que a emoção inicial em torno dos chatbots de uso geral começa a diminuir, o mercado está com fome de ferramentas especializadas de IA que se destacam em tarefas profissionais específicas. Ao se concentrar no raciocínio transparente para especialistas em domínio, Mistral criou um nicho potencialmente valioso.

Fundada no ano passado por ex -alunos de DeepMind e Meta AI, a Mistral se moveu a uma velocidade vertiginosa para se estabelecer como campeão da IA da Europa. Eles constantemente perfuraram seu peso, criando modelos que competem com as ofertas de empresas muitas vezes do seu tamanho.

À medida que as organizações exigem cada vez mais IA que possam se explicar – particularmente na Europa, onde a Lei da IA exigirá transparência – o foco do magistral em mostrar seu processo de raciocínio parece particularmente oportuna.

(Imagem por Stephane)

Veja também: Lutando alucinações: o MIT Spinout ensina ai a admitir quando não tem noção

Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira Ai & Big Data Expo Ocorrendo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos principais, incluindo Conferência de Automação InteligenteAssim, BlockxAssim, Semana de Transformação Digitale Cyber Security & Cloud Expo.

Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.

Créditos Autor