Sistemas de inteligência artificial como o ChatGPT fornecem respostas de som plausível para qualquer pergunta que você possa fazer. Mas eles nem sempre revelam as lacunas em seus conhecimentos ou áreas onde são incertas. Esse problema pode ter grandes consequências, pois os sistemas de IA são cada vez mais usados para fazer coisas como desenvolver medicamentos, sintetizar informações e dirigir carros autônomos.
Agora, o spinout do MIT Themis Ai está ajudando a quantificar a incerteza do modelo e as saídas corretas antes que elas causem problemas maiores. A plataforma CAPSA da empresa pode funcionar com qualquer modelo de aprendizado de máquina para detectar e corrigir saídas não confiáveis em segundos. Ele funciona modificando os modelos de IA para permitir que eles detectem padrões em seu processamento de dados que indicam ambiguidade, incompletude ou viés.
“A idéia é pegar um modelo, envolvê-lo em Capsa, identificar as incertezas e os modos de falha do modelo e depois aprimorar o modelo”, diz a co-fundadora da Themis AI e a professora do MIT Daniela Rus, que também é diretora do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSALAIL). “Estamos empolgados em oferecer uma solução que pode melhorar os modelos e oferecer garantias de que o modelo está funcionando corretamente”.
Rus fundou a OMIS AI em 2021 com Alexander Amini ’17, SM ’18, PhD ’22 e Elaheh Ahmadi ’20, Meng ’21, duas antigas afiliadas de pesquisa em seu laboratório. Desde então, eles ajudaram as empresas de telecomunicações com planejamento e automação de rede, ajudaram as empresas de petróleo e gás a usarem a IA para entender as imagens sísmicas e publicaram artigos sobre o desenvolvimento de chatbots mais confiáveis e confiáveis.
“Queremos ativar a IA nas aplicações de alto risco de todos os setores”, diz Amini. “Todos nós vimos exemplos de AI alucinando ou cometendo erros. À medida que a IA é implantada de maneira mais ampla, esses erros podem levar a consequências devastadoras. Nosso software pode tornar esses sistemas mais transparentes”.
Ajudando os modelos a saber o que eles não sabem
O Rus ‘Lab está pesquisando a incerteza do modelo há anos. Em 2018, ela recebeu financiamento da Toyota para estudar a confiabilidade de uma solução de condução autônoma baseada em aprendizado de máquina.
“Esse é um contexto crítico de segurança, onde a confiabilidade do modelo de compreensão é muito importante”, diz Rus.
Em separado trabalharRus, Amini e seus colaboradores construíram um algoritmo que poderia detectar o viés racial e de gênero em sistemas de reconhecimento facial e recuar automaticamente os dados de treinamento do modelo, mostrando o viés eliminado. O algoritmo funcionou identificando as partes não representativas dos dados de treinamento subjacentes e gerando novas amostras de dados semelhantes para reequilibrá -los.
Em 2021, os eventuais co-fundadores mostraram um abordagem semelhante poderia ser usado para ajudar as empresas farmacêuticas a usar modelos de IA para prever as propriedades dos candidatos a medicamentos. Eles fundaram a OMIS AI no final daquele ano.
“Orientar a descoberta de medicamentos pode economizar muito dinheiro”, diz Rus. “Esse foi o caso de uso que nos fez perceber o quão poderoso essa ferramenta poderia ser.”
Hoje, a Themis está trabalhando com empresas em uma ampla variedade de indústrias, e muitas dessas empresas estão construindo grandes modelos de idiomas. Ao usar o CAPSA, os modelos são capazes de quantificar sua própria incerteza para cada saída.
“Muitas empresas estão interessadas em usar o LLMS baseado em seus dados, mas estão preocupados com a confiabilidade”, observa Stewart Jamieson SM ’20, PhD ’24, chefe de tecnologia de Themis AI. “Ajudamos o LLMS a auto-relatar sua confiança e incerteza, o que permite que perguntas mais confiáveis respondam e sinalizem saídas não confiáveis”.
A IA da Themis também está em discussões com empresas de semicondutores que constroem soluções de IA em seus chips que podem funcionar fora dos ambientes de nuvem.
“Normalmente, esses modelos menores que funcionam em telefones ou sistemas incorporados não são muito precisos em comparação com o que você pode executar em um servidor, mas podemos obter o melhor dos dois mundos: baixa latência e computação de borda eficiente sem sacrificar a qualidade”, explica Jamieson. “Vemos um futuro em que os dispositivos de borda fazem a maior parte do trabalho, mas sempre que não têm certeza de sua saída, eles podem encaminhar essas tarefas para um servidor central”.
As empresas farmacêuticas também podem usar o CAPSA para melhorar os modelos de IA que estão sendo usados para identificar candidatos a medicamentos e prever seu desempenho em ensaios clínicos.
“As previsões e saídas desses modelos são muito complexos e difíceis de interpretar – os especialistas gastam muito tempo e esforço tentando entender deles”, observa Amini. “A Capsa pode fornecer informações imediatamente para entender se as previsões são apoiadas por evidências no conjunto de treinamento ou são apenas especulações sem muito fundamento. Isso pode acelerar a identificação das previsões mais fortes, e achamos que isso tem um enorme potencial para o bem social”.
Pesquisa para impacto
A equipe de Themis AI acredita que a empresa está bem posicionada para melhorar a vanguarda da tecnologia de IA em constante evolução. Por exemplo, a empresa está explorando a capacidade da Capsa de melhorar a precisão em uma técnica de IA conhecida como raciocínio da cadeia de pensamentos, no qual os LLMs explicam as etapas que tomam para chegar a uma resposta.
“Vimos sinais que a Capsa poderia ajudar a orientar esses processos de raciocínio para identificar as mais altas cadeias de confiança do raciocínio”, diz Amini. “Achamos que isso tem implicações enormes em termos de melhoria da experiência do LLM, reduzindo as latências e a redução dos requisitos de computação. É uma oportunidade extremamente de alto impacto para nós”.
Para Rus, que co-fundou várias empresas desde que chegou ao MIT, Themis AI é uma oportunidade para garantir que sua pesquisa do MIT tenha impacto.
“Meus alunos e eu nos tornamos cada vez mais apaixonados por dar um passo extra para tornar nosso trabalho relevante para o mundo”, diz Rus. “A IA tem um tremendo potencial para transformar as indústrias, mas a IA também levanta preocupações. O que me excita é a oportunidade de ajudar a desenvolver soluções técnicas que abordam esses desafios e também construam confiança e compreensão entre as pessoas e as tecnologias que estão se tornando parte de suas vidas diárias”.