No momento, você está visualizando Uma estrutura de detecção de anomalia que alguém pode usar | MIT News

Uma estrutura de detecção de anomalia que alguém pode usar | MIT News

Os interesses de pesquisa de Sarah Alneygheimish residem na interseção da engenharia de aprendizado de máquina e sistemas. Seu objetivo: tornar os sistemas de aprendizado de máquina mais acessíveis, transparentes e confiáveis.

Alegheimish é um aluno de doutorado no cientista de pesquisa principal Kalyan Veeramachaneni Grupo de Dados-Para-AI no Laboratório de Informação e Sistemas de Decisão (SIDS) do MIT. Aqui, ela compromete a maior parte de sua energia para o desenvolvimento da Orion, uma estrutura de aprendizado de máquina e amigável para o usuário e biblioteca de séries temporais capazes de detectar anomalias sem supervisão em ambientes industriais e operacionais em larga escala.

Influência precoce

Filha de um professor universitário e educador de professores, ela aprendeu desde tenra idade que o conhecimento deveria ser compartilhado livremente. “Acho que crescer em um lar onde a educação era altamente valorizada faz parte do motivo pelo qual quero tornar as ferramentas de aprendizado de máquina acessíveis”. A própria experiência pessoal de Alncegheimish com recursos de código aberto só aumentou sua motivação. “Aprendi a ver a acessibilidade como a chave para a adoção. Para buscar o impacto, a nova tecnologia precisa ser acessada e avaliada por quem precisa. Esse é o objetivo de fazer o desenvolvimento de código aberto”.

Alegheimish obteve seu diploma de bacharel na King Saud University (KSU). “Eu estava na primeira coorte de cursos de ciência da computação. Antes de ser criada esse programa, o único outro especialista disponível em computação era (tecnologia da informação)”. Fazer parte da primeira coorte foi emocionante, mas trouxe seus próprios desafios únicos. “Todo o corpo docente estava ensinando novo material. O sucesso exigiu uma experiência de aprendizado independente. Foi quando me deparei com o MIT OpenCourseware: como um recurso para me ensinar.”

Logo após se formar, Alendheimish tornou -se pesquisador na cidade de Ciência e Tecnologia King Abdulaziz para Ciência e Tecnologia (KACST), Laboratório Nacional da Arábia Saudita. Por meio do Centro de Sistemas de Engenharia Complexos (CCEs) da KACST e do MIT, ela começou a realizar pesquisas com Veeramachaneni. Quando ela se inscreveu no MIT para a pós -graduação, seu grupo de pesquisa era sua melhor escolha.

Criando Orion

A tese de mestrado de Alncegheimish focada na detecção de anomalia da série temporal – a identificação de comportamentos ou padrões inesperados nos dados, que podem fornecer aos usuários informações cruciais. Por exemplo, padrões incomuns nos dados de tráfego de rede podem ser um sinal de ameaças de segurança cibernética, leituras anormais de sensores em máquinas pesadas podem prever possíveis falhas futuras e o monitoramento dos sinais vitais do paciente pode ajudar a reduzir as complicações à saúde. Foi através da pesquisa de seu mestre que Alendheimish começou a projetar Orion.

A Orion usa modelos estatísticos e baseados em aprendizado de máquina que são continuamente registrados e mantidos. Os usuários não precisam ser especialistas em aprendizado de máquina para utilizar o código. Eles podem analisar sinais, comparar métodos de detecção de anomalias e investigar anomalias em um programa de ponta a ponta. A estrutura, o código e os conjuntos de dados são todos de código aberto.

“Com o código aberto, a acessibilidade e a transparência são alcançados diretamente. Você tem acesso irrestrito ao código, onde pode investigar como o modelo funciona através da compreensão do código. Aumentamos a transparência com o Orion: rotulamos todas as etapas do modelo e o apresentamos ao usuário”. Alegheimish diz que essa transparência ajuda a permitir que os usuários comecem a confiar no modelo antes que eles vejam por si mesmos o quão confiável é.

“Estamos tentando pegar todos esses algoritmos de aprendizado de máquina e colocá-los em um só lugar para que qualquer pessoa possa usar nossos modelos no ensino médio”, diz ela. “Não é apenas para os patrocinadores que trabalhamos no MIT. Ele está sendo usado por muitos usuários públicos. Eles vêm à biblioteca, instalam -o e o executam em seus dados. Está se mostrando uma ótima fonte para as pessoas encontrarem alguns dos métodos mais recentes para detecção de anomalia”.

Modelos reaproveitando para detecção de anomalia

Em seu doutorado, a Alendheimish está explorando ainda mais maneiras inovadoras de fazer detecção de anomalia usando Orion. “Quando iniciei minha pesquisa, todos os modelos de aprendizado de máquina precisavam ser treinados do zero em seus dados. Agora estamos em uma época em que podemos usar modelos pré-treinados”, diz ela. Trabalhar com modelos pré-treinados economiza tempo e custos computacionais. O desafio, porém, é que a detecção de anomalia da série temporal é uma tarefa nova para eles. “No sentido original deles, esses modelos foram treinados para prever, mas não para encontrar anomalias”, diz Alendheimish. “Estamos ultrapassando seus limites através da engenharia imediata, sem nenhum treinamento adicional”.

Como esses modelos já capturam os padrões de dados de séries temporais, o alepheimish acredita que eles já têm tudo o que precisam para permitir que eles detectem anomalias. Até agora, seus resultados atuais apóiam essa teoria. Eles não superam a taxa de sucesso dos modelos que são treinados independentemente em dados específicos, mas ela acredita que um dia.

Design acessível

Alegheimish fala longamente sobre os esforços pelos quais passou para tornar Orion mais acessível. “Antes de chegar ao MIT, eu costumava pensar que a parte crucial da pesquisa era desenvolver o próprio modelo de aprendizado de máquina ou melhorar seu estado atual. Com o tempo, percebi que a única maneira de tornar sua pesquisa acessível e adaptável para outros é desenvolver sistemas que os tornam acessíveis. Durante meus estudos de pós -graduação, eu adotei a abordagem de desenvolver meus modelos e sistemas em conjunto” ”

O elemento -chave para o desenvolvimento do sistema foi encontrar as abstrações certas para trabalhar com seus modelos. Essas abstrações fornecem representação universal para todos os modelos com componentes simplificados. “Qualquer modelo terá uma sequência de etapas para passar da entrada bruta para a saída desejada. Padronizamos a entrada e a saída, o que permite que o meio seja flexível e fluido. Até agora, todos os modelos que executamos foram capazes de adaptar às nossas abstrações”. As abstrações que ela usa têm sido estáveis ​​e confiáveis ​​nos últimos seis anos.

O valor da construção simultaneamente de sistemas e modelos pode ser visto no trabalho de Alendicheimish como mentor. Ela teve a oportunidade de trabalhar com os alunos de dois mestres obtendo seus diplomas de engenharia. “Tudo o que mostrei a eles era o próprio sistema e a documentação de como usá -lo. Ambos os alunos foram capazes de desenvolver seus próprios modelos com as abstrações nas quais nos em conformidade. Reafirmou que estamos seguindo o caminho certo”.

Alegheimish também investigou se um modelo de idioma grande (LLM) poderia ser usado como mediador entre usuários e um sistema. O agente LLM que ela implementou é capaz de se conectar ao Orion sem os usuários que precisam conhecer os pequenos detalhes de como o Orion funciona. “Pense no chatgpt. Você não tem idéia do que está por trás disso, mas é muito acessível a todos.” Para seu software, os usuários conhecem apenas dois comandos: ajuste e detecte. O FIT permite que os usuários treinem seu modelo, enquanto a detecção permite detectar anomalias.

“O objetivo final do que eu tentei fazer é tornar a IA mais acessível a todos”, diz ela. Até agora, Orion atingiu mais de 120.000 downloads e mais de mil usuários marcaram o repositório como um de seus favoritos no Github. “Tradicionalmente, você costumava medir o impacto da pesquisa por meio de citações e publicações em papel. Agora você obtém adoção em tempo real por meio de código aberto”.

Créditos Autor

Deixe um comentário