Usando modelo de IA pré-treinado da NVIDIA, a startup Evozyne criou duas proteínas com potencial significativo na área da saúde e da energia limpa. Um artigo conjunto divulgado descreve o processo e os elementos básicos biológicos produzidos. Um tem como objetivo curar uma doença congênita, outro foi projetado para consumir dióxido de carbono e reduzir o aquecimento global.
Os resultados iniciais mostram uma nova maneira de acelerar a descoberta de medicamentos e muito mais.
“É muito encorajador que, mesmo nesta primeira rodada, o modelo de IA tenha produzido proteínas sintéticas tão boas quanto as que ocorrem naturalmente”, diz Andrew Ferguson, co-fundador da Evozyne e co-autor do artigo. “Isso nos diz que ele aprendeu corretamente as regras de desenvolvimento da natureza”.
Um modelo de IA transformador
A Evozyne usou o ProtT5 da NVIDIA, um modelo transformer que faz parte do NVIDIA BioNeMo, serviço e framework de softwares para a criação de modelos de IA para a área da saúde.
“O BioNeMo nos ofereceu tudo o que precisávamos para sustentar o treinamento de modelos e, depois, executar trabalhos com o modelo de maneira muito barata. Conseguimos gerar milhões de sequências em apenas alguns segundos”, diz Ferguson, engenheiro molecular que trabalha na intersecção da química com machine learning.
O modelo está no centro do processo da Evozyne, chamado ProT-VAE. É um workflow que combina o BioNeMo com um autocodificador que funciona como um filtro. “O uso de grandes modelos de linguagem combinados com autocodificadores variacionais para desenvolver proteínas não estava no radar de ninguém há alguns anos”.
Modelo aprende como a natureza funciona
Como um aluno lendo um livro, o modelo transformer da NVIDIA lê sequências de aminoácidos em milhões de proteínas. Usando as mesmas técnicas que as redes neurais empregam para entender o texto, ele aprendeu como a natureza monta esses poderosos elementos básicos da biologia.
O modelo então previu como montar novas proteínas adequadas para as funções que a Evozyne quer abordar. “A tecnologia está nos permitindo concretizar o que parecia um sonho impossível há 10 anos atrás”, explica.
Um mar de possibilidades
O machine learning ajuda a navegar pelo número astronômico de sequências proteicas possíveis e, em seguida, identifica as mais úteis com eficiência.
O método tradicional de engenharia de proteína, chamado de evolução dirigida, usa uma abordagem lenta e incerta. Normalmente, ele só altera alguns aminoácidos em sequência de cada vez.
Em contraste, a abordagem da Evozyne pode alterar metade ou mais dos aminoácidos em uma proteína em uma única rodada. Isso é o equivalente a fazer centenas de mutações. “Estamos dando grandes saltos, o que nos permite explorar proteínas inéditas com funções novas e úteis”, afirma.
Usando o novo processo, o plano é criar uma variedade de proteínas para combater desde doenças até mudanças climáticas.
Como a NVIDIA ajudou
“A NVIDIA é uma parceira incrível nesse trabalho”, afirma. “Eles dimensionaram trabalhos para várias GPUs acelerando o treinamento”, diz Joshua Moller, cientista de dados da Evozyne. “Analisamos conjuntos de dados inteiros em um minuto. Isso reduziu o tempo de treinamento de grandes modelos de IA de meses para uma semana, permitindo treinar modelos, alguns com bilhões de parâmetros, que simplesmente não seria possível de outra forma”, conta Ferguson.
“As soluções oferecidas pela NVIDIA são importantes para acelerar o desenvolvimento e descobrir novos medicamentos para a área da saúde. Isso contribui para a redução de tempo e custo, além de fornecer um ambiente mais sustentável para os próximos anos”, pontua Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Muito mais por vir
O horizonte da engenharia de proteínas acelerada por IA é amplo. “O segmento está se movendo extremamente rápido e estou muito animado para ver o que virá por aí”, finaliza Andrew Ferguson, observando o surgimento recente de modelos de difusão. “Quem sabe onde estaremos daqui a cinco anos?”
Interessados podem se inscrever para ter acesso antecipado ao NVIDIA BioNeMo e para ver como ele pode acelerar suas aplicações.
Fonte: Olhar Digital
Comentários