Cada vez mais a ciência mundial se baseia em grande quantidade de dados ou de processos, que exigem suporte computacional de alto desempenho. Por outro lado, muitos pesquisadores conhecem os algoritmos analíticos necessários para o seu trabalho, mas não possuem a experiência em operações de Bioinformática e Computação de Alto Desempenho (HPC), como análises complexas, softwares especializados e submissões de tarefas paralelas e gerenciamento de clusters. O Núcleo de Bioinformática e Biologia Computacional do Instituto Butantan (NBBC) oferece uma infraestrutura avançada de HPC, permitindo a realização de análises computacionalmente intensivas exigidas pela pesquisa nas áreas de Biologia Molecular, Bioquímica, Biofísica e Evolução, entre outras. Essa infraestrutura traz uma contribuição valiosa para o Butantan, permitindo a realização de pesquisas de ponta e impacto.
O Núcleo fortalece a integração de cientistas de diversas áreas, com o objetivo de ampliar a conscientização e a incorporação das ferramentas de tecnologia da informação na pesquisa, farmacologia e vacinologia. Esta articulação promove um ambiente colaborativo que potencializa os esforços locais e internacionais em bioinformática e biologia computacional, tornando-os mais eficientes e competitivos. Seus propósitos são: integrar pesquisadores e ampliar o uso de bioinformática; gerenciar e fornecer suporte computacional para as pesquisas; gerar novas ferramentas de análise de dados; e treinar pesquisadores, alunos e equipes em programação e em bioinformática.
Os principais temas desenvolvidos pelo NBBC são relacionados às áreas de Biologia Molecular e Bioquímica, com foco em estudos evolutivos de organismos venenosos, descoberta de novas moléculas com potencial farmacológico, desenvolvimento de novas vacinas e vigilância genômica.
Para simplificar o acesso à infraestrutura computacional, o núcleo oferece uma interface via terminal Linux de fácil utilização. Isso permite aos pesquisadores submeterem suas tarefas computacionais que necessitam de alto desempenho, e avançar em questões científicas específicas por meio da complexidade da área em ambientes de HPC – como a descoberta de compostos bioativos, antivenenos e vacinas com potenciais impactos na saúde pública. Com esses recursos, o NBBC apoia projetos de bioinformática em larga escala e acelera pesquisas em genômica, transcriptômica, proteômica, biologia estrutural e evolutiva, além do desenho de novas moléculas, entre outras iniciativas. Adicionalmente, são oferecidos cursos de bioinformática e de programação para capacitar novos usuários a utilizar a infraestrutura computacional e permitir que outros usuários a utilizem de maneira mais eficiente.
Facilitando a integração de dados, simulação impulsionada por HPC e análise de dados ômicos e farmacológicos, o núcleo reúne pesquisadores que desempenham um papel fundamental na identificação de novos alvos terapêuticos e no desenvolvimento de ferramentas para a compreensão de sistemas e mecanismos biológicos.
Essa abordagem integradora não apenas aumenta a produtividade e apoia projetos inovadores dentro do Instituto, mas também contribui para a comunidade científica em geral, potencializando o engajamento em colaborações nacionais e internacionais voltadas para descobertas na área da saúde. Com o suporte de uma robusta estrutura computacional, o núcleo está posicionado para enfrentar desafios urgentes nas ciências da vida e na bioinformática.
Com a união de projetos sobre genômica bacteriana e viral, esta linha foca na compreensão da evolução, disseminação e mecanismos de resistência de patógenos que afetam a saúde pública.
• Epidemiologia genômica de bactérias clinicamente relevantes: esta linha investiga surtos bacterianos e a evolução de patógenos, estudando a resistência a antibióticos e os impactos de vacinas em patógenos como Haemophilus aegyptius e Streptococcus pneumoniae, com foco na caracterização genômica e análise filogenética.
Pesquisadores envolvidos:
• Milton Yutaka Nishiyama Junior
• Enéas de Carvalho
Este tema abrange projetos relacionados à descoberta, análise funcional e potencial terapêutico de compostos bioativos derivados de organismos venenosos, com aplicações em descobertas de fármacos e biotecnologia.
• Métodos computacionais para predição e classificação de peptídeos bioativos: esta linha desenvolve modelos para prever e classificar peptídeos antimicrobianos (AMPs) e outras moléculas bioativas encontradas em organismos venenosos, integrando dados de transcriptoma e proteoma para melhorar a precisão da predição.
• Avaliação genômica ampla do efeito de venenos em bactérias: o objetivo é estudar a resposta das bactérias de interesse médico e veterinário Pseudomonas aeruginosa, Providencia rettgeri e Proteus sp ao veneno de Bothrops alternatus. Essas bactérias são normalmente encontradas em serpentes saudáveis e podem causar infecções em répteis.
Pesquisadores envolvidos:
• Milton Yutaka Nishiyama Junior
• Enéas de Carvalho
Com foco no desenvolvimento de antivenenos e imunoterapia, este tema inclui projetos sobre predição de epítopos, engenharia de anticorpos sintéticos e métodos computacionais para aumentar a segurança e a eficácia de tratamentos para acidentes com serpentes.
• Abordagens computacionais para caracterização e descoberta de epítopos e engenharia de anticorpos em toxinas de cobra: este projeto aborda o problema global de saúde causado pelo envenenamento por serpentes, reconhecido pela OMS como uma doença tropical negligenciada. A produção tradicional de antiveneno é cara e pode causar reações adversas, o que leva à pesquisa de alternativas. Esta linha propõe métodos computacionais para prever epítopos de toxinas de veneno e estudar estruturas de anticorpos que podem servir como modelos para anticorpos sintéticos, visando aumentar a capacidade de ligação e a redução dos efeitos colaterais.
• Design de vacinas multi-epítopos: uma vacina pode estimular vários aspectos da resposta imune. Para aumentar e maximizar essa capacidade, o NBBC identifica partes específicas de uma proteína (os epítopos) que têm propriedades imunológicas únicas e alta probabilidade de desencadear resposta imune. Ao combinar esses epítopos direcionados em um único antígeno, é criada uma vacina multi-epítopo, que envolve múltiplas facetas da resposta imune, intensificando seu efeito e aumentando as chances de sucesso do imunizante.
Pesquisadores envolvidos:
• Milton Yutaka Nishiyama Junior
• Enéas de Carvalho
Com inteligência artificial (IA) e predição estrutural, este tema apoia projetos focados na modelagem de estruturas de proteínas, padrões de glicosilação e modificações pós-traducional para entender as funções de proteínas e design de biomoléculas.
• Evolução e caracterização funcional de famílias de genes em venenos de aracnídeos: com o objetivo de entender a evolução e os mecanismos moleculares dos genes de venenos, são estudadas a duplicação de genes, as junções alternativas e as modificações. O projeto visa revelar como esses fatores impulsionam a diversidade de venenos e descobrir potenciais aplicações biotecnológicas por meio do desenvolvimento de Redes Regulatórias de Genes, modelos de IA e Redes Adversas Generativas.
• Modelos de IA para descrever a estrutura de toxinas glicosiladas de serpentes Bothrops: a glicolisação, uma modificação pós-traducional essencial, é crítica para a estabilidade e função das toxinas de serpentes. Esta pesquisa usa modelos de IA e métodos analíticos para prever a estrutura de toxinas glicosiladas, com foco em glicopeptídeos em venenos de Bothrops. Ao integrar abordagens de aprendizado físico e machine learning, este projeto avança na compreensão do papel da glicosilação na estrutura da proteína, contribuindo potencialmente para o design de biomoléculas e vacinas.
• Avaliação dos principais fatores relacionados a falhas na produção industrial de imunobiológicos: a produção industrial de imunobiológicos envolve muitos processos, e falhas em qualquer uma dessas etapas podem interromper toda a cadeia de produção, levando ao aumento de custos e a potenciais perdas de produtos. Para identificar e avaliar sistematicamente esses pontos de falha e sua criticidade, o NBBC conduz uma análise de dados aprofundada a partir de técnicas de machine learning. Este projeto visa melhorar a identificação de fatores de risco, permitindo medidas preventivas mais robustas em toda a cadeia de produção imunológica.
Pesquisadores envolvidos:
• Milton Yutaka Nishiyama Junior
• Enéas de Carvalho
Enéas de Carvalho
Pesquisador Científico VI
Milton Yutaka Nishiyama Junior
Especialista de Laboratório
Danilo Cardozo Maciel Barboza
Tecnologista de laboratório
Wesley Freitas Mantovani
Bolsista Capacitação Técnica TT-IVa
• Estratégias ômicas (genômica, transcriptômica e proteômica)
• Desenho experimental
• Preparação de amostras
• Análises de bioinformática
• CD – Circular Dichroism
• Inteligência Artificial
• Aprendizagem de máquina
• Aprendizagem profunda
• Reconhecimento de padrões
• Caracterização estrutural de proteínas
• Predição estrutural de proteína
• Interação proteína-proteína, peptídeo-proteína
• Servidor Vital – 112-cores/224-threads, 3TB RAM, 2x GPUs V100
• Sistema HPC
• 24x CPU Nodes (256-cores, 1.5TB RAM)
• 2x GPU Nodes (2x H100 NVLINK)
• 1x Storage Node (1.5 PB)
• 1x Fat Node (3TB RAM)
• Network Fiber channel 400GB/s