Bioinformática: Detecção de agente microbiano

A bioinformática é uma ferramenta fundamental na análise de amostras microbiológicas, pois permite a identificação correta da taxonomia de microrganismos patogênicos, sendo assim, essencial para caracterizar a contaminações, estruturar meios eficientes de controle e estabelecer conclusões sobre as relações entre diferentes microrganismos. Dessa forma, esse processo de detecção e identificação pode ser feito de forma eficaz através de técnicas de sequenciamento associadas ao uso de bancos de dados curados. 

Pré-processamento e filtragem de sequências

Para isso, o primeiro passo do procedimento consiste em avaliar e filtrar as sequências brutas (reads) obtidas no sequenciamento, de modo a garantir o uso de dados de alta qualidade. Logo, isso é importante, porque o material genético original sequenciado provém, geralmente, de comunidades microbianas Com isso, nessa etapa pode-se utilizar de diferentes programas, como:

  • Para dados Illumina:
    • Trimmomatic: remoção de adaptadores, corte baseado em qualidade, remoção de regiões de baixa qualidade, tratamento específico de dados paired-end, produzindo arquivos mais limpos.
  • Para dados Oxford Nanopore:
    • NanoPack: conjunto de ferramentas em Python para visualização e processamento de dados de leitura longa, composto por:
      • NanoPlot: gera gráficos QC informativos e estatísticas detalhadas de qualidade;
      • NanoStat: produz resumo de dados estatísticos;
      • NanoFilt: ferramenta de filtragem e corte de leitura;
      • NanoLyse: remoção rápida de possíveis contaminantes de interferência.
  • Essas ferramentas são utilizadas para monitorar qualidade, explorar padrões de leitura e filtrar dados de leitura longa.

Montagem do genoma

Na etapa da montagem do genoma, há a combinação de sequências lidas em trechos contínuos (contings), de modo que, a partir da semelhança entre elas, seja possível reconstruir o genoma de forma mais completa e precisa. Dessa forma, pode utilizar-se o:

  • Flye: montador de leitura longa que gera contigs de alta continuidade e qualidade a partir de dados Oxford Nanopore ou PacBio.

Identificação e Classificação Taxonômica

Após a montagem, parte-se para a etapa de identificação e classificação. Neste processo, é importante associar os genes aos grupos taxonômicos. Para isso, as sequências são comparadas a bancos de dados de referência, em busca de similaridades, sendo possível utilizar o:

  • BLAST (Basic Local Alignment Search Tool):  compara sequências obtidas com bancos de dados, como NCBI Protein, permitindo analisar a homologia entre genes, conservação de aminoácidos e diferenças pontuais que podem influenciar o funcionamento da proteína;
    • Permitindo a identificação de microrganismos com uso de bancos de dados biológicos e detecção de contaminantes específicos.

Integração e Interpretação dos Resultados

Dessa forma, a integração das ferramentas permite determinar a presença e identidade dos contaminantes específicos, inferindo a origem de contaminação. Por isso, essas análises são essenciais, para a confiabilidade dos resultados microbiológicos , aprimorando controle de qualidade da pesquisa, diagnóstico e análise. 


A Protos Biotec Jr. fornece os serviços de análises laboratoriais e de bioinformática na análise e sequenciamento de genoma. Ficou interessado(a)? Entre em contato conosco!

Referências:

BOLGER, A. M.; LOHSE, M.; USADEL, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics, v. 30, n. 15, p. 2114-2120, 2014. DOI: 10.1093/bioinformatics/btu170.

DE COSTER, W. et al. NanoPack: visualizing and processing long-read sequencing data. Bioinformatics, v. 34, n. 15, p. 2666-2669, 2018. DOI: 10.1093/bioinformatics/bty149. 

KOŁMOGOROV, M. et al. Assembly of long, error-prone reads using repeat graphs. Nature Biotechnology, v. 37, n. 5, p. 540-546, 2019. DOI: 10.1038/s41587-019-0072-8.

NEIS, A. Entendendo BLAST – Parte I: conceitos principais. Medium, (2020). Disponível em: <https://medium.com/omixdata/entendendo-blast-parte-i-conceitos-principais-4711e34cc2b6>. Acesso em: 21 out. 2025.

PEIXOTO, M. B. Bioinformática aplicada a um projeto de metagenômica. Campinas: Universidade Estadual de Campinas (Unicamp), 2021. Disponível em: https://ic.unicamp.br/~zanoni/students/mestrado/bruno/proposta.pdf. Acesso em: 21 out. 2025.

SARMENTO, F. J. de Q. Desenvolvimento de uma plataforma de bioinformática integrada aplicada à identificação molecular de microrganismos patogênicos. 2013. 108 f. Tese (Doutorado em Biotecnologia) – Universidade Federal da Paraíba, João Pessoa, 2013.