A bioinformática é uma ferramenta fundamental na análise de amostras microbiológicas, pois permite a identificação correta da taxonomia de microrganismos patogênicos, sendo assim, essencial para caracterizar a contaminações, estruturar meios eficientes de controle e estabelecer conclusões sobre as relações entre diferentes microrganismos. Dessa forma, esse processo de detecção e identificação pode ser feito de forma eficaz através de técnicas de sequenciamento associadas ao uso de bancos de dados curados.
Pré-processamento e filtragem de sequências
Para isso, o primeiro passo do procedimento consiste em avaliar e filtrar as sequências brutas (reads) obtidas no sequenciamento, de modo a garantir o uso de dados de alta qualidade. Logo, isso é importante, porque o material genético original sequenciado provém, geralmente, de comunidades microbianas Com isso, nessa etapa pode-se utilizar de diferentes programas, como:
- Para dados Illumina:
- Trimmomatic: remoção de adaptadores, corte baseado em qualidade, remoção de regiões de baixa qualidade, tratamento específico de dados paired-end, produzindo arquivos mais limpos.
- Para dados Oxford Nanopore:
- NanoPack: conjunto de ferramentas em Python para visualização e processamento de dados de leitura longa, composto por:
- NanoPlot: gera gráficos QC informativos e estatísticas detalhadas de qualidade;
- NanoStat: produz resumo de dados estatísticos;
- NanoFilt: ferramenta de filtragem e corte de leitura;
- NanoLyse: remoção rápida de possíveis contaminantes de interferência.
- NanoPack: conjunto de ferramentas em Python para visualização e processamento de dados de leitura longa, composto por:
- Essas ferramentas são utilizadas para monitorar qualidade, explorar padrões de leitura e filtrar dados de leitura longa.
Montagem do genoma
Na etapa da montagem do genoma, há a combinação de sequências lidas em trechos contínuos (contings), de modo que, a partir da semelhança entre elas, seja possível reconstruir o genoma de forma mais completa e precisa. Dessa forma, pode utilizar-se o:
- Flye: montador de leitura longa que gera contigs de alta continuidade e qualidade a partir de dados Oxford Nanopore ou PacBio.
Identificação e Classificação Taxonômica
Após a montagem, parte-se para a etapa de identificação e classificação. Neste processo, é importante associar os genes aos grupos taxonômicos. Para isso, as sequências são comparadas a bancos de dados de referência, em busca de similaridades, sendo possível utilizar o:
- BLAST (Basic Local Alignment Search Tool): compara sequências obtidas com bancos de dados, como NCBI Protein, permitindo analisar a homologia entre genes, conservação de aminoácidos e diferenças pontuais que podem influenciar o funcionamento da proteína;
- Permitindo a identificação de microrganismos com uso de bancos de dados biológicos e detecção de contaminantes específicos.
Integração e Interpretação dos Resultados
Dessa forma, a integração das ferramentas permite determinar a presença e identidade dos contaminantes específicos, inferindo a origem de contaminação. Por isso, essas análises são essenciais, para a confiabilidade dos resultados microbiológicos , aprimorando controle de qualidade da pesquisa, diagnóstico e análise.
A Protos Biotec Jr. fornece os serviços de análises laboratoriais e de bioinformática na análise e sequenciamento de genoma. Ficou interessado(a)? Entre em contato conosco!

Referências:
BOLGER, A. M.; LOHSE, M.; USADEL, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics, v. 30, n. 15, p. 2114-2120, 2014. DOI: 10.1093/bioinformatics/btu170.
DE COSTER, W. et al. NanoPack: visualizing and processing long-read sequencing data. Bioinformatics, v. 34, n. 15, p. 2666-2669, 2018. DOI: 10.1093/bioinformatics/bty149.
KOŁMOGOROV, M. et al. Assembly of long, error-prone reads using repeat graphs. Nature Biotechnology, v. 37, n. 5, p. 540-546, 2019. DOI: 10.1038/s41587-019-0072-8.
NEIS, A. Entendendo BLAST – Parte I: conceitos principais. Medium, (2020). Disponível em: <https://medium.com/omixdata/entendendo-blast-parte-i-conceitos-principais-4711e34cc2b6>. Acesso em: 21 out. 2025.
PEIXOTO, M. B. Bioinformática aplicada a um projeto de metagenômica. Campinas: Universidade Estadual de Campinas (Unicamp), 2021. Disponível em: https://ic.unicamp.br/~zanoni/students/mestrado/bruno/proposta.pdf. Acesso em: 21 out. 2025.
SARMENTO, F. J. de Q. Desenvolvimento de uma plataforma de bioinformática integrada aplicada à identificação molecular de microrganismos patogênicos. 2013. 108 f. Tese (Doutorado em Biotecnologia) – Universidade Federal da Paraíba, João Pessoa, 2013.
