Desvendando a diversidade microbiana: A análise taxonômica com o Kraken 2

O que é uma classificação taxonômica?

Antes de introduzir o Kraken 2, é necessário primeiro entender como as espécies são categorizadas e identificadas dentro da Biologia. Para isso, biólogos e cientistas utilizam da classificação taxonômica de espécies.

A classificação taxonômica (biológica) de espécies nada mais é do que a identificação de relações de parentesco inferidas pela comunidade científica entre espécies de seres vivos. Dentro do escopo da taxonomia – ciência de classificação e identificação de seres vivos – estão englobadas sete atividades distintas:

  • Reconhecimento, descrição e nomeação de táxons (espécies, gêneros, famílias, etc, a qual a espécie pertence);
  • Comparação de táxons, incluindo estudos de parentesco (análise filogenética);
  • Classificação de táxons (preferencialmente com base em análises filogenéticas);
  • Estudo da variação genética dentro de espécies;
  • Construção de ferramentas para identificação (chaves, códigos de barras de DNA);
  • Identificação de espécimes (referindo-os aos táxons, utilizando as ferramentas);
  • Inferência de inventários de táxons em áreas ou ecossistemas específicos (utilizando as ferramentas para identificação).

A classificação taxonômica é imprescindível para a Biologia e para a ciência no geral. Com ela, é possível inferir relações de parentesco e de evolução das espécies, permitindo estudar a relação de como os seres vivos evoluíram desde o início da vida e entender como a vida e a evolução puderam estabelecer-se no planeta. Além disso, tal análise também permite entender porque e como espécies específicas apresentam certas características que outras não apresentam e vice-versa, ajudando a entender seu funcionamento, podendo auxiliar na pesquisa biotecnológica destes seres, na medida de que tais características podem ser utilizadas para desenvolver novas tecnologias úteis.

Uma das ferramentas mais utilizadas para melhor entender as relações de parentesco entre as espécies estudadas é a árvore filogenética. Que consiste em uma representação esquemática da relação entre as espécies, em um formato que lembra galhos em uma árvore. Abaixo está um exemplo de tais árvores.

Fonte: Paster et al., 1991.

O que é o Kraken 2?

Uma vez entendido o conceito de análise taxonômica e filogenética, torna-se fácil compreender a função do Kraken 2Kraken 2 é um software de bioinformática desenvolvido pela Johns Hopkins University que funciona como um sistema de classificação taxonômica que utiliza correspondências exatas de k-mers (sequências de material genético) para conseguir gerar uma classificação entre os organismos analisados. Este classificador associa cada k-mer de uma sequência em análise ao menor ancestral comum (LCA) de todos os genomas que contêm o k-mer fornecido. Com isso, as atribuições de k-mers possibilitam o programa criar um algoritmo de classificação (árvore filogenética).

Vantagens em Utilizar o Kraken 2

Dentre as vantagens em utilizar o Kraken 2, está sua alta velocidade de processamento, que é significativamente mais rápida e consome menos memória que seu antecessor e outras ferramentas. Outra vantagem é sua classificação precisa baseada nos k-mers, proporcionando alta precisão na classificação taxonômica.

Além destes benefícios, uma das principais vantagens do programa é seu suporte a diversos bancos de dados, facilitando análises de rRNA (RNA ribossomal) e metagenômicas amplas. O software ainda permite integração com outras ferramentas de análises, o que aumenta a robustez dos resultados.

Como posso realizar minha análise?

A Protos oferece em seu catálogo o serviço de Análises Bioinformáticas para facilitar seu trabalho e agilizar sua pesquisa! Não quer perder tempo fazendo análises e deseja resultados com confiabilidade? Contate-nos!

Referências

ENGHOFF, H. What is taxonomy?: An overview with myriapodological examples. Soil Organisms, [S. l.], v. 81, n. 3, p. 441-451, 2009. Disponível em: https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=fa387d431a007b890e35b259c4b39148fcec74bc.

GUERRA-GARCÍA, J. M; ESPINOSA, F; GARCÍA-GÓMEZ, J. C.Trends in Taxonomy today: an overview about the main topics in Taxonomy. Zoologica Baetica, [S. l.], v. 19, p. 15-49, 2008. Disponível em: https://www.researchgate.net/publication/269465472_Trends_in_taxonomy_today.

JOHNS HOPKINS UNIVERSITY. Center for Computational Biology. How to Choose Your Metagenomics Classification Tool. Baltimore, 29 set. 2022. Disponível em: https://ccb.jhu.edu/software/choosing-a-metagenomics-classifier/. Acesso em: 20 mai. 2025.

JOHNS HOPKINS UNIVERSITY. Center for Computational Biology. Kraken 2. Baltimore, 29 set. 2022. Disponível em: https://ccb.jhu.edu/software/kraken2/. Acesso em: 20 mai. 2025.

LU, J. et al. Bracken: estimating species abundance in metagenomics data. PeerJ Computer Science, v. 3, n. e104, 2017. DOI: https://doi.org/10.7717/peerj-cs.104.

LU, J. et al. Metagenome analysis using the Kraken software suite. Nature protocols, v. 17, n. 12, p. 2815-2839, 2022. DOI: https://doi.org/10.1038/s41596-022-00738-y.

LU, J; SALZBERG, S. L. Ultrafast and accurate 16S rRNA microbial community analysis using Kraken 2. Microbiome, v. 8, n. 124, 2020. DOI: https://doi.org/10.1186/s40168-020-00900-2.

PASTER, B. J. et al. Phylogenetic analysis of the spirochetes. Journal of Bacteriology, v. 173, n. 19, p. 6101-6109, 1991. Disponível em: https://journals.asm.org/doi/epdf/10.1128/jb.173.19.6101-6109.1991.

PEARMAN, W. S; FREED, N. E; SILANDER, O. K. Testing the advantages and disadvantages of short- and long- read eukaryotic metagenomics using simulated reads. BMC Bioinformatics, v. 21, n. 220, 2020. DOI: https://doi.org/10.1186/s12859-020-3528-4.

WOOD, D. E; LU, J; LANGMEAD, B. Improved metagenomic analysis with Kraken 2. Genome Biology, v. 20, n. 257, 2019. DOI: https://doi.org/10.1186/s13059-019-1891-0.

WOOD, D. E; SALZBERG, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology, v. 15, n. R46, 2014. DOI: https://genomebiology.biomedcentral.com/articles/10.1186/gb-2014-15-3-r46.