DNA como Ciência da Informação

representação da bioinformatica

Não é novidade para ninguém que o DNA é a maior influência biológica para cada uma das nossas características físicas – os chamados fenótipos. Desde a cor dos nossos olhos à maneira como as nossas articulações se encaixam umas nas outras, a parte majoritária dessas características e comportamentos são determinados ou, se não, fortemente influenciados pelo DNA. No entanto, você sabia que essa fonte de vida, ordem e regularidade também pode funcionar como base estrutural das Ciências da Informação?

Mas como a estrutura do DNA e as suas características são assimiladas em informação? Será que a replicação do DNA e a transcrição do DNA em RNA podem estar envolvidas nesse processo? É exatamente isso que veremos a seguir!

Estrutura do DNA

O DNA é uma molécula longa e espiralada, uma dupla hélice composta por duas metades complementares ligadas por interações de hidrogênio, as duas fitas de DNA. Um detalhe importante, tecnicamente uma dupla hélice de DNA não pode ser chamada de uma molécula, porque suas partes complementares estão conectadas apenas por interações de hidrogênio, que são interações intermoleculares relativamente fracas.

O nome “DNA” é uma abreviação de DeoxyriboNucleic Acid, ou seja, Ácido DesoxirriboNucleico. Esse nome vai ser explicado um pouco mais para frente no texto.

Enfim, cada uma das fitas é composta por moléculas menores, chamadas nucleotídeos, ligadas linearmente. Quando ligadas, as duas fitas de DNA se assemelham a uma espécie de escada contorcida. Nesse formato de escada, cada “corrimão” é formado por duas estruturas orgânicas que se alternam, um grupo fosfato e um açúcar – a desoxirribose. A cada uma dessas desoxirriboses se liga uma base nitrogenada, que é a estrutura que dá toda a variação da expressão gênica. Existem 4 bases presentes na fita de DNA que podem estar ligadas na desoxirribose: a adenina (A), a timina (T), a guanina (G) e a citosina (C), que se dispõem como os “degraus” da escada. Cada uma dessas estruturas está indicada na imagem abaixo!

O modelo da estrutura do DNA, que se assemelha a uma escada vertical contorcida. É possível observar os grupos fosfatos e as desoxirriboses (indicadas por um hexágono) alternando-se. Além disso, vê-se as bases nitrogenadas se ligando em pares complementares, timina se ligando a adenina e citosina se ligando a guanina.
Fonte: Brasil Escola.

Mas que relação essa estrutura tem com o código genético? Pois bem, cada uma das bases nitrogenadas pode variar dentro dessas quatro opções. A depender da ordem dessas bases na fita do DNA, um trecho dessa grande pode codificar uma grande variedade de proteínas, os “tijolos” moleculares dos organismos vivos.

Cada trecho que codifica uma proteína é chamado de um gene. Dentro do gene, a variação das bases resulta diretamente na variação da proteína que pode ser produzida dentro de uma célula através dos processos de transcrição e tradução.

É assim que o DNA, um fita microscópica, controla as nossas características físicas!

Ciências da Informação

O que é informação? Informação, a uma primeira vista, é o conteúdo que “flui” de um emissor a um receptor, de uma forma que haja comunicação entre as duas partes, o que é um conceito bastante primitivo. De fato, a informação engloba mais do que isso, mas aí já está o suficiente para o entendimento do conceito.

As ciências da informação costumam ser diretamente associadas a computadores e à programação, que são unidades básicas do estudo da informação objetivamente, o estudo de como um ser humano pode transmitir uma informação a uma máquina e como essa máquina pode armazenar, processar e retransmitir essa informação. Os computadores, por sua vez, utilizam “unidades de informação” chamadas bits, que podem assumir valores de 0 ou 1, desligado ou ligado, ausência ou presença de corrente elétrica.

Um conjunto de bits, que transmitem e armazenam informações.
Fonte: Compara Já.

Além dos bits, como forma de armazenamento de informação, os computadores também são capazes de processar dados através de “portões lógicos”. Esses portões recebem dois bits e, a depender de que sinais esses bits codificam, transmitem um bit de informação de volta à máquina. Por exemplo, o AND gate recebe duas entradas e transmite uma saída positiva se, e somente se, as duas entradas forem positivas, como é possível observar na imagem abaixo.

Uma tabela que expressa o símbolo do AND gate à esquerda e as opções de informação à direita. Como é mostrado, o portão somente libera sinal positivo se suas entradas forem positivas.
Fonte: 911 Eletronic.

Além deste, existem vários portões lógicos capazes de manipular de diferentes formas os bits. É em cima desses portões que as linguagens de programação agem. Uma linguagem de programação como Python utiliza palavras e símbolos humanos para criar e manipular uma série de portões de tal maneira que as entradas possíveis proporcionam todas as respostas esperadas e desejadas.

Quer saber mais sobre linguagens de programação? Que tal aprender também sobre genética no processo? Acesse nosso outro texto sobre Biopython, a biblioteca de códigos capaz de manipular sequências genéticas: https://protosbiotec.com/blog/biopython-conheca-esta-ferramenta/.

DNA como forma de informação

Enfim, agora seremos capazes de compreender como o DNA pode servir de fonte e manipulador de informações. Vimos que as bases nitrogenadas possuem uma sequência linear muito bem definida e capaz de dar origem a diversos tipos de proteínas. Assim, não é difícil imaginar que uma sequência de bases possa ser convertida em uma sequência linear composta por 0 e 1, ou mesmo o contrário, como mostra a imagem abaixo.

Um texto é traduzido para “binário”, a forma de escrita utilizada por computadores. O texto em binário é, então, convertido para “ternário”, uma forma de escrita que utiliza 0, 1 e 2. Essa escrita em ternário é capaz de codificar a fita do DNA, em que cada dígito (0, 1 e 2) é usado para selecionar uma base nitrogenada diferente da anterior. Esse código em bases é, por fim, montado em uma fita de DNA, que pode ser armazenada por muito tempo.
Fonte: retirada de um artigo1, disponível em: <https://imgur.com/bxAWmAi>

De uma maneira análoga, as fitas de DNA podem servir, ao invés de molde para codificação de uma mensagem, como os próprios portões lógicos! A imagem abaixo pertence a um vídeo de divulgação científica intitulado “Logic gates made of DNA beat me at tic-tac-toe”, ou seja, “Portões lógicos feitos de DNA me venceram no jogo da velha”.

Thumbnail do vídeo em questão. A molécula representada pelo modelo de brinquedo na imagem é uma seção de uma fita de DNA especialmente montada para manipular reações bioquímicas.
Fonte: https://www.youtube.com/watch?v=GgPdRKqcRTE

A partir desses exemplos, fica claro como o DNA pode ser uma forma muito confiável e versátil de informação. O DNA não só é capaz de codificar informações, sendo ele mesmo a própria forma de armazenamento, como é capaz de manipular reações químicas de uma maneira que se assemelha muito com os níveis mais fundamentais da programação convencional, os logic gates.

Se for do interesse, nosso blog já possui outro texto que trata de um assunto tão interessante quanto este, o Biopython. Acesse o conteúdo aqui.