Como sequenciamos o genoma?

Inicialmente, precisamos obter amostras do DNA que será sequenciado. Elas podem ser obtidas a partir de praticamente todas as células que formam um organismo. Podemos utilizar uma célula presente na raiz de um fio de cabelo ou no sangue, por exemplo. Por meio de algumas reações químicas, purificamos e isolamos as moléculas de DNA presentes nas células.

Em seguida, ocorre a produção de cópias dessas moléculas de DNA. Para que isso ocorra, fornecemos nucleotídeos que servirão de matéria-prima para a produção dessas cópias. Contudo, uma parte desses nucleotídeos apresenta uma alteração em sua estrutura molecular que faz com que seja emitida uma luz de coloração específica quando lançamos sobre eles um feixe de laser. Outra modificação desses nucleotídeos especiais faz com que eles interrompam a produção dessa cópia. Dessa forma, sempre que eles são incorporados, o DNA para de ser copiado.

As cópias do DNA que será sequenciado começam a ser produzidas, mas resultam em moléculas de tamanhos diferentes, pois dependem do local onde um nucleotídeo alterado se incorporou, encerrando a produção dessa cópia.

Depois disso, essas moléculas são separadas por tamanho através de uma técnica conhecida como eletroforese. Por conta de uma corrente elétrica que é aplicada nessa amostra, as moléculas de diferentes tamanhos começam a se deslocar em um gel. As moléculas menores se deslocam com maior velocidade por esse meio gelatinoso. Durante esse deslocamento, as moléculas, agrupadas por tamanho, passam por um feixe de laser e refletem uma luz colorida.

Como cada cor corresponde a um nucleotídeo específico, é possível determinar a posição das adeninas, das guaninas, das citosinas e das timinas no DNA. Para isso, um detector capta a ordem específica das cores refletidas na eletroforese.

O Projeto Genoma Humano, por exemplo, identificou a cor de mais de 3 bilhões de nucleotídeos. Para que esse trabalho se tornasse viável na época, cada grupo de pesquisadores sequenciou trechos específicos de nosso DNA. Em seguida, essas sequências foram alinhadas, ou seja, ordenadas. Para isso, foram necessários computadores de alta performance, pois o volume de informações era muito grande.

Caso queira compreender melhor o processo, veja a animação "Como sequenciamos o genoma?"