Sequenciamento de DNA - tecnologias para ler o código da vida

O que é sequenciamento de DNA?

O sequenciamento de DNA é um método para determinar a ordem dos nucleotídeos em um DNA molécula. O sequenciamento de DNA revolucionou a genômica. Desde 1995, o sequenciamento de DNA tornou possível analisar os genomas de mais de 50.000 (em 2020) organismos diferentes.

Juntamente com outros métodos analíticos de DNA, essa técnica também é usada para investigar doenças genéticas, entre outras coisas. Além disso, no contexto da clonagem molecular, o sequenciamento de DNA tornou-se indispensável nos laboratórios de biologia molecular e engenharia genética.

Você está interessado em decodificar 100% do seu DNA? A Nebula Genomics oferece o sequenciamento completo do genoma mais acessível! Comece uma vida inteira de descobertas com acesso total aos seus dados genômicos, atualizações semanais com base nas últimas descobertas científicas, análises avançadas de ancestrais e ferramentas poderosas de exploração do genoma. Clique aqui para saber mais!

Editado por Christina Swords, Ph.D.

Os desafios do sequenciamento de DNA

A determinação das sequências biológicas foi um problema não resolvido por décadas, até meados da década de 1970, quando os métodos bioquímicos ou moleculares foram desenvolvidos. Hoje em dia, até mesmo o sequenciamento em larga escala de genomas inteiros se tornou comparativamente rápido e fácil.

No entanto, os desafios do sequenciamento do genoma não se limitam apenas à leitura direta da sequência de ácido nucleico. Devido a limitações técnicas, apenas seções curtas de DNA (leituras) de até 1000 pares de bases são lidas em cada reação de sequenciamento individual. Para uma longa fita de DNA, um método conhecido como primer walking foi usado pela primeira vez em 1979. Nesse procedimento, a sequência foi lida peça por peça.

Em um projeto de sequenciamento maior, o Projeto Genoma Humano , vários bilhões de pares de bases foram sequenciados. Isso foi feito por uma abordagem conhecida como sequenciamento de espingarda. Hoje, somos capazes de estudar doenças, alvos de drogas, identificações baseadas em DNA, etc. Graças à tecnologia de sequenciamento de DNA maciçamente paralelo.

No sequenciamento shotgun, a fita de DNA é primeiro quebrada em fragmentos menores de nucleotídeos, que são então sequenciados base por base. A informação da sequência dos segmentos curtos individuais é então remontada em um genoma completo usando ferramentas de bioinformática.

A seqüência de dados brutos é analisada a fim de obter informações biologicamente relevantes. Sem ele, qualquer informação de sequência permanece sem valor científico.

Métodos de sequenciação

Vários métodos estão disponíveis hoje para ler as informações da sequência de DNA usando máquinas de sequenciamento. Por muito tempo, os desenvolvimentos dos métodos de sequenciamento foram baseados no sequenciamento Sanger. Os métodos modernos oferecem possibilidades de sequenciamento acelerado por meio de sequenciamento altamente paralelo. Os novos métodos de sequenciamento são freqüentemente chamados de sequenciamento de última geração.

Métodos clássicos

Método de Maxam e Gilbert

O método foi desenvolvido por Allan Maxam e Walter Gilbert em 1977. É baseado em duas abordagens. A clivagem química de base específica de DNA e subsequente separação dos fragmentos por eletroforese em gel de poliacrilamida desnaturante.

O DNA é primeiro marcado em uma extremidade 5 ‘ou 3’ com fosfato radioativo ou uma substância não radioativa (biotina, fluoresceína). Em quatro preparações separadas, as bases específicas da estrutura açúcar-fosfato do DNA são então parcialmente (limitadas) modificadas e clivadas. Por exemplo, a guanina básica (G) é metilada pelo reagente sulfato de dimetila e removida por tratamento alcalino com piperidina.

A fita de DNA é então completamente clivada. Em cada preparação, são formados fragmentos de comprimentos diferentes, a extremidade 3 ‘dos quais sempre foi clivada em certas bases. A eletroforese em gel de poliacrilamida desnaturante separa os fragmentos de acordo com o comprimento, sendo as diferenças de comprimento resolvidas por uma base. Comparando as quatro abordagens no gel, a sequência do DNA pode ser lida.

Este método permitiu que seus inventores determinassem a sequência do operon de um genoma bacteriano. Hoje, o método raramente é usado porque requer reagentes tóxicos. Além disso, é mais difícil de automatizar do que o método didesoxi de Sanger desenvolvido ao mesmo tempo.

Abordagem de sequenciamento Maxam Gilbert. Fonte da imagem: JHCaufield, Wikimedia Commons

Método didesoxi (Sanger sequenciamento )

O método didesoxi de Sanger também é chamado de síntese de terminação de cadeia. É um método enzimático. Foi desenvolvido por Sanger e Coulson por volta de 1975. Foi apresentado em 1977 com a primeira sequência completa de um genoma (Bacteriófago φX174).

Sanger recebeu o Prêmio Nobel de Química em 1980 por seu trabalho com sequenciamento de DNA. Ele recebeu o prêmio junto com Walter Gilbert e Paul Berg.

A enzima DNA polimerase é usado para alongar uma das duas fitas complementares de DNA. A dupla hélice do DNA é desnaturada por aquecimento, após o qual fitas simples ficam disponíveis para processamento posterior.

Em quatro outras preparações idênticas, uma de cada uma das quatro bases é adicionada como trifosfato de didesoxinucleosídeo (ddNTP). Estes ddNTPs de terminação de cadeia não têm um grupo 3′-hidroxi para ligar o grupo fosfato do próximo nucleotídeo. Sua adição à fita recém-sintetizada interrompe a extensão do DNA pela DNA polimerase por causa da falta do grupo OH.

Como resultado, são produzidos fragmentos de DNA de diferentes comprimentos, que sempre terminam com o mesmo ddNTP em cada lote individual.

Após a reação de sequenciação, os produtos de ruptura marcados de todas as abordagens são separados longitudinalmente por eletroforese em gel de poliacrilamida.

A sequência pode então ser lida em um filme fotográfico (filme de raios-X) após a exposição do gel radioativo. A sequência complementar correspondente é a sequência do molde de DNA de fita simples usado. Atualmente, uma variação da reação em cadeia da polimerase (PCR) é utilizada como reação de sequenciamento.

Ao contrário da PCR, apenas um primer é usado, de modo que o DNA é amplificado apenas linearmente.

No início dos anos 1980, Fritz M. Pohl e seu grupo de pesquisa desenvolveram um método radioativo para o sequenciamento de DNA. Nesta tecnologia de sequenciamento, as moléculas de DNA seriam transferidas para um transportador durante a separação eletroforética.

O “Direct-Blotting-Electrophoresis System GATC 1500” foi comercializado pela empresa GATC Biotech, sediada em Constance. O sequenciador de DNA foi utilizado, por exemplo, no projeto genoma europeu para sequenciamento do cromossomo II da levedura. Saccharomyces cerevisiae .

Desde o início de 1990, trifosfatos didesoxinucleosídeos marcados com corantes fluorescentes têm sido usados em particular. Cada um dos quatro ddNTPs é acoplado a um corante diferente. Esta modificação torna possível adicionar todos os quatro ddNTPs em um vaso de reação.

A divisão em abordagens separadas e o manuseio de radioisótopos não são mais necessários. Os produtos de terminação de cadeia resultantes são separados por eletroforese capilar e excitados para fluorescência por um laser.

Os ddNTPs no final de cada fragmento de DNA, portanto, mostram fluorescência de cores diferentes. Esta fluorescência pode ser detectada por um detector. O eletroferograma mostra diretamente a sequência de bases da fita sequenciada de DNA.

Um fluxo de trabalho típico para sequenciamento Sanger. Fonte da imagem: Estevezj, Wikimedia Commons

Abordagens modernas

Com a crescente importância do sequenciamento de DNA em pesquisas e diagnósticos, foram desenvolvidos métodos que permitem o aumento do rendimento. Agora é possível sequenciar o genoma humano completo em cerca de 8 dias. Os métodos correspondentes são chamados de sequenciamento de segunda geração.

Diferentes empresas desenvolveram métodos com diferentes vantagens e desvantagens. Além dos listados aqui, existem outros. O sequenciamento de DNA de segunda geração foi nomeado o “método do ano 2007” pela revista Nature Methods.

Sequenciamento de DNA usando pirosequenciamento

O pirosequenciamento usa uma DNA polimerase para sintetizar a contra-fita de DNA, embora o tipo de DNA polimerase ainda possa variar.

A mistura de DNA é ligada a um adaptador de DNA e acoplada a contas por meio de uma sequência de adaptador complementar. As contas carregadas com DNA são colocadas em uma placa com poros. A detecção depende de um detector de luz.

A DNA polimerase é observada “em ação” à medida que anexa sucessivamente nucleotídeos individuais a uma fita de DNA recém-sintetizada. A inserção bem-sucedida de um nucleotídeo é convertida em um sinal de luz que é detectado por um detector. O DNA a ser sequenciado serve como uma fita de matriz e está disponível em uma forma de fita simples.

O alongamento da fita de DNA é feito pela adição de um dos quatro tipos de trifosfatos de desoxinucleosídeo (dNTP) complementarmente. Quando o nucleotídeo apropriado é adicionado, um sinal é obtido. A adição de um NTP inadequado não resulta em sinal detectável. Em seguida, o NTP existente é destruído e outro tipo é adicionado; isso continua até que uma reação seja mostrada novamente.

Esta é uma reação mediada por enzima luciferase. Quando um nucleotídeo complementar é incorporado pela DNA polimerase, o pirofosfato (PPi) é liberado. O pirofosfato é convertido em trifosfato de adenosina (ATP) pela ATP sulfurilase.

O ATP conduz a reação da luciferase, que converte a luciferina em oxiluciferina. Isso, por sua vez, resulta em um sinal de luz detectável – cuja intensidade é proporcional ao ATP consumido.

O pirosequenciamento tem sido usado para determinar a frequência de certas gene mutações, por exemplo, na investigação de doenças genéticas. A pirosequenciamento pode ser facilmente automatizada e é adequada para análises altamente paralelas de amostras de DNA.

Sequenciamento por hibridização

Para tanto, seções curtas de DNA (oligonucleotídeos) são fixadas em fileiras e colunas em um suporte de vidro (chip de DNA ou microarray).

Os fragmentos do DNA a serem sequenciados são marcados com corantes e aplicados à matriz do oligonucleotídeo. Isso permite que as seções de DNA complementares fixas e livres hibridem umas com as outras. Depois de lavar os fragmentos não ligados, o padrão de hibridização é lido nos rótulos de cores e sua força.

As sequências dos oligonucleotídeos fixos e suas regiões de sobreposição são conhecidas. Conseqüentemente, o padrão de cores pode ser usado para deduzir a sequência geral subjacente do DNA desconhecido.

Sistema de sequenciamento de DNA semicondutor de íons

o Ion Torrent O método usa tecnologia de chip semicondutor para realizar o sequenciamento não óptico direto do genoma usando circuitos integrados.

Os dados de sequenciação são obtidos diretamente da detecção de íons produzidos por DNA polimerases dependentes de molde. O chip semicondutor usado neste método tem um transistor de efeito de campo sensível a íons. Seus sensores estão dispostos em uma grade de 1,2 milhão de poços nos quais ocorre a reação da polimerase. Esta grade permite a detecção paralela e simultânea de reações de sequência independentes.

É usada a tecnologia complementar de semicondutor de óxido metálico (CMOS), que permite uma reação econômica em alta densidade de ponto de medição.

Tecnologia de sequenciamento de semicondutores de íons, Fonte: Konrad Foerstner, Wikimedia Commons

Sequenciamento com síntese de ponte

Essa tecnologia de sequenciamento é conhecida como sequenciamento com síntese em ponte de Solexa / Illumina. O DNA de fita dupla a ser sequenciado é ligado em ambas as extremidades com uma sequência adaptadora diferente em cada extremidade.

O DNA é então desnaturado, ligado a uma placa transportadora em uma forma de fita simples após diluição. E ainda amplificado in situ por amplificação de ponte. Isso cria áreas individuais (clusters) de DNA amplificado na placa transportadora, que têm a mesma sequência dentro de um cluster.

A reação de PCR é com quatro substratos de terminação de cadeia fluorescentes de cores diferentes. A respectiva base incorporada por ciclo é determinada em tempo real em um cluster.

Codificação de duas bases

Sequenciamento por Detecção de Oligo Ligation ( Sólido ) da Applied Biosystems é uma variante do Sequencing by Ligation.

Uma biblioteca de DNA é diluída e acoplada a microesferas com uma DNA polimerase. O DNA é então amplificado em uma emulsão PCR. Assim, cada microbead contém várias cópias de uma única sequência de DNA. As microesferas são modificadas na extremidade 3 ‘para que possam ser fixadas individualmente a uma placa de suporte.

Após a ligação do primer, quatro diferentes sondas cliváveis são adicionadas, cada uma delas marcada com uma cor fluorescente diferente. Eles se ligam ao molde de DNA por meio dos dois primeiros nucleotídeos (CA, CT, GG, GC). Em seguida, as micropérolas são ligadas a uma DNA ligase. As sondas são então clivadas, liberando assim os rótulos.

Usando até cinco primers, cada base na sequência de DNA é determinada em pelo menos duas reações de ligação diferentes.

Plataforma SOLiD. — Plataforma SOLiD, fonte da imagem: Philippe Hupe, Wikimedia Commons

Sequenciamento de DNA com extremidades emparelhadas

Um sinal claramente identificável pode ser obtido gerando pequenos pedaços de DNA a partir das extremidades terminais de uma sequência de DNA. Este método de sequenciamento de DNA também é conhecido como sequenciamento de tags de extremidade pareada, PETS.

Sequenciamento de DNA de terceira geração

Pela primeira vez, o sequenciamento de terceira geração mede a reação em moléculas únicas como um experimento de molécula única.

Isso elimina a necessidade de amplificação por PCR antes do sequenciamento. As polimerases apresentam tendência para a ligação a algumas sequências de DNA. Portanto, isso evita a amplificação desigual por polimerases de DNA termoestáveis.

Assim, algumas sequências podem ser ignoradas. Além disso, o genoma de uma célula individual pode ser examinado.

O sinal liberado é gravado em tempo real. No sequenciamento de DNA de terceira geração, dois sinais diferentes são registrados, dependendo do método utilizado. Eles são prótons ou fluoróforos liberados. O sequenciamento de DNA e RNA de células individuais foi denominado “método do ano 2013” pela revista Nature Methods.

Tecnologia de sequenciamento de terceira geração. Fonte da imagem: Chandra Shekhar Pareek, Rafal Smoczynski, Andrej Tretyn, Wikimedia Commons

Sequenciamento de nanopore

Sequenciamento de nanopore é baseado em mudanças no fluxo de íons através de nanoporos embutidos em uma membrana criada artificialmente. Nanoporos são poros biológicos ou sintéticos ou mesmo poros semissintéticos. O nanopore está embutido em uma membrana artificial que possui uma resistência elétrica particularmente alta.

O poro está permanentemente aberto em contraste com os canais iônicos comuns. Isso permite um fluxo constante de íons através da membrana após a aplicação de um potencial. As moléculas de DNA que passam pelo poro levam a uma redução da corrente. Essa redução atual tem uma amplitude específica para cada nucleotídeo, que pode ser medida e atribuída ao nucleotídeo correspondente.

No sequenciamento de fita simples, uma fita dupla de DNA é separada por uma helicase e introduzida no nanopore.

No caso de um poro MspA, quatro nucleotídeos do DNA estão localizados simultaneamente dentro do poro. A velocidade de passagem depende, entre outras coisas, da diferença do valor do pH através da membrana. As mudanças específicas da corrente de íons para cada um dos quatro nucleotídeos permitem que a sequência seja lida.

Uma avaliação é realizada, por exemplo, com o software Poretools. A vantagem desse método é que ele tem uma precisão constante, mesmo com longas fitas de DNA. Uma variação do método é usada para o sequenciamento de proteínas.

A tecnologia de sequenciamento nanopore está sendo desenvolvida pela empresa britânica Oxford Nanopore Technologies. Seu sequenciador “MinION” estava inicialmente disponível apenas por meio de um “Programa de Acesso Antecipado”. Mas está disponível por meio de canais de distribuição convencionais desde 2015.

Antes de sair, confira nossa próxima geração baseada em sequenciamento Sequenciamento do genoma completo !

Sequenciamento de DNA – tecnologias para ler o código da vida