Secuenciación de ADN: tecnologías para leer el código de la vida

¿Qué es la secuenciación de ADN?

La secuenciación del ADN es un método para determinar el orden de los nucleótidos en un ADN molécula. La secuenciación del ADN ha revolucionado la genómica. Desde 1995, la secuenciación del ADN ha hecho posible analizar los genomas de más de 50.000 (hasta 2020) organismos diferentes.

Junto con otros métodos analíticos de ADN, esta técnica también se utiliza para investigar enfermedades genéticas, entre otras cosas. Además, en el contexto de la clonación molecular, la secuenciación del ADN se ha vuelto indispensable en los laboratorios de biología molecular e ingeniería genética.

¿Estás interesado en decodificar el 100% de tu ADN? ¡Nebula Genomics ofrece la secuenciación del genoma completo más asequible! Comience una vida de descubrimiento con acceso completo a sus datos genómicos, actualizaciones semanales basadas en los últimos descubrimientos científicos, análisis de ascendencia avanzado y potentes herramientas de exploración del genoma. ¡Pulsa aquí para saber más!

Editado por Christina Swords, Ph.D.

Los desafíos de la secuenciación del ADN

La determinación de las secuencias biológicas fue un problema sin resolver durante décadas hasta mediados de la década de 1970 cuando se desarrollaron métodos bioquímicos o moleculares. Hoy en día, incluso la secuenciación a gran escala de genomas completos se ha vuelto relativamente rápida y fácil.

Sin embargo, los desafíos de la secuenciación del genoma no se limitan solo a la lectura directa de la secuencia de ácido nucleico. Debido a limitaciones técnicas, solo se leen secciones cortas de ADN (lecturas) de hasta 1000 pares de bases en cada reacción de secuenciación individual. Para una cadena larga de ADN, en 1979 se utilizó por primera vez un método conocido como primer caminar. En este procedimiento, la secuencia se leyó pieza por pieza.

En un proyecto de secuenciación más grande, Proyecto Genoma Humano , se secuenciaron varios miles de millones de pares de bases. Esto se hizo mediante un enfoque conocido como secuenciación de escopeta. Hoy en día, podemos estudiar enfermedades, dianas de fármacos, identificaciones basadas en ADN, etc. Gracias a la tecnología de secuenciación de ADN masivamente paralela.

En la secuenciación rápida, la hebra de ADN se divide primero en fragmentos más pequeños de nucleótidos, que luego se secuencian base por base. La información de la secuencia de los segmentos cortos individuales se vuelve a montar en un genoma completo utilizando herramientas bioinformáticas.

La secuencia de datos brutos se analiza para obtener información biológicamente relevante. Sin él, cualquier información de secuencia queda sin valor científico.

Métodos de secuenciación

Actualmente se encuentran disponibles varios métodos para leer la información de la secuencia de ADN utilizando máquinas de secuenciación. Durante mucho tiempo, los desarrollos de los métodos de secuenciación se basaron en la secuenciación de Sanger. Los métodos modernos ofrecen posibilidades de secuenciación acelerada mediante secuenciación altamente paralela. Los nuevos métodos de secuenciación a menudo se denominan secuenciación de próxima generación.

Métodos clásicos

Método de Maxam y Gilbert

El método fue desarrollado por Allan Maxam y Walter Gilbert en 1977. Se basa en dos enfoques. La escisión química de base específica del ADN y la posterior separación de los fragmentos mediante electroforesis en gel de poliacrilamida desnaturalizante.

El ADN se marca primero en un extremo 5 ‘o 3’ con fosfato radiactivo o una sustancia no radiactiva (biotina, fluoresceína). En cuatro preparaciones separadas, las bases específicas de la columna vertebral de azúcar-fosfato del ADN se modifican y escinden parcialmente (de forma limitada). Por ejemplo, la guanina base (G) se metila con el reactivo dimetilsulfato y se elimina mediante tratamiento alcalino con piperidina.

Luego, la hebra de ADN se escinde completamente. En cada preparación, se forman fragmentos de diferentes longitudes, cuyo extremo 3 ‘siempre se ha escindido en ciertas bases. La electroforesis en gel de poliacrilamida desnaturalizante separa los fragmentos según la longitud, resolviéndose las diferencias de longitud por una base. Al comparar los cuatro enfoques en el gel, se puede leer la secuencia del ADN.

Este método permitió a sus inventores determinar la secuencia del operón de un genoma bacteriano. Hoy en día, el método rara vez se usa porque requiere reactivos tóxicos. Además, es más difícil de automatizar que el método didesoxi de Sanger desarrollado al mismo tiempo.

Enfoque de secuenciación de Maxam Gilbert. Fuente de la imagen: JHCaufield, Wikimedia Commons

Método didesoxi (Sanger secuenciación )

El método didesoxi de Sanger también se denomina síntesis de terminación de cadena. Es un método enzimático. Fue desarrollado por Sanger y Coulson alrededor de 1975. Se presentó en 1977 con la primera secuencia completa de un genoma (Bacteriophage φX174).

Sanger recibió el Premio Nobel de Química en 1980 por su trabajo en la secuenciación del ADN. Recibió el premio junto a Walter Gilbert y Paul Berg.

La enzima ADN polimerasa se utiliza para alargar una de las dos cadenas de ADN complementarias. La doble hélice de ADN se desnaturaliza mediante calentamiento, después de lo cual las hebras simples están disponibles para su posterior procesamiento.

En cuatro preparaciones por lo demás idénticas, una de cada una de las cuatro bases se agrega como trifosfato de didesoxinucleósido (ddNTP). Estos ddNTP que terminan la cadena no tienen un grupo 3′-hidroxi para unir el grupo fosfato del siguiente nucleótido. Su adición a la cadena recién sintetizada detiene la extensión del ADN por parte de la ADN polimerasa debido a la falta del grupo OH.

Como resultado, se producen fragmentos de ADN de diferentes longitudes, que siempre terminan con el mismo ddNTP en cada lote individual.

Después de la reacción de secuenciación, los productos de rotura marcados de todos los enfoques se separan longitudinalmente mediante electroforesis en gel de poliacrilamida.

La secuencia se puede leer luego en una película fotográfica (película de rayos X) después de la exposición del gel radiactivo. La secuencia complementaria correspondiente es la secuencia de la plantilla de ADN monocatenario utilizada. Hoy en día, una variación de la reacción en cadena de la polimerasa (PCR) se utiliza como reacción de secuenciación.

A diferencia de la PCR, solo se usa un cebador, de modo que el ADN solo se amplifica linealmente.

A principios de la década de 1980, Fritz M. Pohl y su grupo de investigación desarrollaron un método radiactivo para secuenciar el ADN. En esta tecnología de secuenciación, las moléculas de ADN se transferirían a un portador durante la separación electroforética.

El «Sistema de electroforesis de transferencia directa GATC 1500» fue comercializado por la empresa GATC Biotech, con sede en Constance. El secuenciador de ADN se utilizó, por ejemplo, en el proyecto europeo del genoma para secuenciar el cromosoma II de la levadura. Saccharomyces cerevisiae .

Desde principios de la década de 1990, se han utilizado en particular trifosfatos de didesoxinucleósido marcados con tintes fluorescentes. Cada uno de los cuatro ddNTP se acopla con un tinte diferente. Esta modificación hace posible agregar los cuatro ddNTP en un recipiente de reacción.

Ya no es necesario dividir en enfoques separados y manejar radioisótopos. Los productos de terminación de cadena resultantes se separan mediante electroforesis capilar y se excitan para que emitan fluorescencia mediante un láser.

Los ddNTP al final de cada fragmento de ADN muestran por tanto fluorescencia de diferentes colores. Esta fluorescencia puede ser detectada por un detector. El electroferograma muestra directamente la secuencia de bases de la cadena de ADN secuenciada.

Un flujo de trabajo típico para la secuenciación de Sanger. Fuente de la imagen: Estevezj, Wikimedia Commons

Enfoques modernos

Con la creciente importancia de la secuenciación del ADN en la investigación y el diagnóstico, se han desarrollado métodos que permiten un mayor rendimiento. Ahora es posible secuenciar el genoma humano completo en aproximadamente 8 días. Los métodos correspondientes se denominan secuenciación de segunda generación.

Diferentes empresas han desarrollado métodos con diferentes ventajas y desventajas. Aparte de los enumerados aquí, hay otros. La secuenciación de ADN de segunda generación fue nombrada «método del año 2007» por la revista Nature Methods.

Secuenciación de ADN mediante pirosecuenciación

La pirosecuenciación utiliza una ADN polimerasa para sintetizar la hebra contraria de ADN, aunque el tipo de ADN polimerasa aún puede variar.

La mezcla de ADN se liga con un adaptador de ADN y se acopla a perlas mediante una secuencia adaptadora complementaria. Las perlas cargadas con ADN se colocan en una placa con poros. La detección depende de un detector de luz.

La ADN polimerasa se observa «en acción» cuando une sucesivamente nucleótidos individuales a una cadena de ADN recién sintetizada. La inserción exitosa de un nucleótido se convierte en una señal luminosa que es detectada por un detector. El ADN que se va a secuenciar sirve como una hebra de matriz y está disponible en forma de hebra única.

El alargamiento de la cadena de ADN se realiza agregando uno de los cuatro tipos de desoxinucleósido trifosfato (dNTP) de forma complementaria. Cuando se agrega el nucleótido apropiado, se obtiene una señal. La adición de un NTP inadecuado no da como resultado una señal detectable. Luego, el NTP existente se destruye y se agrega otro tipo; esto continúa hasta que se vuelve a mostrar una reacción.

Esta es una reacción mediada por la enzima luciferasa. Cuando la ADN polimerasa incorpora un nucleótido complementario, se libera pirofosfato (PPi). El pirofosfato se convierte en trifosfato de adenosina (ATP) por la ATP sulfurilasa.

El ATP impulsa la reacción de la luciferasa, que convierte la luciferina en oxiluciferina. Esto, a su vez, da como resultado una señal de luz detectable, cuya fuerza es proporcional al ATP consumido.

La pirosecuenciación se ha utilizado para determinar la frecuencia de ciertos gene mutaciones, por ejemplo, en la investigación de enfermedades genéticas. La pirosecuenciación se puede automatizar fácilmente y es adecuada para el análisis altamente paralelo de muestras de ADN.

Secuenciación por hibridación

Para ello, se fijan secciones cortas de ADN (oligonucleótidos) en filas y columnas en un soporte de vidrio (chip de ADN o micromatriz).

Los fragmentos del ADN que se van a secuenciar se marcan con tintes y se aplican a la matriz de oligonucleótidos. Esto permite que las secciones de ADN libres y fijas complementarias se hibriden entre sí. Después de lavar los fragmentos no unidos, se lee el patrón de hibridación de las etiquetas de color y su intensidad.

Se conocen las secuencias de los oligonucleótidos fijados y sus regiones superpuestas. Por tanto, el patrón de color se puede utilizar en última instancia para deducir la secuencia global subyacente del ADN desconocido.

Sistema de secuenciación de ADN semiconductor de iones

los Ion Torrent El método utiliza tecnología de chips semiconductores para realizar la secuenciación directa del genoma no óptica utilizando circuitos integrados.

Los datos de secuenciación se obtienen directamente de la detección de iones producidos por ADN polimerasas dependientes de molde. El chip semiconductor utilizado en este método tiene un transistor de efecto de campo sensible a los iones. Sus sensores están dispuestos en una cuadrícula de 1,2 millones de pozos en los que tiene lugar la reacción de la polimerasa. Esta rejilla permite la detección paralela y simultánea de reacciones de secuencia independientes.

Se utiliza tecnología complementaria de semiconductores de óxido de metal (CMOS), que permite una reacción rentable a una alta densidad de puntos de medición.

Tecnología de secuenciación de semiconductores de iones, Fuente: Konrad Foerstner, Wikimedia Commons

Secuenciación con síntesis puente

Esta tecnología de secuenciación se conoce como secuenciación con síntesis puente de Solexa / Illumina. El ADN de doble hebra que se va a secuenciar se liga en ambos extremos con una secuencia adaptadora diferente en cada extremo.

A continuación, el ADN se desnaturaliza y se liga a una placa de soporte en una forma monocatenaria después de la dilución. Y amplificado aún más in situ mediante amplificación puente. Esto crea áreas individuales (grupos) de ADN amplificado en la placa portadora, que tienen la misma secuencia dentro de un grupo.

La reacción de PCR es con cuatro sustratos de terminación de cadena fluorescentes de diferentes colores. La base respectiva incorporada por ciclo se determina en tiempo real en un cluster.

Codificación de dos bases

Secuenciación por detección de ligadura de oligo ( Sólido ) de Applied Biosystems es una variante de Secuenciación por ligadura.

Una biblioteca de ADN se diluye y se acopla a microperlas con una ADN polimerasa. Luego, el ADN se amplifica en una PCR en emulsión. Por tanto, cada microperla contiene varias copias de una única secuencia de ADN. Las microperlas se modifican en el extremo 3 ‘para que se puedan unir individualmente a una placa portadora.

Después de la unión del cebador, se añaden cuatro sondas escindibles diferentes, cada una de las cuales está marcada con un color fluorescente diferente. Se unen a la plantilla de ADN por medio de los dos primeros nucleótidos (CA, CT, GG, GC). A continuación, las microperlas se ligan con una ADN ligasa. A continuación, las sondas se escinden, liberando así las etiquetas.

Usando hasta cinco cebadores, cada base en la secuencia de ADN se determina en al menos dos reacciones de ligación diferentes.

Plataforma SOLida. — Plataforma SOLiD, fuente de la imagen: Philippe Hupe, Wikimedia Commons

Secuenciación de ADN con extremos emparejados

Se puede obtener una señal claramente identificable generando fragmentos cortos de ADN a partir de los extremos terminales de una secuencia de ADN. Este método de secuenciación de ADN también se conoce como secuenciación de etiquetas de extremos emparejados, PETS.

Secuenciación de ADN de tercera generación

Por primera vez, la secuenciación de tercera generación mide la reacción en moléculas individuales como un experimento de una sola molécula.

Esto elimina la necesidad de amplificación por PCR antes de la secuenciación. Las polimerasas muestran un sesgo de unión a algunas secuencias de ADN. Por tanto, esto evita la amplificación desigual por las ADN polimerasas termoestables.

Por tanto, se pueden pasar por alto algunas secuencias. Además, se puede examinar el genoma de una célula individual.

La señal liberada se registra en tiempo real. En la secuenciación de ADN de tercera generación, se registran dos señales diferentes, según el método utilizado. Son protones o fluoróforos liberados. La secuenciación de ADN y ARN de células individuales fue nombrada «método del año 2013» por la revista Nature Methods.

Tecnología de secuenciación de tercera generación. Fuente de la imagen: Chandra Shekhar Pareek, Rafal Smoczynski, Andrej Tretyn, Wikimedia Commons

Secuenciación de nanoporos

Secuenciación de nanoporos se basa en cambios en el flujo de iones a través de nanoporos incrustados en una membrana creada artificialmente. Los nanoporos son poros biológicos o sintéticos o incluso poros semisintéticos. El nanoporo está incrustado en una membrana artificial que tiene una resistencia eléctrica particularmente alta.

El poro está permanentemente abierto en contraste con los canales iónicos ordinarios. Esto permite un flujo constante de iones a través de la membrana después de la aplicación de un potencial. Las moléculas de ADN que atraviesan el poro provocan una reducción de la corriente. Esta reducción de corriente tiene una amplitud específica para cada nucleótido, que se puede medir y asignar al nucleótido correspondiente.

En la secuenciación de una sola hebra, una helicasa separa una hebra de ADN de doble hebra y se introduce en el nanoporo.

En el caso de un poro de MspA, cuatro nucleótidos del ADN se localizan simultáneamente dentro del poro. La velocidad de paso depende, entre otras cosas, de la diferencia del valor de pH a través de la membrana. Los cambios de corriente de iones específicos para cada uno de los cuatro nucleótidos permiten leer la secuencia.

La evaluación se realiza, por ejemplo, con el software Poretools. La ventaja de este método es que tiene una precisión constante incluso con cadenas largas de ADN. Se utiliza una variación del método para la secuenciación de proteínas.

La tecnología de secuenciación de nanoporos está siendo avanzada por la empresa británica Oxford Nanopore Technologies. Su secuenciador «MinION» inicialmente solo estaba disponible a través de un «Programa de acceso anticipado». Pero está disponible a través de canales de distribución convencionales desde 2015.

Antes de irse, consulte nuestra nueva generación basada en secuenciación Secuenciación del genoma completo !