Séquençage d’ADN – Technologies pour lire le code de la vie

Qu’est-ce que le séquençage de l’ADN?

Le séquençage de l’ADN est une méthode de détermination de l’ordre des nucléotides dans un ADN molécule. Le séquençage de l’ADN a révolutionné la génomique. Depuis 1995, le séquençage de l’ADN a permis d’analyser les génomes de plus de 50000 (en 2020) organismes différents.

Avec d’autres méthodes d’analyse de l’ADN, cette technique est également utilisée pour enquêter sur les maladies génétiques, entre autres. Par ailleurs, dans le cadre du clonage moléculaire, le séquençage de l’ADN est devenu indispensable dans les laboratoires de biologie moléculaire et de génie génétique.

Êtes-vous intéressé à décoder 100% de votre ADN? Nebula Genomics propose le séquençage du génome entier le plus abordable! Commencez une vie de découverte avec un accès complet à vos données génomiques, des mises à jour hebdomadaires basées sur les dernières découvertes scientifiques, une analyse ascendante avancée et de puissants outils d’exploration du génome. Cliquez ici pour en savoir plus!

Edité par Christina Swords, Ph.D.

Les défis du séquençage d’ADN

La détermination des séquences biologiques a été un problème non résolu pendant des décennies jusqu’au milieu des années 1970, lorsque des méthodes biochimiques ou moléculaires ont été développées. De nos jours, même le séquençage à grande échelle de génomes entiers est devenu relativement rapide et facile.

Cependant, les défis du séquençage du génome ne se limitent pas à la lecture directe de la séquence d’acide nucléique. En raison de limitations techniques, seules de courtes sections d’ADN (lectures) jusqu’à 1000 paires de bases sont lues dans chaque réaction de séquençage individuelle. Pour un long brin d’ADN, une méthode connue sous le nom de marche des amorces a été utilisée pour la première fois en 1979. Dans cette procédure, la séquence a été lue pièce par pièce.

Dans un projet de séquençage plus vaste, le Projet du génome humain , plusieurs milliards de paires de bases ont été séquencées. Cela a été fait par une approche connue sous le nom de séquençage des fusils de chasse. Aujourd’hui, nous sommes en mesure d’étudier des maladies, des cibles médicamenteuses, des identifications basées sur l’ADN, etc. Grâce à la technologie de séquençage d’ADN massivement parallèle.

Dans le séquençage par fusil de chasse, le brin d’ADN est d’abord décomposé en fragments plus petits de nucléotides, qui sont ensuite séquencés base par base. Les informations de séquence des segments courts individuels sont ensuite réassemblées dans un génome complet à l’aide d’outils bioinformatiques.

La séquence de données brutes est analysée afin d’obtenir des informations biologiquement pertinentes. Sans elle, toute information de séquence reste sans valeur scientifique.

Méthodes de séquençage

Plusieurs méthodes sont aujourd’hui disponibles pour lire les informations de séquence d’ADN à l’aide de machines de séquençage. Pendant longtemps, les développements des méthodes de séquençage ont été construits sur le séquençage de Sanger. Les méthodes modernes offrent des possibilités de séquençage accéléré grâce à un séquençage hautement parallèle. Les nouvelles méthodes de séquençage sont souvent appelées séquençage de nouvelle génération.

Méthodes classiques

Méthode de Maxam et Gilbert

La méthode a été développée par Allan Maxam et Walter Gilbert en 1977. Il repose sur deux approches. Le clivage chimique spécifique de la base de l’ADN et la séparation ultérieure des fragments par électrophorèse sur gel de polyacrylamide dénaturant.

L’ADN est d’abord marqué à une extrémité 5 ‘ou 3’ avec du phosphate radioactif ou une substance non radioactive (biotine, fluorescéine). Dans quatre préparations séparées, des bases spécifiques du squelette sucre-phosphate de l’ADN sont ensuite partiellement (limitées) modifiées et clivées. Par exemple, la guanine de base (G) est méthylée par le réactif sulfate de diméthyle et éliminée par traitement alcalin avec de la pipéridine.

Le brin d’ADN est alors complètement clivé. Dans chaque préparation, des fragments de différentes longueurs se forment, dont l’extrémité 3 ‘a toujours été clivée à certaines bases. L’électrophorèse sur gel de polyacrylamide dénaturant sépare les fragments en fonction de la longueur, les différences de longueur étant résolues par une base. En comparant les quatre approches sur le gel, la séquence de l’ADN peut être lue.

Cette méthode a permis à ses inventeurs de déterminer la séquence d’opérons d’un génome bactérien. Aujourd’hui, la méthode est rarement utilisée car elle nécessite des réactifs toxiques. En outre, il est plus difficile à automatiser que la méthode didésoxy de Sanger développée en même temps.

Approche de séquençage de Maxam Gilbert.
Approche de séquençage de Maxam Gilbert. Source de l’image: JHCaufield, Wikimedia Commons

Méthode didésoxy (Sanger séquençage )

La méthode didésoxy de Sanger est également appelée synthèse de terminaison de chaîne. C’est une méthode enzymatique. Il a été développé par Sanger et Coulson vers 1975. Il a été présenté en 1977 avec la première séquence complète d’un génome (Bacteriophage φX174).

Sanger a reçu le prix Nobel de chimie en 1980 pour ses travaux sur le séquençage de l’ADN. Il a reçu le prix avec Walter Gilbert et Paul Berg.

L’enzyme ADN polymérase est utilisé pour allonger l’un des deux brins d’ADN complémentaires. La double hélice d’ADN est dénaturée par chauffage, après quoi les simples brins sont disponibles pour un traitement ultérieur.

Dans quatre préparations par ailleurs identiques, une de chacune des quatre bases est ajoutée sous forme de didésoxynucléoside triphosphate (ddNTP). Ces ddNTP de terminaison de chaîne n’ont pas de groupe 3′-hydroxy pour lier le groupe phosphate du nucléotide suivant. Leur ajout dans le brin nouvellement synthétisé arrête l’extension de l’ADN par l’ADN polymérase en raison du groupe OH manquant.

En conséquence, des fragments d’ADN de différentes longueurs sont produits, qui se terminent toujours par le même ddNTP dans chaque lot individuel.

Après la réaction de séquençage, les produits de rupture marqués de toutes les approches sont séparés dans le sens de la longueur par électrophorèse sur gel de polyacrylamide.

La séquence peut ensuite être lue sur un film photographique (film radiographique) après exposition du gel radioactif. La séquence complémentaire correspondante est la séquence de la matrice d’ADN simple brin utilisée. De nos jours, une variante de la réaction en chaîne par polymérase (PCR) est utilisée comme réaction de séquençage.

Contrairement à la PCR, une seule amorce est utilisée, de sorte que l’ADN n’est amplifié que linéairement.

Au début des années 80, Fritz M. Pohl et son groupe de recherche ont développé une méthode radioactive pour le séquençage de l’ADN. Dans cette technologie de séquençage, les molécules d’ADN seraient transférées vers un support pendant la séparation électrophorétique.

Le « Direct-Blotting-Electrophoresis System GATC 1500 » a été commercialisé par la société Constance GATC Biotech. Le séquenceur d’ADN a été utilisé, par exemple, dans le projet européen du génome pour séquencer le chromosome II de la levure Saccharomyces cerevisiae .

Depuis le début des années 1990, les didésoxynucléosides triphosphates marqués par des colorants fluorescents sont notamment utilisés. Chacun des quatre ddNTP est couplé à un colorant différent. Cette modification permet d’ajouter les quatre ddNTP dans un seul réacteur.

La division en approches séparées et la manipulation des radio-isotopes ne sont plus nécessaires. Les produits de terminaison de chaîne résultants sont séparés par électrophorèse capillaire et excités pour devenir fluorescents par un laser.

Les ddNTP à la fin de chaque fragment d’ADN montrent ainsi une fluorescence de couleurs différentes. Cette fluorescence peut être détectée par un détecteur. L’électrophorégramme montre directement la séquence des bases du brin d’ADN séquencé.

Un flux de travail typique pour le séquençage Sanger.
Un flux de travail typique pour le séquençage Sanger. Source de l’image: Estevezj, Wikimedia Commons

Approches modernes

Avec l’importance croissante du séquençage de l’ADN dans la recherche et le diagnostic, des méthodes ont été développées qui permettent un débit accru. Il est désormais possible de séquencer le génome humain complet en environ 8 jours. Les méthodes correspondantes sont appelées séquençage de deuxième génération.

Différentes entreprises ont développé des méthodes présentant différents avantages et inconvénients. En dehors de ceux énumérés ici, il y en a d’autres. Le séquençage de l’ADN de deuxième génération a été nommé «méthode de l’année 2007» par la revue Nature Methods.

Séquençage d’ADN par pyroséquençage

Le pyroséquençage utilise une ADN polymérase pour synthétiser le contre-brin d’ADN, bien que le type d’ADN polymérase puisse encore varier.

Le mélange d’ADN est ligaturé avec un adaptateur d’ADN et couplé à des billes via une séquence d’adaptateur complémentaire. Les billes chargées d’ADN sont placées sur une plaque avec des pores. La détection dépend d’un détecteur de lumière.

L’ADN polymérase est observée « en action » car elle attache successivement des nucléotides individuels à un brin d’ADN nouvellement synthétisé. Une insertion réussie d’un nucléotide est convertie en un signal lumineux qui est détecté par un détecteur. L’ADN à séquencer sert de brin de matrice et est disponible sous une forme simple brin.

L’élongation du brin d’ADN se fait en ajoutant l’un des quatre types de désoxynucléoside triphosphates (dNTP) de manière complémentaire. Lorsque le nucléotide approprié est ajouté, un signal est obtenu. L’ajout d’un NTP inapproprié n’entraîne pas de signal détectable. Ensuite, le NTP existant est détruit et un autre type est ajouté; cela continue jusqu’à ce qu’une réaction soit à nouveau montrée.

Il s’agit d’une réaction médiée par une enzyme luciférase. Lorsqu’un nucléotide complémentaire est incorporé par l’ADN polymérase, du pyrophosphate (PPi) est libéré. Le pyrophosphate est converti en adénosine triphosphate (ATP) par l’ATP sulfurylase.

L’ATP entraîne la réaction de la luciférase, qui convertit la luciférine en oxyluciférine. Cela entraîne à son tour un signal lumineux détectable – dont la force est proportionnelle à l’ATP consommé.

Le pyroséquençage a été utilisé pour déterminer la fréquence de certains gène mutations, par exemple dans la recherche de maladies génétiques. Le pyroséquençage peut être facilement automatisé et convient à l’analyse hautement parallèle d’échantillons d’ADN.

Pyroséquençage.
Pyroséquençage. Source de l’image: Thisisjp, Wikimedia Commons

Séquençage par hybridation

A cet effet, de courtes coupes d’ADN (oligonucléotides) sont fixées en rangées et colonnes sur un support en verre (puce à ADN ou microarray).

Les fragments de l’ADN à séquencer sont marqués avec des colorants et appliqués sur la matrice oligonucléotidique. Cela permet aux sections d’ADN fixes et libres complémentaires de s’hybrider les unes avec les autres. Après lavage des fragments non liés, le modèle d’hybridation est lu à partir des étiquettes de couleur et de leur force.

Les séquences des oligonucléotides fixés et leurs régions de chevauchement sont connues. Par conséquent, le modèle de couleur peut finalement être utilisé pour déduire la séquence globale sous-jacente de l’ADN inconnu.

Système de séquençage d’ADN ion-semi-conducteur

le Ion Torrent utilise la technologie des puces à semi-conducteurs pour effectuer un séquençage direct non optique du génome à l’aide de circuits intégrés.

Les données de séquençage sont obtenues directement à partir de la détection des ions produits par les ADN polymérases dépendantes de la matrice. La puce semi-conductrice utilisée dans ce procédé possède un transistor à effet de champ sensible aux ions. Ses capteurs sont disposés dans une grille de 1,2 million de puits dans lesquels se déroule la réaction de polymérase. Cette grille permet une détection parallèle et simultanée de réactions de séquence indépendantes.

Une technologie complémentaire oxyde de métal semi-conducteur (CMOS) est utilisée, ce qui permet une réaction rentable à haute densité de points de mesure.

Technologie de séquençage des semi-conducteurs ioniques, Source: Konrad Foerstner, Wikimedia Commons
Technologie de séquençage des semi-conducteurs ioniques, Source: Konrad Foerstner, Wikimedia Commons

Séquençage avec synthèse de pont

Cette technologie de séquençage est connue sous le nom de séquençage avec synthèse de pont de Solexa / Illumina. L’ADN double brin à séquencer est ligaturé aux deux extrémités avec une séquence adaptatrice différente à chaque extrémité.

L’ADN est ensuite dénaturé, ligaturé sur une plaque support sous une forme simple brin après dilution. Et encore amplifié in situ par amplification en pont. Cela crée des zones individuelles (grappes) d’ADN amplifié sur la plaque porteuse, qui ont la même séquence dans un cluster.

La réaction de PCR est avec quatre substrats de terminaison de chaîne fluorescents de couleurs différentes. La base respective incorporée par cycle est déterminée en temps réel dans un cluster.

Encodage à deux bases

Séquençage par détection de ligature Oligo ( Solide ) d’Applied Biosystems est une variante du séquençage par ligature.

Une bibliothèque d’ADN est diluée et couplée à des microbilles avec une ADN polymérase. L’ADN est ensuite amplifié dans une émulsion PCR. Ainsi, chaque microbille contient plusieurs copies d’une même séquence d’ADN. Les microbilles sont modifiées à l’extrémité 3 ‘de manière à pouvoir être fixées individuellement à une plaque de support.

Après la liaison de l’amorce, quatre sondes clivables différentes sont ajoutées, chacune d’elles étant marquée d’une couleur fluorescente différente. Ils se lient à la matrice d’ADN au moyen des deux premiers nucléotides (CA, CT, GG, GC). Ensuite, les microbilles sont ligaturées avec une ADN ligase. Les sondes sont ensuite clivées, libérant ainsi les étiquettes.

En utilisant jusqu’à cinq amorces, chaque base de la séquence d’ADN est déterminée dans au moins deux réactions de ligature différentes.

Plateforme SOLiD.
Plateforme SOLiD, Source de l’image: Philippe Hupe, Wikimedia Commons

Séquençage d’ADN avec des extrémités appariées

Un signal clairement identifiable peut être obtenu en générant de courts morceaux d’ADN à partir des extrémités terminales d’une séquence d’ADN. Cette méthode de séquençage d’ADN est également connue sous le nom de séquençage d’étiquettes appariées, PETS.

Séquençage d’ADN de troisième génération

Pour la première fois, le séquençage de troisième génération mesure la réaction dans des molécules uniques en tant qu’expérience sur une seule molécule.

Cela élimine la nécessité d’une amplification par PCR avant le séquençage. Les polymérases présentent un biais pour la liaison à certaines séquences d’ADN. Cela évite donc une amplification inégale par des ADN polymérases thermostables.

Ainsi, certaines séquences peuvent être négligées. De plus, le génome d’une cellule individuelle peut être examiné.

Le signal émis est enregistré en temps réel. Dans le séquençage d’ADN de troisième génération, deux signaux différents sont enregistrés, selon la méthode utilisée. Ce sont des protons ou des fluorophores libérés. Le séquençage de l’ADN et de l’ARN de cellules individuelles a été nommé «méthode de l’année 2013» par la revue Nature Methods.

Technologie de séquençage de troisième génération. Source de l'image: Chandra Shekhar Pareek, Rafal Smoczynski, Andrej Tretyn, Wikimedia Commons
Technologie de séquençage de troisième génération. Source de l’image: Chandra Shekhar Pareek, Rafal Smoczynski, Andrej Tretyn, Wikimedia Commons

Séquençage Nanopore

Séquençage Nanopore est basé sur des changements dans le flux d’ions à travers des nanopores intégrés dans une membrane créée artificiellement. Les nanopores sont des pores biologiques ou synthétiques ou même des pores semi-synthétiques. Le nanopore est noyé dans une membrane artificielle qui présente une résistance électrique particulièrement élevée.

Le pore est ouvert en permanence contrairement aux canaux ioniques ordinaires. Cela permet un flux constant d’ions à travers la membrane après l’application d’un potentiel. Les molécules d’ADN traversant le pore conduisent à une réduction du courant. Cette réduction de courant a une amplitude spécifique pour chaque nucléotide, qui peut être mesurée et attribuée au nucléotide correspondant.

Dans le séquençage simple brin, un brin d’ADN double brin est séparé par une hélicase et introduit dans le nanopore.

Dans le cas d’un pore MspA, quatre nucléotides de l’ADN sont situés simultanément à l’intérieur du pore. La vitesse de passage dépend, entre autres, de la différence de pH à travers la membrane. Les changements de courant ionique spécifiques pour chacun des quatre nucléotides permettent de lire la séquence.

Une évaluation est réalisée, par exemple, avec le logiciel Poretools. L’avantage de cette méthode est qu’elle a une précision constante même avec de longs brins d’ADN. Une variante de la méthode est utilisée pour le séquençage des protéines.

La technologie de séquençage des nanopores est avancée par la société britannique Oxford Nanopore Technologies. Leur séquenceur « MinION » était initialement disponible uniquement via un « Early Access Program ». Mais il est disponible via les canaux de distribution conventionnels depuis 2015.

Avant de partir, découvrez notre nouvelle génération basée sur le séquençage Séquençage du génome entier !

A propos de l'auteur