Rétrotransposition somatique généralisée de L1 dans l'épithélium colorectal normal

Nouvelles

MaisonMaison / Nouvelles / Rétrotransposition somatique généralisée de L1 dans l'épithélium colorectal normal

Mar 08, 2023

Rétrotransposition somatique généralisée de L1 dans l'épithélium colorectal normal

Nature tome 617, pages

Nature volume 617, pages 540–547 (2023)Citer cet article

14 000 accès

161 Altmétrique

Détails des métriques

Tout au long de la vie d'un individu, les altérations génomiques s'accumulent dans les cellules somatiques1,2,3,4,5,6,7,8,9,10,11. Cependant, le paysage mutationnel induit par la rétrotransposition de l'élément nucléaire 1 intercalé depuis longtemps (L1), un élément mobile largement répandu dans le génome humain12,13,14, est mal compris dans les cellules normales. Ici, nous avons exploré les séquences du génome entier de 899 clones unicellulaires établis à partir de trois types de cellules différents prélevés sur 28 individus. Nous avons identifié 1 708 événements de rétrotransposition somatique L1 enrichis en épithélium colorectal et montrant une relation positive avec l'âge. Les empreintes digitales des éléments sources ont montré 34 L1 compétents en rétrotransposition. L'analyse multidimensionnelle a démontré que (1) les rétrotranspositions somatiques de L1 se produisent à partir du début de l'embryogenèse à un rythme substantiel, (2) l'activation / la désactivation épigénétique d'un élément source est préférentiellement déterminée au stade précoce de l'organogenèse, (3) les L1 compétentes en rétrotransposition avec une fréquence d'allèle de population plus faible ont une activité de rétrotransposition plus élevée et (4) seule une petite fraction des transcrits de L1 dans le cytoplasme est finalement rétrotransposée dans les cellules somatiques. L'analyse des cancers appariés a en outre suggéré que le taux de rétrotransposition somatique de L1 est considérablement augmenté au cours de la tumorigenèse colorectale. En résumé, cette étude illustre le mosaïcisme somatique induit par la rétrotransposition L1 dans les cellules normales et donne un aperçu de la régulation génomique et épigénomique des éléments transposables au cours de la vie humaine.

Les mutations somatiques s'accumulent spontanément dans les cellules normales tout au long de la vie d'un individu, dès la première division cellulaire2,3,4,5. Des études antérieures sur le mosaïcisme somatique se sont principalement concentrées sur les variants nucléotidiques6,7,8,9,10,11. Les événements structurels plus complexes restent moins explorés en raison, en partie, de leur rareté relative et des défis techniques de détection, en particulier à une résolution unicellulaire.

Les rétrotransposons longs intercalés de l'élément nucléaire 1 (L1) sont des éléments transposables répandus représentant environ 17 % du génome humain12,13,14. Au cours de l'évolution, les rétrotransposons L1 sont une unité parasitaire remarquablement réussie dans la lignée germinale en se « copiant et collant » eux-mêmes sur de nouveaux sites génomiques15. Cependant, la plupart des quelque 500 000 L1 du génome humain de référence sont incapables de se transposer davantage car elles sont tronquées et ont perdu leur potentiel fonctionnel. À ce jour, 264 sources L1 compétentes en rétrotransposition (rc-L1) ont été découvertes dans les génomes du cancer16,17 ou dans d'autres études expérimentales12,13,18,19,20,21. Parfois, des rétrotranspositions L1 ont été trouvées dans l'analyse génétique des tissus dans plusieurs maladies22,23, impliquant leur rôle dans le développement de maladies humaines et nécessitant une caractérisation plus systématique.

Les événements de rétrotransposition somatique de L1 (soL1R) ont été systématiquement explorés dans les tissus cancéreux16,17,24. Des types de cancer spécifiques, y compris les adénocarcinomes œsophagiens et colorectaux, ont montré une charge plus élevée de soL1R, ce qui conduit souvent à une altération des gènes du cancer17. Dans les tissus normaux polyclonaux, soL1R n'a pas encore été clairement étudié car il est difficile de détecter des cas limités à une petite fraction de cellules. Bien que plusieurs techniques aient déjà été utilisées pour montrer les soL1R dans les neurones normaux, des taux de soL1R incohérents ont été rapportés dans les études, allant de 0,04 à 13,7 soL1R par neurone25,26,27,28,29,30.

Pour explorer systématiquement le mosaïcisme induit par soL1R dans les cellules normales, nous avons étudié les séquences du génome entier de colonies développées à partir de cellules individuelles (ci-après dénommées clones)2,4. Nos approches ont en outre permis un profilage multi-omique simultané à partir de clones identiques31 et une détection précise des événements embryogènes précoces partagés par plusieurs clones2,4,5.

Au total, nous avons exploré 899 séquences du génome entier de clones (Fig. 1a) établis à partir d'épithélium colorectal (406 clones de 19 donneurs), de fibroblastes prélevés à divers endroits (341 clones de sept donneurs)4, de cellules souches et progénitrices hématopoïétiques (140 clones d'un donneur)9 et de polypes adénomateux associés à MUTYH dans le côlon (12 clones de quatre polypes d'un donneur). De plus, nous avons étudié 19 tissus de cancer colorectal appariés provenant de donneurs de clones colorectaux normaux (tableau supplémentaire 1). À partir de ces séquences, nous avons évalué les mutations acquises somatiquement, y compris les variants mononucléotidiques (SNV), les indels, les variations structurelles et les soL1R (tableau supplémentaire 1). Ces mutations ont confirmé que la grande majorité des clones avaient été établis à partir d'une seule cellule fondatrice non néoplasique sans artefacts fréquents associés à la culture (données étendues, Figs. 1a, b).

a, Conception expérimentale de l'étude. CSH, cellules souches et progénitrices hématopoïétiques. b, Proportion de clones avec différents nombres de soL1R dans différents types de cellules (nombre de clones indiqué entre parenthèses). c, Proportion de clones colorectaux normaux avec différents nombres de soL1R sur 19 individus (nombre de clones indiqué entre parenthèses). d, Régression linéaire du nombre moyen de soL1R par clone sur l'âge chez 19 individus avec des clones colorectaux normaux. La ligne verticale traversant chaque point indique la plage de charge soL1R par clone chez chaque individu. La ligne bleue représente la ligne de régression et les zones ombrées indiquent son intervalle de confiance à 95 %. Deux individus aberrants (HC15 et HC06) sont surlignés en rouge. e,f, Phylogénies clonales précoces de HC14 (e) et HC19 (f) reconstruites par mutation somatique ponctuelle. La longueur des branches est proportionnelle au nombre de mutations somatiques, qui sont indiquées par des nombres à côté des branches. Les branches embryonnaires précoces sont colorées par la fraction d'allèle variant (VAF) des mutations embryonnaires précoces (EEM) dans le sang. Les nombres de soL1R détectés sont indiqués dans les cercles pleins au bout des branches. Les diagrammes circulaires indiquent la proportion de cellules sanguines hébergeant l'EEM ou le soL1R. Segment RT, segment rétrotransposé. g, taux de soL1R normalisés à différents stades et types de cellules.

Parmi les 887 clones adénomateux normaux et 12 associés à MUTYH, nous avons identifié 1 250 et 458 soL1R, respectivement, par une analyse combinée à l'aide de quatre outils bioinformatiques différents (données étendues Fig. 1c et tableaux supplémentaires 1 et 2). Il convient de noter que les événements soL1R se distinguaient clairement des autres réarrangements génomiques en raison des deux caractéristiques canoniques de la rétrotransposition - la queue poly-A et la duplication du site cible (TSD; Données étendues Fig. 1d, e). De multiples preuves ont indiqué que la plupart des soL1R dans les clones étaient de véritables événements somatiques plutôt que des événements induits par la culture (Discussion supplémentaire 1 et Fig. 1 supplémentaire). De plus, nous avons en outre trouvé 572 soL1R des 19 cancers appariés, dont 97,2 % (n = 556) étaient des événements clonaux partagés par toutes les cellules cancéreuses du tissu. Pour les autres types de rétrotransposons, nous avons également détecté neuf insertions Alu somatiques dans des clones normaux (tableau supplémentaire 2).

Sur les 1 250 soL1R des 887 clones sains, 98,9 % (n = 1 236) ont été détectés à partir de l'épithélium colorectal, montrant une spécificité de type cellulaire extrême (P = 9,0 × 10−173, test exact de Fisher bilatéral). La plupart des clones colorectaux normaux (n = 359, 88 %) abritaient au moins un soL1R, en moyenne trois événements par clone (Fig. 1b). Remarquablement, les soL1R étaient plus abondants que les autres types classiques de variation structurelle somatique chez les clones (Extended Data Fig. 1f).

Dans l'épithélium colorectal, nous avons trouvé des variations substantielles de la charge de soL1R entre les clones et les individus. La charge de soL1R dans les clones colorectaux était comprise entre zéro et 18 par clone (Fig. 1c). En moyenne, les charges de soL1R ont montré une relation large mais positive avec l'âge des individus (0, 028 soL1R par clone et par an; Fig. 1d), similaire à la propriété de type horloge des SNV et des indels somatiques endogènes (Extended Data Fig. 2a)32. Cela implique que les soL1R sont acquis à un taux de fond plus ou moins constant tout au long de la vie dans l'épithélium colorectal. Deux individus aberrants suggèrent en outre une prédisposition génétique et/ou des expositions environnementales qui stimulent les activités L1 (Fig. 1d).

Les charges de soL1R n'étaient pas fortement associées à d'autres caractéristiques, telles que le sexe et la localisation anatomique des clones dans le côlon (Extended Data Fig. 2b, c). Au niveau des clones individuels, la charge de soL1R n'a pas montré d'association marquée avec d'autres caractéristiques génomiques telles que la charge de mutation ponctuelle, la longueur des télomères, l'activité des processus SNV endogènes aux cellules33 (SBS1 et SBS5/40; signatures standard dans la base de données COSMIC), l'exposition aux espèces réactives de l'oxygène (SBS18) ou à la colibactine de pks + Escherichia coli34 (SBS88) (données étendues Fig. 2d – i).

Les SoL1R dans les cellules normales ne se limitent pas à l'épithélium colorectal, car nous avons détecté 37 autres sur 259 patchs microdisséqués par capture laser (LCM) de 13 organes5,11 (données étendues Fig. 2j et tableau supplémentaire 3). Cependant, ces charges ne doivent pas être directement comparées à celles des clones colorectaux, car la sensibilité de détection de soL1R est compromise dans le séquençage du génome entier basé sur LCM (WGS ; Discussion supplémentaire 2 et Figs. 2 et 3 supplémentaires).

Sur les 1 250 soL1R dans les clones normaux, 30 étaient partagés par deux clones ou plus chez un individu (dix événements lorsqu'ils se sont effondrés), ce qui implique que ces événements étaient présents dans les cellules ancestrales communes les plus récentes des clones. Les phylogénies développementales des clones, reconstruites à l'aide de mutations postzygotiques comme indiqué précédemment4,5 (Fig. 1e, f et données étendues Fig. 3 et 4), ont clairement démontré que ces soL1R étaient des événements embryonnaires. Par exemple, un événement soL1R dans HC14, partagé par six clones colorectaux (six clones sur 19, fréquence clonale de 32%), a été acquis dans une cellule ancestrale au niveau du nœud de deuxième génération de la phylogénie (Fig. 1e). En plus de la position du nœud, le nombre de mutations ponctuelles postzygotiques (n = 5) dans le nœud ancestral a soutenu l'idée que l'événement s'est produit au stade embryonnaire à quatre cellules, étant donné que les deux premières générations cellulaires du développement humain génèrent 2,4 à 3,8 mutations par cellule par division cellulaire (pcpcd) et les générations cellulaires ultérieures génèrent 0,7 à 1,2 mutations pcpcd4,5. Comme prévu pour un événement de prégastrulation, soL1R a été observé dans une séquence d'environ 200 × du génome entier du sang périphérique (origine mésodermique) avec une fréquence cellulaire d'environ 34% au-delà de l'épithélium colorectal (origine endodermique; Fig. 1e). De même, une insertion somatique d'Alu, trouvée dans HC04, a également probablement été obtenue au stade de la prégastrulation (Extended Data Fig. 4).

Les neuf autres SOL1R partagés étaient probablement des événements embryonnaires postgastrulation, étant donné les positions en aval et le temps moléculaire de leurs nœuds ancestraux dans la phylogénie (générations cellulaires de 16‒56 points, équivalent à la mutation fixe prévisionnelle du taux de mutation fixe dans le sang de l'embryogenèse) et de l'absence de SOL1R et données étendues Figs. 3 et 4).

Pour comparer les différents stades et types de cellules, nous avons calculé les taux de soL1R en comptant le nombre d'événements soL1R par nombre de mutations ponctuelles endogènes32,33 (EPM ; définis comme SBS1 et SBS5/40 SNV et indels ID1 et ID2). Le taux de soL1R dans les branches colorectales terminales (épithélium colorectal post-développement) était de 1,2 pour 1 000 EPM (Fig. 1g). Ce taux était environ quatre fois plus élevé dans les branches embryonnaires post-gastrulation se différenciant en épithélium colorectal (4,52 pour 1 000 EPM, P = 8,4 × 10−4, test exact de Poisson bilatéral), équivalent à entre 1,1 × 10−3 et 9,0 × 10−3 soL1R pcpcd (en supposant un taux de mutation ponctuelle endogène précoce fixe4,5). L'estimation ponctuelle du taux de soL1R dans les branches de prégastrulation était de 1, 06 pour 1 000 EPM, bien que nous ayons trouvé un tel cas chez 28 individus (Fig. 1e). En revanche, les taux étaient proches de zéro pour 1 000 EPM pour les lignées sanguines et fibroblastiques, quels que soient les stades embryonnaires et post-développementaux (Fig. 1g).

Les segments rétrotransposés dans les soL1R des clones colorectaux normaux étaient principalement la fraction 3' des séquences L1 répétitives (n = 1 063, 89 % ; connu sous le nom de solo-L1 ; Fig. 2a)16. Parfois, les séquences uniques en aval des sources L1 ont été rétrotransposées avec ou sans séquences L1 (connues sous le nom de transductions partenaires (n = 11, 1%) et orphelines (n = 124, 10%), respectivement; Fig. 2a)16. Dans les événements de transduction, la prise d'empreintes digitales de leurs éléments sources est possible en utilisant les séquences uniques comme code-barres des sources L116.

a, Schéma de principe de trois classes de rétrotransposition L1 : solo-L1, transduction en couple et transduction orpheline. b, Le paysage des événements de transduction avec les caractéristiques de 34 rc-L1. TD, transduction ; AFR, Africains ; EUR, Européens ; EAS, Asiatiques de l'Est ; SAS, Sud-Asiatiques ; AMR, Américains. c, Relation entre la fréquence des allèles de population des rc-L1 et leur activité de rétrotransposition normalisée. Les points verts indiquent des sources privées trouvées chez un seul individu ; les points rouges indiquent les sources actives prédominantes ; les points noirs et gris indiquent des sources communes contribuant à des événements de transduction et à aucun événement de transduction dans notre étude, respectivement. La ligne bleue représente la ligne de régression des sources actives, mais non répandues, et les zones ombrées indiquent son intervalle de confiance à 95 %. TPAM, nombre de transductions par allèle L1 pour 1 million de mutations ponctuelles endogènes du temps moléculaire. d, Proportion de la sous-famille L1 et prévalence des mutations tronquantes des sources rc-L1 dans leur PAF. Les groupes avec PAF < 25, 25 < PAF < 75 et PAF > 75 ont respectivement dix, 34 et 90 sources L1.

En combinant des clones colorectaux et des tissus cancéreux, nous avons trouvé 217 événements de transduction avec 34 sources L1 englobant ceux-ci, confirmant leur compétence de rétrotransposition (Fig. 2b et Tableau supplémentaire 4). Parmi ceux-ci, 12 (35%) étaient de nouveaux rc-L1 car ils ne chevauchaient pas 264 sources actives précédemment connues12,13,16,17,18,19,20,21. Les nouvelles sources de rc-L1 comprennent trois types : (1) une source de lignée germinale référencée (présente à la fois dans le génome de référence humain et dans la lignée germinale de l'individu), (2) sept sources de lignée germinale non référencée (absentes dans le génome de référence mais présentes dans la lignée germinale) et (3) quatre sources postzygotes acquises absentes à la fois dans le génome de référence et la lignée germinale (Extended Data Fig. 5). Il convient de noter que quatre nouvelles sources de lignées germinales non référencées (17q25.3, 1q23.3-1, 1p22.1 et 2q21.1-2 ; Fig. 2b et tableau supplémentaire 4) étaient privées pour un individu, n'étant pas observées dans notre panel de lignées germinales comprenant 2 860 individus de cinq ancêtres. Cela indique que l'acquisition de nouvelles sources de rc-L1 est en cours dans le pool du génome humain, comme le suggèrent les études génomiques basées sur la population12,21,35.

Chacune des 34 sources rc-L1 a contribué à un nombre différent de transductions dans les clones colorectaux (Fig. 2b). Par exemple, quatre sources L1 (22q12.1-2, 1p12, Xp22.2-1 et 12p13.32) ont affecté une grande partie (au moins 50 %) des individus, provoquant environ 50 % des événements de transduction somatique dans notre étude. Ces quatre rc-L1 étaient répandus dans la population, montrant une fréquence allélique de la population (PAF) d'environ 100 % dans le pool du génome humain (Fig. 2b).

À l'exception de ces quatre rc-L1 «prévalents actifs», les rc-L1 à PAF élevé ont montré une faible activité soL1R dans l'épithélium colorectal. La plupart des 90 rc-L1 avec PAF supérieur à 75 % n'ont contribué à aucun (81, 90 %) ou à un événement soL1R (4, 4 %) dans les 406 clones colorectaux. En revanche, les éléments sources rares étaient souvent rétrotransposés dans plusieurs clones d'un individu ayant la source dans la lignée germinale. Par exemple, la source privée 17q25.3 a contribué à six événements sur 22 clones colorectaux de HC13 (Fig. 2b).

Pour comparer les activités de rétrotransposition entre différents éléments sources, les transductions de chaque rc-L1 ont été comptées par allèle L1 pour 1 million d'EPM de temps moléculaire (appelé TPAM) dans les lignées colorectales normales chez les individus hébergeant la source. Curieusement, les taux de TPAM ont généralement montré une corrélation négative avec le PAF des rc-L1 (Fig. 2c). Les sources rares ont montré des activités de rétrotransposition plus élevées que les sources courantes, à l'exception des quatre rc-L1 actifs courants. Ces caractéristiques sont conformes à la relation inverse entre la prévalence et la pénétrance des variants génomiques humains36. Étant donné que les rc-L1 peuvent provoquer une mutagenèse par insertion, qui est potentiellement dommageable, son activité doit être réprimée par des mécanismes génétiques et/ou épigénétiques. Les sources ultrarares précèdent probablement une sélection négative suffisante car elles sont apparues relativement récemment dans la population humaine12.

Pour comprendre le fondement génétique des activités différentielles entre les rc-L1, nous avons exploré les polymorphismes de séquence des éléments sources à l'aide du WGS à lecture longue de deux clones colorectaux. Les éléments sources prévalents dans la population appartenaient principalement aux sous-familles L1 plus anciennes (telles que pré-Ta et PA2), comme suggéré précédemment12, et abritaient des mutations perturbant le cadre de lecture ouvert plus fréquemment que les éléments sources rares (Fig. 2d et Tableau supplémentaire 4).

Pour explorer le fondement épigénétique des activités différentielles de rc-L1 dans les cellules normales, nous avons combiné la méthylation de l'ADN du génome entier (dans 139 clones) et les profils d'expression de l'ARN (dans 116 clones) dans un sous-ensemble de clones établis (Figs. 1a et 3a). Comme indiqué pour les tissus en vrac, ces clones représentaient une forte corrélation négative entre la méthylation et la transcription du promoteur L1 spécifique au locus (Extended Data Fig. 6), suggérant que la déméthylation du promoteur L1 est un interrupteur principal pour la transcription L1.

a, Schéma de principe de l'analyse multidimensionnelle. b, Panorama de l'état de méthylation de l'ADN de 30 rc-L1 avec des phylogénies développementales pour 132 clones colorectaux normaux et sept clones de fibroblastes de neuf individus. Il comprend 14 rc-L1 contribuant à des événements de transduction dans ces clones et 16 rc-L1 supplémentaires montrant des promoteurs déméthylés dans au moins cinq clones. Le nombre de mutations ponctuelles spécifiques à une branche est indiqué dans les phylogénies. c, d, statut de méthylation de l'ADN et niveau de transcription de lecture de rc-L1 à 22q12.1-2 (c) et 12p13.32 (d). e, Proportion de non-troncature et de déméthylation du promoteur de 90 rc-L1 prévalents dans la population. Points rouges, sources actives prédominantes ; points noirs et gris, sources communes montrant respectivement aucun et aucun événement de transduction dans notre étude. f, Différences de méthylation du promoteur rc-L1 dans les paires de clones en fonction de leur temps de ramification embryonnaire. Les 30 premiers rc-L1 présentant une variation substantielle de la méthylation du promoteur ont été pris en compte. Un taux de mutation fixe4 a été utilisé pour convertir le temps de mutation en génération de cellules embryonnaires. %P, point de pourcentage ; *P < 2,2 × 10−16 (test de Kolmogorov–Smirnov à deux échantillons). g, h, profil de méthylation des régions en amont et en aval de 100 kb de rc-L1 en 22q12.1-2 (g) et 1p12 (h). Les locus rc-L1 sont mis en évidence par des rectangles jaunes. En haut, coordonnées génomiques et ordre des sites CpG. Milieu, fraction de CpG méthylé dans les clones colorectaux (or) et fibroblastes (argent) (g), et dans les clones colorectaux avec des promoteurs ouverts (orange) et fermés (bleu) (h). En bas, différences de fraction de CpG méthylé représentées dans le panneau du milieu. mCpG, CpG méthylé.

La fréquence de la déméthylation du promoteur (et la transcription résultante) variait selon les types de cellules et les éléments sources (Fig. 3b, Données étendues Fig. 7, Discussion supplémentaire 3 et Figs supplémentaires 4 et 5). Bien que principalement méthylés dans les clones de fibroblastes, les promoteurs rc-L1 étaient souvent nettement déméthylés dans les clones colorectaux. Par exemple, les promoteurs des sources actives prévalentes 22q12.1-2 et 12p13.32 ont montré une déméthylation biallélique fréquente (et la transcription d'ARN résultante) dans les clones colorectaux (Fig. 3b – d). Parfois, la fréquence clonale de la déméthylation d'un promoteur rc-L1 était plus répandue chez des individus spécifiques, comme observé dans les sources 5q14.1-1 et 14q12-3 (Fig. 3b). Les profils de méthylation de l'ADN du génome entier de divers tissus en vrac38 suggèrent que le tissu du côlon a une fréquence de déméthylation du promoteur rc-L1 plus élevée que tout autre type de cellule (Extended Data Fig. 8a).

Il convient de noter que nous avons observé que les rc-L1 prévalents dans la population étaient fréquemment réprimés par la méthylation du promoteur et/ou la troncature génétique. Sur les 90 rc-L1 prévalents dans la population (PAF> 75%), 68 (75, 6%) présentaient une méthylation prédominante du promoteur dans plus de 75% des clones colorectaux (Fig. 3e). Sur les 22 autres rc-L1 non préférentiellement promoteurs méthylés (tels que 12q13.13), dix hébergeaient des mutations tronquant le cadre de lecture ouvert dans tous les allèles informatifs du séquençage à lecture longue. Les 12 rc-L1 restants, en particulier les quatre sources actives prévalentes (22q12.1-2, Xp22.2-1, 1p12 et 12p13.32), ont échappé à la fois à la répression génétique et épigénétique, ce qui peut indiquer les rôles fonctionnels des sources39.

L'analyse multidimensionnelle a en outre fourni quatre informations sur la régulation épigénétique des éléments sources et l'activité subséquente de soL1R. Premièrement, la déméthylation du promoteur rc-L1 est une condition préalable pour les soL1R. Un élément source provoquant des événements de transduction dans un clone était toujours le promoteur déméthylé dans le clone correspondant (Fig. 3b; 47 sur 47, mis en évidence par des rectangles rouges; 37 déméthylations homozygotes et dix hétérozygotes). Cela indique en outre que le promoteur rc-L1 déméthylé est stable dans les lignées somatiques au fil du temps, car sa méthylation inverse perturberait une telle association exclusive.

Deuxièmement, l'épigénotype du promoteur L1 est principalement déterminé dans l'embryogenèse. La déméthylation autosomique du promoteur rc-L1 était principalement homozygote (Fig. 3b – d), ce qui suggère qu'elle est directement héritée de la reprogrammation épigénétique prégastrulation, qui supprime globalement les méthylations de l'ADN dans le génome40,41,42. Un scénario alternatif, la perte stochastique de méthylation dans le processus de vieillissement, est moins probable car il façonnera préférentiellement la déméthylation dans un allèle. Nos résultats suggèrent plutôt que les promoteurs rc-L1 entièrement déméthylés formés au stade embryonnaire le plus précoce ne sont pas suffisamment reméthylés par la suite dans les lignées épithéliales colorectales (Fig. 3b). La reméthylation devrait être plus approfondie dans les lignées de fibroblastes, car les clones de fibroblastes ont montré une méthylation presque complète du promoteur rc-L1 (Fig. 3b). Le temps moléculaire dans les phylogénies clonales indique également que le processus de reméthylation du promoteur rc-L1 est opérationnel principalement au stade post-gastrulation. Les clones colorectaux ayant leur cellule ancestrale commune la plus récente dans les 17 à 65 mutations embryonnaires du temps moléculaire (12e à 90e générations cellulaires, en supposant le taux de mutation précoce fixe mentionné ci-dessus4,5 ; proche de la gastrulation à l'organogenèse) présentaient une concordance plus élevée des épigénotypes de promoteurs pour une source rc-L1 (taux de concordance de 77 %, 1 446 sur 1 885 paires clone-L1) que les clones qui ont divergé plus tôt ( Fig. 3b–d,f).

Troisièmement, la plage de reméthylation insuffisante est localisée au promoteur de rc-L1 et est indépendante des autres régions génomiques. Par exemple, malgré la différence extrême dans le niveau de méthylation du promoteur de la source 22q12.1-2 active prévalente entre les fibroblastes et les clones colorectaux, ses régions en amont et en aval de 100 kb présentaient des profils de méthylation de l'ADN très similaires (Fig. 3g). De même, les niveaux de méthylation de l'ADN des régions voisines et à l'échelle du génome étaient largement concordants entre les clones colorectaux, quel que soit l'épigénotype du promoteur L1 (Fig. 3h et Données étendues Fig. 8b, c).

Enfin, la plupart des transcrits L1 sont improductifs vis-à-vis des soL1R dans les cellules normales. Un clone colorectal a 17–42 allèles rc-L1 avec déméthylation du promoteur (Fig. 3b), et leurs séquences de transcriptome suggèrent qu'une lignée épithéliale colorectale est continuellement exposée à plusieurs transcrits rc-L1 au cours d'une vie (moyenne de 0,6 fragments par kilobase de transcrit par million de lectures cartographiées (FPKM) lorsque tous les rc-L1 sont agrégés ; Données étendues Fig. 7)43. Cependant, un clone acquiert environ trois soL1R au cours de sa vie, ce qui implique la présence d'un mécanisme de défense actif qui protège la rétrotransposition des transcrits L1 dans les cellules normales.

Les sites cibles des soL1R étaient largement répartis sur l'ensemble du génome dans les cellules normales et cancéreuses (données étendues, Fig. 9a). Les SoL1R dans les clones normaux étaient plus fréquemment insérés dans les régions des motifs du site cible de l'endonucléase L1 (190 fois; intervalle de confiance (IC) à 95% 78,8–459) et les régions à réplication tardive (5,89 fois; IC à 95% 4,48–7,74) comme précédemment observé dans les cancers17, bien que les états de chromatine et les niveaux de transcription aient montré un effet relativement faible (données étendues Fig. 9b).

Nous avons observé un niveau substantiel d'épuisement de soL1R dans les régions fonctionnelles du génome, comme observé dans la lignée germinale L1s44. Parmi les 1 250 soL1R dans les clones normaux, nous n'avons trouvé qu'un seul événement impliquant un exon d'un gène codant pour une protéine, qui a montré une fréquence 29 fois inférieure à l'attente aléatoire (P = 1,9 × 10−11, test exact de Poisson bilatéral). De même, les soL1R ont été plus fréquemment observés dans les régions à faible gène (Extended Data Fig. 9c). Les réarrangements génomiques combinés à SoL1R, qui représentaient 1 % des soL1R dans les tissus cancéreux17, n'ont pas été observés dans les clones normaux. Nos données ont en outre démontré que les événements soL1R n'induisaient pas de mutations supplémentaires, de modifications de l'expression / de l'épissage des gènes ou des altérations de la méthylation de l'ADN dans les régions voisines à partir des sites de rétrotransposition (données étendues Fig. 9d – f). Nous supposons que les clones avec des soL1R fonctionnellement dommageables ont été sélectionnés négativement dans les cellules normales.

Nous avons en outre étudié les séquences de points de rupture sur les sites cibles soL1R pour déduire les processus mécanistes des insertions L1. En plus des deux caractéristiques canoniques (TSD et queue poly-A), qui sont acquises par transcription inverse amorcée par la cible (processus A ; Fig. 4a, b), une fraction substantielle des soL1R a montré des variations de séquence dans la partie 5' de la tête des segments rétrotransposés, caractérisées par (1) une courte inversion dans le corps intrarétrotransposé (intraRT) (n = 354 ; 29,5 %), (2) une courte inversion de repli (duplication inversée) dans la 5 ′ en amont du site cible (n = 3 ; 0,3 %) ou (3) les deux (n = 1 ; 0,1 %). Ces variations de séquence peuvent être expliquées par le mécanisme d'amorçage jumeau (processus B ; Fig. 4b)45 et la synthèse supplémentaire d'ADN (environ 52 à 220 paires de bases (pb)) potentiellement par des ADN polymérases dans la résolution finale de la mutagenèse par insertion médiée par L1 (processus C ; Fig. 4b), respectivement. Un événement occasionnel supplémentaire a été observé dans un clone établi à partir d'un adénome, dans lequel une partie de l'ARNm précurseur, transcrit à proximité du site d'insertion, a été transcrit de manière inverse et co-inséré dans le génome, suggérant une commutation de brin de la transcriptase inverse (Extended Data Fig. 9g). Ces caractéristiques illustrent collectivement que les soL1R ne sont pas acquis par des processus entièrement ordonnés et linéaires, mais plusieurs événements optionnels peuvent être engagés de manière stochastique46.

a,b, Diagrammes schématiques des structures génomiques des insertions L1 canoniques et complexes (a) et des mécanismes sous-jacents (b). Corps RT, corps rétrotransposé ; DSB, rupture double brin. c, Phylogénie des clones adénomateux associés à MUTYH avec des taux de L1 normalisés dans des groupes de lignées classées par mutations conductrices. La longueur des branches est proportionnelle au temps moléculaire, mesuré par le nombre de mutations ponctuelles somatiques. Les nombres de soL1R spécifiques à la branche et de mutations du conducteur spécifiques à la branche sont indiqués.

Fait intéressant, nous avons trouvé deux clones, chacun ayant des transductions sur des sites cibles génomiques différents mais avec exactement la même longueur de séquences uniques (Extended Data Fig. 9h). Étant donné que la queue poly-A est un événement aléatoire dans la transcription de lecture, nos résultats suggèrent que plusieurs événements soL1R à partir d'un seul transcrit L1 sont possibles.

La charge soL1R dans les 19 carcinomes colorectaux appariés a montré une variance considérable, entre 4 et 105 (Fig. 1b). En moyenne, la charge soL1R était de 30 par cancer, environ dix fois plus fréquente que celle observée chez les clones colorectaux normaux. Le taux de soL1R dans les carcinomes colorectaux était de 3,47 pour 1 000 EPM, ce qui est environ trois fois plus élevé que dans l'épithélium colorectal normal (Extended Data Fig. 10a). Qualitativement, les soL1R dans les tumeurs ont entraîné des changements plus profonds, y compris une longueur d'insert plus longue (1 031 contre 453 pb pour solo-L1, P = 8,6 × 10−20, test t bilatéral ; 755 contre 615 pb pour les transductions en couple, P = 0,59, test de somme des rangs de Wilcoxon bilatéral ; et 530 contre 242 pb pour les transductions orphelines, P = 0,004, test t bilatéral ; Données étendues Fig. 10b) et une fréquence plus élevée de variations de séquence de tête (41,8 vesus 29,9 %, P = 9,6 × 10−7, test exact de Fisher bilatéral ; Données étendues Fig. 10c). Nos résultats suggèrent une condition permissive pour la rétrotransposition de L1 dans le développement tumoral, pas nécessairement équivalente à l'instabilité classique du génome dans les cancers. Par exemple, les mutations inactivant TP53 et l'instabilité microsatellite et chromosomique n'ont pas montré de corrélation robuste avec les charges de soL1R dans les cancers colorectaux (données étendues Fig. 10d, e). Bien que l'instabilité chromosomique ait été significative dans les pancancers englobant plus de 2 600 cas de cancer17 (données étendues Fig. 10f, g), l'association était faible et incohérente dans chaque type histologique de tumeur (données étendues Fig. 11).

Une accélération du taux de soL1R au cours du développement tumoral a été observée dans les clones adénomateux associés à MUTYH. Dans l'arbre de développement des polypes adénomateux, le taux de soL1R a augmenté à mesure que les lignées se rapprochaient du carcinome avec une accumulation de plus de mutations conductrices. Par exemple, le taux de soL1R dans les lignées avec trois mutations de conducteur (mutations de perte de fonction dans APC et ARID1A et une mutation de gain de fonction dans KRAS) était trois à cinq fois plus élevé que celui des lignées sans conducteur marqué (Fig. 4c).

Nos résultats démontrent que les éléments L1 endogènes cellulaires conduisent à une rétrotransposition dans les lignées somatiques normales et que les cellules épithéliales du côlon acquièrent 0, 028 événements soL1R par an. La mobilisation commence dès le début de l'embryogenèse humaine, avant même la gastrulation, comme observé précédemment13,47. Le répertoire de rc-L1 est hérité des parents et leur activation épigénétique est principalement déterminée au stade embryonnaire post-gastrulation, qui est ensuite transmis de manière robuste dans la lignée somatique au cours du vieillissement (Fig. 5). Compte tenu du nombre de cryptes dans le côlon (10 millions)48, les individus dans la soixantaine auraient collectivement 20 millions d'événements de rétrotransposition dans l'épithélium colorectal. Une petite fraction de ces insertions L1 peut conférer des changements phénotypiques dans les cellules mutantes et contribuer à des maladies humaines telles que le cancer17.

Diagramme schématique illustrant les facteurs influençant le paysage soL1R. La composition génétique des rc-L1 est héritée des parents. Le paysage de la méthylation des promoteurs rc-L1 est principalement déterminé par la déméthylation globale de l'ADN, suivie de processus de reméthylation dans les stades de développement. Ensuite, lorsqu'un promoteur rc-L1 est déméthylé dans une lignée cellulaire spécifique, la source exprime des transcrits L1 permettant ainsi l'induction de soL1Rs.

Plusieurs méthodes complémentaires, notamment le séquençage profond6, l'amplification du génome entier8, le séquençage d'ADN duplex49, le LCM5,10,11 et les expansions unicellulaires in vitro2,4,7,9, peuvent être utilisées pour explorer les modifications génomiques acquises somatiquement dans les cellules normales. Bien que les expansions clonales demandent beaucoup de travail et ne s'appliquent qu'aux cellules en division, elles présentent des avantages fondamentaux31, notamment (1) la mise en œuvre d'une détection de mutation sensible et précise au niveau absolu de la cellule unique, (2) la facilitation du profilage multi-omique supplémentaire dans les mêmes clones uniques et (3) permettant l'exploration des relations développementales précoces des clones.

Bien que nos analyses suggèrent certains mécanismes, beaucoup de choses restent à découvrir dans la dynamique de la rétrotransposition de L1 dans les cellules normales. En raison de leur nature répétitive, les séquences d'éléments source et les soL1R sont largement inaccessibles par des lectures courtes. La base mécaniste de la spécificité du locus et du type cellulaire dans la déméthylation différentielle du promoteur est déconcertante. Des panoramas plus complets sur un nombre plus important de cellules individuelles de divers types de cellules, à différents moments du vieillissement et de la progression de la maladie et par des techniques de séquençage plus innovantes50, sont justifiés pour répondre à ces questions.

Pour l'établissement in vitro d'organoïdes clonaux à partir de tissus colorectaux, des tissus muqueux sains ont été obtenus à partir d'échantillons chirurgicaux de 19 patients subissant une chirurgie élective d'ablation de tumeur (tableau supplémentaire 1). Des tissus normaux (d'une taille d'environ 1 × 1 × 1 cm3) ont été coupés dans une région à plus de 5 cm de la tumeur primaire. Des tissus sanguins et tumoraux colorectaux appariés provenant des mêmes patients ont également été collectés pour le WGS des tissus en vrac.

Des biopsies fraîches d'un patient atteint de polypose adénomateuse familiale associée à MUTYH ont été obtenues par coloscopie. Des tissus (d'une taille d'environ 0,5 × 0,5 × 0,5 cm3) ont été coupés à partir de quatre polypes. Du sang apparié et du tissu de la muqueuse buccale du même patient ont également été prélevés.

Tous les tissus ont été transportés au laboratoire pour des expériences de culture d'organoïdes dans les 8 h suivant la procédure de collecte. Toutes les procédures de cette étude ont été approuvées par le comité d'examen institutionnel de l'hôpital universitaire national de Séoul (n° d'approbation 1911-106-1080) et KAIST (n° d'approbation KH2022-058), et le consentement éclairé a été obtenu de tous les participants à l'étude. Cette étude a été menée conformément à la Déclaration d'Helsinki et à ses amendements ultérieurs. Aucune méthode statistique n'a été utilisée pour prédéterminer la taille de l'échantillon. Les expériences ont été menées sans randomisation et les enquêteurs n'ont pas été mis en aveugle pendant les procédures expérimentales et l'analyse des données.

Nous avons inclus des séquences du génome entier accessibles au public de clones expansés unicellulaires pour obtenir une image plus complète de la rétrotransposition de L1 dans divers tissus humains. Nous avons inclus 474 séquences du génome entier de deux ensembles de données précédents, un pour les cellules hématopoïétiques (140 clones d'un individu)9 et un pour les fibroblastes mésenchymateux de nos travaux précédents (334 clones de sept individus)4. De plus, nous avons inclus 259 séquences du génome entier produites à partir de patchs à base de LCM disséqués à partir de 13 organes étudiés dans une étude précédente5,11. De plus, nous avons exploré 578 séquences du génome entier générées à partir de patchs de tissus colorectaux à base de LCM51 pour étudier les différences de sensibilité pour la détection de soL1R entre les méthodes d'expansion LCM et clonale.

Pour comprendre le PAF des rc-L1, nous avons collecté 2 852 séquences du génome entier accessibles au public de tissus normaux avec des informations sur l'origine ethnique connue. Ces données ont été recueillies à partir de diverses études52,53,54,55,56,57.

Pour comprendre l'impact du niveau d'instabilité du génome sur la fréquence des soL1R dans les tumeurs, nous avons exploré plus en détail les appels de variantes du consortium ICGC/TCGA Pan-Cancer Analysis of Whole-Genome (PCAWG), qui comprenait 2 677 cancers et correspondait à des séquences normales du génome entier dans environ 40 types de tumeurs17,53. Les SoL1R des échantillons du PCAWG peuvent être trouvés dans un article précédent17. D'autres appels de mutation somatique (y compris les mutations inactivant TP53, les variations structurelles et les signatures mutationnelles) générés par le consortium peuvent être téléchargés à l'adresse https://dcc.icgc.org/releases/PCAWG. Notre matrice utilisée dans l'analyse est disponible dans le tableau supplémentaire 5, qui comprend les mutations motrices de 19 cancers colorectaux appariés identifiés à l'aide de CancerVision (Genome Insight).

Toutes les procédures d'établissement d'organoïdes et les compositions de médias ont été adoptées à partir de la littérature, avec de légères modifications58. Les tissus muqueux ont été coupés en sections d'environ 5 mm et lavés avec du PBS. Les tissus ont été transférés sur EDTA 10 mM (Invitrogen) dans des tubes coniques de 50 ml, suivis d'une incubation sous agitation pendant 30 min à température ambiante. Après incubation, les tubes ont été doucement secoués pour séparer les cryptes des tissus conjonctifs. Le surnageant a été collecté et 20 µl de suspension ont été observés au stéréomicroscope pour vérifier la présence de cryptes. La suspension de crypte a été centrifugée à une force centrifuge relative de 300 pendant 3 min, et le culot a été lavé une fois avec du PBS pour réduire le temps d'ischémie. Les cryptes isolées ont été intégrées dans du Matrigel à facteur de croissance réduit (Corning) et étalées sur une plaque à 12 puits (TPP). Le placage des cryptes a été réalisé à dilution limitée par modification du protocole d'une étude précédente59. En bref, environ 2 000 cryptes ont été transférées dans 900 μl de Matrigel et 3 × 150 μl de gouttelettes ont été étalées dans trois puits d'une plaque à 12 puits. Ensuite, 450 µl de Matrigel ont été ajoutés à la dilution restante et l'étalement de trois gouttelettes dans trois puits a été répété. La dilution en série a été effectuée au moins quatre fois et la dilution restante finale a été étalée dans six puits. Les plaques ont été transférées dans un incubateur à 37 ° C pendant 5 à 10 min pour solidifier le Matrigel. Chaque puits a été recouvert de 1 ml de milieu de culture organoïde, dont les compositions sont décrites dans le tableau supplémentaire 6.

La culture primaire des cryptes en vrac et diluées a été maintenue pendant au moins 10 jours pour assurer la masse initiale d'organoïde d'origine à crypte unique. Après croissance des organoïdes, un seul exemple a été prélevé manuellement à l'aide d'une pipette de 200 ul sous un microscope inversé. L'organoïde prélevé a été placé dans un tube Eppendorf et dissocié à l'aide d'une seringue de 1 ml avec une aiguille de 25 G sous TrypLE Express (Gibco). Ensuite, le blocage de TrypLE par ADF+++ (Advanced DMEM/F12 avec 10 mM HEPES, 1 × GlutaMAX et 1 % de pénicilline-streptomycine) a été suivi d'une centrifugation et d'un lavage. Le culot a été placé dans un seul puits d'une plaque de 24 puits. Les plaques ont été transférées dans un incubateur humidifié à 37 °C/5 % de CO2 et le milieu a été changé tous les 2 à 3 jours. Après un passage réussi, les organoïdes clonaux ont été transférés dans une plaque à 12 puits et encore élargis. Des clones confluents ont été collectés pour l'extraction d'acide nucléique et le stock d'organoïdes.

Des organoïdes cultivés dérivés d'une seule crypte ont été récoltés et dissociés à l'aide de TrypLE Express. Après blocage de TrypLE et lavage, les organoïdes ont été remis en suspension à l'aide d'ADF+++. Les suspensions d'organoïdes ont été filtrées à travers une passoire de 40 μm (Falcon), puis les cellules individuelles ont été triées dans un tube FACS par un trieur de cellules (FACSMelody, BD Biosciences). Les cellules individuelles ont été sélectionnées en fonction des caractéristiques de diffusion vers l'avant et latérales conformément au protocole du fabricant. Les cellules triées ont été peu ensemencées avec du Matrigel réduit en facteur de croissance (500 par puits) dans des plaques à 12 puits. Des organoïdes uniques reclonalisés cultivés ont été manuellement sélectionnés et développés par les méthodes décrites ci-dessus.

Nous avons obtenu sept clones de fibroblastes pour l'analyse de méthylation. Les fibroblastes cutanés dermiques ont été cultivés par une méthode décrite précédemment4. En bref, des échantillons de peau ont été lavés avec du PBS (Gibco) et le tissu adipeux et les vaisseaux sanguins ont été retirés. Les tissus restants ont été coupés en petits morceaux (1–2 mm2) et traités avec 1 mg ml–1 solution de collagénase/dispase (Roche) à 37 °C pendant 1 h. Après traitement, la couche épidermique a été séparée de la couche dermique et cette dernière a été lavée avec du milieu DMEM contenant 20 % de FBS (Gibco) pour inhiber l'activité collagénase/dispase. Le tissu dermique a ensuite été haché en petits morceaux et cultivé dans des plaques à 24 puits recouvertes de collagène I (Corning) avec 200 µl de milieu dans un incubateur humidifié à 37 ° C avec une concentration de 5% de CO2.

Pour le séquençage Illumina, nous avons extrait les matériaux d'ADN génomique des cellules expansées par clonage, apparié le sang périphérique et les tissus tumoraux colorectaux à l'aide du kit DNeasy Blood and Tissue (Qiagen) ou du kit Allprep DNA/RNA (Qiagen) selon le protocole du fabricant. Les bibliothèques d'ADN ont été générées à l'aide des kits de préparation de bibliothèques sans PCR Truseq DNA (Illumina) et séquencées sur la plateforme Illumina HiSeq X Ten ou sur la plateforme NovaSeq 6000. Les clones colorectaux ont été séquences du génome entier avec une profondeur de couverture moyenne de 17 fois. Le sang périphérique et les tissus tumoraux colorectaux appariés ont été séquencés avec une couverture moyenne de 181 et 35 fois, respectivement. Pour le séquençage PacBio, nous avons extrait l'ADN génomique des organoïdes du côlon à l'aide du kit Circulomics Nanobind Tissue Big DNA (Circulomics) selon le protocole du fabricant. Des bibliothèques d'ADN ont été préparées à l'aide du kit de préparation de modèles express MRTbell 2.0 (PacBio) et séquencées sur une plate-forme PacBio Sequel IIe.

L'ARN total a été extrait des cellules expansées par clonage en utilisant le kit Allprep DNA/RNA (Qiagen). La bibliothèque de séquençage d'ARN total a été construite à l'aide du kit Truseq Stranded Total RNA Gold (Illumina) selon le protocole du fabricant.

L'ADN génomique a été extrait des cellules à expansion clonale en utilisant soit le kit DNeasy Blood and Tissue (Qiagen) soit le kit Allprep DNA/RNA (Qiagen). Les bibliothèques ont été préparées à partir de 200 ng d'ADN d'entrée avec de l'ADN contrôle (pUC19 méthylé CpG et ADN lambda non méthylé CpG) à l'aide du kit NEBNext Enzymatic Methylation-seq (NEB) selon le protocole du fabricant. Le séquençage apparié a été réalisé à l'aide de la plateforme NovaSeq 6000 (Illumina).

Les lectures séquencées ont été cartographiées sur le génome humain de référence (GRCh37) à l'aide de l'algorithme Burrows-Wheeler aligner (BWA)-MEM60. Les lectures dupliquées ont été supprimées soit par Picard (disponible sur http://broadinstitute.github.io/picard) soit par SAMBLASTER61. Nous avons identifié les SNV et les indels courts comme indiqué précédemment4. En bref, les substitutions de bases et les indels courts ont été appelés en utilisant Haplotypecaller2 (réf. 62) et VarScan2 (réf. 63). Pour établir des ensembles de variantes de haute confiance, nous avons supprimé les variantes présentant les caractéristiques suivantes : (1) 1 % ou plus de VAF dans le panel de la normale, (2) une proportion élevée d'indels ou de coupures (plus de 70 %), (3) trois ou plusieurs bases incompatibles dans les lectures de variantes et (4) existence fréquente de lectures d'erreur dans d'autres clones.

Nous avons identifié des variations structurelles somatiques de la même manière que dans notre précédent rapport4. Nous avons appelé des variations structurelles en utilisant DELLY64 avec des échantillons de sang appariés et des clones phylogénétiquement éloignés pour conserver les mutations embryonnaires et somatiques précoces. Nous avons ensuite écarté les variantes présentant les caractéristiques suivantes : (1) la présence dans le panel de normales, (2) un nombre insuffisant de paires de lecture de soutien (moins de dix paires de lecture sans étiquette SA de soutien ou moins de trois paires de lecture discordantes avec une étiquette SA de soutien) et (3) de nombreuses lectures discordantes dans des échantillons de sang appariés. Pour supprimer tous les événements faux positifs restants et sauver les événements faux négatifs situés à proximité des points de rupture, nous avons inspecté visuellement tous les réarrangements passant le processus de filtrage à l'aide de Integrative Genomics Viewer65.

Nous avons appelé des rétrotranspositions L1 en utilisant MELT20, TraFiC-mem16, DELLY64 et xTea66 avec des échantillons de sang appariés et des clones phylogénétiquement distants pour conserver les mutations embryonnaires et somatiques précoces. Les appels potentiels de la lignée germinale, chevauchant des événements trouvés dans des échantillons de sang non appariés, ont été supprimés. Pour confirmer la fiabilité des appels et supprimer les événements faux positifs restants, nous avons inspecté visuellement tous les candidats soL1R en nous concentrant sur deux éléments de preuve à l'appui : (1) les queues poly-A et (2) les duplications du site cible à l'aide d'Integrative Genomics Viewer65. De plus, nous avons exclu les variantes avec un faible nombre de lectures de support (moins de 10 % du total des lectures) pour exclure les artefacts potentiels. Nous avons obtenu les extrémités 5 'et 3' du segment inséré pour calculer la taille des soL1R et déterminer si l'inversion L1 ou la transduction médiée par L1 étaient combinées. Lorsque les deux extrémités de l'insert étaient cartographiées sur des brins opposés, la variante était considérée comme inversée. Lorsque le segment inséré a été cartographié sur des séquences génomiques uniques et non répétitives, où un élément L1 de pleine longueur est situé dans une région en amont de 15 kb, nous avons déterminé que l'insertion L1 était combinée à la transduction 3 'et dérivée de l'élément L1 sur la région en amont des séquences uniques. Pour calculer le VAF des soL1R, nous avons divisé le nombre de paires de lecture prenant en charge L1 par le nombre total de paires de lecture informatives autour des sites d'insertion. Une paire de lecture était considérée comme informative si la région couvrant son début et sa fin s'étendait sur le point d'arrêt d'insertion. De plus, nous avons compté deux fois le nombre de paires de lecture prenant en charge la référence lors du calcul du nombre total de paires de lecture informatives, car l'insertion est prise en charge par des paires de lecture aux deux extrémités de l'insert. Pour identifier les insertions L1 clonales dans les échantillons de cancer, nous avons établi un seuil basé sur la valeur minimale de la fraction cellulaire des soL1R partagés dans les clones colorectaux normaux, car les soL1R partagés sont considérés comme de véritables variants. Nous avons utilisé la même approche pour d'autres insertions d'éléments mobiles, notamment Alu et SVA.

Pour extraire les signatures mutationnelles de nos échantillons, nous avons utilisé trois outils différents (script interne, SigProfiler67 et processus dirichlet hiérarchiques68) afin d'obtenir un ensemble consensuel de signatures mutationnelles pour chaque type d'échantillon de côlon, y compris les cellules épithéliales normales, l'adénome et le carcinome. En bref, notre script interne est basé sur une factorisation matricielle non négative avec ou sans diverses contraintes mathématiques, et emprunte les méthodes de base du prédécesseur de SigProfiler69, telles que l'utilisation d'une mesure de stabilité et d'erreur de reconstruction pour la sélection du modèle ; cependant, il offre une plus grande flexibilité dans l'examen d'un ensemble plus large de solutions possibles, y compris celles qui peuvent être manquées par SigProfiler, et permet une approche délibérée pour déterminer le nombre de processus mutationnels présumés. En conséquence, nous avons sélectionné un sous-ensemble de signatures qui expliquent le mieux le spectre mutationnel donné : SBS1, SBS5, SBS18, SBS40, SBS88, SBS89, ID1, ID2, ID5, ID9, ID18 et IDB pour les cellules épithéliales colorectales normales ; SBS1, SBS5, SBS18, SBS36, SBS40, ID1, ID2, ID5 et ID9 pour l'adénome associé à MUTYH ; et SBS1, SBS2, SBS5, SBS13, SBS15, SBS17a, SBS17b, SBS18, SBS21, SBS36, SBS40, SBS44, SBS88, ID1, ID2, ID5, ID9, ID12, ID14 et ID18 pour les cancers colorectaux. Toutes les signatures sont attribuées à des signatures mutationnelles connues disponibles à partir de la v.3.2 de la signature mutationnelle COSMIC (disponible sur https://cancer.sanger.ac.uk/cosmic/signatures) et IDB, qui est une signature nouvellement trouvée issue de recherches antérieures sur des cellules épithéliales colorectales normales51 mais pas encore cataloguée dans la signature mutationnelle COSMIC.

Nous avons reconstruit l'arbre phylogénétique des colonies et le clone majeur du tissu cancéreux d'un individu en générant une matrice n × m représentant le génotype de n mutations de m échantillons, comme précédemment effectué4. En bref, les SNV et les indels courts de tous les échantillons d'un individu ont été fusionnés et seules les variantes avec cinq lectures cartographiées ou plus dans tous les échantillons ont été incluses pour éviter un génotypage incorrect pour une faible couverture. De plus, les variantes avec VAF < 0,25 dans tous les échantillons ont été supprimées pour exclure les artefacts de séquençage potentiels. Si le VAF de la ième mutation dans le jième échantillon était supérieur à 0,1, Mij a été attribué 1 ; sinon, 0. Les mutations partagées dans tous les échantillons ont été considérées comme des variantes de la lignée germinale et rejetées. Nous avons regroupé toutes les mutations en fonction des types d'échantillons dans lesquels elles ont été trouvées et établi la relation hiérarchique entre les groupes de mutations. En bref, si les échantillons du groupe de mutations A contiennent tous les échantillons du groupe de mutations B en plus d'autres échantillons, le groupe de mutations B est subordonné au groupe de mutations A. Nous avons alors reconstruit l'arbre phylogénétique qui explique le mieux la hiérarchie des groupes de mutations. L'arbre phylogénétique final est un arbre enraciné dans lequel chaque échantillon (colonie) est attaché à un nœud terminal de l'arbre, le nombre de mutations dans le groupe de mutation correspondant étant la longueur de la branche. Pour les échantillons de cancer, la longueur des branches représente des mutations ponctuelles clonales avec des fractions de cellules cancéreuses supérieures à 0,7. Pour convertir le temps moléculaire (nombre de mutations précoces) en générations de cellules physiques, nous avons utilisé un taux de mutation de 2,4 à 3,8 pcpcd pour les deux premières divisions cellulaires, puis de 0,7 à 1,2 pcpcd, qui ont été estimés à partir d'un travail précédent4,5.

Lors du calcul des taux de soL1R, nous avons classé les mutations ponctuelles sur les arbres phylogénétiques en quatre étapes différentes : prégastrulation, postgastrulation, vieillissement (postdéveloppement) et tumorigenèse. Les mutations partagées par plusieurs clones et détectées dans les séquences du génome entier du sang en vrac (origine mésodermique) ont été considérées comme prégastrulationnelles. Les mutations dans les branches précoces4,51,70 mais non trouvées dans les séquences du génome entier du sang en vrac ont été considérées comme post-gastrulationnelles. Toutes les autres mutations dans les clones normaux ont été considérées comme s'étant accumulées au cours du processus de vieillissement. Pour les mutations du vieillissement et de la tumorigenèse, nous avons compté celles attribuables à des processus mutationnels endogènes (SBS1 et SBS5/40 pour les SNV, ID1 et ID2 pour les indels), afin d'exclure les mutations supplémentaires dues à une exposition externe à des cancérogènes. Pour les mutations dans les tumeurs, nous avons compté les mutations ponctuelles clonales (fractions de cellules cancéreuses supérieures à 0,7) pour exclure les mutations sous-clonales. Enfin, nous avons calculé les taux de soL1R à chaque étape en divisant le nombre de soL1R par le nombre total de mutations ponctuelles endogènes. Le calcul du taux de soL1R pour la tumorigenèse n'incluait que les tumeurs non hypermutées.

Pour calculer le PAF des sources rc-L1, nous avons collecté 2 852 séquences du génome entier accessibles au public et huit internes (au total 2 860) de tissus normaux avec des informations sur l'origine ethnique connue (714 Africains, 588 Européens, 538 Sud-Asiatiques, 646 Asiatiques de l'Est et 374 Américains)52,53,54,55,56,57. Au départ, nous avons déterminé si les individus avaient des rc-L1 dans leur génome. En bref, nous avons calculé la proportion de lectures prenant en charge L1 pour L1 sans référence et la proportion de lectures avec une petite taille d'insert s'opposant à la suppression de L1 pour la référence L1, respectivement. Seuls les rc-L1 avec une proportion de 15% ou plus ont été considérés comme existant dans le génome. Nous avons ensuite calculé le PAF d'un rc-L1 spécifique comme la proportion d'individus avec le L1 dans la population.

Les lectures séquencées ont été cartographiées sur le génome de référence humain (GRCh37) à l'aide de pbmm2 (https://github.com/PacificBiosciences/pbmm2), un wrapper pour minimap2 (réf. 71). Les séquences pour les lectures prenant en charge L1 près des éléments sources ont été extraites et cartographiées sur les séquences consensus L1HS18 à l'aide de BWA60. Nous avons ensuite identifié les variations de séquence des éléments sources, y compris les mutations tronquées, et attribué chaque élément source aux sous-familles L1 correspondantes21.

Les lectures séquencées ont été traitées à l'aide de Cutadapt72 pour supprimer les séquences d'adaptateur. Les lectures coupées ont été cartographiées à l'aide de Bismark73 sur le génome combinant le génome de référence humain (GRCh37) modifié par l'incorporation de séquences consensus L1 aux sites source L1 non de référence, pUC19 et séquences d'ADN lambda. Pour un seul site CpG, le nombre de lectures supportant la méthylation (C ou G), le nombre de lectures supportant la déméthylation (A ou T) et la proportion d'anciennes lectures parmi les lectures totales (fraction de méthylation) ont été calculés à l'aide de Bismark. L'efficacité de conversion a été estimée avec des lectures cartographiées sur pUC19 méthylé CpG et ADN lambda non méthylé CpG. Pour observer l'état global de méthylation, nous avons examiné la fraction de méthylation dans des régions allant de 600 pb en amont à 600 pb en aval du site de début de transcription L1 pour chaque élément source L1. Nous nous sommes ensuite concentrés sur les sites CpG situés entre le site de début de transcription L1 et la région aval de 250 pb (+1 à +250) et avons classé chaque site CpG dans l'une des trois catégories selon la fraction de méthylation : déméthylation homozygote (fraction de méthylation inférieure à 25 %), hétérozygote (fraction de méthylation d'au moins 25 % et fraction de méthylation inférieure à 75 %) et méthylation homozygote (fraction de méthylation d'au moins 75 %). Ensuite, les scores de méthylation ont été attribués aux sites CpG (0 pour la déméthylation homozygote, 5 pour la méthylation hétérozygote et 10 pour la méthylation homozygote) et résumés en faisant la moyenne du score de tous les sites CpG sur la région +1 à +250 de l'élément L1. Enfin, nous avons comparé le score de méthylation dans chaque échantillon et chaque élément source connu pour déterminer la relation entre l'état de méthylation et l'activation de la source.

Pour l'analyse du niveau de méthylation du promoteur L1 dans les tissus en vrac, nous avons téléchargé les données de séquençage du bisulfite du génome entier de 16 tissus différents de Roadmap Epigenomics74. Les codes de feuille de route sont E050 BLD.MOB.CD34.PC.F (Mobilized_CD34_Primary_Cells_Female), E058 SKIN.PEN.FRSK.KER.03 (Penis_Foreskin_Keratinocyte_Primary_Cells_skin03), E066 LIV.ADLT (Adult_Liver), E071 BRN.HIPP.MID (Brain_Hippocampus _Moyen), E079 GI.ESO (Œsophage), E094 GI.STMC.GAST (Gastrique), E095 HRT.VENT.L (Gauche_Ventricule), E096 LNG (Poumon), E097 OVRY (Ovaire), E098 PANC (Pancréas), E100 MUS.PSOAS (Psoas_Muscle), E104 HRT.ATR.R (Droit_ Atrium), E105 HRT.VNT.R (Right_Ventricle) E106 GI.CLN.SIG (Sigmoid_Colon), E109 GI.S.INT (Small_Intestine) et E112 THYM (Thymus). Les fractions de méthylation des sites CpG dans les sources L1 référencées ont été collectées et résumées en faisant la moyenne de la fraction de tous les sites CpG sur la région +1 à +250 de l'élément L1, puis comparées au niveau moyen de méthylation du promoteur L1 dans différents tissus.

Les lectures séquencées ont été traitées à l'aide de Cutadapt72 pour supprimer les séquences d'adaptateur. Les lectures coupées ont été cartographiées sur le génome humain de référence (GRCh37) à l'aide de l'algorithme BWA-MEM60. Les lectures en double ont été supprimées par SAMBLASTER61. Pour identifier le niveau d'expression de chaque élément source L1, nous avons collecté des lectures cartographiées sur des régions jusqu'à 1 kb en aval de l'extrémité 3 'de l'élément source et calculé la valeur FPKM. Seules les lectures dans le même sens avec l'élément source ont été prises en compte. Si l'élément source était situé sur le gène et que les deux étaient sur le même brin, la valeur FPKM n'a pas été calculée car l'origine des lectures sur la région en aval est ambiguë.

Le taux d'insertion L1 a été calculé comme le nombre total de soL1Rs par fenêtre glissante de 10 Mb, avec un incrément de 5 Mb. Pour examiner la relation entre le taux d'insertion de L1 et d'autres caractéristiques génomiques à la résolution d'un seul nucléotide, nous avons utilisé une approche statistique décrite précédemment17,75. En bref, nous avons divisé le génome en quatre bacs (0-3) pour chacune des caractéristiques génomiques, y compris le temps de réplication, l'hypersensibilité à l'ADN, la marque d'histone (H3K9me3 et H3K36me3), l'expression de l'ARN et la proximité avec le motif de l'endonucléase canonique L1 (ici défini comme TTTT|R (où R est A ou G) ou Y|AAAA (où Y est C ou T)). Par comparaison des séquences de points de rupture avec le motif de l'endonucléase L1, nous avons attribué des régions génomiques avec plus de quatre (les plus dissemblables), trois, deux et moins d'un (les plus similaires) mésappariements au motif de l'endonucléase L1 dans les bacs 0, 1, 2 et 3, respectivement. Les données d'hypersensibilité à l'ADN et de marques d'histones du Roadmap Epigenomics Consortium ont été résumées en faisant la moyenne du signal d'enrichissement en plis sur huit types de cellules. Les régions génomiques avec un signal d'enrichissement en pli inférieur à 1 appartenaient au bac 0, et le reste a été divisé en trois bacs de taille égale : bac 1 (le moins enrichi), bac 2 (modérément enrichi) et bac 3 (le plus enrichi). Les données de séquençage de l'ARN ont également été obtenues à partir de Roadmap et FPKM et moyennées sur huit types de cellules. Les régions sans expression (FPKM = 0) appartiennent au bac 0 et le reste a été divisé en trois bacs de taille égale : bac 1 (le moins exprimé), bac 2 (modérément exprimé) et bac 3 (le plus exprimé). Le temps de réplication a été traité en faisant la moyenne de huit types de cellules ENCODE, et les régions génomiques ont été stratifiées en quatre régions de taille égale : le bac 0 contenait les régions avec le dernier temps de réplication et le bac 3 contenait les régions avec le premier temps de réplication. Pour chaque caractéristique, les scores d'enrichissement ont été calculés en comparant les bacs 1 à 3 au bac 0. Par conséquent, la valeur logarithmique du score d'enrichissement pour le bac 0 doit être égale à 0 et n'est pas décrite sur les tracés.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les données de séquençage du génome entier, de la méthylation de l'ADN et du transcriptome sont déposées dans les archives européennes du génome et du phénome sous le numéro d'accès. EGAS00001006213 et sont disponibles pour une utilisation générale en recherche. Le génome humain de référence GRCh37 est disponible sur https://www.ncbi.nlm.nih.gov/data-hub/genome/GCF_000001405.13.

Des scripts internes pour les analyses sont disponibles sur GitHub (https://github.com/ju-lab/colon_LINE1).

Stratton, MR, Campbell, PJ & Futreal, PA Le génome du cancer. Nature 458, 719–724 (2009).

Article CAS PubMed PubMed Central ADS Google Scholar

Behjati, S. et al. Le séquençage du génome des cellules normales révèle des lignées de développement et des processus mutationnels. Nature 513, 422–425 (2014).

Article CAS PubMed PubMed Central ADS Google Scholar

Ju, YS et al. Les mutations somatiques révèlent une dynamique cellulaire asymétrique dans l'embryon humain précoce. Nature 543, 714–718 (2017).

Article CAS PubMed PubMed Central ADS Google Scholar

Park, S. et al. Dynamique clonale dans l'embryogenèse humaine précoce déduite de la mutation somatique. Nature 597, 393–397 (2021).

Article CAS PubMed ADS Google Scholar

Coorens, THH et al. Phylogénies étendues du développement humain déduites des mutations somatiques. Nature 597, 387–392 (2021).

Article CAS PubMed ADS Google Scholar

Martincorena, I. et al. Évolution tumorale. Fardeau élevé et sélection positive omniprésente des mutations somatiques dans la peau humaine normale. Sciences 348, 880–886 (2015).

Article CAS PubMed PubMed Central ADS Google Scholar

Blokzijl, F. et al. Accumulation de mutations spécifiques aux tissus dans les cellules souches adultes humaines au cours de la vie. Nature 538, 260-264 (2016).

Article CAS PubMed PubMed Central ADS Google Scholar

Lodato, MA et al. Le vieillissement et la neurodégénérescence sont associés à des mutations accrues dans des neurones humains uniques. Sciences 359, 555-559 (2018).

Article CAS PubMed ADS Google Scholar

Lee-Six, H. et al. Dynamique des populations de sang humain normal déduite de mutations somatiques. Nature 561, 473–478 (2018).

Article CAS PubMed PubMed Central ADS Google Scholar

Moore, L. et al. Le paysage mutationnel de l'épithélium endométrial humain normal. Nature 580, 640–646 (2020).

Article CAS PubMed ADS Google Scholar

Moore, L. et al. Le paysage mutationnel des cellules somatiques et germinales humaines. Nature 597, 381–386 (2021).

Article CAS PubMed ADS Google Scholar

Ebert, P. et al. Divers génomes humains résolus par haplotype et analyse intégrée de la variation structurelle. Sciences 372, eabf7117 (2021).

Article CAS PubMed PubMed Central Google Scholar

Sanchez-Luque, FJ et al. LINE-1 évasion de la répression épigénétique chez l'homme. Mol. Cellule 75, 590–604.

Article CAS PubMed Google Scholar

Lander, ES et al. Séquençage initial et analyse du génome humain. Nature 409, 860–921 (2001).

Article CAS PubMed ADS Google Scholar

Kazazian, HH Jr Éléments mobiles : moteurs de l'évolution du génome. Sciences 303, 1626-1632 (2004).

Article CAS PubMed ADS Google Scholar

Tubio, JMC et al. L'ADN mobile dans le cancer. Transduction extensive d'ADN non répétitif médiée par la rétrotransposition L1 dans les génomes du cancer. Sciences 345, 1251343 (2014).

Article PubMed PubMed Central Google Scholar

Rodriguez-Martin, B. et al. L'analyse pan-cancer de génomes entiers identifie les réarrangements de conducteurs favorisés par la rétrotransposition LINE-1. Nat. Genet. 52, 306–319 (2020).

Article CAS PubMed PubMed Central Google Scholar

Brouha, B. et al. Les L1 chaudes représentent l'essentiel de la rétrotransposition dans la population humaine. Proc. Natl Acad. Sci. États-Unis 100, 5280–5285 (2003).

Article CAS PubMed PubMed Central ADS Google Scholar

Beck, CR et al. Activité de rétrotransposition de LINE-1 dans les génomes humains. Cellule 141, 1159-1170 (2010).

Article CAS PubMed PubMed Central Google Scholar

Gardner, EJ et al. Le Mobile Element Locator Tool (MELT) : découverte et biologie des éléments mobiles à l'échelle de la population. Génome Res. 27, 1916-1929 (2017).

Article CAS PubMed PubMed Central Google Scholar

Chuang, NT et al. Mutagenèse des génomes humains par des éléments mobiles endogènes à l'échelle d'une population. Génome Res. 31, 2225-2235 (2021).

Article PubMed PubMed Central Google Scholar

Kazazian, HH Jr et al. L'hémophilie A résultant de l'insertion de novo de séquences L1 représente un nouveau mécanisme de mutation chez l'homme. Nature 332, 164-166 (1988).

Article CAS PubMed ADS Google Scholar

Ostertag , EM & Kazazian , HH Jr Biologie des rétrotransposons mammifères L1 . Annu. Rév. Genet. 35, 501–538 (2001).

Article CAS PubMed Google Scholar

Lee, E. et al. Paysage de la rétrotransposition somatique dans les cancers humains. Sciences 337, 967–971 (2012).

Article CAS PubMed PubMed Central ADS Google Scholar

Coufal, NG et al. Rétrotransposition L1 dans les cellules progénitrices neurales humaines. Nature 460, 1127-1131 (2009).

Article CAS PubMed PubMed Central ADS Google Scholar

Baillie, JK et al. La rétrotransposition somatique modifie le paysage génétique du cerveau humain. Nature 479, 534–537 (2011).

Article CAS PubMed PubMed Central ADS Google Scholar

Évrony, GD et al. Analyse par séquençage mononeuronal de la rétrotransposition L1 et de la mutation somatique dans le cerveau humain. Cellule 151, 483–496 (2012).

Article CAS PubMed PubMed Central Google Scholar

Évrony, GD et al. Analyse de la lignée cellulaire dans le cerveau humain à l'aide de rétroéléments endogènes. Neurone 85, 49–59 (2015).

Article CAS PubMed PubMed Central Google Scholar

Upton, KR et al. Mosaïque L1 omniprésente dans les neurones de l'hippocampe. Cellule 161, 228-239 (2015).

Article CAS PubMed PubMed Central Google Scholar

Erwin, JA et al. Les régions génomiques associées à L1 sont supprimées dans les cellules somatiques du cerveau humain sain. Nat. Neurosci. 19, 1583-1591 (2016).

Article CAS PubMed PubMed Central Google Scholar

Youk, J., Kwon, HW, Kim, R. & Ju, YS Dissection de génomes unicellulaires par la technique organoïde clonale. Exp. Mol. Méd. 53, 1503-1511 (2021).

Article CAS PubMed PubMed Central Google Scholar

Alexandrov, LB et al. Processus mutationnels de type horloge dans les cellules somatiques humaines. Nat. Genet. 47, 1402–1407 (2015).

Article CAS PubMed PubMed Central Google Scholar

Alexandrov, LB et al. Le répertoire des signatures mutationnelles dans le cancer humain. Nature 578, 94-101 (2020).

Article CAS PubMed PubMed Central ADS Google Scholar

Pleguezuelos-Manzano, C. et al. Signature mutationnelle dans le cancer colorectal causé par pks génotoxique E. coli. Nature 580, 269–273 (2020).

Article CAS PubMed PubMed Central ADS Google Scholar

Stewart, C. et al. Une carte complète des polymorphismes d'insertion d'éléments mobiles chez l'homme. PLoS Genet. 7, e1002236 (2011).

Article CAS PubMed PubMed Central Google Scholar

McCarthy, MI et al. Études d'association à l'échelle du génome pour des traits complexes : consensus, incertitude et défis. Nat. Révérend Genet. 9, 356–369 (2008).

Article CAS PubMed Google Scholar

Iskow, RC et al. Mutagenèse naturelle des génomes humains par des rétrotransposons endogènes. Cellule 141, 1253-1261 (2010).

Article CAS PubMed PubMed Central Google Scholar

Consortium du projet ENCODE. Une encyclopédie intégrée des éléments d'ADN dans le génome humain. Nature 489, 57–74 (2012).

Annonces d'article Google Scholar

Jachowicz, JW et al. L'activation de LINE-1 après la fécondation régule l'accessibilité globale de la chromatine dans l'embryon précoce de la souris. Nat. Genet. 49, 1502-1510 (2017).

Article CAS PubMed Google Scholar

Messerschmidt, DM, Knowles, BB & Solter, D. Dynamique de la méthylation de l'ADN lors de la reprogrammation épigénétique dans la lignée germinale et les embryons préimplantatoires. Gènes Dév. 28, 812–828 (2014).

Article CAS PubMed PubMed Central Google Scholar

Guo, H. et al. Le paysage de la méthylation de l'ADN des embryons précoces humains. Nature 511, 606–610 (2014).

Article CAS PubMed ADS Google Scholar

Smith, ZD et al. Dynamique de méthylation de l'ADN de l'embryon préimplantatoire humain. Nature 511, 611–615 (2014).

Article CAS PubMed PubMed Central ADS Google Scholar

Mortazavi, A., Williams, BA, McCue, K., Schaeffer, L. & Wold, B. Cartographie et quantification des transcriptomes de mammifères par ARN-Seq. Nat. Méthodes 5, 621–628 (2008).

Article CAS PubMed Google Scholar

Medstrand, P., van de Lagemaat, LN & Mager, DL Distributions des rétroéléments dans le génome humain : variations associées à l'âge et à la proximité des gènes. Génome Res. 12, 1483–1495 (2002).

Article CAS PubMed PubMed Central Google Scholar

Ostertag, EM & Kazazian, HH Jr Twin priming : un mécanisme proposé pour la création d'inversions dans la rétrotransposition L1. Génome Res. 11, 2059-2065 (2001).

Article CAS PubMed PubMed Central Google Scholar

Gilbert, N., Lutz, S., Morrish, TA et Moran, JV Destins multiples des intermédiaires de rétrotransposition L1 dans des cellules humaines en culture. Mol. Cellule. Biol. 25, 7780–7795 (2005).

Article CAS PubMed PubMed Central Google Scholar

van den Hurk, JA et al. La rétrotransposition L1 peut se produire tôt dans le développement embryonnaire humain. Hum. Mol. Genet. 16, 1587-1592 (2007).

Article PubMed Google Scholar

Nguyen, H. et al. Déficient Pms2, ERCC1, Ku86, CcOI dans les anomalies du champ au cours de la progression vers le cancer du côlon. J.Vis. Exp. 28, 1931 (2010).

Google Scholar

Abascal, F. et al. Paysages de mutation somatique à résolution d'une seule molécule. Nature 593, 405–410 (2021).

Article CAS PubMed ADS Google Scholar

Ewing, AD et al. Le séquençage des nanopores permet un profilage épigénomique complet des éléments transposables. Mol. Cellule 80, 915–928 (2020).

Article CAS PubMed Google Scholar

Lee-Six, H. et al. Le paysage de la mutation somatique dans les cellules épithéliales colorectales normales. Nature 574, 532–537 (2019).

Article CAS PubMed ADS Google Scholar

Lee, JJ-K. et coll. Traçage des réarrangements oncogènes dans l'histoire mutationnelle de l'adénocarcinome pulmonaire. Cellule 177, 1842–1857 (2019).

Article CAS PubMed Google Scholar

ICGC/TCGA Pan-Cancer Analysis of Whole Genomes Consortium. Analyse pan-cancer de génomes entiers. Nature 578, 82–93 (2020).

Annonces d'article Google Scholar

1000 Genomes Project Consortium et al. Une référence mondiale pour la variation génétique humaine. Nature 526, 68–74 (2015).

Article Google Scholar

Mallick, S. et al. Le projet Simons Genome Diversity : 300 génomes de 142 populations diverses. Nature 538, 201-206 (2016).

Article CAS PubMed PubMed Central ADS Google Scholar

Bergstrom, A. et al. Aperçu de la variation génétique humaine et de l'histoire de la population à partir de 929 génomes divers. Sciences 367, eaay5012 (2020).

Article PubMed PubMed Central Google Scholar

Lorente-Galdos, B. et al. L'analyse de la séquence du génome entier d'un ensemble d'échantillons panafricains révèle un flux génétique archaïque d'une population basale éteinte d'humains modernes vers des populations subsahariennes. Génome Biol. 20, 77 (2019).

Article PubMed PubMed Central Google Scholar

Fujii, M., Matano, M., Nanki, K. & Sato, T. Génie génétique efficace des organoïdes intestinaux humains utilisant l'électroporation. Nat. Protocole 10, 1474-1485 (2015).

Article CAS PubMed Google Scholar

Jager, M. et al. Mesure de l'accumulation de mutations dans des cellules souches humaines adultes uniques par séquençage du génome entier de cultures organoïdes. Nat. Protocole 13, 59–78 (2018).

Article CAS PubMed Google Scholar

Li, H. & Durbin, R. Alignement de lecture rapide et précis avec la transformée de Burrows-Wheeler. Bioinformatique 25, 1754–1760 (2009).

Article CAS PubMed PubMed Central Google Scholar

Faust, GG & Hall, IM SAMBLASTER : marquage rapide des doublons et extraction de lecture des variantes structurelles. Bioinformatique 30, 2503-2505 (2014).

Article CAS PubMed PubMed Central Google Scholar

Van der Auwera, GA et al. Des données FastQ aux appels de variantes à haute confiance : le pipeline des meilleures pratiques du kit d'outils d'analyse du génome. Courant. Protocole Bioinformatique 43, 11.10.11–11.10.33 (2013).

Google Scholar

Koboldt, DC et al. VarScan 2 : découverte d'une mutation somatique et d'une altération du nombre de copies dans le cancer par séquençage de l'exome. Génome Res. 22, 568-576 (2012).

Article CAS PubMed PubMed Central Google Scholar

Rausch, T. et al. DELLY : découverte de variantes structurelles par analyse intégrée des lectures appariées et fractionnées. Bioinformatique 28, i333–i339 (2012).

Article CAS PubMed PubMed Central Google Scholar

Robinson, JT et al. Visionneuse de génomique intégrative. Nat. Biotechnol. 29, 24-26 (2011).

Article CAS PubMed PubMed Central Google Scholar

Chu, C. et al. Identification complète des insertions d'éléments transposables à l'aide de plusieurs technologies de séquençage. Nat. Commun. 12, 3836 (2021).

Article CAS PubMed PubMed Central ADS Google Scholar

Islam, SMA et al. Découvrir de nouvelles signatures mutationnelles par extraction de novo avec SigProfilerExtractor. Génomique cellulaire 2, 100179 (2022).

Article CAS PubMed PubMed Central Google Scholar

Teh, YW, Jordan, MI, Beal, MJ & Blei, DM Processus de Dirichlet hiérarchiques. Confiture. Statistique Assoc. 101, 1566-1581 (2006).

Article MathSciNet CAS MATH Google Scholar

Alexandrov, LB, Nik-Zainal, S., Wedge, DC, Campbell, PJ & Stratton, MR Décryptage des signatures des processus mutationnels opératoires dans le cancer humain. Cell Rep. 3, 246–259 (2013).

Article CAS PubMed PubMed Central Google Scholar

Mitchell, E. et al. Dynamique clonale de l'hématopoïèse tout au long de la vie humaine. Nature 606, 343-350 (2022).

Article CAS PubMed PubMed Central ADS Google Scholar

Li, H. Minimap2 : alignement par paires pour les séquences de nucléotides. Bioinformatique 34, 3094–3100 (2018).

Article CAS PubMed PubMed Central Google Scholar

Martin, M. Cutadapt supprime les séquences d'adaptateur des lectures de séquençage à haut débit. EMBnet J 17, 10 (2011).

Article Google Scholar

Krueger, F. & Andrews, SR Bismark : un aligneur flexible et un appelant de méthylation pour les applications Bisulfite-Seq. Bioinformatique 27, 1571-1572 (2011).

Article CAS PubMed PubMed Central Google Scholar

Kundaje, A. et al. Analyse intégrative de 111 épigénomes humains de référence. Nature 518, 317–330 (2015).

Article CAS PubMed PubMed Central Google Scholar

Supek, F. & Lehner, B. Les signatures de mutation en cluster révèlent que la réparation de l'ADN sujette aux erreurs cible les mutations des gènes actifs. Cellule 170, 534–547 (2017).

Article CAS PubMed Google Scholar

Télécharger les références

Nous remercions S. Park, R. Kim, B.-K. Koo et GJ Faulkner pour leurs commentaires et discussions. Ce travail a été soutenu par la National Research Foundation of Korea financée par le gouvernement coréen (n° NRF-2020R1A3B2078973 à YSJ et NRF-2021R1G1A1009606 à HWK) ; une subvention du MD-PhD/Medical Scientist Training Program par l'intermédiaire de l'Institut coréen de développement de l'industrie de la santé, financé par le ministère de la Santé et du Bien-être de la République de Corée ; et par la Fondation Suh Kyungbae (no. SUHF-18010082 à YSJ).

Ces auteurs ont contribué à parts égales : Chang Hyun Nam, Jeonghwan Youk

Graduate School of Medical Science and Engineering, Korea Advanced Institute of Science and Technology, Daejeon, République de Corée

Chang Hyun Nam, Jeonghwan Youk, Joonoh Lim, Soo A Oh, Hyein Won, Yunah Lee, Jinju Han et Young Seok Ju

Genome Insight, Inc., Daejeon, République de Corée

Jeonghwan Youk, Jeong Yeon Kim, Joonoh Lim et Young Seok Ju

Département de médecine interne, Hôpital universitaire national de Séoul, Séoul, République de Corée

Jeonghwan Youk et Hyun Jung Lee

Korea Institute of Science and Technology Information, Daejeon, République de Corée

Parc Jung Woo et Junehawk Lee

Département de chirurgie, Collège de médecine de l'Université nationale de Séoul, Séoul, République de Corée

Ji Won Park, Seung-Yong Jeong et Min Jung Kim

Département des sciences de la vie, Université de Séoul, Séoul, République de Corée

Dong-Sung Lee

Département d'anatomie, École de médecine, Université nationale de Kyungpook, Daegu, République de Corée

Ji gagné Oh

Département d'anatomie, Yonsei University College of Medicine, Séoul, République de Corée

Ji gagné Oh

Département de médecine nucléaire, Collège universitaire de médecine de Corée, Séoul, République de Corée

Hyun Woo Kwon

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

JY et YSJ ont conçu l'étude. JY, HWK, JYK, HW et YL ont développé l'ensemble du protocole d'expansion clonale des cellules épithéliales colorectales et mené des expériences. HJL, Ji.WP, S.-YJ et MJK ont recueilli des échantillons colorectaux et des antécédents cliniques de patients. SAO a réalisé le séquençage du génome. CHN et JY ont effectué la plupart des analyses génomiques et statistiques, avec les contributions de J.Lim, HWK et YSJ Ju.WP et J.Lee ont contribué à la gestion des données génomiques à grande échelle. D.-SL, JWO et JH ont participé à l'interprétation des données. CHN, HWK et YSJ ont rédigé le manuscrit avec les contributions de tous les auteurs. YSJ a supervisé l'ensemble de l'étude.

Correspondance avec Hyun Woo Kwon, Min Jung Kim ou Young Seok Ju.

YSJ est cofondateur et directeur général de Genome Insight, Inc. Les autres auteurs ne déclarent aucun intérêt concurrent.

Nature remercie Trevor Graham, Jose Tubio et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

a, Un diagramme de dispersion montrant la couverture moyenne de séquençage des clones et le VAF maximal des mutations somatiques. La plupart des clones ont montré leur pic VAF autour de 0,5, indiquant qu'ils ont été établis à partir d'une seule cellule fondatrice. b, Changements du nombre de copies au niveau du chromosome des 887 clones normaux. Aucune aneuploïdie significative à l'échelle du génome n'a été détectée, soutenant la stabilité génomique lors de l'expansion clonale de cellules individuelles normales. c, Un diagramme de Venn montrant le nombre de soL1R détectés par chaque outil bioinformatique. d, Un tracé schématique décrivant deux empreintes génomiques de rétrotransposition, la queue poly-A et la duplication du site cible. Corps RT, corps rétrotransposé ; TSD, duplication du site cible. e, La distribution des longueurs de sites cibles aux sites d'insertion. Les longueurs de site cible positives et négatives indiquent respectivement la duplication et la suppression du site cible. soL1R, rétrotransposition somatique L1. f, nombre de variations structurelles dans 406 clones de cellules épithéliales normales du côlon. Inversion TT, inversion queue-queue ; Inversion HH, inversion tête à tête.

a, Régression linéaire entre le nombre moyen de mutations ponctuelles endogènes dans les clones colorectaux et l'âge de prélèvement chez 19 individus. La ligne bleue représente la ligne de régression (44,6 mutations ponctuelles par an) et les zones ombrées indiquent son intervalle de confiance à 95 %. Le taux est cohérent avec le taux précédemment estimé dans le côlon (43,6 mutations par an de Lee-Six et al., Réf. 51). b,c, Comparaison du nombre moyen de soL1R par individu selon le sexe (b) et la localisation anatomique des cryptes colorectales (c) chez 19 individus avec des clones colorectaux normaux avec le test de somme des rangs de Wilcoxon bilatéral. Les boîtes à moustaches illustrent les valeurs médianes avec des intervalles interquartiles (IQR) avec des moustaches (1,5 x IQR). ns, non significatif. d–i, Relation entre le nombre de soL1R pour chaque clone colorectal et le nombre de mutations ponctuelles somatiques (d), la longueur des télomères (e), le nombre de SNV somatiques SBS1 (f, mutations en forme d'horloge par désamination de la 5-méthylcytosine), le nombre de SNV somatiques SBS5+SBS40 (g, mutations en forme d'horloge par processus inconnu), le nombre de SNV somatiques SBS18 (h, possiblement endommagé par l'oxygène réactif espèce), et le nombre de SNV SBS88 somatiques (c'est-à-dire les dommages causés par la colibactine de pks + E. coli). Aucune association évidente n'a été trouvée. j, Nombre de patchs basés sur LCM avec différents nombres de soL1R dans différents organes. LCM, microdissection par capture laser.

Les premières phylogénies des clones colorectaux et le tissu cancéreux correspondant sont présentés chez sept individus qui ont partagé des soL1R entre les clones. Les longueurs des branches sont proportionnelles au temps moléculaire mesuré par le nombre de mutations ponctuelles somatiques. Les nombres de mutations ponctuelles spécifiques à la branche sont indiqués par des nombres. Les cercles pleins aux extrémités des branches représentent les clones normaux (cercles noirs) et les clones cancéreux (cercles rouges). Les nombres dans les cercles pleins indiquent le nombre de soL1R détectés à partir des clones. Les zones ombrées indiquent les lignées somatiques avec des soL1R partagés. L'emplacement génomique des insertions soL1R partagées et la proportion de cellules sanguines portant les soL1R sont indiqués par des coordonnées génomiques et des camemberts. Les barres colorées sur le côté droit représentent la proportion de signatures mutationnelles attribuables aux mutations ponctuelles somatiques. Les diamants orange montrent des sources L1 (origine), qui ont provoqué des événements de transduction à travers les clones colorectaux.

Les phylogénies précoces des clones colorectaux et le tissu cancéreux correspondant sont présentés chez 12 individus qui n'ont pas de soL1R partagés entre les clones. Les longueurs des branches sont proportionnelles au temps moléculaire mesuré par le nombre de mutations ponctuelles somatiques. Les nombres de mutations ponctuelles spécifiques à la branche sont indiqués par des nombres. Les cercles pleins aux extrémités des branches représentent les clones normaux (cercles noirs) et les clones cancéreux (cercles rouges). Les nombres dans les cercles pleins indiquent le nombre de soL1R détectés à partir des clones. La zone ombrée indique les lignées somatiques avec une insertion Alu partagée. L'emplacement génomique de l'insertion Alu partagée et la proportion de cellules sanguines portant l'insertion Alu sont indiqués par des coordonnées génomiques et un diagramme circulaire. Les barres colorées sur le côté droit représentent la proportion de signatures mutationnelles attribuables aux mutations ponctuelles somatiques. Les diamants orange montrent des sources L1 (origine), qui ont provoqué des événements de transduction à travers les clones colorectaux.

La tumeur HC05 a un rc-L1 en 22q12.1 (milieu) qui ne se trouve pas dans la lignée germinale de HC05 (sang ; à gauche). Le rc-L1 (22q12.1-1) a provoqué un événement de transduction en 5q31.1 (à droite) dans la tumeur, suggérant une transduction secondaire à partir du nouveau rc-L1 acquis somatiquement. L'ordre des événements proposé est résumé dans le panneau inférieur gauche. SoL1R, rétrotransposition somatique L1.

La relation entre le statut de méthylation de l'ADN dans la région promotrice et le niveau d'expression de l'ARN par lecture des rc-L1, qui ont des niveaux de méthylation et d'expression variables, est décrite chez chaque individu. Il n'inclut que les cas où il y a plus de 10 clones avec des informations sur les niveaux de méthylation et d'expression pour un rc-L1 spécifique chez un individu. Le coefficient de corrélation et la valeur P du test de Pearson sont décrits. La ligne bleue représente la ligne de régression et les zones ombrées indiquent son intervalle de confiance à 95 %. FPKM, fragments par kilobase de transcription par million.

L'état de méthylation de l'ADN, les niveaux d'expression de l'ARN par lecture et les phylogénies développementales de 48 rc-L1 dans 132 clones colorectaux normaux et 7 clones de fibroblastes de 9 patients sont affichés. Il comprend 27 rc-L1 qui étaient actifs dans notre cohorte colorectale et 21 rc-L1 qui hébergent des promoteurs déméthylés dans au moins cinq clones colorectaux. Les phylogénies sont indiquées sur le côté gauche avec le nombre de mutations ponctuelles (temps moléculaire). PAF, fréquence des allèles dans la population ; FPKM, fragments par kilobase de transcrit par million ; rc-L1, L1 compétente en rétrotransposition.

a, niveau moyen de méthylation de l'ADN du promoteur L1 dans différents tissus d'ENCODE. Parmi les 30 rc-L1 décrits sur la figure 3b, seuls 12 rc-L1 avec suffisamment de lectures dans tous les tissus ont été sélectionnés. b, Profils de méthylation des régions en amont et en aval de 100 kb de 6 rc-L1 de référence avec des niveaux de méthylation variables dans les clones colorectaux. La région pour rc-L1 est mise en surbrillance avec des cases jaunes. Les coordonnées génomiques et l'ordre des sites CpG sont représentés dans le panneau supérieur. Le panneau du milieu montre la fraction de CpG méthylé dans les clones colorectaux avec des promoteurs ouverts (orange) et fermés (bleu). Le panneau du bas montre les différences dans la fraction de CpG méthylé représentée dans le panneau du milieu. mCpG, CpG méthylé. c, Un diagramme de dispersion montrant les niveaux de méthylation à l'échelle du génome des clones colorectaux normaux chez chaque individu.

a, distribution à l'échelle du génome des sites cibles soL1R dans les clones colorectaux normaux et 19 cancers colorectaux appariés. Les barres représentent le nombre d'insertions L1 dans une fenêtre glissante de 10 Mo avec un pas de 5 Mo. b, Association entre le taux d'insertion L1 et diverses caractéristiques génomiques. Les points représentent la valeur logarithmique des scores d'enrichissement calculés en comparant les bacs 1 à 3 au bac 0 pour chaque caractéristique. motif L1 EN, motif cible de l'endonucléase L1 ; DHS, site d'hypersensibilité à la DNase I. c, Distribution des distances au gène le plus proche des sites d'insertion L1 et ceux des sites aléatoires. d – f, distribution des distances aux mutations ponctuelles les plus proches (d), niveau d'expression génique (e) et fraction de méthylation de la région voisine (f) dans les clones colorectaux avec et sans insertions L1. TPM, transcriptions par million. g, Un exemple d'un soL1R co-inséré avec un gène exprimé à proximité du site d'insertion. Un mécanisme suggestif est montré dans le panneau inférieur. SoL1R, rétrotransposition somatique L1 ; TSD, duplication du site cible ; Corps RT, corps rétrotransposé. h, Un exemple d'un clone avec deux événements de transduction à différents sites cibles génomiques mais avec la même longueur des séquences uniques. Un mécanisme suggestif est montré dans le panneau inférieur.

a, Le taux de soL1R est accéléré au cours de la tumorigenèse dans les lignées colorectales. EPM, mutation ponctuelle endogène. b, Distribution de la taille d'insertion L1 dans 406 clones colorectaux normaux et 19 cancers colorectaux appariés. c, Proportion d'événements soL1Rs avec variations de la tête dans 406 clones colorectaux normaux et 19 cancers colorectaux appariés. d – g, Le nombre de soL1R entre les cancers colorectaux avec ou sans mutations inactivatrices de TP53 (à gauche), l'instabilité microsatellite (au milieu) et l'instabilité génomique (instabilité chromosomique ; à droite). Les numéros d'échantillons sont indiqués entre parenthèses. Les valeurs P du test t bilatéral (gauche, milieu) et de la régression linéaire (droite) ont été affichées. Les boîtes à moustaches illustrent les valeurs médianes avec des intervalles interquartiles (IQR) avec des moustaches (1,5 x IQR). Les lignes bleues représentent les lignes de régression et les zones ombrées indiquent leurs intervalles de confiance à 95 %. Les valeurs P de la régression multivariée bilatérale étaient représentées dans l'espace de droite. ns, non significatif. d. Dans 19 tissus de cancer colorectal appariés. e. Dans 19 tissus de cancer colorectal appariés et 52 tissus de cancer colorectal PCAWG. F. Dans 19 tissus cancéreux colorectaux appariés et 4 types de cancer (adénocarcinomes colorectaux, adénocarcinomes œsophagiens, carcinomes épidermoïdes du poumon et carcinomes épidermoïdes de la tête et du cou) montrant une charge de soL1R plus élevée parmi 40 types histologiques dans le PCAWG. g. Dans 19 tissus de cancer colorectal appariés avec tous les échantillons PCAWG de la liste blanche.

La relation entre la charge de soL1R et l'instabilité classique du génome, telle que les mutations inactivant TP53 et l'instabilité chromosomique, a été analysée dans les échantillons de la liste blanche du PCAWG (n = 2 677) et 19 cancers colorectaux appariés dans cette étude. Les types de cancer comptant moins de 10 cas n'ont pas été pris en compte. a, mutations somatiques inactivant TP53 et nombre d'événements soL1R. Les boîtes à moustaches illustrent les valeurs médianes avec des intervalles interquartiles (IQR) avec des moustaches (1,5 x IQR). Le nombre de cas dans chaque type d'histologie a été indiqué entre parenthèses. Les valeurs P du test t bilatéral ont été affichées. NA, non disponible. b, Régression linéaire entre l'instabilité chromosomique (réarrangements génomiques) et le nombre d'événements soL1R dans chaque type de cancer. Les lignes bleues représentent les lignes de régression et les zones ombrées indiquent leurs intervalles de confiance à 95 %. Les valeurs R au carré et P de la régression linéaire étaient représentées dans chaque panneau.

Ce fichier contient la discussion supplémentaire 1 (événements potentiels de rétrotransposition de L1 associés à la culture dans les clones), la discussion supplémentaire 2 (techniques génomiques pour la détection sensible des soL1R), la discussion supplémentaire 3 (panorama de la méthylation du promoteur et l'expression de lecture des rc-L1), des références supplémentaires, des figures supplémentaires. 1–5 et légendes des tableaux supplémentaires 1–6.

Caractéristiques démographiques et mutationnelles des échantillons. Le tableau présente des informations sur chaque échantillon de l'étude, y compris l'âge et le sexe des patients, l'emplacement anatomique où les échantillons ont été obtenus et la charge mutationnelle et les signatures pour chaque échantillon.

Annotation des rétrotranspositions somatiques identifiées dans cette étude. Le tableau présente des informations détaillées sur chaque événement de rétrotransposition somatique identifié dans l'étude, y compris les coordonnées génomiques, l'orientation du brin, la taille et le type d'insertion et le nombre de lectures de support pour chaque insertion.

Annotation des rétrotranspositions somatiques identifiées dans les patchs à base de LCM. Le tableau présente des informations détaillées sur chaque événement de rétrotransposition somatique identifié dans les patchs basés sur LCM, y compris les coordonnées génomiques, l'orientation des brins, la taille et le type d'insertion et le nombre de lectures de support pour chaque insertion.

Liste des éléments source avec caractéristiques. Le tableau contient des informations sur 276 rc-L1 analysés dans l'étude, y compris les coordonnées génomiques, le cytobande, l'orientation des brins, la fréquence des allèles de la population, les informations sur la sous-famille L1 et une liste des mutations tronquantes. De plus, le tableau montre le nombre d'événements de transduction de chaque rc-L1 dans chaque échantillon colorectal examiné dans l'étude.

Association des caractéristiques de soL1R et d'instabilité du génome dans le cancer. Le tableau présente des informations sur les échantillons de cancer colorectal analysés dans l'étude et les cancers inscrits sur la liste blanche du PCAWG, y compris les informations histologiques, le nombre de rétrotranspositions somatiques L1 et les variations structurelles, si les échantillons hébergent des mutations inactivant TP53 ou une instabilité microsatellite et une liste des mutations pilotes canoniques.

Composition de milieu de culture organoïde pour cellules épithéliales colorectales. Le tableau présente la composition du milieu de culture organoïde pour les cellules épithéliales colorectales.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Nam, CH, Youk, J., Kim, JY et al. Rétrotransposition somatique généralisée de L1 dans l'épithélium colorectal normal. Nature 617, 540–547 (2023). https://doi.org/10.1038/s41586-023-06046-z

Télécharger la citation

Reçu : 18 mai 2022

Accepté : 04 avril 2023

Publié: 10 mai 2023

Date d'émission : 18 mai 2023

DOI : https://doi.org/10.1038/s41586-023-06046-z

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.