La séquence d'ADN et les modificateurs de chromatine coopèrent pour conférer une bistabilité épigénétique aux régions de contrôle d'empreinte

Nouvelles

MaisonMaison / Nouvelles / La séquence d'ADN et les modificateurs de chromatine coopèrent pour conférer une bistabilité épigénétique aux régions de contrôle d'empreinte

Oct 22, 2023

La séquence d'ADN et les modificateurs de chromatine coopèrent pour conférer une bistabilité épigénétique aux régions de contrôle d'empreinte

Nature Genetics volume 54,

Nature Genetics volume 54, pages 1702–1710 (2022)Citer cet article

14 000 accès

2 Citations

53 Altmétrique

Détails des métriques

L'empreinte génomique est régulée par la méthylation de l'ADN spécifique aux parents des régions de contrôle de l'empreinte (ICR). Malgré une séquence d'ADN identique, les ICR peuvent exister dans deux états épigénétiques distincts qui sont mémorisés tout au long de divisions cellulaires illimitées et réinitialisés lors de la formation de la lignée germinale. Ici, nous étudions systématiquement les déterminants génétiques et épigénétiques de cette bistabilité épigénétique. Par intégration itérative des ICR et des séquences d'ADN associées à un emplacement ectopique dans le génome de la souris, nous identifions d'abord les caractéristiques de la séquence d'ADN nécessaires au maintien des états épigénétiques dans les cellules souches embryonnaires. Les propriétés régulatrices autonomes des ICR nous ont en outre permis de créer des reporters sensibles à la méthylation de l'ADN et de cribler les composants clés impliqués dans la régulation de leur mémoire épigénétique. Outre DNMT1, UHRF1 et ZFP57, nous identifions des facteurs qui empêchent le passage des états méthylés aux états non méthylés et montrons que deux de ces candidats, ATF7IP et ZMYM2, sont importants pour la stabilité de la méthylation de l'ADN et de H3K9 au niveau des ICR dans les cellules souches embryonnaires.

La régulation épigénétique de l'activité des gènes dépend de plusieurs couches de modifications de la chromatine qui sont maintenues pendant la réplication de l'ADN1,2. Par définition, ces mécanismes épigénétiques agissent indépendamment de la séquence d'ADN au niveau des sites génomiques qu'ils occupent. Cependant, plusieurs études ont mis en évidence une contribution de la séquence d'ADN à la régulation et au maintien des modifications de la chromatine, empêchant une distinction claire entre le contrôle épigénétique et génétique de l'activité des gènes3,4,5,6,7,8. L'empreinte génomique est un phénomène épigénétique, où les marques de méthylation de l'ADN sur les ICR maternels ou paternels dictent l'activité parentale spécifique des transcrits en cis9,10,11. Les ICR héritent des marques de méthylation de l'ADN spécifiques aux parents de l'ovocyte ou du sperme, qui sont ensuite propagées dans tous les tissus somatiques de la génération suivante9. L'héritage d'états épigénétiques différentiels sur les chromosomes parentaux, malgré une séquence d'ADN identique, une localisation chromosomique identique et une exposition aux mêmes facteurs de régulation dans le noyau, fait des ICR un excellent modèle pour étudier la contribution individuelle de la séquence d'ADN et des modifications de la chromatine à la mémoire épigénétique.

Plusieurs facteurs et mécanismes ont été identifiés qui régulent le maintien de la méthylation de l'ADN aux ICR. Une fois les marques de méthylation déposées dans la lignée germinale12, la méthyltransférase de maintenance DNMT1 et sa protéine accessoire UHRF1 sont responsables du maintien de la méthylation lors de la réplication de l'ADN13. De plus, plusieurs facteurs ont été identifiés pour réguler H3K9me3 au niveau des ICR méthylés par l'ADN, notamment SETDB1, KAP1 et G9A14,15,16. Surtout. le facteur à doigt de zinc KRAB ZFP57 se lie à la séquence d'ADN hexanucléotidique méthylée TGCmCGC et recrute KAP1 et d'autres facteurs associés pour établir une rétroaction entre la méthylation de l'ADN et H3K9me3 aux ICR16,17. En effet, la liaison de ZFP57 et le recrutement de KAP1 sont des étapes cruciales dans la régulation des empreintes, car l'inactivation (KO) de Zfp57 chez la souris entraîne la perte de presque toutes les empreintes et la létalité embryonnaire18,19,20, et ZFP57 est nécessaire au maintien de la méthylation de l'ADN et de H3K9me3 aux ICR dans les systèmes cellulaires16,18,21.

Bien que les facteurs qui contrôlent la méthylation de l'ADN et des histones au niveau des ICR aient été largement étudiés, les propriétés de la séquence d'ADN des ICR n'ont pas été explorées en détail. De plus, on ne sait pas non plus si d'autres acteurs clés contribuent au maintien épigénétique des ICR. Par intégration itérative des séquences d'ADN ICR au même site génomique dans les cellules souches embryonnaires de souris (mESC), nous montrons que les ICR sont des éléments génétiques autonomes qui peuvent récapituler les états épigénétiques observés aux emplacements endogènes. En utilisant cette configuration, nous montrons qu'en préréglant la méthylation de l'ADN, nous pouvons établir deux états épigénétiques opposés qui sont fidèlement propagés par l'ICR ectopique. Ce commutateur dépendant de la méthylation de l'ADN est unique aux ICR. Des intégrations systématiques d'ICR variants et synthétiques nous ont permis d'identifier les exigences de séquence nécessaires et suffisantes pour ce comportement de type interrupteur. De plus, en utilisant les ICR ectopiques comme rapporteurs sensibles à la méthylation de l'ADN dans les cribles génétiques de perte de fonction, nous confirmons que DNMT1, UHRF1 et ZFP57 sont les principaux régulateurs épigénétiques de l'empreinte génomique. De plus, nous identifions ATF7IP et ZMYM2 comme des facteurs impliqués dans la régulation du maintien des états épigénétiques aux ICR.

Nous avons émis l'hypothèse que la séquence d'ADN des ICR devrait contenir suffisamment d'informations pour établir et maintenir les états épigénétiques distincts observés sur les allèles parentaux (Extended Data Fig. 1a). Nous avons sélectionné quatre ICR parmi les groupes d'empreintes Airn, Kcnq1ot1, Zrsr1 et H19 et utilisé l'échange de cassette médié par la recombinase (RMCE3) pour les intégrer individuellement dans le génome des mESC (Fig. 1a). Pour imiter les états différentiels de méthylation de l'ADN des ICR, nous avons effectué une RMCE en parallèle pour les ICR non méthylés et les ICR préméthylés par la CpG méthyltransférase bactérienne M.SssI (Fig. 1a et Extended Data Fig. 1b). Comme séquence de contrôle, nous avons utilisé l'Igf2r DMR (région différentiellement méthylée), un promoteur qui acquiert la méthylation différentielle de l'ADN uniquement lors de la différenciation22. De plus, nous avons inclus un ensemble de promoteurs de gènes inactifs (Hes3, Tcl1 et Syt1), dont il avait été précédemment démontré qu'ils étaient protégés de la méthylation de novo de l'ADN lorsqu'ils étaient intégrés au même site RMCE3 (Fig. 1b).

a, Aperçu expérimental de la génération de lignées cellulaires stables avec des plasmides donneurs méthylés ou non méthylés à l'aide de RMCE. b, Résumé tabulaire de l'analyse de la méthylation pour tous les ICR intégrés, DMR de contrôle et séquences promotrices. La méthylation endogène (Endog. meth.) décrit l'état de méthylation du locus endogène dans les mESC. Mat., méthylation maternelle ; Pat., méthylation paternelle ; n/a, pas de méthylation. La taille, la densité de CpG (en 100 bp) et la teneur en GC (%) sont indiquées. Les pourcentages totaux de méthylation des séquences d'ADN intégrées via RMCE mesurés par bsPCR sont indiqués pour des expériences utilisant des plasmides donneurs non méthylés (- M.SssI) et préméthylés (+ M.SssI). n/d, non déterminé. Les astérisques indiquent les mesures obtenues de Lienert et al.3. c, Analyse détaillée de la méthylation pour l'ICR Airn ectopique. Les positions CpG dans la séquence Airn ICR sont indiquées par des lignes verticales noires. Les régions amplifiées pour la bsPCR sont représentées et les mesures d'une seule molécule sont représentées par des cercles noirs correspondant aux dinucléotides CpG méthylés et des cercles blancs aux dinucléotides CpG non méthylés. Les positions CpG marquées d'un « x » correspondent à des nucléotides non alignés en raison d'erreurs de séquençage. Les valeurs de méthylation agrégées sont affichées sous forme de lignes verticales codées par couleur à la position CpG respective. d, Mesures ChIP-qPCR au niveau des ICR ectopiques et endogènes par rapport à un site intergénique. H3K9me3, bleu ; H3K4me2, orange. Les points de données indiquent les répliques techniques individuelles.

Après une intégration réussie, nous avons mesuré la méthylation de l'ADN au site RMCE par PCR de conversion au bisulfite (bsPCR). Les quatre ICR ont conservé leur statut préétabli de méthylation de l'ADN au niveau du site ectopique, bien que dans certains cas, une méthylation de novo mineure au niveau des ICR non méthylés ait été observée (Fig. 1b, c et Extended Data Fig. 1c – e). En revanche, le maintien de la méthylation préétablie de l'ADN n'a pas été observé pour le DMR Igf2r et les éléments promoteurs de contrôle (Fig.1b et Extended Data Fig. 1f – i). Les états différentiels de méthylation de l'ADN au niveau de l'Airn ICR ectopique ont été maintenus de manière stable après une culture prolongée de mESC pendant plus de 20 passages, ou lors de l'intégration à une position RMCE différente dans le génome, et également après la différenciation in vitro des mESC en progéniteurs neuronaux (Extended Data Fig. 2a – c). De plus, la méthylation de l'ADN de l'ICR Airn ectopique était toujours conservée à des niveaux élevés après la culture de mESC dans un milieu 2i pendant 10 jours, malgré la réduction globale de la 5-méthylcytosine résultant de l'acquisition d'un état de cellule souche naïve23,24,25,26 (Extended Data Fig. 2a, d).

Outre la méthylation de l'ADN, les ICR endogènes présentent en outre des modifications différentielles des histones (Extended Data Fig. 1a), l'ICR méthylé étant décoré par H3K9me3 et l'ICR non méthylé par H3K4me2 (réf. 14, 22, 27). Nous avons effectué une PCR quantitative (qPCR) par immunoprécipitation de la chromatine (ChIP) pour H3K9me3 et H3K4me2 et comparé l'enrichissement de ces marques aux intégrations RMCE des ICR Airn et Kcnq1ot1 avec leurs homologues endogènes (Fig. 1d). Les ICR non méthylés au site RMCE ont montré un manque de H3K9me3 et une augmentation de H3K4me2, tandis que les ICR préméthylés ont révélé le schéma opposé, avec une augmentation de H3K9me3 et une absence de H3K4me2 (Fig. 1d). Des études antérieures ont identifié la protéine ZFP57 KRAB-Znf spécifique à la méthylation de l'ADN comme étant nécessaire au maintien de la méthylation de l'ADN et de H3K9me3 aux ICR endogènes16,18,21. Cette régulation est récapitulée au niveau de l'ICR ectopique, car la suppression CRISPR-Cas9 de Zfp57 dans les mESC entraîne une perte rapide et complète de la méthylation de l'ADN sur les sites ectopiques et endogènes (Extended Data Fig. 2e).

Nous avons entrepris de tester si la séquence d'ADN ICR est nécessaire pour la mémoire épigénétique. Tout d'abord, nous avons cherché à identifier si des fragments ICR plus petits mémoriseraient également efficacement des schémas de méthylation d'ADN prédéfinis et avons répété les mêmes expériences avec quatre fragments plus petits de l'Airn ICR (Fig. 2a et Données étendues Fig. 2f). Aucun des fragments testés n'a pu récapituler fidèlement le maintien différentiel de la méthylation. La même chose a été observée pour l'ICR H19 paternellement méthylé (Extended Data Fig. 2g, h). Des études antérieures portant sur les régions régulatrices non-ICR (promoteurs, îlots CpG ou activateurs) ont révélé que la densité de CpG, la teneur en GC et/ou la séquence nucléotidique peuvent influencer l'établissement des schémas de méthylation de l'ADN3,4,5,6. Sur la base de leur densité de CpG et de leur teneur en GC, les ICR testés ici se situent dans la gamme d'éléments génomiques chevauchant des promoteurs d'îlots CpG non méthylés (données étendues Fig. 3a). Pour déterminer si la densité de CpG et la teneur en GC des ICR contribuent au maintien des états méthylés et non méthylés, nous avons sélectionné quatre régions génomiques très similaires à l'Airn ICR en termes de taille, de GC%, de nombre et de distribution de CpG (Extended Data Fig. 3b – d). Ces éléments `` Airn-like '' n'ont pas réussi à maintenir la méthylation différentielle et ont adopté un état hypométhylé comme leur homologue endogène, ce qui suggère que la longueur de la séquence d'ADN, la densité de CpG et la teneur en GC ne sont pas suffisantes pour établir deux états épigénétiques distincts (Extended Data Fig. 3e, f).

a, Résumé tabulaire de l'analyse de méthylation pour tous les fragments Airn-ICR indiqués schématiquement à gauche. De plus, la longueur des fragments, les densités de CpG et la teneur en GC sont indiquées pour chaque fragment. Même représentation que sur la Fig. 1b. b, analyse de méthylation pour l'ICR Airn mélangé. Même représentation que sur la Fig. 1c. Les positions CpG marquées d'un « x » correspondent à des nucléotides non alignés en raison d'erreurs de séquençage. c, Mesures ChIP-qPCR à l'ICR Airn mélangé sur le site ectopique par rapport à l'ICR Airn endogène. Les points de données montrent des répétitions techniques individuelles. H3K9me3, bleu ; H3K4me2, orange. d, analyse de méthylation pour l'ICR Airn mélangé avec des sites de liaison ZFP57 reconstitués. Même représentation que dans le panneau b. e, L'analyse de méthylation pour l'ICR Airn mélangé intégré aux cellules d'érythroleucémie murine (MEL) montre le maintien de la méthylation de l'ADN.

Pour mieux distinguer l'exigence directe de la séquence d'ADN de la teneur en CpG et GC, nous avons généré un élément d'ADN synthétique basé sur la séquence Airn ICR, où nous avons permuté les séquences d'ADN inter-CpG jusqu'à ce qu'un décalage de 78% soit atteint (Extended Data Fig. 4a, b). Il est important de noter que la permutation de la séquence d'origine a conservé le contenu GC local ainsi que le nombre et la position des CpG d'origine. Ce remplacement a supprimé toutes les informations de séquence d'ADN inter-CpG, nous permettant de distinguer la contribution de la séquence d'ADN de la fréquence et de la distribution des CpG. Nous avons répété les expériences RMCE avec cet Airn ICR «mélangé» et avons observé qu'il ne parvenait pas à maintenir l'état épigénétique prédéfini (Fig. 2b). Dans les deux cas, la méthylation de l'ADN a atteint une valeur intermédiaire de 40,3 % pour l'insertion non méthylée et de 23,5 % pour l'insertion préméthylée, avec des schémas de méthylation désordonnés (Fig. 2b). Les altérations de la séquence ont en outre conduit à un établissement réduit des H3K9me3 et H3K4me2 au site RMCE, indépendamment de l'état de méthylation prédéfini (Fig. 2c).

Le brassage de la séquence d'ADN inter-CpG dans l'Airn ICR a perturbé tous les motifs de liaison de ZFP57, ce qui pourrait expliquer le manque de maintenance observé, en accord avec une évaluation in silico de la liaison de ZFP57 à la séquence Airn ICR de type sauvage et mélangée à l'aide de BPNet28 (Données étendues Fig. 4c, d). En conséquence, nous avons voulu étudier si les motifs ZFP57 sont suffisants pour le maintien de l'état épigénétique. Par conséquent, nous avons restauré les motifs de liaison ZFP57 dans l'ICR mélangé (Extended Data Fig. 4e) et introduit cet élément d'ADN méthylé et non méthylé sur le site RMCE dans les mESC. Bien que la version non méthylée n'ait pas réussi à maintenir l'état hypométhylé, l'ICR préméthylé a pu maintenir un état complètement hyperméthylé (Fig. 2d). Compte tenu de ces observations, nous nous sommes demandé si l'exigence de sites de liaison ZFP57 dépendait du contexte cellulaire, d'autant plus que l'expression du gène Zfp57 est spécifique au tissu18,29. Par conséquent, nous avons introduit l'Airn ICR mélangé dans des cellules d'érythroleucémie de souris (MEL) compétentes pour le RMCE et effectué un séquençage ciblé au bisulfite. Les ICR mélangés méthylés et non méthylés ont conservé les schémas de méthylation de l'ADN prédéfinis (Fig. 2e), indiquant que dans les cellules MEL, la teneur en CpG est suffisante pour la mémoire des états de méthylation de l'ADN.

Les ICR endogènes sont des éléments cis-régulateurs qui dictent l'expression allélique des transcrits voisins en fonction de leur état de méthylation de l'ADN9. Nous avons d'abord voulu tester si les séquences ICR peuvent réduire au silence trois constructions rapporteurs différentes en présence de méthylation de l'ADN lorsqu'elles sont intégrées ensemble au site RMCE (Fig. 3a et Données étendues Fig. 5a). Nous avons sélectionné trois promoteurs constitutifs couramment utilisés (pCAGGS, hEF1alpha et hPGK) et montré qu'ils peuvent maintenir l'expression d'un rapporteur GFP au site d'intégration RMCE en l'absence d'ICR (Extended Data Fig. 5b). Ensuite, nous avons mesuré la capacité de trois ICR méthylés (Airn, Kcnq1ot1 et Peg10) à réprimer de manière stable ces promoteurs au même site d'intégration RMCE (Fig. 3b). Toutes les séquences ICR testées ont montré une répression stable en combinaison avec les promoteurs Ef1alpha et hPGK. En revanche, les promoteurs méthylés sans ICR, ou en combinaison avec le promoteur Dazl, qui est connu pour être régulé de manière dépendante de la méthylation de l'ADN31, n'ont pas pu maintenir un état réprimé (Fig. 3b). Le promoteur synthétique pCAGGS a donné des résultats variables, en fonction de l'ICR utilisé, suggérant que la force de ce promoteur composite peut surmonter la répression épigénétique induite par certains ICR (Fig. 3b). La répression dépendante de la méthylation de l'ADN a été maintenue sur de plus longues périodes, telle que mesurée par l'activité GFP dans plusieurs populations dérivées par clonage après 16, 23 et 30 jours (données étendues Fig. 5c). La même répression dépendante de l'ICR méthylé a été observée pour l'ICR H19 paternellement méthylé (Extended Data Fig. 5d).

a, Aperçu schématique et expérimental de la génération de lignées cellulaires rapporteurs à l'aide de RMCE. b, analyse par cytométrie en flux de l'expression de la GFP 12 jours après la transfection avec différentes combinaisons ICR/promoteur préméthylées. Chaque point de données montre le pourcentage de mesure de cellules GFP-positives à partir d'une population de cellules dérivées par clonage. c, L'analyse par cytométrie en flux indique le pourcentage de cellules GFP-positives dans des lignées cellulaires indépendantes récupérant des plasmides donneurs RMCE méthylés ou non méthylés contenant l'ICR Airn mélangé de type sauvage ou l'ICR Airn mélangé avec des sites ZFP57 reconstitués en combinaison avec le promoteur pEF1a. L'activité GFP a été mesurée à deux moments consécutifs (16 et 23 jours). d, analyse par cytométrie en flux de trois clones indépendants avec le rapporteur Airn-CAG méthylé après 2 jours de traitement avec l'inhibiteur de méthylation de l'ADN GSK-3484862 et des témoins non traités et DMSO. Les mesures ont été répétées 7 jours après l'élimination du médicament pour tester la réversion du silence du rapporteur. Même représentation que dans le panneau b.

Cette configuration nous a permis de tester la contribution de la méthylation et de la séquence de l'ADN sur le potentiel de silençage des ICR. Pour cela, nous avons utilisé la construction de rapporteur Airn-pEF1a-GFP qui a montré un maintien stable de l'expression de la GFP lorsqu'elle est insérée non méthylée et un silence stable lorsqu'elle est insérée méthylée (Fig. 3c). Lorsque nous avons remplacé l'Airn ICR par la version mélangée d'Airn, nous avons observé une perte de silence dans la plupart des clones mesurés déjà après 16 jours et même plus après une culture prolongée, ce qui suggère que le silence dépendant de la méthylation en cis nécessite une séquence ICR intacte (Fig. 3c). Enfin, nous avons introduit la séquence Airn mélangée contenant des sites de liaison ZFP57 reconstitués. Bien que la version non méthylée ait entraîné une perte stochastique d'activité transcriptionnelle, la construction méthylée a donné lieu à une répression stable du promoteur voisin pendant plusieurs générations, ce qui indique que la liaison de ZFP57 est non seulement nécessaire au maintien de la mémoire épigénétique aux ICR, mais également suffisante pour le silençage épigénétique en cis (Fig. 3c).

Pour tester si la méthylation de l'ADN des ICR est nécessaire à la répression du promoteur voisin, nous avons défié les lignées cellulaires rapporteurs établies en les cultivant dans des milieux 2i et 2i + vitamine C. Les deux conditions réduisent les niveaux de méthylation de l'ADN à l'échelle du génome23,24,25, tandis que l'ajout de vitamine C entraîne une élimination supplémentaire de la méthylation de l'ADN des ICR et des éléments répétitifs26,32. La répression de la GFP a été maintenue dans le milieu 2i ; cependant, la répression a été progressivement perdue en présence de 2i + vitamine C (Extended Data Fig. 5e – g). Pour tester davantage la dépendance à la méthylation de l'ADN pour maintenir l'état réprimé au niveau des reporters ICR, nous avons effectué des expériences KO des facteurs généraux de maintien de la méthylation de l'ADN Uhrf1 et Dnmt1 (réf. 33). Comme prévu, l'élimination de la méthylation de l'ADN dans ces cellules KO a entraîné une réactivation du rapporteur ICR dans les 7 jours (Extended Data Fig. 6a, b). Le faible pourcentage de cellules qui présentent une réactivation de la GFP dans ces tests est dû à une faible efficacité KO dans le pool de cellules ciblées par CRISPR. Par conséquent, nous avons cultivé le rapporteur Airn-ICR en présence de l'inhibiteur de DNMT1 GSK-3484862 (réf. 34) pendant 2 jours. Nous avons observé une réactivation complète avec plus de 95% des cellules exprimant la GFP (Fig. 3d et Extended Data Fig. 6c). L'utilisation de cet inhibiteur de DNMT1 nous a en outre permis de tester si la réactivation est réversible ; par conséquent, nous avons retiré GSK-3484862 du milieu et poursuivi la culture pendant 7 jours supplémentaires après le lavage (Fig. 3d et Extended Data Fig. 6c). Nous n'avons observé aucun resilençage des reporters activés, ce qui indique qu'une fois l'ICR allumé, il ne peut pas revenir à un état silencieux.

Après avoir établi plusieurs lignées cellulaires rapporteurs spécifiques à l'ICR, nous voulions dépister les protéines nécessaires au maintien des états répressifs de l'ICR. Nous avons d'abord établi le flux de travail de criblage CRISPR en utilisant une bibliothèque ciblée contre 1 051 facteurs liés à la chromatine avec 6 204 ARN guides (bibliothèque ChromMM) et une bibliothèque de contrôle avec 500 guides non ciblés dans la lignée cellulaire reporter pCAGGS-Airn (Fig. 4a et Extended Data Fig. 7a), et nous avons déterminé le moment pour collecter les clones positifs (Extended Data Fig. 7b). Nous avons effectué le criblage dans trois lignées de rapporteurs ICR méthylés (Airn, Kcnq1ot1 et Peg10) et collecté des cellules GFP-positives après 8 jours et répété le criblage pour Airn, Kcnq1ot1 dans des conditions de milieu 2i sensibilisé (données étendues Fig. 7c, d).

a, Aperçu expérimental des écrans CRISPR ciblés utilisant plusieurs reporters ICR préméthylés. La stratégie de déclenchement est décrite dans Extended Data Fig. 7a et Methods. b, Vue d'ensemble des résultats des écrans CRISPR dans trois lignées cellulaires reporters ICR cultivées dans des conditions sériques. Les points bleus indiquent les gènes avec une valeur P <0,01 calculée à l'aide de MAGeCK RRA (agrégation de rang robuste). Les lignes pointillées indiquent le seuil de valeur P à 0,05. c, Heatmap montrant les candidats potentiels de tous les écrans CRISPR. La couleur indique le changement de pli logarithmique résumé dans tous les guides pour un gène donné, tel que déterminé par MAGeCK. Les enrichissements ont été calculés en combinant tous les réplicats pour une comparaison, en utilisant la fraction enrichie en GFP contre le pool de cellules non triées. L'astérisque indique P < 0,05 en utilisant l'agrégation de rang robuste MAGeCK. Voir le panneau correspondant b et les données étendues Fig. 8b,d. Les valeurs P exactes peuvent être trouvées dans le tableau supplémentaire 1.

Comme prévu, les trois témoins positifs Zfp57, Uhrf1 et Dnmt1 ont été les meilleurs résultats dans tous les écrans (Fig. 4b, c, données étendues Fig. 8a – c et tableau supplémentaire 1). De plus, d'autres facteurs associés à l'hétérochromatine comme Cbx1, Cbx5, Atrx, Daxx et Setdb1 ont été enrichis dans la fraction GFP-positive. La liste des occurrences de haute confiance qui ont été trouvées à plusieurs reprises dans tous les écrans a été enrichie pour Zfp57, Uhrf1 et Dnmt1, tandis que d'autres occurrences ont été identifiées dans des lignées cellulaires rapporteuses ICR individuelles (Fig. 4c). Nous avons repensé une bibliothèque CRISPR étendue (EpiTF) composée de 20 470 ARN guides contre 4 095 gènes codant pour des facteurs nucléaires afin de couvrir une grande partie de la famille des protéines à doigts de zinc KRAB et avons répété l'écran à l'aide du journaliste Airn ICR (tableau supplémentaire 1). Malgré la complexité accrue de la bibliothèque, nous n'avons pas identifié de facteurs de transcription supplémentaires jouant un rôle dans le maintien du silence du journaliste Airn (Fig. 4c et Extended Data Fig. 8d, e). Plusieurs candidats identifiés dans plus d'un écran ont été testés par validation simple KO. Zfp57, Uhrf1 et Dnmt1 ont montré une régulation à la hausse constante dans les trois lignées de rapporteurs, tandis que d'autres candidats ont entraîné une réactivation inférieure ou stochastique dans certaines des lignées de rapporteurs testées (Extended Data Fig. 8f).

Deux facteurs ont été identifiés dans au moins trois cribles différents (Fig. 4c et Extended Data Fig. 8g) : ATF7IP, responsable du silençage médié par SETDB1 des éléments transposables35,36,37, ainsi que ZMYM2, un facteur d'interaction avec ATF7IP associé à la restriction de croissance des cellules pluripotentes humaines38,39. Compte tenu de leur association avec H3K9me3 et de leur implication dans le silence transcriptionnel des éléments répétitifs, nous avons testé leur contribution à la régulation de la maintenance épigénétique aux ICR. De plus, l'ATF7IP humain a été récemment identifié comme étant un répresseur de gènes à empreinte paternellement exprimés et requis pour faire taire les gènes spécifiques du sperme40. Nous avons d'abord voulu voir si ces facteurs se localisaient effectivement aux ICR endogènes et avons analysé les ensembles de données mESC ChIP-seq existants disponibles pour SETDB1 (réf. 41), ZFP57 (réf. 42), ATF7IP39 et ZMYM2 (réf. 43). Nous avons observé une forte colocalisation de tous les facteurs au niveau des ICR endogènes utilisés dans les cribles CRISPR (Fig. 5a). En élargissant davantage notre analyse à tous les ICR annotés, nous constatons que presque tous les ICR sont co-liés par ATF7IP, ZMYM2, ZFP57 et SETDB1 (Fig. 5b). Les exceptions notables sont MCTS2/H13, où ATF7IP est absent, et H19, qui montre une localisation réduite de ZMYM2. En règle générale, nous observons que ATF7IP et ZMYM2 colocalisent toujours en présence de SETDB1 et ZFP57, ce qui suggère qu'ils se localisent aux ICR dans le cadre de la machinerie H3K9me3. Fait intéressant, l'analyse à l'échelle du génome des pics ATF7IP, ZMYM2, ZFP57 et SETDB1 indique que cette colocalisation n'est pas toujours observée en dehors des ICR. Bien que la majorité (85%) des quelques pics ATF7IP que nous avons détectés chevauchent les sites ZFP57 et SETDB1, seuls 30% des pics ZMYM2 colocalisent avec ZFP57 et SETDB1 (Extended Data Fig. 9a). Les pics de ZMYM2 en dehors des sites ZFP57 / SETDB1 montrent une méthylation de H3K9me3 et de l'ADN inférieure à celle des pics chevauchant ZFP57 / SETDB1, ce qui suggère que ZMYM2 est impliqué dans plusieurs voies de régulation indépendamment de SETDB1 (Données étendues Fig. 9b, c). Indépendamment de cette liaison, nous constatons une réduction de la localisation d'ATF7IP et de ZMYM2 dans les ICR Airn en l'absence de ZFP57 (Extended Data Fig. 9d).

a, instantanés du navigateur du génome pour les ICR Airn, Kcnq1ot1 et Peg10 utilisés dans les expériences d'écran CRISPR. Les ensembles de données ChIP-seq indiquent la colocalisation de ZFP57, ATF7IP, ZMYM2 et SETDB1 aux ICR d'intérêt. b, Heatmaps résumant la liaison de ATF7IP, ZMYM2, ZFP57, SETDB1 et H3K9me3 10 kb (k) en amont et en aval de tous les ICR annotés dans le génome de la souris. Les lectures normalisées de la bibliothèque sont affichées par 20 bp. c, Gauche : représentation schématique de la configuration de la ligature à proximité de la biotine pour détecter les protéines sur les sites liés à ZFP57 comparant ZFP57 fusionné à TurboID. LC MS/MS : chromatographie liquide couplée à la spectrométrie de masse en tandem. À droite : graphique du volcan montrant des protéines enrichies et indiquant des résultats statistiquement significatifs à partir d'une comparaison directe entre ZFP57-TurboID et TurboID-NLS (nTurboID). Les protéines statistiquement enrichies sont indiquées (test t bilatéral corrigé du taux de fausses découvertes (FDR) : FDR = 0,05, variance artificielle au sein des groupes (s0) = 1, n = 4 répétitions techniques). d, l'analyse de la méthylation de l'ADN au niveau des ICR sélectionnés montre une perte de méthylation dans les cellules Atf7ip-KO et Zmym2-KO (voir Données étendues Fig. 10c pour les autres ICR). Les valeurs de méthylation indiquées pour les CpG individuels obtenus à partir de WGBS dans des cellules de type sauvage, Zmym2-KO ou Atf7ip-KO. La position génomique des CpG est indiquée ci-dessous. e, H3K9me3 ChIP-seq indique la perte de H3K9me3 au niveau des ICR sélectionnés (Extended Data Fig. 10e pour les autres ICR). Les lectures sont affichées par fenêtres de 100 bp. Les ICR dans les régions d'impression respectives sont indiqués.

Pour interroger plus avant le lien entre ATF7IP et ZMYM2 au niveau des ICR, nous avons recruté la biotine ligase de proximité TurboID44 aux ICR méthylés via une protéine de fusion ZFP57-TurboID exprimée à partir du site RMCE et effectué BioID comme décrit précédemment45 (Fig. 5c). Comme contrôle de fond, nous avons généré une lignée cellulaire exprimant uniquement le NLS-TurboID (nTurbo) et inclus une lignée cellulaire exprimant uniquement le domaine KRAB de ZFP57 fusionné à la ligase TurboID pour distinguer les protéines qui interagissent avec ZFP57 lorsqu'elles ne sont pas liées à la chromatine. La détection par spectrométrie de masse de protéines enrichies comprenait plusieurs facteurs précédemment associés à ZFP57 (KAP1, CBX3, CBX5 et MORC3). Parmi eux, nous avons détecté ATF7IP (Fig. 5c, Données étendues Fig. 9e et Tableau supplémentaire 1), confirmant les résultats obtenus à partir du dépistage CRISPR et de l'analyse à l'échelle du génome. Dans le cas de ZMYM2, nous n'avons pas pu détecter la protéine dans la fraction biotinylée ou l'échantillon de fond, ce qui suggère que son enrichissement était inférieur à la limite de détection ou n'interagissait pas spécifiquement avec ZFP57.

Ensuite, nous avons voulu tester si l'absence de ces facteurs exprimés au début du développement de la souris influence l'état épigénétique des ICR endogènes, et nous avons généré des mESC KO pour Atf7ip et Zmym2 à l'aide de CRISPR-Cas9 (Extended Data Fig. 9f, g). Le séquençage au bisulfite du génome entier (WGBS) a révélé une réduction de la méthylation de l'ADN dans la majorité des ICR analysés, malgré une perte limitée de méthylation à l'échelle du génome (Fig. 5d et Extended Data Fig. 10a – c). Les ICR Peg13 et Meg3/Rian ont conservé la méthylation de l'ADN dans les deux lignées cellulaires KO, tandis que H13/Mcts et Gnas/Nespas ont spécifiquement conservé la méthylation en l'absence de ZMYM2 et Zrsr1/Commd1 et H19 en l'absence d'ATF7IP. La perte de méthylation de l'ICR a été confirmée par un séquençage ciblé au bisulfite autour des sites de liaison d'ATF7IP et de ZMYM2 au niveau des ICR Airn, Kcnq1ot1 et Peg10 (Extended Data Fig. 10d). Enfin, nous avons profilé H3K9me3 dans les mêmes lignées cellulaires KO et observé une perte de H3K9me3 dans tous les ICR, à l'exception de Peg13 et Meg3/Rian, qui ont conservé H3K9me3 dans les deux lignées KO. De plus, Zrsr1/Commd1 et H19 ont conservé H3K9me3 dans les cellules Atf7ip KO (Fig. 5e et Extended Data Fig. 10e). Les changements concordants dans la méthylation de l'ADN et H3K9me3 aux ICR en l'absence d'ATF7IP ou de ZMYM2 indiquent que ces facteurs sont nécessaires pour empêcher le passage des ICR de l'état méthylé à l'état non méthylé dans les mESC.

Ici, nous avons entrepris d'étudier les déterminants génétiques et épigénétiques qui permettent aux ICR de maintenir leur méthylation différentielle de l'ADN. Pour cela, nous avons isolé les ICR de leur contexte chromosomique endogène et les avons insérés dans une position hétérologue dans le génome des mESC. Lorsqu'ils sont intégrés non méthylés, les ICR testés maintiennent un état sans méthylation d'ADN et euchromatique, suggérant des mécanismes spécifiques à la séquence qui empêchent la méthylation de novo. Ce comportement est similaire aux promoteurs d'îlots CpG, qui sont protégés de la méthylation de l'ADN grâce à une densité élevée de CpG4,5. En effet, sur la base de leur densité de CpG et de leur pourcentage de GC, la plupart des ICR répondent à la définition des îlots CpG. En revanche, l'intégration de séquences ICR ADN-méthylées sur le même site écrase cet état par défaut et conduit à une propagation stable de la méthylation de l'ADN avec établissement ultérieur de marques d'hétérochromatine. Ainsi, les ICR sont des éléments de séquence d'ADN autonomes qui peuvent récapituler les mécanismes de régulation épigénétique observés à leur position endogène. Cette découverte est conforme aux travaux antérieurs indiquant que la séquence d'ADN des ICR est suffisante pour récapituler l'établissement d'empreintes au cours du développement de la souris45,46,47,48,49. Il est important de noter que cette commutation entre deux états de chromatine opposés basés sur la méthylation de l'ADN n'a pas été observée pour les promoteurs non-ICR et d'autres séquences d'ADN de taille, de densité de CpG ou de contenu en GC similaires, ce qui suggère que des propriétés spécialisées de l'ICR pleine longueur sont nécessaires pour cette « bistabilité épigénétique ».

Les ICR ectopiques ont permis d'étudier systématiquement les séquences d'ADN et les facteurs de régulation de la chromatine nécessaires à la création et au maintien de la mémoire épigénétique aux ICR dans un environnement génomique contrôlé. En introduisant des ICR synthétiques avec des séquences d'ADN modifiées, nous observons que la teneur en GC et la densité de CpG ne sont pas suffisantes pour coder la bistabilité dans les mESC, mais que des séquences supplémentaires, telles que les motifs de liaison ZFP57, jouent un rôle important dans le maintien de la méthylation de l'ADN et de H3K9. Cette découverte est conforme aux travaux antérieurs, où les mutations des CpG méthylés du motif de reconnaissance ZFP57 entraînaient une perte de maintien de la méthylation sur l'ensemble du Snrpn ICR21. De plus, nous montrons que la liaison de ZFP57 est non seulement nécessaire mais également suffisante pour la mémoire épigénétique à l'état méthylé Airn ICR dans les mESC. Dans le cas de l'allèle non méthylé, les mêmes changements de séquence entraînent une perte de protection contre la méthylation de novo, suggérant des mécanismes spécifiques à la séquence qui protègent de la méthylation de novo, potentiellement similaires à ceux observés dans les régions régulatrices des gènes non imprimés3,5. Néanmoins, étant donné que le maintien de la méthylation différentielle de l'Airn ICR dans les cellules MEL était indépendant des séquences d'ADN en dehors des CpG, nous suggérons une exigence spécifique au type de cellule pour les facteurs spécifiques à la séquence impliqués dans le maintien épigénétique. Dans le cas de ZFP57, cela serait conforme à son activité transcriptionnelle restreinte aux cellules germinales et au début du développement18,29.

Après avoir identifié l'établissement et le maintien robustes de l'hétérochromatine au niveau des ICR méthylés, nous avons pu générer des lignées cellulaires rapporteurs qui répondent à la méthylation de l'ADN. Contrairement aux stratégies précédentes qui utilisaient le promoteur Snrpn pour signaler les changements de méthylation au niveau des promoteurs de gènes endogènes50,51, nos lignées cellulaires signalent directement les changements réglementaires au niveau des ICR introduits. Nous avons utilisé ces rapporteurs pour dépister les facteurs nécessaires au maintien de l'état refoulé. Les écrans CRISPR ciblés identifient Dnmt1, Uhrf1 et Zfp57 comme les gènes les plus pertinents nécessaires pour maintenir le statut de méthylation de l'ADN à tous les ICR testés, confirmant la pertinence de notre configuration. De plus, nos cribles fonctionnels ont identifié, et donc validé, des facteurs supplémentaires qui ont été décrits pour réguler H3K9me3 dans tout le génome et pour s'associer aux ICR, notamment DAXX, ATRX, CBX1 et CBX5 (réfs. 14,52,53).

Parmi les résultats obtenus, nous avons identifié ATF7IP et ZMYM2 comme des facteurs impliqués dans le maintien de la répression épigénétique chez les reporters ICR. ATF7IP et SETDB1 présentent un chevauchement fonctionnel dans la régulation des éléments rétroviraux endogènes, ATF7IP agissant comme cofacteur de SETDB1 en stimulant son activité enzymatique, en le protégeant de la dégradation protéasomique et en facilitant sa localisation nucléaire35,37,54,55. Bien que la perte de SETDB1 soit mortelle dans les mESC, l'absence d'ATF7IP réduit les niveaux de SETDB1, suffisants pour la viabilité mais insuffisants pour maintenir tous les sites réprimés dans le génome37,56. Il a été démontré que le domaine de fibronectine de type III C-terminal d'ATF7IP interagit avec ZMYM2 (également ZFP198), et cette interaction a été suggérée comme étant importante pour le silençage de quelques gènes spécifiques à la lignée germinale, y compris le gène FKBP6 imprimé39,57. ZMYM2 a également été décrit pour interagir avec la chromatine marquée par H3K9me358,59 et en outre requis pour le silençage des éléments rétroviraux endogènes, empêchant ainsi la transition vers des cellules de type deux cellules dans la culture mESC43,54. Le rôle de ZMYM2 dans la restriction de la puissance est en outre étayé par le fait que ZMYM2 est nécessaire pour sortir de la pluripotence38,60. Nous montrons que ATF7IP et ZMYM2 colocalisent avec ZFP57 et SETDB1 dans la majorité des ICR endogènes dans les mESC et sont nécessaires à la mémoire de l'état épigénétique dans les ICR méthylés. Ceci est conforme à une publication montrant un rôle d'ATF7IP dans la régulation des gènes spécifiques au sperme et des gènes imprimés paternellement exprimés, y compris Peg13 dans les CSE parthénogénétiques humaines40. Nos résultats indiquent que, dans les mESC, ATF7IP pourrait jouer un rôle plus large dans la régulation de tous les ICR méthylés, indépendamment de l'origine parentale.

Si et comment ces deux facteurs contribuent au maintien des empreintes pendant la formation du zygote et le développement précoce reste à tester. Dans les mESC, leur absence a entraîné une fidélité de maintenance altérée et une perte sporadique de H3K9me3 à plusieurs ICR, indépendamment de leur origine parentale. Nous suggérons que cela déstabilise la boucle de rétroaction répressive entre la méthylation de l'ADN et H3K9me3, permettant le passage de l'ICR à l'état non méthylé par défaut. Bien que nous observions des différences dans les activités régulatrices d'ATF7IP et de ZMYM2 au niveau de certains ICR (par exemple, Mcts2/H13, Zrsr1/Commd1 et H19), il reste à déterminer si cela est dû à une spécificité de ces facteurs vis-à-vis de ces ICR. Alternativement, cela pourrait refléter la stochasticité dans le passage de l'ICR à un état non méthylé en l'absence de l'un ou l'autre facteur, qui est mémorisé dans les cellules dérivées par clonage.

Des mESC compétentes pour le RMCE (TC-1 (réf. 3), obtenues auprès de A. Dean, National Institutes of Health (NIH)) ont été cultivées sur des boîtes recouvertes de gélatine à 0,2 % dans un milieu mESC contenant du DMEM (Invitrogen), 15 % de sérum de veau fœtal (Invitrogen), 1 × acides aminés non essentiels (Invitrogen), 1 × Glutamax (Invitrogen), 0,001 % de 2-mercaptoéthanol ( Invitrogen) et facteur inhibiteur de la leucémie titré (fabriqué en interne) à 37 °C dans 7 % de CO2. Alternativement, les mESC ont été cultivées dans un milieu 2i contenant 50 % de milieu Neurobasal (Invitrogen), un milieu DMEM/F12 (Invitrogen), 1 × acides aminés non essentiels (Invitrogen), 1 × Glutamax (Invitrogen), 0,001 % de 2-mercaptoéthanol (Invitrogen), 1 × supplément N2 (Invitrogen), 1 × supplément B27 (Invitrogen), facteur inhibiteur de la leucémie titré, 3 µ M CHIR99021 (Sigma-Aldrich) et 1 µM PD0325901 (Sigma-Aldrich). Lorsque cela est indiqué, de l'acide l-ascorbique (Stemcell Technologies) a été ajouté à une concentration de 100 µg ml-1 (réf. 26). La différenciation en cellules progénitrices neuronales a été réalisée comme décrit précédemment sans cellules nourricières61. Pour l'inhibition de DNMT1, GSK-3484862 (MedChemExpress) a été ajouté à une concentration finale de 10 µM, comme déterminé précédemment34. Des cellules MEL30 compétentes en RMCE (obtenues auprès de D. Schübeler, FMI Bâle) ont été cultivées en suspension dans du DMEM (Invitrogen) additionné de 10 % de sérum de veau fœtal (Invitrogen) et de 1 × Glutamax (Invitrogen). Toutes les lignées cellulaires compétentes pour le RMCE (TC-1 et MEL) ont été authentifiées sur la base de la sélection et de la PCR sur la cassette de résistance au RMCE.

Des intégrations ciblées de lignées cellulaires dans les mESC ont été obtenues par RMCE en utilisant soit l'électroporation de 2 × 106 cellules avec les transfections Amaxa Nucleofector (Lonza) ou Lipofectamine 3000 (Invitrogen) de 2, 5 × 104 cellules. Tous les vecteurs RMCE ont été cotransfectés avec un plasmide exprimant CRE dans un rapport de 1:0,6 µg, en utilisant soit un total de 40 µg de plasmide pour le kit Amaxa Nucleofector, soit 1 µg pour la Lipofectamine 3000. Deux jours après la transfection, les cellules ont été sélectionnées avec 3 µM de Ganciclovir pendant plus de 8 jours. Les lignées cellulaires obtenues ont été conservées sous forme de pools et, si nécessaire, des lignées cellulaires clonales ont été obtenues par dilution limitée. Des pools ou des lignées cellulaires clonales ont été génotypés à l'aide de PCR spécifiques au site d'intégration. La lignée cellulaire parentale pour toutes les lignées cellulaires rapporteuses utilisées dans les cribles CRISPR contient un gène Cas9 exprimé de manière stable du locus Rosa26, obtenu par intégration médiée par TALEN comme décrit précédemment62. Des lignées de cellules KO monoclones ont été obtenues par CRISPR-Cas9 en utilisant le plasmide px330-hSpCas9 (Addgene, 42230) avec un rapporteur de recombinaison pRR-Puro62. Un total de 1 µg d'ADN plasmidique dans un rapport de 1: 0, 1 de px330 à pRR-Puro a été transfecté à l'aide de Lipofectamine 3000. La sélection de la puromycine a commencé 36 h après la transfection pendant 36 à 48 h à une concentration de 2 µg ml-1. Les lignées cellulaires KO ont été validées à l'aide d'une PCR spécifique au site de ciblage. La RMCE dans les cellules MEL a été réalisée à l'aide de Lipofectamine 3000 (Invitrogen), en étalant 5 × 105 cellules dans des plaques à 6 puits pour les cellules en suspension. Un total de 2,5 ug d'ADN plasmidique, en utilisant la même ration que celle décrite précédemment, a été transfecté selon les instructions du fabricant. Après 48 h, les cellules ont été transférées dans des flacons T75 et les cellules qui ont subi une recombinaison ont été sélectionnées avec un milieu contenant du ganciclovir 5 µM pendant plus de 8 jours.

Un squelette contenant deux sites loxP inversés3 a été utilisé pour cloner plusieurs vecteurs rapporteurs vides contenant un site d'entrée universel de 60 pb avec un site de restriction EcoRV central, suivi d'un promoteur (pCAGGS, hPGK et Ef1alpha) qui pilote un gène eGFP ou mScarlet pour les écrans ChromM et EpiTF, respectivement, suivi d'une séquence BGH-poly(A) et d'une séquence WPRE en aval. Des séquences individuelles d'ICR ou de contrôle ont été amplifiées à partir d'ADN génomique (tableau supplémentaire 1). L'assemblage Gibson a été réalisé selon le protocole NEB Gibson Assembly Master Mix. La méthylation in vitro a été réalisée avec jusqu'à 40 µg d'ADN plasmidique en utilisant la méthyltransférase NEB M.SssI dans deux réactions consécutives d'au moins 4 h avec 600 µM SAM (NEB, B9003S) et 1,5 U M.SssI (NEB, M0226L) par microgramme d'ADN. La méthylation complète des plasmides a été confirmée en utilisant l'enzyme de restriction sensible à la méthylation CpG HpaII (NEB) et une réaction témoin insensible à la méthylation avec MspI (NEB). Les lignées cellulaires ont été générées comme décrit précédemment. Les clones individuels ont été génotypés par PCR avec des amorces couvrant les sites loxP. La méthylation de la construction rapporteur intégrée a été validée sur des clones sélectionnés.

L'acquisition des données de cytométrie en flux a été réalisée sur un analyseur de cellules BD FACSCanto II ou BD LSR Fortessa. Le FACS a été réalisé avec un trieur de cellules BD FACSAria III. L'analyse des données a été effectuée avec FlowJo (version 10.7) ou BD FACSDiva (9.1.2). Tous les échantillons ont été contrôlés pour des cellules individuelles, en utilisant la zone de diffusion vers l'avant (FSC-A) par rapport à la zone de diffusion latérale (SSC-A), suivie de FSC-A par rapport à la hauteur de diffusion vers l'avant (FSC-H). Les populations GFP-négatives et positives ont été quantifiées en utilisant des cellules de type sauvage GFP-négatives comme référence. Pour la coloration des marqueurs de surface cellulaire, une suspension cellulaire uniforme a été préparée par trypsinisation et filtration à travers un tamis cellulaire de 40 μm (BD Bioscience). Les cellules ont été colorées avec un anticorps CD90.1 conjugué à l'allophycocyanine (APC) (Invitrogen, 17-0900-82) pendant 30 min à 4 ° C avec une concentration d'anticorps saturée (1 µl pour 15 millions de cellules).

BPnet28 (version 0.0.23) a été utilisé pour déterminer le motif de séquence et le contexte de la liaison ZPF57 dans les mESC. Les données ZFP57 ChIP-seq et les fichiers d'entrée correspondants42 ont été alignés sur le génome de la souris (NCBI Build 37 mm9, juillet 2007) à l'aide de bowtie2 (version 2.3.5.1) après le retrait des adaptateurs à l'aide de trimgalore (version 0.6.6). Les lectures alignées ont été filtrées pour les doublons PCR à l'aide de Picard (version 2.23.9), et seules les lectures avec une qualité de cartographie (MAPQ) > 40 ont été conservées pour une analyse plus approfondie. Tous les réplicats ont été fusionnés avant le pic d'appel à l'aide de MACS2 (version 2.1.1.20160309) avec les paramètres suivants : callpeak -g mm–keep-dup all -q 0.05–call-summits. Les lectures mappées sur les brins positif et négatif des ensembles de données fusionnés ont été divisées en fichiers individuels et ajustées à la base 5′ en tant que pistes d'entrée pour BPnet. Un modèle a été formé avec l'architecture bpnet9 par défaut (https://github.com/kundajelab/bpnet), en utilisant les chromosomes 1, 8 et 9 comme ensemble de test et des pics sur les chromosomes 2, 3 et 4 comme ensembles de validation. Les pics sur les chromosomes X et Y ont été exclus de la formation du modèle. Après calcul des scores de contribution avec la méthode DeepLIFT de BPnet, les motifs ont été déterminés à l'aide de la méthode TF-MoDISco de BPnet. Pour déterminer les scores de contribution sur les séquences Airn et Airn mélangées, l'ADN d'entrée a été codé à chaud avant de les soumettre au modèle formé pour générer des prédictions de liaison ZFP57. Pour les mutations de marche, 10 nt de la séquence mélangée ont été échangés avec la séquence Airn d'origine et décalés de 1 pb par prédiction.

Jusqu'à 2 µg d'ADN génomique, ou la quantité totale de matériau élué de la puce, ont été utilisés pour la conversion au bisulfite à l'aide du kit EpiTect Bisulfite (Qiagen). La PCR au bisulfite a été réalisée à l'aide de la polymérase PhusionU (Thermo Fisher Scientific) avec les amorces indiquées dans le tableau supplémentaire 1 en utilisant les conditions suivantes : dénaturation initiale à 95 °C pendant 5 min, suivie de 45 cycles de 1 min à 95 °C, 1 min à 50–60 °C (en fonction de la paire d'amorces) et 1 min à 72 °C, suivie de 5 min d'extension finale à 72 °C. Les amplicons ont été clonés dans le vecteur CloneJET (Thermo Fisher Scientific), séquencés par séquençage Sanger et analysés à l'aide de QUMA63.

Des bibliothèques de séquençage de bisulfite ciblées ont été fabriquées à partir de fragments de PCR de bisulfite regroupés équimolaires. Deux réactions PCR indépendantes ont été exécutées par cible avec des températures de recuit à 50 ° C et 58 ° C pour atténuer le biais d'amplification. Des bibliothèques indexées ont été préparées à l'aide du kit NEBNext Ultra II (NEB) à partir de 10 ng d'amplicons regroupés selon le protocole du fabricant. Le séquençage a été effectué sur une machine Illumina NovaSeq6000 avec des lectures appariées de 150 pb. Les fichiers Fastq ont été découpés à l'aide de trim_galore (version 0.6.6) et l'alignement a été effectué avec Bismark (version 0.23.0) avec le paramètre non_directional. La méthylation des CpG a été extraite à l'aide de l'extracteur de méthylation Bismark et la méthylation moyenne des CpG a été calculée dans R, à l'exclusion des CpG couverts moins de 500 fois.

Le WGBS des mESC Atf7ip et Zmym2 KO a été effectué comme décrit précédemment64. En bref, 10 µg d'ADN génomique ont été soniqués à une longueur d'environ 400 à 500 pb. Pour chaque échantillon, 2 µg d'ADN génomique cisaillé ont été mélangés avec 10 ng d'ADN de phage T7 méthylé soniqué équimolaire et d'ADN de phage Lambda non méthylé. La ligature des adaptateurs a été réalisée avec le kit NEBNext Ultra II (NEB E7645L) en utilisant des adaptateurs méthylés (NEB, E7535S), avant la conversion au bisulfite en utilisant le kit de conversion au bisulfite Qiagen Epitect, selon les instructions du fabricant. Après conversion, les bibliothèques ont été amplifiées pendant 10 cycles en utilisant l'ADN polymérase Pfu TurboCx Hotstart (Agilent) et les amorces à double index NEB (NEB, E7600S). Les réactions PCR ont été effectuées avec les paramètres suivants : 95 °C pendant 2 min, 98 °C pendant 30 s, suivis de 10 cycles de 98 °C pendant 15 s, 65 °C pendant 30 s et 72 °C pendant 3 min, se terminant par 5 min à 72 °C. Les réactions de PCR ont été nettoyées à l'aide de billes 1,2 x AMPure XP (Beckman Coulter) et éluées dans 20 µl de tampon EB (Qiagen). La qualité de la bibliothèque a été vérifiée sur une Agilent TapeStation et le séquençage a été effectué sur une machine Illumina NovaSeq 6000.

Environ 15 × 106 cellules ont été récoltées par IP et fixées avec du formaldéhyde sans méthanol à 1 % pendant 8 min. La réticulation a été désactivée en ajoutant de la glycine à une concentration finale de 0,125 nM et incubée pendant 10 min à 4 ° C sur de la glace. Les cellules ont été culottées à 600 × g pendant 5 min, lavées avec du PBS froid et incubées pendant 10 min sur de la glace dans un tampon contenant 10 mM EDTA, 10 mM Tris pH 8, 0,5 mM EGTA et 0,25% Triton X-100. Après centrifugation, les cellules ont été incubées dans EDTA 1 mM, Tris 10 mM pH 8, EGTA 0,5 mM et NaCl 200 mM pendant 10 min sur de la glace. La chromatine a été extraite dans un tampon à haute teneur en sel contenant 50 mM HEPES, pH 7,5, 1 mM EDTA, 1% Triton X-100, 0,1% désoxycholate, 0,2% SDS et 500 mM NaCl pendant 2 h à 4 ° C, et la chromatine a été cisaillée à l'aide d'un sonicateur Bioruptor Pico (Diagenode). Ensuite, 100 µg de chromatine ont été utilisés par réaction IP avec 30 µl de billes magnétiques de protéine A prébloquées (Invitrogen). Les billes ont été bloquées avec 1 mg de BSA et 100 ng d'ARNt de levure (Sigma) dans un tampon TE contenant un mélange d'inhibiteurs de protéinase (Roche) avant utilisation. Avant l'IP, la chromatine a été pré-clarifiée avec 20 µl de billes bloquées pendant 1 h à 4 °C. Ensuite, 5% du matériau d'entrée a été conservé à -20 ° C et déréticulé le long du matériau IP. Ensuite, 5 µg d'anticorps ont été utilisés par IP pour une incubation d'une nuit à 4 °C. Le lendemain, 30 µl de billes bloquées ont été ajoutés à la chromatine et incubés pendant 4 h à 4 °C. Les billes ont été séparées sur un aimant et lavées deux fois pendant 8 min avec un tampon riche en sel, une fois avec 50 mM LiCl, 0,5 % NP-40, 0,5 % désoxycholate, 1 mM EDTA et 10 mM Tris, pH 8. Après deux lavages supplémentaires avec TE pendant 8 min, la chromatine a été éluée après 30 min d'incubation à 37 °C avec 60 µg RNaseA (Roche) dans SDS 1 % et NaHCO3 100 mM, suivi d'une incubation de 3 h en ajoutant EDTA 10 mM, Tris 40 mM, pH 8 et 60 µg de protéinase K (Roche). La décroissance finale a été effectuée pendant une nuit à 65°C. Le matériau élué a été nettoyé par extraction au phénol chloroforme et quantifié à l'aide d'un fluorimètre Qubit 2.0 (Thermo Fisher Scientific). Les anticorps suivants ont été utilisés pour ChIP : H3K9me3 (Abcam, ab8898, 5 µg par IP), H3K4me2 (Diagenode, C15410035, 5 µg par IP), H3K4me3 (Abcam, ab8580, 5 µg par IP), ATF7IP (Bethyl, A300-169A, 5 µg par IP) et ZMYM2 (Bethyl, A301 -711A, 10 µg par IP).

Les réactions qPCR ont été exécutées en double technique sur une machine Rotor Gene Q (Roche) à l'aide du kit qPCR universel KAPA SYBR Fast (Sigma) dans des réactions de 10 µl avec 1 µl d'ADN élué pour le matériel IP ou 1 µl d'une dilution 1:10 du matériel d'entrée. Les valeurs delta Ct ont été calculées sur l'entrée, suivies du delta Ct et du changement de pli sur une région intergénique. Les amorces sont répertoriées dans le tableau supplémentaire 1. Les parcelles correspondantes ont été générées avec Prism (5.0a).

Les bibliothèques ChIP-seq ont été préparées à l'aide du kit NEBNext ChIP-seq Library Prep Master Mix pour Illumina (NEB, E6240) ou du kit NEBNext Ultra II, en suivant le protocole du fabricant. Les bibliothèques finales ont été visualisées et quantifiées sur un système TapeStation 2200 (Agilent) et regroupées avec des rapports molaires égaux avant le séquençage sur une machine Illumina NovaSeq6000 avec des lectures appariées de 150 pb.

Les ensembles de données publiés à l'échelle du génome mESC ont été obtenus à partir de GEO (WGBS65; H3K9me3, H3K4me3, H3K36me3 et H3K27me3 (réf. 66), DNase-seq et RNA-seq67, SETDB1 (réf. 41), ZFP57 (réf. 42), ZMYM2 (réf. 43) et ATF7IP39. les ensembles de données publiés et les lectures ChIP-seq générées dans cette étude ont été filtrées pour les lectures de faible qualité ainsi que les séquences d'adaptation à l'aide de trimgalore (version 0.6.6) et cartographiées sur le génome de la souris (NCBI Build 37 mm9, juillet 2007). QuasR (1.30.0) dans R avec les paramètres standard qAlign(). Les traces de perruque ont été obtenues avec la commande QuasR qExportWig() et visualisées à l'aide du navigateur de génome UCSC (https://genome.ucsc.edu). La cartographie des données WGBS a été réalisée avec QuasR à l'aide de qAlign() avec les paramètres suivants : genome = 'BSgenome.Mmusculus.UCSC.mm9', aligner = 'Rbowtie' and bisulfite = 'dir'. Les appels de méthylation CpG ont été extraits à l'aide de qMeth() et filtrés pour ne contenir que les CpG couverts au moins 10 ×. Les coordonnées des pics ChIP-seq ont été obtenues à l'aide de MACS2 (version 2.1.1.20160309) avec les paramètres suivants : callpeak -g mm–keep-dup all -q 0,05–call-summits. Les coordonnées ont été importées dans R en tant qu'objets GenomicRanges et les pics supérieurs à 1 kb ont été supprimés de l'analyse ultérieure. Les chevauchements entre les pics ont été calculés à l'aide de la fonction findOverlaps () dans R, avec maxgap = 1000 L. Des cartes thermiques sur les ICR et les régions de pic ont été générées avec genomation () dans R à l'aide des fonctions ScoreMatrixList () et multiHeatMatrix ().

La bibliothèque ChromMM et EpiTFs a été construite en tant que sous-groupe de la bibliothèque sgRNA de Vienne, comme décrit précédemment68. Le lentivirus a été produit dans des cellules HEK293T (obtenues auprès de G. Schwank, Université de Zurich) comme décrit69. Le virus non concentré a été titré avec différentes quantités en suivant la même procédure de transduction utilisée pour les écrans CRISPR réels. La transduction a été réalisée avec 1,25 × 106 cellules ensemencées dans des plaques à 6 puits recouvertes de gélatine dans un milieu de cellules souches embryonnaires contenant 8 µg ml-1 de polybrène (Merck), tournant pendant 60 min à 500 × g à 37 ° C. Après centrifugation, les cellules ont été incubées pendant 12 h à 37 ° C, avant de les transférer sur plusieurs plaques de 15 cm et de les cultiver pendant 24 heures supplémentaires. Après 36 h, les cellules transduites ont été sélectionnées à l'aide de FACS. Pour la bibliothèque ChromMM, les cellules ont été colorées contre le marqueur de surface cellulaire CD90.1 à l'aide d'un anticorps conjugué à l'APC (Invitrogen, 17-0900-82, 1 µl pour 15 millions de cellules), sur des cellules uniques APC-positives et GFP-négatives. Pour la bibliothèque EpiTF, les cellules ont été bloquées sur des cellules uniques GFP-positives et mScarlet négatives. Après le tri, les cellules ont été ensemencées peu sur plusieurs plats de 15 cm et seulement passées une fois après 4 jours pour éviter les goulots d'étranglement dans la représentation de la bibliothèque. Au jour 10 après la transduction, les cellules GFP-positives ont été triées et traitées ultérieurement pour l'extraction d'ADN génomique à l'aide du kit DNeasy Blood and Tissue (Qiagen). Tous les écrans ont été réalisés avec au moins 30 millions de cellules et une faible multiplicité d'infection entre 0,1 et 0,2, donnant un nombre total de cellules d'au moins 3 millions de cellules et une représentation guide d'au moins 450 × par guide après le premier tri. Pour le tri final, le même nombre de cellules initialement transduites a été utilisé pour le tri et conservé comme pool de référence. Le criblage avec la bibliothèque EpiTF a été réalisé comme décrit ci-dessus, cependant 90 millions de cellules ont été utilisées pour la transduction à une multiplicité d'infection de 0,2. Initialement, tous les écrans ont été réalisés en double ou en triple technique avec des clones rapporteurs individuels, puis répétés une fois de plus en tant qu'expériences indépendantes. Pour marquer les gènes essentiels et limitant la croissance, les cellules regroupées aux jours indiqués ont été comparées à la bibliothèque de plasmides initiale.

La préparation de la bibliothèque a été effectuée pour la quantité totale d'ADN génomique extrait en deux étapes consécutives d'amplification par PCR. Dans la première PCR, les séquences guides intégrées ont été amplifiées à l'aide de l'ADN polymérase Herculase II Fusion (Agilent) conformément aux instructions du fabricant avec un maximum de 500 ng d'entrée d'ADN par réaction de 50 µl à l'aide d'amorces spécifiques à la bibliothèque avec des séquences adaptatrices 3 'pour le codage à barres (tableau supplémentaire 1). Le mélange PCR contenait 1,5 % de DMSO et avait une concentration finale de 3 nM de MgCl2. Les produits amplifiés ont d'abord été purifiés à l'aide du kit d'extraction MinElute Gel (Qiagen) et les dimères d'amorce potentiels ont été éliminés à l'aide de billes AmpureXP (Beckmann) à un rapport de 0, 7 × volume. Un codage à barres spécifique à l'échantillon a été effectué dans une seconde PCR à l'aide de NEBNext Multiplex Oligos (NEB) et du NEBNext Q5 Hot Start HiFi PCR Master mix (NEB) conformément au manuel du fabricant avec 10 % du produit élué de la première PCR et 7 cycles d'amplification. Pour la bibliothèque EpiTF, le codage à barres a été effectué avec les amorces i5 du kit NEBNext Multiplex Oligo (NEB) et une amorce personnalisée portant la séquence P7 (tableau supplémentaire 1). Le séquençage a été effectué sur une machine Illumina NovaSeq6000 ou MiSeq, en spécifiant un indice de lecture 1 de 10 pb pour la bibliothèque EpiTF.

Le démultiplexage a été effectué à l'aide du pipeline standard d'Illumina. Pour la bibliothèque EpiTF, le démultiplexage n'a été effectué que sur l'index i5, car l'index i7 contient l'UMI68. Les fichiers Fastq ont été coupés pour inclure uniquement la séquence d'ARN guide à l'aide de cutadapt (version 3.10) spécifiant -g 5′-TAGCTTCTTAAAC...GGTGTTTCGTC-3′ pour les séquences d'adaptateur liées dans le squelette du lentivirus pour la bibliothèque ChromMM ou -g aaacaccg…gtttaaga pour la bibliothèque EpiTF. L'alignement a été effectué à l'aide de bowtie2 (version 2.3.5.1) par rapport à un génome de référence construit à partir des séquences d'ARNsg, en spécifiant les paramètres d'alignement suivants : -k 1–très sensible. Les fichiers BAM ont été convertis en fichiers bed à l'aide de la fonction bamtobed ​​de bedtools (version 2.27.1). Les fichiers de lit ont été importés dans R pour créer une matrice de comptage pour MAGeCK (version 0.5.9.2). Pour l'analyse finale, les décomptes des répétitions techniques ainsi que des différents bacs GFP haut et GFP bas ont été agrégés. MAGeCK a été exécuté avec la méthode de la norme définie sur le total et exécuté sur le pool non trié comme échantillon de contrôle, en spécifiant les répétitions indépendantes.

La validation d'un seul guide a été effectuée avec un ARN guide qui a été inclus dans la bibliothèque et un guide conçu indépendamment avec une activité élevée sur cible et faible hors cible, comme décrit dans la réf. 70 (tableau supplémentaire 1). Les guides ont été clonés dans le squelette px459 (Addgene, 62988) qui permet la sélection de la puromycine. Pour cela, 1 000 cellules ont été ensemencées dans des puits recouverts de gélatine d'une plaque de 96 puits 1 jour avant la transfection. Ensuite, 100 ng d'ADN plasmidique ont été transfectés par puits en tant que réplicats techniques en utilisant Lipofectamine 3000 (Invitrogen). Après 36 h, les cellules transfectées ont été sélectionnées pendant 36 à 48 h avec 2 µg ml-1 de puromycine en utilisant des cellules non transfectées comme contrôle. La réactivation du rapporteur a été évaluée 12 jours après la transfection à l'aide de la cytométrie en flux, et la réactivation de la GFP a été quantifiée sur les cellules transfectées avec des guides de contrôle non ciblant.

Pour le transfert Western, 20 à 35 μg de protéines ont été séparées sur des gels de polyacrylamide à 6 % ou 10 % et transférées sur des membranes de fluorure de polyvinylidène à l'aide du système TransBlot Turbo (Bio-Rad). Pour la coloration à base d'anticorps, la membrane a été lavée une fois avec TBS-T (10 mM Tris, pH 8,0, 150 mM NaCl et 0,1 % Tween-20), bloquée avec 5 % de lait écrémé en poudre dans TBS-T et colorée avec des anticorps primaires contre ATF7IP (Bethyl, A300-169A), ZMYM2 (Bethyl, A301-711A-M) ou LAMIN B1 (Sant a Cruz Biotechnology, 374015) à 4 °C pendant la nuit. Le lendemain, les membranes ont été lavées trois fois avec du TBS-T pendant 10 min avant incubation avec des anticorps secondaires spécifiques à l'espèce conjugués à la peroxydase de raifort pendant 1 h à température ambiante. Après trois lavages supplémentaires avec TBS-T pendant 10 min chacun, le signal a été détecté à l'aide du réactif de détection de transfert Western Amersham ECL (GE Healthcare Life Sciences; RPN2109) et exposé sur Amersham Hyperfilm ECL (GE Healthcare Life Sciences; 28906836) dans une chambre noire.

Les lignées cellulaires ont été générées comme décrit dans Villasenor et al.45. La séquence codante de l'enzyme BioID2 du vecteur d'entrée d'origine a été remplacée par la séquence codante de l'enzyme TurboID44. Les cellules ont été soit transfectées avec le vecteur d'entrée, contenant uniquement le TurboID avec une séquence de localisation nucléaire, la séquence d'ADNc ZFP57 de souris pleine longueur clonée en amont du TurboID, ou le domaine KRAB de ZFP57 comme annoté sur UniProt. Toutes les cellules ont été validées à l'aide d'un Western blot de cellules incubées avec 50 µM de biotine (Sigma-Aldrich) pendant 12 h comme décrit précédemment avec des ajustements mineurs pour s'adapter à la détection de la biotine. En bref, les membranes ont été bloquées dans 5% de BSA dans du TBS contenant 0, 1% de Triton X-100 pendant 1 h et colorées avec de la streptavidine-peroxydase de raifort (1: 20 000) dans du TBS contenant 0, 1% de Triton X-100 pendant une nuit à 4 ° C. La membrane a été lavée deux fois avec du TBS contenant 0,3 % de Triton X-100, deux fois avec du TBS contenant 0,3 % de Triton X-100 et 500 mM de NaCl supplémentaires, avant un dernier lavage avec du TBS contenant 0,3 % de Triton X-100 pendant 10 min à température ambiante chacun.

Les échantillons TurboID ont été préparés comme décrit dans Villaseñor et al.45. En bref, les cellules ont été cultivées en quadruple sur des plaques de 15 cm, incubées avec 50 μM de biotine (Sigma-Aldrich) pendant 12 h à 70 % de confluence et récoltées avec de la trypsine. Dans ce qui suit, les échantillons ont été manipulés à 4 °C ou sur de la glace. Les culots cellulaires ont été gonflés dans 5 × volume de tampon d'extraction nucléaire 1 (NEB1; 10 mM HEPES, pH 7,5, 10 mM KCl, 1 mM EDTA, 1,5 mM MgCl2, 1 mM dithiothréitol (DTT), 1 × cocktail d'inhibiteurs de protéase complets sans EDTA (PIC; Roche) pendant 10 min, avant de tourner à 2 000 × g pendant 10 min. ont été homogénéisés à l'aide d'un pistil de Dounce en vrac dans 2 volumes de NEB1. Les noyaux ont été recueillis par centrifugation à 2 000 x g pendant 10 min, remis en suspension dans un volume de tampon d'extraction nucléaire 2 avec 450 mM de NaCl (NEB2 ; 20 mM HEPES, pH 7,5, 0,2 mM EDTA, 1,5 mM MgCl2, 20 % de glycérol, 1 mM DTT et 1 × PIC) et homogénéisé 10 fois de plus avec un pistil Dounce serré, suivi d'une incubation pendant 1 h avec rotation en tête. Les débris ont été éliminés par centrifugation à 2 000 × g pendant 10 min avant d'ajuster la concentration en sel du surnageant à 150 mM de NaCl avec 2 × volumes de NEB2 et d'ajuster la concentration finale de NP40 à 0,3 %. o Fisher Scientific, Q33211) et des quantités égales d'extraits de protéines ont été utilisées par IP. Pour chaque IP, 40 µl de Streptavidin M-280 Dynabeads (Thermo Fisher Scientific), pré-bloqués dans un tampon IP (IPB ; NEB2, 150 mM NaCl, 0,3 % NP40, 1 mM DTT, 1 × PIC) contenant 1 % de gélatine de poisson froide, ont été ajoutés aux extraits et incubés à 4 °C pendant la nuit tout en tournant. Ensuite, les billes ont été lavées deux fois avec du SDS à 2 % dans du TE contenant du DTT 1 mM et du PIC 1 × pendant 10 min en rotation à température ambiante, suivi d'un lavage de 10 min avec un tampon à teneur élevée en sel (HEPES 50 mM, pH 7,5, EDTA 1 mM, 1 % Triton X-100, désoxycholate 0,1 %, SDS 0,1 %, NaCl 500 mM, DTT 1 mM, 1 × PIC), un lavage avec du tampon DOC (50 mM LiCl, 10 mM Tris, pH 8,0, 0,5 % NP40, 0,5 % désoxycholate, 1 mM EDTA, 1 mM DTT et 1 × PIC) et deux fois avec du tampon TE contenant 1 mM DTT, 1 × PIC. Après les lavages, les billes ont été pré-digérées avec 5 µg ml-1 trypsine (Promega; V5111) dans 40 µl de tampon de digestion (urée 1 M dans Tris 50 mM, pH 8,0, Tris-(2-carboxyéthyl) phosphine 1 mM) pendant 2,5 h à 26 °C et agitation à 600 tr/min. Le surnageant a encore été réduit avec 2 mM de Tris-(2-carboxyéthyl)-phosphine pendant 45 min à température ambiante, alkylé avec 10 mM de chloroacétamide pendant 30 min à température ambiante et protégé de la lumière. Pour la digestion finale, la solution protéique a été incubée avec 0,5 µg supplémentaire de trypsine pendant une nuit à 37 °C. Le lendemain, les échantillons digérés ont été préparés pour être chargés sur des C18 StageTips en ajoutant de l'acide trifluoracétique (TFA) à une concentration finale de 0,5 % et de l'acétonitrile (ACN) à une concentration finale de 3 %. Les C18-StageTips produits en interne (Functional Genomics Center Zurich) ont été humidifiés avec 100 % de méthanol, nettoyés deux fois avec la solution d'élution (60 % ACN, 0,1 % TFA) et préparés pour le chargement en lavant deux fois avec 3 % ACN et 0,1 % TFA. Après le chargement de la solution de peptide, les échantillons ont été centrifugés et le surnageant a été chargé plus longtemps, avant de laver deux fois avec 3 % d'ACN et 0,1 % de TFA. Enfin, les peptides ont été élués deux fois avec la solution d'élution, congelés sous vide dans de l'azote liquide, séchés sous vide rapide, centrifugés et reconstitués dans 3 % d'ACN, 0,1 % d'acide formique, contenant des peptides standard de temps de rétention interne (iRTs, Biognosys). Les échantillons ont été analysés sur un système HPLC Easy-nLC 1000 couplé à un spectromètre de masse Orbitrap Fusion (Thermo Fisher Scientific) avec des échantillons randomisés en bloc

MaxQuant (version 1.5.3.30) a été utilisé pour l'identification des protéines et la quantification sans étiquette71 sur la base du protéome de référence de souris (UniProtKB/Swiss-Prot et UniProtKB/TrEMBL) version 2018_12 combiné avec des protéines contaminantes annotées manuellement, avec des valeurs FDR de protéine et de peptide fixées à 1 %. Perseus a été utilisé pour l'analyse statistique comme décrit précédemment72. Pour cela, seules les protéines identifiées dans trois échantillons sur quatre par groupe ont été conservées. Les valeurs manquantes ont été imputées à partir d'une distribution gaussienne décalée vers la gauche de 1,8 écart-type avec une largeur de 0,3. Un test t a été utilisé pour identifier les interacteurs potentiels en utilisant un seuil FDR <0,05 et une valeur S0 de 1. Les données ont été visualisées à l'aide de R (version 4.0.3).

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Les données de séquençage ont été déposées auprès du NCBI GEO sous le numéro d'accession suivant GSE176461 ; Les données protéomiques de spectrométrie de masse ont été déposées auprès du Consortium ProteomeXchange via le référentiel partenaire PRIDE avec l'identifiant de jeu de données PXD034918. Les données sources sont fournies avec ce document.

Toutes les analyses ont été réalisées à l'aide d'outils déjà publiés ou développés. Aucun code personnalisé n'a été développé ou utilisé.

Almouzni, G. & Cedar, H. Maintenance des informations épigénétiques. Cold Spring Harb. Perspective. Biol. 8, a019372 (2016).

Article PubMed PubMed Central Google Scholar

Villaseñor, R. & Baubec, T. Mécanismes de régulation régissant l'organisation et la fonction de la chromatine. Courant. Avis. Cell Biol. 70, 10-17 (2021).

Article PubMed Google Scholar

Lienert, F. et al. Identification d'éléments génétiques qui déterminent de manière autonome les états de méthylation de l'ADN. Nat. Genet. 43, 1091-1097 (2011).

Article CAS PubMed Google Scholar

Wachter, E. et al. Les îlots CpG synthétiques révèlent les déterminants de la séquence d'ADN de la structure de la chromatine. eLife 3, e03397 (2014).

Article PubMed PubMed Central Google Scholar

Krebs, AR, Dessus-Babus, S., Burger, L. & Schübeler, D. L'ingénierie à haut débit d'un génome de mammifère révèle les principes de construction des états de méthylation dans les régions riches en CG. eLife 3, e04094 (2014).

Article PubMed PubMed Central Google Scholar

Lynch, MD et al. Une analyse interspécifique révèle un rôle clé des dinucléotides CpG non méthylés dans le recrutement du complexe Polycomb chez les vertébrés : une analyse interspécifique de la bivalence de la chromatine. EMBO J. 31, 317–329 (2012).

Article CAS PubMed Google Scholar

Jermann, P., Hoerner, L., Burger, L. et Schubeler, D. De courtes séquences peuvent recruter efficacement la triméthylation de l'histone H3 lysine 27 en l'absence d'activité activatrice et de méthylation de l'ADN. Proc. Natl Acad. Sci. 111, E3415–E3421 (2014).

Article CAS PubMed PubMed Central Google Scholar

Pantier, R. et al. SALL4 contrôle le destin cellulaire en réponse à la composition de base de l'ADN. Mol. Cellule 81, 845–858 (2021).

Article CAS PubMed PubMed Central Google Scholar

Barlow, DP Empreinte génomique : Un modèle de découverte épigénétique chez les mammifères. Annu. Révérend Genet. 45, 379–403 (2011).

Article CAS PubMed Google Scholar

Wutz, A. et al. L'expression imprimée du gène Igf2r dépend d'un îlot CpG intronique. Nature 389, 745–749 (1997).

Article CAS PubMed Google Scholar

Fitzpatrick, GV, Soloway, PD & Higgins, MJ Perte régionale d'empreinte et déficit de croissance chez la souris avec une suppression ciblée de KvDMR1. Nat. Genet. 32, 426–431 (2002).

Article CAS PubMed Google Scholar

Hanna, CW & Kelsey, G. Caractéristiques et mécanismes de l'empreinte génomique canonique et non canonique. Gènes Dév. 35, 821–834 (2021).

Article CAS PubMed PubMed Central Google Scholar

Hirasawa, R. et al. Les Dnmt1 maternels et zygotiques sont nécessaires et suffisants pour le maintien des empreintes de méthylation de l'ADN au cours du développement préimplantatoire. Gènes Dév. 22, 1607-1616 (2008).

Article CAS PubMed PubMed Central Google Scholar

Regha, K. et al. La chromatine active et répressive sont intercalées sans se propager dans un groupe de gènes imprimés dans le génome des mammifères. Mol. Cellule 27, 353–366 (2007).

Article CAS PubMed PubMed Central Google Scholar

Nagano, T. et al. L'ARN non codant de l'air fait taire épigénétiquement la transcription en ciblant G9a sur la chromatine. Sciences 322, 1717-1720 (2008).

Article CAS PubMed Google Scholar

Quenneville, S. et al. Dans les cellules souches embryonnaires, ZFP57/KAP1 reconnaissent un hexanucléotide méthylé pour affecter la chromatine et la méthylation de l'ADN des régions de contrôle d'empreinte. Mol. Cellule 44, 361–372 (2011).

Article CAS PubMed PubMed Central Google Scholar

Liu, Y., Toh, H., Sasaki, H., Zhang, X. & Cheng, X. Un modèle atomique de reconnaissance par Zfp57 de la méthylation CpG dans une séquence d'ADN spécifique. Gènes Dév. 26, 2374–2379 (2012).

Article CAS PubMed PubMed Central Google Scholar

Li, X. et al. Un gène à effet zygotique maternel, Zfp57, maintient les empreintes maternelles et paternelles. Dév. Cellule 15, 547-557 (2008).

Article CAS PubMed PubMed Central Google Scholar

Messerschmidt, DM et al. Trim28 est nécessaire pour la stabilité épigénétique pendant la transition de l'ovocyte de souris à l'embryon. Sciences 335, 1499-1502 (2012).

Article CAS PubMed Google Scholar

Takahashi, N. et al. ZNF445 est un régulateur primaire de l'empreinte génomique. Gènes Dév. 33, 49–54 (2019).

Article CAS PubMed PubMed Central Google Scholar

Anvar, Z. et al. ZFP57 reconnaît des variantes de motifs de séquences multiples et étroitement espacées pour maintenir des marques épigénétiques répressives dans les cellules souches embryonnaires de souris. Nucleic Acids Res. 44, 1118-1132 (2016).

Article CAS PubMed Google Scholar

Latos, PA et al. Le chevauchement transcriptionnel d'Airn, mais pas ses produits lncRNA, induit le silençage d'Igf2r imprimé. Sciences 338, 1469-1472 (2012).

Article CAS PubMed Google Scholar

Leitch, HG et al. La pluripotence naïve est associée à une hypométhylation globale de l'ADN. Nat. Structure. Mol. Biol. 20, 311-316 (2013).

Article CAS PubMed PubMed Central Google Scholar

Habibi, E. et al. Séquençage au bisulfite du génome entier de deux méthylomes d'ADN interconvertibles distincts de cellules souches embryonnaires de souris. Cellule souche cellulaire 13, 360–369 (2013).

Article CAS PubMed Google Scholar

Ficz, G. et al. L'inhibition de la signalisation FGF dans les ESC entraîne une déméthylation rapide à l'échelle du génome vers l'état fondamental épigénétique de la pluripotence. Cellule souche cellulaire 13, 351–359 (2013).

Article CAS PubMed PubMed Central Google Scholar

Walter, M., Teissandier, A., Pérez-Palacios, R. & Bourc'his, D. Un interrupteur épigénétique assure la répression du transposon lors de la perte dynamique de méthylation de l'ADN dans les cellules souches embryonnaires. eLife 5, e11418 (2016).

Article PubMed PubMed Central Google Scholar

Singh, P. et al. Analyse à l'échelle du chromosome de la chromatine spécifique de l'allèle parental et de la méthylation de l'ADN. Mol. Cellule. Biol. 31, 1757-1770 (2011).

Article CAS PubMed PubMed Central Google Scholar

Avsec, Ž. et coll. Les modèles de résolution de base de la liaison des facteurs de transcription révèlent une syntaxe de motif souple. Nat. Genet. 53, 354–366 (2021).

Article CAS PubMed PubMed Central Google Scholar

Li, X. & Leder, P. Identification des gènes préférentiellement exprimés dans les cellules souches embryonnaires indifférenciées. BMC Cell Biol. 8, 37 (2007).

Article PubMed PubMed Central Google Scholar

Feng, Y.-Q., Lorincz, MC, Fiering, S., Greally, JM et Bouhassira, EE Les effets de position sont influencés par l'orientation d'un transgène par rapport à la chromatine flanquante. Mol. Cellule. Biol. 21, 298–309 (2001).

Article CAS PubMed PubMed Central Google Scholar

Maatouk, DM et al. La méthylation de l'ADN est un mécanisme principal pour faire taire les gènes des cellules germinales primordiales postmigratoires dans les lignées de cellules germinales et de cellules somatiques. Développement 133, 3411–3418 (2006).

Article CAS PubMed Google Scholar

Blaschke, K. et al. La vitamine C induit une déméthylation de l'ADN dépendante de Tet et un état de type blastocyste dans les cellules ES. Nature 500, 222-226 (2013).

Article CAS PubMed PubMed Central Google Scholar

Sharif, J. et al. La protéine SRA Np95 assure la médiation de l'hérédité épigénétique en recrutant Dnmt1 en méthylé. ADN 450, 6 (2007).

Google Scholar

Portilho, NA L'inhibiteur de DNMT1 GSK-3484862 assure la médiation de la déméthylation globale dans les cellules souches embryonnaires murines. Épigénétique Chromatine 12, 56 (2021).

Article Google Scholar

Wang, H. et al. mAM facilite la conversion par ESET du diméthyle en triméthyllysine 9 de l'histone H3 pour provoquer une répression transcriptionnelle. Mol. Cellule 12, 475–487 (2003).

Article CAS PubMed Google Scholar

Ichimura, T. et al. Répression transcriptionnelle et formation d'hétérochromatine par les protéines des familles MBD1 et MCAF/AM. J. Biol. Chim. 280, 13928–13935 (2005).

Article CAS PubMed Google Scholar

Tsusaka, T., Shimura, C. & Shinkai, Y. ATF7IP régule la localisation nucléaire de SETDB1 et augmente son ubiquitination. EMBO Rep. 20, e48297 (2019).

Article CAS PubMed PubMed Central Google Scholar

Lezmi, E. et al. Le régulateur de chromatine ZMYM2 limite la croissance des cellules souches pluripotentes humaines et est essentiel à la formation de tératome. Stem Cell Rep. 15, 1275-1286 (2020).

Article CAS Google Scholar

Tsusaka, T., Fukuda, K., Shimura, C., Kato, M. et Shinkai, Y. Le domaine de la fibronectine de type III (FNIII) d'ATF7IP contribue à un silence transcriptionnel efficace médié par le complexe SETDB1. Épigénétique Chromatine 13, 52 (2020).

Article CAS PubMed PubMed Central Google Scholar

Bar, S. et al. Identification des régulateurs de l'empreinte parentale par criblage CRISPR/Cas9 dans les cellules souches embryonnaires humaines haploïdes. Nat. Commun. 12, 6718 (2021).

Article CAS PubMed PubMed Central Google Scholar

Xu, W. et al. METTL3 régule l'hétérochromatine dans les cellules souches embryonnaires de souris. Nature 591, 317-321 (2021).

Article CAS PubMed Google Scholar

Shi, H. et al. Régulation ZFP57 des éléments transposables et de l'expression génique dans et au-delà des domaines imprimés. Épigénétique Chromatine 12, 49 (2019).

Article PubMed PubMed Central Google Scholar

Yang, F. et al. L'activation médiée par DUX-miR-344-ZMYM2 des LTR MERVL induit un état de type 2C totipotent. Cellule souche cellulaire 26, 234–250.e7 (2020).

Article CAS PubMed PubMed Central Google Scholar

Branon, TC et al. Marquage de proximité efficace dans les cellules vivantes et les organismes avec TurboID. Nat. Biotechnol. 36, 880–887 (2018).

Article CAS PubMed PubMed Central Google Scholar

Villasenor, R. et al. ChromID identifie l'interactome protéique au niveau des marques de chromatine. Nat. Biotechnol. 38, 728–736 (2020).

Article PubMed PubMed Central Google Scholar

Tanimoto, K., Shimotsuma, M., Matsuzaki, H., Omori, A. & Fukamizu, A. Empreinte génomique récapitulée dans le locus de la B-globine humaine. PNAS 102, 10250–10255 (2005).

Article CAS PubMed PubMed Central Google Scholar

Taylor, DH, McLean, CM, Wu, WL, Wang, AB & Soloway, PD Méthylation de l'ADN imprimé reconstitué à un locus non imprimé. Épigénétique Chromatine 9, 41 (2016).

Article PubMed PubMed Central Google Scholar

Matsuzaki, H. et al. Des fragments d'ADN synthétique portant des éléments cis ICR deviennent méthylés de manière différentielle et récapitulent l'empreinte génomique chez les souris transgéniques. Épigénétique Chromatine 11, 36 (2018).

Article PubMed PubMed Central Google Scholar

Park, YJ et al. Séquences suffisantes pour programmer la méthylation de l'ADN germinal imprimée définie. PLoS One 7, e33024 (2012).

Article CAS PubMed PubMed Central Google Scholar

Stelzer, Y., Shivalila, CS, Soldner, F., Markoulaki, S. & Jaenisch, R. Suivi des changements dynamiques de la méthylation de l'ADN à une résolution unicellulaire. Cellule 163, 218-229 (2015).

Article CAS PubMed PubMed Central Google Scholar

Dixon, G. et al. QSER1 protège les vallées de méthylation de l'ADN de la méthylation de novo. Sciences 372, eabd0875 (2021).

Article CAS PubMed PubMed Central Google Scholar

Voon, HPJ et al. L'ATRX joue un rôle clé dans le maintien du silence au niveau des locus hétérochromatiques interstitiels et des gènes imprimés. Cell Rep. 11, 405–418 (2015).

Article CAS PubMed PubMed Central Google Scholar

Elsässer, SJ, Noh, K.-M., Diaz, N., Allis, CD & Banaszynski, LA L'histone H3.3 est nécessaire pour le silençage des éléments rétroviraux endogènes dans les cellules souches embryonnaires. Nature 522, 240–244 (2015).

Article PubMed PubMed Central Google Scholar

Yang, BX et al. Identification systématique des facteurs de silençage du provirus dans les cellules souches embryonnaires. Cellule 163, 230-245 (2015).

Article CAS PubMed PubMed Central Google Scholar

Timms, RT, Tchasovnikarova, IA, Antrobus, R., Dougan, G. & Lehner, PJ La stabilisation médiée par ATF7IP de l'histone méthyltransférase SETDB1 est essentielle pour la formation d'hétérochromatine par le complexe HUSH. Cell Rep. 17, 653–659 (2016).

Article CAS PubMed PubMed Central Google Scholar

Matsui, T. et al. Le silençage proviral dans les cellules souches embryonnaires nécessite l'histone méthyltransférase ESET. Nature 464, 927–931 (2010).

Article CAS PubMed Google Scholar

Strogantsev, R. et al. Liaison allèle-spécifique de ZFP57 dans la régulation épigénétique de l'expression monoallélique imprimée et non imprimée. Génome Biol. 16, 112 (2015).

Article PubMed PubMed Central Google Scholar

Nikolov, M., Soeroes, S., Stark, H. & Urlaub, H. Purification par affinité de la chromatine et spectrométrie de masse quantitative définissant l'interactome des modèles de modification des histones. Mol. Cellule. Protéome. 10, 17 (2011).

Article Google Scholar

Eberl, HC, Spruijt, CG, Kelstrup, CD, Vermeulen, M. & Mann, M. Une carte des lecteurs de chromatine généraux et spécialisés dans les tissus de souris générés par la protéomique d'interaction sans étiquette. Mol. Cellule 49, 368–378 (2013).

Article CAS PubMed Google Scholar

Hackett, JA et al. Tracer les transitions de la pluripotence au destin des cellules germinales avec le dépistage CRISPR. Nat. Commun. 9, 4292 (2018).

Article PubMed PubMed Central Google Scholar

Bibel, M. et al. Différenciation des cellules souches embryonnaires de souris en une lignée neuronale définie. Nat. Neurosci. 7, 1003–1009 (2004).

Article CAS PubMed Google Scholar

Flemr, M. & Bühler, M. Génération en une seule étape de cellules souches embryonnaires de souris knock-out conditionnelles. Cell Rep. 12, 709–716 (2015).

Article CAS PubMed Google Scholar

Kumaki, Y., Oda, M. & Okano, M. QUMA : outil de quantification pour l'analyse de la méthylation. Nucleic Acids Res. 36, W170–W175 (2008).

Article CAS PubMed PubMed Central Google Scholar

Mallona, ​​I. et al. La préférence de séquence flanquante module la méthylation de novo de l'ADN dans le génome de la souris. Nucleic Acids Res. 49, 145-157 (2021).

Article CAS PubMed Google Scholar

Stadler, MB et al. Les facteurs de liaison à l'ADN façonnent le méthylome de la souris dans les régions régulatrices distales. Nature 480, 490–495 (2011).

Article CAS PubMed Google Scholar

Marks, H. et al. Les fondements transcriptionnels et épigénomiques de la pluripotence de l'état fondamental. Cellule 149, 590–604 (2012).

Article CAS PubMed PubMed Central Google Scholar

Domcke, S. et al. La compétition entre la méthylation de l'ADN et les facteurs de transcription détermine la liaison de NRF1. Nature 528, 575-579 (2015).

Article CAS PubMed Google Scholar

Michlits, G. et al. Le score VBC multicouche prédit les sgARN qui génèrent efficacement des allèles de perte de fonction. Nat. Méthodes 17, 708–716 (2020).

Article CAS PubMed Google Scholar

Ringel, T. et al. Le dépistage CRISPR à l'échelle du génome dans les organoïdes intestinaux humains identifie les facteurs de résistance au TGF-β. Cellule souche cellulaire 26, 431–440.e8 (2020).

Article CAS PubMed Google Scholar

Doench, JG et al. Conception sgrNA optimisée pour maximiser l'activité et minimiser les effets hors cible de CRISPR-Cas9. Nat. Biotechnol. 34, 184-191 (2016).

Article CAS PubMed PubMed Central Google Scholar

Cox, J. & Mann, M. MaxQuant permet des taux d'identification de peptides élevés, des précisions de masse individualisées en ppb et une quantification des protéines à l'échelle du protéome. Nat. Biotechnol. 26, 1367-1372 (2008).

Article CAS PubMed Google Scholar

Tyanova, S. et al. La plate-forme informatique Perseus pour une analyse complète des données (proté)omiques. Nat. Méthodes 13, 731–740 (2016).

Article CAS PubMed Google Scholar

Gao, Y. et al. Paysage d'expression des protéines des embryons de souris au cours du développement pré-implantatoire. Cell Rep. 21, 3957–3969 (2017).

Article CAS PubMed Google Scholar

Télécharger les références

Nous remercions A. Dean (NIH/NIDDK) pour avoir aimablement fourni la lignée mESC TC-1 et M. Buehler (FMI Bâle) et C. Földy (Université de Zurich) pour le partage de plasmides. En outre, nous remercions G. Schwank et son groupe (Université de Zurich) pour leur aide dans l'établissement du protocole d'écran CRISPR, le Functional Genomics Center Zurich (FGCZ), S3IT Zurich et Cytometry Facility de l'Université de Zurich pour leur soutien. Nous remercions P.-A. Defossez (Université Paris Diderot) et les membres du groupe Baubec pour leur contribution et pour leurs critiques constructives. TB reconnaît le soutien de l'Université de Zurich et de l'Université d'Utrecht, du Fonds national suisse de la recherche scientifique (183722, 180354 et 190378), du Conseil européen de la recherche (865094 - ChromatinLEGO - ERC-2019-COG) et du programme EMBO Young Investigator. NS a été soutenu par des bourses postdoctorales de l'EMBO et de l'Université de Zurich et est boursier SNSF Ambizione (186012). RV reconnaît le soutien de l'Université de Zurich (bourse postdoctorale UZH FK-21-060). DS reconnaît le soutien de la Novartis Research Foundation, du Conseil européen de la recherche dans le cadre de l'accord de subvention du programme de recherche et d'innovation Horizon 2020 de l'Union européenne (UE) (667951-ReadMe et 884664-DNAccess) et du Fonds national suisse de la recherche scientifique (310030B_176394). ARK reconnaît le soutien du Laboratoire européen de biologie moléculaire, Deutsche Forschungsgemeinschaft (KR 5247/1-1) et du Fonds national suisse Ambizione (subvention PZOOP3_161493).

Nina Schmolka

Adresse actuelle : Institut d'immunologie expérimentale, Université de Zurich, Zurich, Suisse

Rodrigo Villasenor

Adresse actuelle : Division de biologie moléculaire, Centre biomédical de Munich, Université Ludwig-Maximilians, Munich, Allemagne

Silvia Domcke

Adresse actuelle : Department of Genome Sciences, University of Washington, Seattle, WA, USA

Arnaud R. Krebs

Adresse actuelle : Laboratoire européen de biologie moléculaire (EMBL), Unité de biologie des génomes, Heidelberg, Allemagne

Département des mécanismes moléculaires des maladies, Université de Zurich, Zurich, Suisse

Stefan Butz, Nina Schmolka, Ino D. Karemaker, Rodrigo Villaseñor, Isabel Schwarz & Tuncay Baubec

Programme de doctorat en sciences de la vie moléculaire de la Life Science Zurich Graduate School, Université de Zurich et ETH Zurich, Zurich, Suisse

Stefan Butz

Institut Friedrich Miescher pour la recherche biomédicale, Bâle, Suisse

Silvia Domcke, Florian Lienert, Arnaud R. Krebs & Dirk Schübeler

Faculté des sciences, Université de Bâle, Bâle, Suisse

Silvia Domcke, Florian Lienert & Dirk Schübeler

Institute of Molecular Biotechnology Austria (IMBA), Vienna BioCenter (VBC), Vienne, Autriche

Esther CH Uijttewaal & Ulrich Elling

Institut de recherche en pathologie moléculaire (IMP), Vienna BioCenter (VBC), Vienne, Autriche

Julian Jude et Johannes Zuber

Division de la biologie du génome et de l'épigénétique, Institut de biodynamique et de biocomplexité, Département de biologie, Faculté des sciences, Université d'Utrecht, Utrecht, Pays-Bas

Nathalie P. de Wagenaar, Xue Bao & Tuncay Baubec

Université de médecine de Vienne, Vienna BioCenter (VBC), Vienne, Autriche

Jean Zuber

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

SB et TB ont conçu l'étude. SB, NS, IK, RV, IS, SD, FL, NdW, XB et TB ont réalisé des expériences. JJ, UE, JZ et UE ont conçu et généré des bibliothèques CRISPR ciblées. AK et DS ont fourni des lignées cellulaires et des ensembles de données utilisés dans cette étude. SB et TB ont rédigé le manuscrit, avec la contribution de tous les auteurs.

Correspondance à Tuncay Baubec.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Genetics remercie Maxim Greenberg et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

a) Instantané du navigateur du génome pour le locus Airn ICR dans les cellules souches embryonnaires de souris. Les pistes ChIP-seq pour les modifications de la chromatine, les données RNA-seq pour l'activité transcriptionnelle, DHS-seq pour l'accessibilité de la chromatine, les données WGBS pour la méthylation de l'ADN et la densité GC locale en pourcentage sont présentées. La séquence ICR utilisée pour les expériences est mise en évidence. b) Gel d'agarose représentatif pour la digestion de restriction de plasmides méthylés et non méthylés in vitro avant la transfection. HpaII et MspI partagent le même site de reconnaissance, mais HpaII est bloqué par la méthylation CpG. L'expérience a été répétée au moins deux fois avant l'intégration du RMCE. Les marqueurs de taille moléculaire sont indiqués. c) Vue d'ensemble schématique du fragment d'ADN intégré ectopique pour H19 avec des lignes verticales illustrant des sites CpG individuels (en haut) et des mesures de molécule unique de la méthylation de l'ADN des séquences pré-méthylées et non méthylées à l'aide de la PCR au bisulfite (en bas). de) comme en (c) : pour Zrsr1 (d) et Kcnq1ot1 (e). f) Vue d'ensemble schématique du fragment d'ADN intégré ectopique pour le DMR gamétique Igf2r avec des lignes verticales illustrant des sites CpG individuels (en haut) et des mesures de molécule unique de la méthylation de l'ADN des séquences pré-méthylées et non méthylées à l'aide de la PCR au bisulfite (en bas). gi) identique à f : Hes3 (g), Syt1 (h) et Tcl1 (i). Les données de bisulfite non méthylé (-M.SssI) pour gi ont été obtenues auprès de Lienert et al.3 et présentées à des fins de comparaison.

Données source

a) Tableau récapitulatif pour l'analyse de la méthylation de l'Airn ICR après culture à long terme (plus de 20 passages consécutifs), intégration aléatoire à un site génomique différent, lors de la différenciation en cellules progénitrices neuronales (NPC), ou après culture en 2i pendant 10 jours. bd) Mesures d'une seule molécule à partir de la PCR au bisulfite correspondant aux données résumées en a. e) Analyse de méthylation pour l'Airn ICR ectopique et endogène après Zfp57 KO médiée par CRISPR. Les triangles indiquent les CpG dans les motifs ZFP57. La région analysée par bsPCR est indiquée. f) Aperçu schématique des fragments Airn ICR testés dans l'étude (en haut) et des résultats de PCR de bisulfite à molécule unique à partir des fragments individuels (ci-dessous) g) Tableau récapitulatif pour l'analyse de méthylation des fragments H19 ICR, y compris la taille, la densité CpG et les informations sur le contenu GC. h) Mesures d'une seule molécule à partir de la PCR au bisulfite correspondant aux données résumées en g.

a) Analyse des caractéristiques de séquence pour les fenêtres de 1 kb à l'échelle du génome. Les points jaunes indiquent les séquences ICR utilisées dans cette étude. Les points rouges indiquent des fragments de type Airn. b) Instantanés du navigateur du génome pour les quatre séquences de type Airn. Les cases en surbrillance indiquent les séquences d'ADN utilisées dans les expériences RMCE. c) Caractéristiques de séquence de séquences de type Airn sélectionnées par rapport à l'Airn ICR. Les lignes verticales correspondent aux sites CpG individuels dans la séquence. d) Pourcentage GC de séquences de type Airn sélectionnées. e) Représentation d'une seule molécule des données résumées en f. f) Résumé tabulaire de l'analyse de la méthylation pour toutes les séquences de type Airn, y compris l'Airn ICR à des fins de comparaison.

a) Flux de travail indiquant le brassage de séquences silico pour l'Airn ICR. b) Séquence caractéristique de la séquence mélangée la plus divergente (Airn mélangé) par rapport à la séquence Airn originale. c) Évaluation BPNet de la liaison ZFP57 à l'ICR Airn de type sauvage et liaison prédite dans l'ICR Airn mélangé. d) Liaison ZFP57 prédite dans Airn de type sauvage avec un remplacement de balayage de 10 pb à partir de la séquence Airn mélangée. Chaque ligne représente la prédiction d'une expérience de remplacement. e) Prédiction de liaison ZFP57 dans des motifs de liaison Airn mélangés + ZFP57 reconstitués.

a) Conception de constructions de rapporteurs GFP avec différents promoteurs utilisant des séquences identiques en porte-à-faux pour l'assemblage de Gibson, et b) analyse par cytométrie en flux de l'expression de GFP de cellules qui portent les constructions de rapporteurs vides non méthylées sans ICR. c) Analyse par cytométrie en flux indiquant le pourcentage de cellules GFP-positives par population (dérivées de clones individuels) montrant la stabilité de la répression pour les reporters ICR méthylés en combinaison avec les promoteurs EF1a (en haut) ou PGK (en bas) mesurés à 16, 23 et 30 jours après la transfection. De plus, le pourcentage de GFP est indiqué pour les cellules recevant des rapporteurs avec des promoteurs méthylés uniquement (pas d'ICR) ou en combinaison avec le promoteur Dazl comme témoins. Chaque point indique des clones dérivés indépendamment. d) Analyse par cytométrie en flux de cellules contenant un rapporteur H19-EF1a. e) Analyse par cytométrie en flux pour un clone représentatif de mESC avec le journaliste Airn-pCAGGS cultivé dans du sérum, 2i ou 2i + vitamine C pendant 12 jours. f) Analyse par cytométrie en flux de trois clones indépendants avec le rapporteur Airn-CAG méthylé après 8 jours dans différentes conditions de milieu. g) Évolution dans le temps de la réactivation de différentes combinaisons ICR-promoteur dans différentes conditions de croissance. Les points de données montrent la valeur moyenne de 3 clones indépendants. La barre d'erreur indique l'erreur standard de la moyenne.

a) Analyse par cytométrie en flux de la réactivation de la GFP 8 jours après la transfection avec des ARN guides ciblant les gènes Uhrf1 et Dnmt1, par rapport aux cellules transfectées avec des ARN guides non ciblant. Les données sont présentées à partir de l'ensemble de la population de cellules ciblées sans présélection pour les cellules KO. b) Résumé des résultats de a. Chaque point indique le % de cellules GFP-positives dans l'ensemble de la population de cellules ciblées. c) Analyse par cytométrie en flux de l'Airn-EF1a-GFP pré-méthylé traité avec l'inhibiteur de méthylation de l'ADN GSK-3484862 pendant 2 jours (en haut) et après lavage pendant 7 jours, indiquant qu'une fois réactivé, le rapporteur ne réagit pas au silence.

a) Stratégie de déclenchement FACS pour les écrans CRISPR utilisant les bibliothèques ChromMM. Les mESC transduites sont sélectionnées sur la base du marqueur de surface cellulaire CD90.1, co-exprimé à partir du sgRNA contenant le transgène. Les cellules réactivées sont triées en fonction de l'expression de GFP (par exemple 8 jours). b) Expérience de cours temporel pour un écran CRISPR utilisant le ChromMM ou une bibliothèque de contrôle réalisée avec trois clones indépendants. Les barres d'erreur indiquent l'erreur standard de la moyenne. cd) Analyse par cytométrie en flux des lignées cellulaires transduites avec la bibliothèque de ciblage de la chromatine par rapport à la bibliothèque de contrôle non ciblant dans le sérum et 2i, respectivement. L'axe indique le pourcentage de cellules GFP-positives dans la population de dépistage CRISPR.

a) Diagramme de rang pour les écrans dans des conditions sériques. La ligne horizontale en pointillés indique le seuil de valeur p de 0,05. Les valeurs de p ont été obtenues à l'aide de MAGeCK RRA (agrégation de rangs robustes). Les points rouges indiquent les facteurs d'hétérochromatine connus associés à la régulation ICR, les points bleus indiquent les gènes trouvés dans plusieurs écrans et les points verts indiquent les contrôles positifs. b) Aperçu des résultats CRISPR pour les lignées cellulaires rapporteuses Airn et Kcnq1ot1 cultivées dans des conditions 2i. La ligne horizontale en pointillés indique le seuil de valeur p de 0,05 obtenu à l'aide de MAGeCK RRA (agrégation de rangs robustes). c) Diagramme de rang pour les écrans dans des conditions 2i. La ligne horizontale en pointillés indique le seuil de valeur p de 0,05 obtenu à l'aide de MAGeCK RRA (agrégation de rangs robustes). d) Vue d'ensemble des résultats CRISPR utilisant la bibliothèque EpiTF dans la lignée cellulaire reporter Airn cultivée dans le sérum. La ligne horizontale en pointillés indique le seuil de valeur p de 0,05 obtenu à l'aide de MAGeCK RRA (agrégation de rangs robustes). e) Diagramme de classement pour l'écran à l'aide du journaliste Airn pEF1a dans le sérum à l'aide de la bibliothèque EpiTF. La ligne horizontale en pointillés indique le seuil de valeur p de 0,05 obtenu à l'aide de MAGeCK RRA (agrégation de rangs robustes). f) Validation de candidats potentiels à l'aide de transfections uniques d'ARN guides contre le gène indiqué. L'expression de la GFP a été mesurée 12 jours après la transfection. Les transfections ont été réalisées en réplicats techniques. Les candidats potentiels ont été ciblés avec un guide indépendant et un guide de la bibliothèque ChromMM. Les données montrent le % de cellules positives dans les pools après le ciblage CRISPR. g) Représentation du réseau pour tous les candidats potentiels utilisant la base de données STRING. Le bord rose indique des interactions déterminées expérimentalement ; le bord cyan indique les interactions connues des bases de données organisées. Les bords verts, rouges et bleus indiquent les interactions prévues en fonction du voisinage des gènes, de la fusion des gènes et de la cooccurrence des gènes, respectivement. Les bords jaunes et noirs sont des interactions prédites basées sur l'exploration de texte et la co-expression, respectivement.

a) Analyse de chevauchement des pics montrant le pourcentage de pics ZMYM2 ou ATF7IP coïncidant avec SETDB1, ZFP57 ou des sites génomiques co-liés par ZFP57 et SETDB1. b) Heatmap indiquant la liaison ZMYM2 aux pics ZMYM2 et séparés par des pics chevauchant les pics SETB1 et SETB1 indépendants. Le signal H3K9me3 ChIP-seq est affiché pour les mêmes ensembles de pics. c) Analyse de méthylation WGBS à des pics indépendants ZMYM2 et ATF7IP (N = 159). Les pics ZMYM2 sont séparés par des sites qui se chevauchent (N = 4201) et qui ne se chevauchent pas (N = 10292) avec SETDB1. Les boîtes à moustaches indiquent la plage interquartile sous forme de boîte (IQR) et les valeurs les plus basses et les plus élevées dans la plage de 1,5 x IQR autour de la boîte sous forme de moustaches. d) ChIP-qPCR pour la liaison ATF7IP et ZMYM2 à l'ICR Airn endogène dans les cellules de type sauvage et Zfp57-KO. L'enrichissement de la puce est normalisé à 5 % d'entrée et calibré sur un site génomique de fond (intergénique). Sont illustrés des répliques techniques indépendantes. e) Parcelles de volcan indiquant les protéines enrichies en ZFP57_dZNF-TurboID (domaine KRAB uniquement) sur une lignée cellulaire TurboID de fond (nTurbo). Les protéines statistiquement enrichies sont indiquées (test t bilatéral corrigé par FDR : FDR = 0,05, s0 = 1, n = 4 répétitions techniques). f) Niveaux d'expression pour ZFP57, ATF7IP et ZMYM2, mesurés à différents moments au cours du développement précoce de l'embryon. Les lectures normalisées RPKM obtenues à partir de la réf. 73. g) Détection par immunotransfert d'ATF7IP et de ZMYM2 dans des cellules de type sauvage et KO à l'aide d'anticorps spécifiques. Lamin B1 est utilisé comme contrôle de chargement. L'astérisque désigne le clone Zmym2-KO utilisé pour l'analyse WGBS. L'expérience a été répétée au moins trois fois. Les marqueurs de poids moléculaire sont indiqués.

Données source

a) Boîtes à moustaches indiquant la méthylation moyenne de l'ADN sur tous les CpG couverts au moins 10x dans le génome de la souris. La plage interquartile est représentée par une boîte (IQR) et les valeurs les plus basses et les plus élevées dans la plage de 1,5 x IQR autour de la boîte sous forme de moustaches. Le nombre de CpG indépendants analysés est indiqué. b) Les contrôles de conversion au bisulfite à partir de l'ADN du phage Lambda enrichi et de l'ADN du phage T7 méthylé montrent une conversion complète des molécules d'ADN. La plage interquartile est représentée par une boîte (IQR) et les valeurs les plus basses et les plus élevées dans la plage de 1,5 x IQR autour de la boîte sous forme de moustaches. Le nombre de CpG indépendants analysés est indiqué. c) Analyse des données WGBS de tous les ICR annotés dans les mESC de type sauvage, Atf7ip-KO et Zmym2-KO. d) Profils de méthylation individuels à partir d'expériences de séquençage au bisulfite ciblées pour les ICR Airn, Kcnqot1 et Peg10 dans les mESC de type sauvage, Atf7ip-KO et Zmym2-KO. 1000 amplicons par échantillon ont été échantillonnés au hasard pour une meilleure visualisation. e) Heatmap montrant H3K9me3 à tous les ICR dans les mESC de type sauvage, Atf7ip-KO et Zmym2-KO. Les lectures normalisées de la bibliothèque sont affichées par 20 bp.

Tableau supplémentaire contenant des informations supplémentaires et des valeurs numériques liées aux écrans CRISPR, aux expériences bioID MS et aux informations sur la séquence d'ADN.

Gel d'ADN non cultivé.

Western blots non recadrés.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Butz, S., Schmolka, N., Karemaker, ID et al. La séquence d'ADN et les modificateurs de chromatine coopèrent pour conférer une bistabilité épigénétique aux régions de contrôle d'empreinte. Nat Genet 54, 1702–1710 (2022). https://doi.org/10.1038/s41588-022-01210-z

Télécharger la citation

Reçu : 10 juin 2021

Accepté : 19 septembre 2022

Publié: 04 novembre 2022

Date d'émission : novembre 2022

DOI : https://doi.org/10.1038/s41588-022-01210-z

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Epigénétique & Chromatine (2023)