Cellules du cœur humain adulte

Rapport des données

Aucune méthode statistique n’a été utilisée pour prédéterminer la taille de l’échantillon. Les expériences n’étaient pas randomisées et les investigateurs n’étaient pas aveugles à l’allocation pendant les expériences et l’évaluation des résultats.

Éthique de la recherche pour les tissus des donneurs

Les tissus cardiaques (donneurs D1-D7 et D11) ont été traités au Wellcome Sanger Institute (Hinxton, Royaume-Uni) et obtenus à partir de donneurs d’organes transplantés décédés après approbation du comité d’éthique de la recherche (réf 15/EE/0152, comité d’éthique de la recherche de l’Est de l’Angleterre Cambridge South) et consentement éclairé des familles des donneurs. Les tissus cardiaques (donneurs H2-H7) ont été traités à la Harvard Medical School (Boston, Massachusetts, États-Unis) et obtenus de donneurs d’organes décédés après approbation du comité d’éthique de la recherche humaine Pro00011739 (Université d’Alberta, Edmonton, Canada). Le consentement éclairé des familles des donneurs a été obtenu par le biais du programme institutionnel HOPE (Human Organ Procurement and Exchange Program). Les antécédents cardiovasculaires étaient sans particularité pour tous les donneurs (tableau supplémentaire 1).

Acquisition et traitement des tissus

Les tissus ont été acquis auprès de donneurs britanniques et nord-américains (D1-7 et 11, H2-7) après la mort circulatoire (DCD) (D2, D4-D7 et D11) et après la mort cérébrale (DBD) (D1, D3, H2-H7). Pour les donneurs britanniques de DCD, après un arrêt de cinq minutes et pour les DBD, la poitrine est ouverte, l’aorte est clampée et des échantillons cardiaques sont prélevés. Pour les donneurs nord-américains de DBD, l’aorte est clampée, une cardioplégie froide (Celsior) est administrée sous pression par l’aorte pour arrêter le battement, le cœur est excisé, rincé dans une solution saline froide et des échantillons sont prélevés. Tous les échantillons du donneur étaient des biopsies myocardiques de pleine épaisseur de l’oreillette gauche et droite, des ventricules gauche et droit, du septum interventriculaire et de l’apex, avec exclusion intentionnelle des grands dépôts de graisse épicardique. Les échantillons utilisés pour l’isolement des noyaux uniques ont été congelés au flash et conservés à -80 °C. L’isolement des cellules uniques et l’enrichissement CD45+ ont été effectués sur des échantillons fraîchement prélevés. Les tissus résiduels après les procédures d’isolement des noyaux et des cellules ont été fixés au formol ou congelés en OCT pour des études supplémentaires.

Tous les tissus ont été conservés et transportés sur glace à tout moment jusqu’à la congélation ou la dissociation des tissus pour minimiser toute dégradation transcriptionnelle. Des études antérieures sur la stabilité tissulaire post-mortem du consortium GTEx sur des tissus en vrac68 et dans des cellules uniques69 suggèrent que seuls des changements mineurs dans les tissus au cours des premières 24 h post-mortem lorsqu’ils sont stockés dans des conditions froides.

Isolation de noyaux uniques

Des noyaux uniques ont été obtenus à partir de tissus congelés au flash en utilisant une homogénéisation mécanique comme décrit précédemment70. Les tissus ont été homogénéisés à l’aide d’un ensemble de broyeurs de tissus Dounce en verre de 7 ml (Merck) avec 8 à 10 coups de pilon libre (A) et 8 à 10 coups de pilon serré (B) dans un tampon d’homogénéisation (250 mM de saccharose, 25 mM de KCl, 5 mM de MgCl2, 10 mM de Tris-HCl, 1 mM de dithiothréitol (DTT), 1× inhibiteur de protéase, 0.4 U μl-1 RNaseIn, 0,2 U μl-1 SUPERaseIn, 0,1 % Triton X-100 dans de l’eau sans nucléase). L’homogénat a été filtré à travers une crépine cellulaire de 40-μm (Corning). Après centrifugation (500g, 5 min, 4 °C), le surnageant a été éliminé et le culot a été remis en suspension dans un tampon de stockage (1× PBS, albumine de sérum bovin (BSA) à 4 %, 0,2 U μl-1 Protector RNaseIn). Les noyaux ont été colorés avec les réactifs NucBlue Live ReadyProbes (ThermoFisher) et les noyaux uniques positifs au Hoechst ont été purifiés par tri cellulaire activé par fluorescence (FACS) en utilisant influx, XDP ou FACSAria (BD Biosciences) (figure supplémentaire 1). La purification et l’intégrité des noyaux ont été vérifiées au microscope, et les noyaux ont été traités ultérieurement à l’aide du contrôleur Chromium (10X Genomics) conformément au protocole du fabricant.

Préparation des cellules uniques

Tissus cardiaques (0.2-0,9 g) ont été transférés de la solution cardioplégique dans des tubes en C de type gentleMACS (Miltenyi Biotec) contenant une solution de base de digestion enzymatique (100 μg ml-1 liberase TH Research grade et 50 μg ml-1 DNase I, HBSS 10 mM HEPES et 30 mM taurine)71. Les tissus ont été hachés à l’aide de ciseaux (FST) et digérés automatiquement à l’aide de l’appareil de dissociation OctoMACS (Miltenyi Biotec) avec chauffage. La suspension unicellulaire appauvrie en cardiomyocytes a été lavée avec une solution de base contenant 20 % de sérum bovin fœtal (FBS) (Gibco), filtrée à travers une crépine en nylon de 70-μm (BD Falcon), recueillie par centrifugation (330g, 10 min, 4 °C) et remise en suspension dans une solution de base contenant 0,2 % de FBS (Gibco). Les cellules ont été comptées manuellement trois fois par exclusion au bleu Trypan après chaque centrifugation et remises en suspension à une concentration d’au moins 2 × 106 ml-1. Les cellules uniques ont été traitées à l’aide du contrôleur Chromium (10X Genomics) selon le protocole du fabricant.

Enrichissement des cellules CD45+

La suspension cellulaire a été préparée comme décrit ci-dessus et ensuite marquée à l’aide de microbilles conjuguées à un anticorps monoclonal anti-CD45 humain selon le protocole du fabricant (Miltenyi Biotec). En bref, jusqu’à 107 cellules ont été incubées pendant 15 min à 4 °C dans 80 μl de tampon PBS, BSA, EDTA (1× PBS pH 7,2, 0,5 % BSA, 2 mM EDTA) contenant 20 μl de microbilles CD45. La suspension cellulaire a été lavée dans le tampon PBS, BSA, EDTA une fois et recueillie par centrifugation (330g, 10 min, 4 °C). Les cellules remises en suspension ont été appliquées sur des colonnes MACS LS (Miltenyi Biotec). La fraction cellulaire appauvrie en CD45 a été éliminée après trois lavages avec du tampon PBS, BSA et EDTA et la fraction cellulaire CD45+ a été recueillie dans du tampon PBS, BSA et EDTA en retirant les colonnes du champ magnétique. Les cellules CD45+ ont été comptées et remises en suspension dans du tampon PBS, BSA et EDTA jusqu’à une concentration d’au moins 2 × 106 par ml avant de poursuivre le traitement à l’aide d’un contrôleur Chromium (10X Genomics) selon le protocole du fabricant.

Préparation de la bibliothèque 10X Chromium

Les cellules individuelles et les noyaux ont été comptés manuellement par exclusion au bleu Trypan ou automatiquement à l’aide d’un Countess II (Life Technologies) en utilisant au moins deux comptages séparés. La suspension de cellules ou de noyaux a été ajustée à 400-1 000 cellules par microlitre et chargée sur le contrôleur Chromium (10X Genomics) avec une récupération ciblée de cellules ou de noyaux de 4 000-10 000 par réaction. Les bibliothèques d’expression génique 3′ ont été préparées conformément aux instructions du fabricant des kits de réactifs pour cellules uniques Chromium v2 ou v3 (10X Genomics). Le contrôle de qualité de l’ADNc et des bibliothèques finales a été effectué à l’aide du Bioanalyzer High Sensitivity DNA Analysis (Agilent) ou du 4200 TapeStation System (Agilent). Les bibliothèques ont été séquencées à l’aide de HiSeq 4000 (Illumina) au Wellcome Sanger Institute, et de NextSeq 500 (Illumina) à la Harvard Medical School avec une profondeur minimale de 20 000-30 000 paires de lectures par cellule ou noyau (tableau supplémentaire 22).

Validation spatiale à l’aide de smFISH avec des sondes RNAscope

Lors de la préparation des échantillons fixés au formol et inclus en paraffine (FFPE), les tissus frais ont été fixés dans du formol à 10% tamponné neutre pendant 18-36 h, puis inclus dans des blocs de paraffine. Les échantillons de tissus congelés ont été fixés dans du paraformaldéhyde à 4 % (ThermoFisher). Les sections ont été coupées à 5-μm d’épaisseur à l’aide d’un microtome et placées sur des lames SuperFrost Plus (VWR). Les lames de tissu FFPE ont été automatiquement colorées à l’aide de BOND RX (Leica) et du kit de réactifs fluorescents RNAscope Multiplex v2 Assay (ACDBio), conformément au protocole du fabricant. Les lames de tissu congelées et fixées ont été traitées selon le protocole du RNAscope Multiplex Fluorescent Assay v1 (ACDBio). Les sondes cibles prêtes à l’emploi ou personnalisées de RNAscope ont été exécutées en parallèle avec des contrôles positifs et négatifs multiplexes (Données étendues Fig. 12b, Tableau supplémentaire 23). Tous les noyaux ont été colorés au DAPI. Toutes les lames de tissu FFPE ont été imagées à l’aide d’un système de criblage confocal Opera Phenix High-Content (Perkin Elmer) avec un pas z de 1μm et un objectif à immersion dans l’eau 20× (NA 0,16, 0,299 μm par pixel). Canaux : DAPI (excitation 375 nm, émission 435-480 nm), Atto 425 (excitation 425 nm, émission 463-501 nm), opal 520 (excitation 488 nm, émission 500-550 nm), opal 570 (excitation 561 nm, émission 570-630 nm), opal 650 (excitation 640 nm, émission 650-760 nm). Les lames de tissu congelées et fixées ont été imagées à l’aide d’un microscope confocal LSM710 (Zeiss) et d’un objectif à immersion d’huile 40× (huile 1,3, DIC III). Canaux : DAPI (excitation 375 nm, émission 435-480 nm), Alexa Fluor 488 (excitation 492 nm, émission 517 nm), Atto 550 (excitation 560 nm, émission 575 nm) et Atto 647 (excitation 649 nm, émission 662 nm). La visualisation et l’élimination de l’arrière-plan (rayon de la boule roulante) ont été effectuées à l’aide de Fiji/ImageJ72. Des pseudo-couleurs ont été utilisées pour une meilleure visualisation.

Coloration à l’hématoxyline et à l’éosine

Les échantillons de tissus ont été fraîchement congelés dans de l’isopentane (ThermoFisher) à -80 °C et inclus dans de l’OCT (VWR). Les sections ont été coupées à une épaisseur de 10 μm à l’aide d’un microtome, placées sur des lames SuperFrostPlus (VWR) et traitées ultérieurement selon un protocole standard de coloration à l’hématoxyline et à l’éosine (Données étendues Fig. 12a).

Acquisition de tissu musculaire squelettique

Des échantillons de muscle intercostal ont été obtenus entre la deuxième et la troisième côte du côté gauche. Il s’agit généralement de la couche la plus profonde du muscle (la plus éloignée de la peau). Les échantillons ont été prélevés directement dans la solution de conservation froide.

Isolation des noyaux pour le muscle squelettique

Le tissu musculaire a été lavé dans 1× PBS, nettoyé de tout dépôt de graisse visible et haché pour obtenir des fragments d’environ 1 mm3. Par échantillon, environ 0,3 g de tissus hachés ont été homogénéisés dans 3 ml de tampon A (250 mM de saccharose, 10 mg ml-1 de BSA, 5 mM de MgCl2, 0,12 U μl-1 de RNaseIn, 0,06 U μl-1 de SUPERasIn, 1× inhibiteur de protéase) en utilisant le set de broyeurs de tissus Dounce (Merck) avec 50 coups de pilon libre (A). L’homogénat a été filtré à travers une crépine cellulaire de 100-μm (Corning) et la crépine a été lavée avec 1 ml puis 750 μl de tampon A. Après l’ajout de Triton X-100 (concentration finale 0,5 %), le mélange a été encore homogénéisé avec 50 coups de pilon serré (B). Après filtration à travers une crépine de 40-μm, les noyaux ont été centrifugés (3 000g, 5 min, 4 °C), remis en suspension dans 1 ml de tampon B (320 mM de saccharose, 10 mg ml-1 de BSA, 3 mM de CaCl2, 2 mM d’acétate de magnésium, 0.1 mM EDTA, 10 mM Tris-HCl, 1 mM DTT, 1× inhibiteur de protéase, 0,12 U μl-1 RNaseIn, 0,06 U μl-1 SUPERasin) et purifié à l’aide d’une solution de gradient Percoll à 27 %. Le mélange Percoll a été centrifugé à 20 000g (15 min, 4 °C) et le culot a été remis en suspension dans 200 μl de tampon B, puis centrifugé (20 000g, 3 min, 4 °C). Après coloration au bleu Trypan, les noyaux intacts ont été comptés à l’aide d’un hémocytomètre. Les noyaux ont été profilés à l’aide d’un contrôleur de chrome (10X Genomics) selon le protocole du fabricant.

Isolation unicellulaire pour le muscle squelettique

Le tissu musculaire a été lavé dans 1× PBS, nettoyé de tout dépôt de graisse visible et finement haché. Ensuite, 2 g du tissu haché ont été transférés dans le tampon de digestion 1 (750 U ml-1 de collagénase de type 2 dans 1× PBS) et incubés à 37 °C dans un bain-marie pendant 90 min. Le tissu partiellement digéré a été recueilli par centrifugation (650g, 5 min, 4 °C) et le culot a été remis en suspension dans le tampon de digestion 2 (100 U ml-1 de collagénase de type 2, 2 U ml-1 de dispase dans du PBS). Après 30 min d’incubation à 37 °C dans un bain-marie, la digestion a été arrêtée par l’ajout de 2% de FBS. Les cellules ont été filtrées à travers une crépine en nylon de 100-μm et une autre de 40-μm (BD Falcon), recueillies par centrifugation (650g, 4 °C, 3 min) et lavées avec du PBS 1×, 2% de FBS. Ensuite, un gradient de Percoll à 20 % (15 000g, 4 °C, 20 min) a été utilisé pour la purification des cellules. La couche contenant les cellules a été recueillie, lavée dans du PBS contenant 2% de FBS, et les cellules viables ont été comptées par exclusion au bleu Trypan en utilisant un hémocytomètre. Les noyaux ont été profilés à l’aide d’un contrôleur de chrome (10X Genomics) selon le protocole du fabricant.

Le tableau des ressources clés des méthodes se trouve dans le tableau supplémentaire 24.

Mappage du transcriptome

Après le séquençage, les échantillons ont été démultiplexés et stockés sous forme de fichiers CRAM. Chaque échantillon a été mappé par rapport au génome de référence humain (GRCh38 v.3.0.0) fourni par 10X Genomics, et en utilisant la suite CellRanger (v.3.0.1) avec des paramètres par défaut. Les échantillons unicellulaires ont été mis en correspondance avec la référence telle qu’elle a été fournie. Les échantillons de noyaux uniques, la référence pour le pré-ARNm, a été créée en utilisant les instructions de 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references).

Traitement des données de comptage

Après la cartographie, les échantillons de chaque source de données (noyaux uniques, cellules uniques et cellules CD45+) ont été regroupés en objets AnnData individuels en concaténant le raw_feature_bc_matrix_h5.h5 et en ajoutant les informations de métadonnées appropriées. Pour chaque objet de source de données, la moyenne des identificateurs moléculaires uniques (UMI) (n_counts) a été calculée et utilisée comme seuil pour les gouttelettes vides.

Détection de doublet

Après avoir éliminé les gouttelettes vides, nous avons appliqué scrublet73 pour attribuer un score de doublet (scrublet_score) à chaque cellule. Ces cellules ont été regroupées et visualisées à l’aide de la méthode UMAP74. En outre, chaque cellule a été traitée pour la détection des doublets en utilisant une méthode de percolation pour permettre une meilleure détection des doublets75.

Contrôle de la qualité des cellules et filtrage

Chaque source de données a été traitée et annotée séparément pour tenir compte des différences de qualité spécifiques à la source. Ces métriques sont incluses comme covariables pour les traitements ultérieurs. Les cellules totales et les cellules CD45+ ont été filtrées pour les comptes (500 < n_counts <15 000), les gènes (200 < n_genes), les gènes mitochondriaux (percent_mito <20%), les gènes ribosomaux (percent_ribo <20%) et le score scrublet (scrublet_score <0,3). Les noyaux uniques ont été filtrés pour les comptes (500 < n_counts <15 000), les gènes (300 < n_genes <6 000), les gènes mitochondriaux (percent_mito <5%), les gènes ribosomiques (percent_ribo <5%) et le scrublet score (scrublet_score <0,3). Les mêmes seuils de filtrage ont été appliqués au jeu de données des muscles squelettiques.

La boîte à outils Scanpy 1.576 en Python v.3..7 a été utilisé pour effectuer des analyses en aval, notamment la normalisation (normalize_per_cell : counts_per_cell_after = 10 000), la transformation logarithmique (log1p), la détection des gènes variables (highly_variable_genes), la régression des sources de variation indésirables (regress_out : n_counts et percent_mito), la mise à l’échelle des caractéristiques des données (scale : max_value = 10) et l’ACP (pca : using highly variable genes), comme décrit précédemment77.

Alignement par lots à l’aide d’un autoencodeur variationnel profond

Nous avons construit un manifold global en alignant toutes les sources de données et les donneurs de nos données. Cela a été fait dans une procédure en trois étapes : (1) Chaque source a été analysée et annotée séparément, en alignant uniquement les donneurs à l’aide d’une étape de régression linéaire dans l’espace péricyte avant l’alignement par lots avec bbknn78. Les gènes exprimés de manière différentielle (DEG) ont été calculés à l’aide d’un test de la somme des rangs de Wilcoxon avec ajustement de Bonferroni-Hochberg, tel qu’implémenté dans le cadre de Scanpy. (2) Pour annoter chaque groupe, nous avons utilisé une approche intégrative en recherchant les DEG les plus significatifs (P < 1 × 10-5) avec un logFC >1 dans les bases de données ToppFun79 et EnrichR80. Les résultats significatifs sur les voies, la régulation transcriptionnelle et les processus biologiques ont été classés par ordre de priorité pour annoter un groupe donné. Chaque compartiment cellulaire a été étiqueté sous le slot adata.obs après avoir regroupé les états cellulaires spécifiques à la source. (3) Toutes les sources ont été combinées en un seul objet AnnData sous l’étiquette adata.obs. Les lots ont été alignés à l’aide de la fonction batch_correction de l’auto-codeur variationnel scGen81. Nous avons d’abord aligné pour adata.obs, en utilisant adata.obs comme ancre. Ensuite, nous avons aligné pour adata.obs, en utilisant adata.obs comme ancre. Chaque tour d’alignement de lot a été exécuté pour 50 époques.

Manifolds pour les adipocytes, vasculaire et immunitaire cardiaque populations, ainsi que l’analyse du muscle squelettique, ont été créés en utilisant cette méthode et la précision de clustering a été évaluée avec SCCAF82 (Extended Data Fig. 12d).

DEGs

Pour aider à l’annotation des sous-populations de chaque compartiment cellulaire, nous avons calculé les DEGs en utilisant le test de la somme des rangs de Wilcoxon tel qu’implémenté dans le workflow scanpy et recommandé par de récentes études de benchmarking83. Un gène a été considéré comme différentiellement exprimé s’il présente un changement de pli transformé en log2 > 1 et un P < 1 × 10-5, sauf indication contraire dans la section d’analyse.

Interactions cellule-cellule

Les matrices d’expression des populations étudiées ont été exportées de l’AnnData, ainsi qu’un tableau de métadonnées contenant les codes-barres des cellules comme indices. Nous avons ensuite exécuté CellPhoneDB comme suit : cellphonedb method statistical_analysis meta.tsv counts.tsv-counts-data = gene_name-threads = 60. Les prédictions brutes de CellPhoneDB ont été filtrées en éliminant les interactions dont la valeur P > 1,0 × 10-5. Les paires significatives ont ensuite été soumises à une analyse d’enrichissement des ensembles de gènes dans ReactomeDB, enrichR et ToppFun pour une classification fonctionnelle. Les cellules vasculaires ont été sous-échantillonnées de manière aléatoire à 39 000 cellules avant l’analyse, et le groupe de réparation cardiaque (cardiomyocytes auriculaires et ventriculaires, FBs et cellules immunitaires) a été sous-échantillonné de manière aléatoire à 69 295 cellules avant l’analyse.

Visualisation de l’expression génique sur les données Visium de 10X Genomics

Nous avons traité les données Visium du myocarde ventriculaire gauche disponibles publiquement de 10X Genomics (https://support.10xgenomics.com/spatial-gene-expression/datasets/1.0.0/V1_Human_Heart) en utilisant le workflow Scanpy v.1..5 adapté à l’analyse des données Visium de 10X Genomics (https://scanpy-tutorials.readthedocs.io/en/latest/spatial/basic-analysis.html). En bref, les spots ayant moins de 500 UMI ou plus de 20 000 UMI, et moins de 200 gènes ont été supprimés. Les données ont été transformées en logarithme et normalisées avant d’être tracées.

Estimation de la vitesse de l’ARN

Pour calculer la vitesse de l’ARN des cellules uniques et des cellules uniques enrichies en CD45+, nous avons utilisé le fichier BAM de sortie de CellRanger et le fichier GTF de GENCODE v33 (ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_33/gencode.v33.chr_patch_hapl_scaff.annotation.gtf.gz) avec la CLI velocyto84 v.0.17.17 pour générer un fichier loom contenant la quantification de l’ARN épissé et non épissé. Ensuite, nous avons construit un manifold, regroupé les cellules et visualisé les vitesses de l’ARN en utilisant scVelo85.

Analyses de sous-population des cardiomyocytes auriculaires et ventriculaires, des FB et des cellules neuronales

Tous les codes-barres étiquetés dans l’objet global comme cardiomyocytes, fibroblastes et cellules neuronales ont été sélectionnés pour d’autres analyses de sous-population. Des critères de filtrage supplémentaires spécifiques aux populations cellulaires ont été appliqués aux noyaux comme suit : nombre de cardiomyocytes (n_counts <12 500), gènes (n_genes <4 000), gènes mitochondriaux (percent_mito <1%), gènes ribosomaux (percent_ribo <1%) et score de scrublet (scrublet_score <0.25) ; gènes mitochondriaux FB (pourcentage_mito <1%), gènes ribosomaux (pourcentage_ribo <1%) ; gènes de cellules neuronales (n_genes <4000), gènes mitochondriaux (pourcentage_mito <1%), gènes ribosomaux (pourcentage_ribo <1%). Les cellules totales et CD45+ ont été exclues des ensembles de données sur les cardiomyocytes auriculaires et ventriculaires et n’ont pas contribué à l’analyse des sous-populations. Aucun autre filtrage des cellules FBs ou neuronales totales et des cellules CD45+ n’a été appliqué. Les cardiomyocytes et les FB ont ensuite été répartis en deux groupes en fonction de la région d’origine : (1) oreillette gauche et droite, et (2) ventricules gauche et droit, apex et septum interventriculaire.

Les effets du donneur ont été alignés comme décrit à l’étape (1) ci-dessus. Pour les cellules FB et neuronales, les sources ont été alignées comme décrit à l’étape (3) ci-dessus. Le clustering de Leiden et la visualisation UMAP ont été réalisés pour identifier les sous-populations et la visualisation86. Les gènes exprimés de manière différentielle ont été calculés à l’aide du test de la somme des rangs de Wilcoxon. Les gènes ont été classés par score.

Comparaison inter-tissulaire des populations immunitaires cardiaques avec les populations immunitaires des muscles squelettiques, des reins et du sang

Nous avons recueilli des données transcriptomiques unicellulaires pour les reins adultes de la réf. 99 (https://www.kidneycellatlas.org/), et sous-ensemble toutes les cellules immunitaires signalées dans leur étude. Pour le SKM, nous avons sélectionné les cellules immunitaires annotées à partir du collecteur fusionné. Pour le sang humain, nous avons utilisé la base de données publique de 10 000 cellules PBMC fournie par 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/datasets/3.0.0/pbmc_10k_v3). Comme décrit précédemment87, nous avons entraîné un modèle de régression logistique sur les cellules immunitaires cardiaques en utilisant 80 % des données d’expression et avons testé sa précision sur les 20 % restants pour produire un modèle d’une précision de 0,6862 (figure 8f des données étendues, tableau supplémentaire 16). Nous avons ensuite appliqué ce modèle pour prédire les populations immunitaires cardiaques analogues dans le rein adulte, le SKM et les PBMC. Les prédictions dont la probabilité était inférieure à 0,8 ont été exclues des analyses comparatives en aval.

Analyse d’enrichissement de l’ontologie génique

Pour la population de cardiomyocytes ventriculaires, nous avons utilisé le package R gProfileR (https://cran.r-project.org/web/packages/gProfileR/index.html) avec la liste de gènes classés par score de vCM4 comme entrée et l’ensemble des gènes exprimés dans les cardiomyocytes ventriculaires comme fond (les gènes ayant un nombre d’UMI >1). Pour effectuer l’analyse de l’ontologie des gènes sur les cellules vasculaires, les 500 premiers DEG significatifs (P < 1 × 10-5) avec un changement de pli transformé en logarithme > 1 ont été recherchés dans la base de données des processus biologiques de l’ontologie des gènes en utilisant ToppFun79 (Tableau supplémentaire 25). Les cinq termes les plus significativement enrichis (q < 0,05) pour chaque sous-population ont été sélectionnés et représentés sur une carte thermique. Pour effectuer l’analyse des voies sur les adipocytes, les 500 premiers DEG significatifs (P < 1 × 10-5) avec un changement de plis transformé en logarithme > 0,5 ont été recherchés dans les bases de données de voies ToppFun79 (tableau supplémentaire 26). Les cinq voies les plus enrichies de manière significative (q < 0,05) pour chaque sous-population ont été sélectionnées et représentées sur une carte thermique.

Score de l’ensemble de gènes

Nous utilisons la fonction score_genes telle qu’implémentée dans scanpy pour calculer l’enrichissement des gènes impliqués dans la voie de l’Oncostatine M. Une liste de gènes a été collectée à partir de recherches bibliographiques88,89. Pour l’enrichissement de l’ensemble des gènes, seuls les gènes hautement exprimés ont été pris en compte afin de réduire le bruit (plus de 500 UMI dans toutes les cellules). La même analyse a été effectuée pour comparer les cellules immunitaires cardiaques dans notre étude avec les observations d’études précédentes sur les macrophages résidents cardiaques51, les macrophages remodelant les tissus de souris45 et l’origine du lignage du sac vitellin90.

Statistiques et reproductibilité

Toutes les analyses ont été effectuées à l’aide du logiciel R, v.3.6.1. Des tests t de Student ont été utilisés pour comparer les distributions des types de cellules sur chaque site. P < 0,05 a été considéré comme statistiquement significatif. Les modèles de régression linéaire (corrélations) ont été obtenus à l’aide de la fonction R linear model (lm), qui estime la vraisemblance statistique (valeur P) d’une relation linéaire. La correction de Bonferroni a été appliquée pour les tests multiples.

Les micrographies ARNscope représentées dans les figures sont représentatives. Les micrographies des figures 2g, 3c, h et la figure 3c des données étendues (HAMP), la figure 3e des données étendues (CNN1), les figures 4g, m, 6f des données étendues ont été répétées avec des résultats similaires dans deux sections de tissus individuels. Les micrographies dans les Figs. 2h, 3f et les données étendues Fig. 3c (CNN1), Données étendues Fig. 3e (PCDH7), Données étendues Figs. 6e, h, 9d ont été répétées avec des résultats similaires dans trois sections de tissus individuels. Les micrographies des Figs. 1e, 2d, 3e et des Figs. 1f, 3c (FHL1) et de la Fig. 6d des données étendues ont été répétées avec des résultats similaires dans quatre sections de tissus individuels. Les micrographies de la figure 2c et de la figure 3c des données étendues (PRELID2), les figures 10e et 12a des données étendues ont été répétées avec des résultats similaires dans six sections de tissu individuelles ou plus. Les contrôles positifs et négatifs ont été effectués une fois par échantillons utilisés.

Analyse d’enrichissement GWAS

Nous avons téléchargé les statistiques sommaires GWAS à partir du large cvdi, du catalogue GWAS de l’EBI et de l’atlas GWAS. Nous avons sélectionné les traits avec des GWAS bien alimentés (n > 5.000 et nombre de loci significatifs >10). Les ensembles de données GWAS sont résumés dans le tableau supplémentaire 27. Les données d’expression génétique des gènes codant pour des protéines ont été mappées sur les identifiants de gènes Entrez et ces annotations de gènes ont été utilisées sur l’assemblage du génome humain hg19/37. Nous n’avons utilisé que les données d’expression génique des noyaux. Nous avons implémenté l’analyse précédemment décrite64 en python et en R. Les comptes transformés en logarithme (plus un pseudo-compte) ont été utilisés pour calculer les profils d’expression moyens spécifiques au type de cellule. Nous avons effectué des analyses magma individuelles pour chaque type de cellule, en conditionnant toujours les covariables par défaut au niveau des gènes (par exemple, la longueur des gènes) et l’expression moyenne des gènes dans toutes les cellules. Ensuite, nous avons appliqué la méthode de Benjamini-Hochberg et sélectionné les associations de traits de type cellulaire avec FDR < 10%. Ces paires ont ensuite été soumises à une analyse conditionnelle comme décrit précédemment64 pour définir les paires d’associations  » indépendantes « ,  » conjointement expliquées  » et  » partiellement conjointement expliquées  » (tableau supplémentaire 28).

Distributions des cellules dispersées et des noyaux isolés

Les différentes procédures d’obtention des noyaux isolés et des cellules dispersées ont entraîné des distributions significativement différentes des types de cellules (tableau supplémentaire 29, données étendues Fig. 2). Notamment, 30,1% et 49,2% des noyaux isolés provenaient de cardiomyocytes auriculaires et ventriculaires dans les régions auriculaires et ventriculaires, alors que ces cellules étaient pour la plupart exclues des préparations de cellules isolées et sélectionnées par CD45 (tableau supplémentaire 2).

En excluant les cardiomyocytes, la distribution des types de cellules identifiées à partir des noyaux isolés et des cellules dispersées est restée distincte (tableau supplémentaire 30). Bien que 59,0 % des cellules dispersées étaient des CE, seuls 15,7 % des noyaux étaient dérivés de CE. En revanche, 64,2 % des noyaux provenaient de BF (31,2 %) et de péricytes (33,0 %), alors que seulement 17,1 % des cellules dispersées étaient des BF (2,3 %) et des péricytes (14,8 %). Ces différences peuvent refléter la sensibilité des noyaux de CE aux procédures d’isolement ou la résistance des péricytes et des FB à la digestion enzymatique cellulaire.

Malgré les différences de distribution cellulaire entre les noyaux isolés et les cellules dispersées, les profils d’expression génique des lignées cellulaires étaient raisonnablement corrélés (r > 0,4 pour chaque type de cellule). Pour aborder la concordance des gènes capturés par les cellules et les noyaux, nous avons comparé l’expression des principaux marqueurs de type cellulaire de la Fig. 1c dans les trois sources (Extended Data Fig. 1c). Les noyaux étant dépourvus d’ARN cytoplasmique, l’expression de certains gènes, notamment les gènes immunitaires NKG7 et C1QA, était plus faible dans les noyaux que dans les cellules. Néanmoins, la tendance générale concernant les gènes marqueurs était cohérente entre les trois sources, et les mêmes gènes distinguaient les types cellulaires individuels indépendamment de la source.

Analyse plus poussée des cellules vasculaires

Le PC3_str contenait une contribution similaire de cellules et de noyaux, et avait un score de scrublet inférieur au seuil rigoureux utilisé ; néanmoins, le nombre moyen de gènes et de comptes dans ce cluster était supérieur à la moyenne. Ainsi, malgré notre filtrage de qualité rigoureux, nous ne pouvons pas exclure la possibilité qu’il y ait des doublets dans ce cluster. EC10_CMC-like et PC4_CMC-like co-expriment des gènes de CE ou de péricyte avec des marqueurs de cardiomyocytes et des études supplémentaires sont nécessaires pour comprendre s’ils représentent des états cellulaires précédemment inconnus ou des doublets.

Les observations des SMC artérielles et veineuses sont soutenues par des études antérieures, qui prédisent que les SMC artérielles sont plus contractiles et que les SMC veineuses sont moins différenciées91.

EC3_cap enrichissent les transcrits codant pour les composants de l’AP1 (JUN et FOS), qui médient de multiples décisions de destin des CE, y compris la réponse au VEGF, aux signaux inflammatoires et de stress, et ATF3, un gène de réponse adaptative induit par divers signaux92,93,94.

Caractérisation des muscles squelettiques

Nous avons recueilli des échantillons de muscles squelettiques intercostaux de cinq individus sains, dont un donneur avec du tissu cardiaque apparié, et avons profilé le transcriptome de 35 665 cellules uniques et 39 597 noyaux uniques. De manière analogue au cœur, la combinaison des cellules et des noyaux nous a permis de capturer et de résoudre les principales lignées cellulaires, y compris les cardiomyocytes, les fibroblastes, les cellules endothéliales, les cellules musculaires lisses, les péricytes, les cellules immunitaires myéloïdes et lymphoïdes et les cellules satellites (Données étendues Fig. 11a, b, Tableau supplémentaire 31).

Une analyse plus poussée des cellules vasculaires du muscle squelettique a identifié dix populations distinctes. Les cellules endothéliales ont montré cinq clusters séparés en fonction de leurs lits vasculaires respectifs avec des signatures similaires à celles que nous observons dans le cœur. Les EC_cap expriment le VWF et le RGCC. Les EC_ven veineuses expriment ACKR1 et PLVAP, tandis que les EC_art artérielles montrent SEMA3G et HEY1, en accord avec nos données cardiaques (Extended Data Fig. 11c, d, Supplementary Table 32).

Les distributions globales des populations de cellules vasculaires et stromales dans les muscles squelettiques et cardiaques étaient similaires, y compris les caractéristiques artérielles et veineuses des EC ; cependant ; le muscle squelettique contenait un seul cluster de SMC, potentiellement lié à la plus petite taille de l’ensemble de données. Dans le muscle squelettique, les interactions cellule-cellule prédites de l’EC_art et des SMCs comprenaient NOTCH1/4-JAG1 ainsi que JAG1/JAG2/DLL4-NOTCH3, mais pas JAG1/JAG2/DLL4-NOTCH2, inféré dans le cœur (Extended Data Fig. 11e, f, Supplementary Table 33).

Cellules immunitaires cardiaques

En utilisant le modèle de régression logistique, nous n’avons pas identifié de contrepartie des monocytes IL17RA+ cardiaques dans le SKM ou le rein, peut-être en raison de la petite taille de cette population.

Les cellules T naïves (CD4+T_naive) identifiées exprimaient CCR7 et SELL, ce qui indique leur nature naïve et résidente dans les tissus95. Les cellules T à mémoire (CD8+T_tem) exprimaient BACH2, STAT4 et IL7R, associés à la mémoire immunitaire à long terme96,97. Nous avons caractérisé davantage les cellules lymphoïdes en utilisant scNym98, et l’avons entraîné en utilisant des données publiées99,100. Le modèle résultant a été appliqué à nos cellules immunitaires cardiaques et les cellules dont le score prédit était supérieur à 0,8 ont été présumées être des candidats probables à la ré-annotation. En utilisant cette approche, nous avons identifié des candidats pour les cellules B du plasma (109), les cellules dendritiques (645), les cellules lymphoïdes innées (89), les cellules T MAIT (219), les cellules T helper (80), les cellules T régulatrices (11), les cellules T à mémoire centrale (103), les cellules T γδ (30) et les cellules dendritiques plasmocytoïdes (27). Ces annotations peuvent être trouvées dans les annotations d’objets immunitaires cardiaques sous l’étiquette ‘scNym’ à l’adresse www.heartcellatlas.org.

Résumé du rapport

Des informations supplémentaires sur la conception de la recherche sont disponibles dans le résumé du rapport de Nature Research lié à cet article.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.