Cellule del cuore umano adulto | Nature

Relazione dei dati
Etica della ricerca per i tessuti dei donatori
Acquisizione ed elaborazione dei tessuti
Isolamento di singoli nuclei
Preparazione delle cellule singole
Arricchimento delle cellule CD45+
Preparazione della biblioteca 10X di cromo
Convalida spaziale utilizzando smFISH con sonde RNAscope
Macchiatura di ematossilina ed eosina
Acquisizione di tessuto muscolare scheletrico
Isolamento dei nuclei per il muscolo scheletrico
Isolamento di singole cellule per il muscolo scheletrico
Mappatura del trascrittoma
Elaborazione dei dati di conteggio
Rilevazione delle doppie
Cell controllo di qualità e filtraggio
Allineamento in lotti usando deep variational autoencoder
DEGs
Interazioni cellula-cellula
Visualizzazione dell’espressione genica sui dati Visium di 10X Genomics
Stima della velocità dell’RNA
Analisi delle sottopopolazioni di cardiomiociti atriali e ventricolari, FBs e cellule neuronali
Confronto cross-tissue delle popolazioni immunitarie cardiache con il muscolo scheletrico, rene e popolazioni immunitarie del sangue
Analisi di arricchimento dell’ontologia genica
Punteggio set genico
Statistiche e riproducibilità
Analisi di arricchimento GWAS
Distribuzioni di cellule disperse e nuclei isolati
Altra analisi delle cellule vascolari
Caratterizzazione del muscolo scheletrico
Cellule immunitarie cardiache
Reporting summary

Relazione dei dati

Non sono stati usati metodi statistici per predeterminare la dimensione del campione. Gli esperimenti non sono stati randomizzati e gli investigatori non erano in cieco rispetto all’assegnazione durante gli esperimenti e la valutazione dei risultati.

Etica della ricerca per i tessuti dei donatori

I tessuti del cuore (donatori D1-D7 e D11) sono stati lavorati al Wellcome Sanger Institute (Hinxton, UK) e ottenuti da donatori di organi deceduti per trapianto dopo l’approvazione del comitato etico della ricerca (rif 15/EE/0152, East of England Cambridge South Research Ethics Committee) e il consenso informato delle famiglie dei donatori. I tessuti del cuore (donatori H2-H7) sono stati trattati presso la Harvard Medical School (Boston, Massachusetts, USA) e ottenuti da donatori di organi deceduti dopo l’approvazione del comitato etico per la ricerca umana Pro00011739 (Università di Alberta, Edmonton, Canada). Il consenso informato da parte delle famiglie dei donatori è stato acquisito tramite il programma istituzionale Human Organ Procurement and Exchange Program (HOPE). L’anamnesi cardiovascolare non presentava anomalie per tutti i donatori (Tabella supplementare 1).

Acquisizione ed elaborazione dei tessuti

I tessuti sono stati acquisiti da donatori britannici e nordamericani (D1-7 e 11, H2-7) dopo la morte circolatoria (DCD) (D2, D4-D7 e D11) e dopo la morte cerebrale (DBD) (D1, D3, H2-H7). Per i donatori DCD del Regno Unito, dopo uno stand-off di cinque minuti e per la DBD, il torace viene aperto, l’aorta viene clampata a croce e vengono acquisiti campioni cardiaci. Per i donatori nordamericani DBD, l’aorta viene clampata trasversalmente, la cardioplegia fredda (Celsior) viene somministrata sotto pressione attraverso l’aorta per arrestare il battito, il cuore viene estratto, risciacquato in soluzione fisiologica fredda e i campioni acquisiti. Tutti i campioni del donatore erano biopsie miocardiche a tutto spessore dall’atrio destro e sinistro, dai ventricoli destro e sinistro, dal setto interventricolare e dall’apice, con esclusione intenzionale dei grandi depositi di grasso epicardico. I campioni utilizzati per l’isolamento dei singoli nuclei sono stati flash-congelati e conservati a -80 °C. Isolamento di singole cellule e CD45 + arricchimento è stato effettuato su campioni appena raccolti. Il tessuto residuo dopo i nuclei e le procedure di isolamento delle cellule è stato fissato in formalina o congelato in OCT per ulteriori studi.

Tutti i tessuti sono stati conservati e trasportati su ghiaccio in ogni momento fino al congelamento o dissociazione del tessuto per ridurre al minimo qualsiasi degradazione trascrizionale. Precedenti studi sulla stabilità del tessuto post-mortem del consorzio GTEx su tessuti bulk68 e in singole cellule69 suggeriscono solo piccoli cambiamenti nei tessuti entro le prime 24 ore post mortem quando conservato in condizioni di freddo.

Isolamento di singoli nuclei

Singoli nuclei sono stati ottenuti da tessuti flash-frozen utilizzando omogeneizzazione meccanica come precedentemente descritto70. I tessuti sono stati omogeneizzati utilizzando un 7 ml di vetro Dounce tessuto grinder set (Merck) con 8-10 colpi di un pestello sciolto (A) e 8-10 colpi di un pestello stretto (B) in tampone di omogeneizzazione (250 mM saccarosio, 25 mM KCl, 5 mM MgCl2, 10 mM Tris-HCl, 1 mM ditiotreitolo (DTT), 1 × proteasi inibitore, 0.4 U μl-1 RNaseIn, 0.2 U μl-1 SUPERaseIn, 0.1% Triton X-100 in acqua senza nucleasi). L’omogeneizzato è stato filtrato attraverso un filtro cellulare da 40μm (Corning). Dopo la centrifugazione (500g, 5 min, 4 ° C) il surnatante è stato rimosso e il pellet è stato risospeso in tampone di conservazione (1 × PBS, 4% sieroalbumina bovina (BSA), 0,2 U μl-1 Protector RNaseIn). I nuclei sono stati colorati con NucBlue Live ReadyProbes Reagents (ThermoFisher) e Hoechst-positivi singoli nuclei sono stati purificati da fluorescente attivato ordinamento delle cellule (FACS) utilizzando influenza, XDP o FACSAria (BD Biosciences) (Fig. 1 supplementare). La purificazione dei nuclei e l’integrità è stata verificata al microscopio, e i nuclei sono stati ulteriormente elaborati utilizzando il Chromium Controller (10X Genomics) secondo il protocollo del produttore.

Preparazione delle cellule singole

I tessuti del cuore (0.2-0,9 g) sono stati trasferiti dalla soluzione cardioplegica in provette C GentleMACS (Miltenyi Biotec) contenenti soluzione di base di digestione enzimatica (100 μg ml-1 liberase TH Research grade e 50 μg ml-1 DNase I, HBSS 10 mM HEPES e 30 mM taurina)71. I tessuti sono stati tritati con le forbici (FST) e automaticamente digerito utilizzando GentleMACS Octo Dissociator (Miltenyi Biotec) con riscaldatori. Cardiomiociti-depurati sospensione singola cella sono stati lavati con soluzione di base contenente 20% di siero fetale bovino (FBS) (Gibco), filtrata attraverso 70-μm filtro di nylon (BD Falcon), raccolti mediante centrifugazione (330g, 10 min, 4 ° C) e risospeso in soluzione di base contenente 0,2% FBS (Gibco). Le cellule sono state contate manualmente tre volte per esclusione Trypan blu dopo ogni centrifugazione e risospese ad una concentrazione di almeno 2 × 106 ml-1. Le singole cellule sono state elaborate utilizzando Chromium Controller (10X Genomics) secondo il protocollo del produttore.

Arricchimento delle cellule CD45+

La sospensione cellulare è stata preparata come descritto sopra e successivamente etichettata utilizzando microsfere coniugate con anticorpo monoclonale anti CD45 umano secondo il protocollo del produttore (Miltenyi Biotec). In breve, fino a 107 cellule sono state incubate per 15 min a 4 ° C in 80 microlitri di PBS, BSA, EDTA buffer (1 × PBS pH 7,2, 0,5% BSA, 2 mM EDTA) contenente 20 microlitri di microsfere CD45. La sospensione cellulare è stata lavata in PBS, BSA, EDTA buffer una volta e raccolta mediante centrifugazione (330g, 10 min, 4 °C). Le cellule risospese sono state applicate alle colonne MACS LS (Miltenyi Biotec). La frazione cellulare CD45-depletata è stata scartata dopo tre lavaggi con PBS, BSA e tampone EDTA e la frazione cellulare CD45+ è stata raccolta in PBS, BSA e tampone EDTA rimuovendo le colonne dal campo magnetico. Le cellule CD45+ sono state contate e risospese in PBS, BSA e tampone EDTA fino a una concentrazione di almeno 2 × 106 per ml prima dell’ulteriore elaborazione utilizzando un controllore di cromo (10X Genomics) secondo il protocollo del produttore.

Preparazione della biblioteca 10X di cromo

Le cellule singole e i nuclei sono stati contati manualmente mediante esclusione blu Trypan o automaticamente utilizzando un Countess II (Life Technologies) utilizzando almeno due conteggi separati. La sospensione di cellule o nuclei è stata regolata a 400-1.000 cellule per microlitro e caricata sul Chromium Controller (10X Genomics) con un recupero mirato di cellule o nuclei di 4.000-10.000 per reazione. 3′ librerie di espressione genica sono stati preparati secondo le istruzioni del produttore del v2 o v3 Chromium Single Cell Reagent Kits (10X Genomics). Il controllo di qualità del cDNA e delle librerie finali è stato fatto utilizzando Bioanalyzer High Sensitivity DNA Analysis (Agilent) o 4200 TapeStation System (Agilent). Le librerie sono state sequenziate utilizzando HiSeq 4000 (Illumina) al Wellcome Sanger Institute, e NextSeq 500 (Illumina) alla Harvard Medical School con una profondità minima di 20.000-30.000 coppie di lettura per cella o nucleo (Tabella supplementare 22).

Convalida spaziale utilizzando smFISH con sonde RNAscope

Durante la preparazione di formalina fissata in paraffina-embedded (FFPE) campioni di tessuto fresco è stato fissato in tampone neutro 10% formalina per 18-36 h e successivamente incorporato in blocchi di paraffina. I campioni di tessuto fisso-congelato sono stati fissati in paraformaldeide al 4% (ThermoFisher). Le sezioni sono state tagliate a 5μm di spessore usando un microtomo e poste su vetrini SuperFrost Plus (VWR). I vetrini di tessuto FFPE sono stati colorati automaticamente utilizzando BOND RX (Leica) e il RNAscope Multiplex Fluorescent Reagent Kit v2 Assay (ACDBio) secondo il protocollo del produttore. I vetrini di tessuto fisso-congelato sono stati trattati secondo il protocollo di RNAscope Multiplex Fluorescent Assay v1 (ACDBio). RNAscope pronto o personalizzati sonde bersaglio sono stati eseguiti in parallelo ai controlli multiplex positivi e negativi (Extended Data Fig. 12b, Tabella supplementare 23). Tutti i nuclei sono stati colorati con DAPI. Tutti i vetrini di tessuto FFPE sono stati ripresi utilizzando un Opera Phenix High-Content Confocal Screening System (Perkin Elmer) con una dimensione di 1μm z-step e 20 × obiettivo a immersione in acqua (NA 0,16, 0,299 micron per pixel). Canali: DAPI (eccitazione 375 nm, emissione 435-480 nm), Atto 425 (eccitazione 425 nm, emissione 463-501 nm), opale 520 (eccitazione 488 nm, emissione 500-550 nm), opale 570 (eccitazione 561 nm, emissione 570-630 nm), opale 650 (eccitazione 640 nm, emissione 650-760 nm). I vetrini di tessuto fisso-congelato sono stati ripresi utilizzando un microscopio confocale LSM710 (Zeiss) e un obiettivo a immersione in olio 40× (olio 1.3, DIC III). Canali: DAPI (eccitazione 375 nm, emissione 435-480 nm), Alexa Fluor 488 (eccitazione 492 nm, emissione 517 nm), Atto 550 (eccitazione 560 nm, emissione 575 nm) e Atto 647 (eccitazione 649 nm, emissione 662 nm). La visualizzazione e la rimozione dello sfondo (raggio della sfera rotolante) sono state fatte usando Fiji/ImageJ72. Pseudocolori sono stati utilizzati per una migliore visualizzazione.

Macchiatura di ematossilina ed eosina

I campioni di tessuto sono stati freschi-congelati in isopentano (ThermoFisher) a -80 °C e incorporati in OCT (VWR). Sezioni sono state tagliate ad uno spessore di 10 μm utilizzando un microtomo, posto su vetrini SuperFrostPlus (VWR) e ulteriormente trattati secondo un protocollo standard di colorazione ematossilina ed eosina (Extended Data Fig. 12a).

Acquisizione di tessuto muscolare scheletrico

I campioni di muscolo intercostale sono stati ottenuti tra la seconda e terza costola sul lato sinistro. Questo è tipicamente lo strato più profondo del muscolo (il più lontano dalla pelle). I campioni sono stati raccolti direttamente nella soluzione di conservazione a freddo.

Isolamento dei nuclei per il muscolo scheletrico

Il tessuto muscolare è stato lavato in 1× PBS, pulito da qualsiasi deposito di grasso visibile e tritato per ottenere frammenti di circa 1 mm3. Per ogni campione, circa 0,3 g di tessuti tritati è stato omogeneizzato in 3 ml di tampone A (250 mM saccarosio, 10 mg ml-1 BSA, 5 mM MgCl2, 0,12 U μl-1 RNaseIn, 0,06 U μl-1 SUPERasIn, 1 × inibitore della proteasi) utilizzando Dounce tessuto macinino set (Merck) con 50 colpi del pestello sciolto (A). L’omogeneizzato è stato filtrato attraverso un filtro cellulare da 100 μm (Corning) e il filtro è stato lavato con 1 ml e poi 750 μl di tampone A. Dopo l’aggiunta di Triton X-100 (concentrazione finale 0,5%), la miscela è stata ulteriormente omogeneizzata con 50 colpi del pestello stretto (B). Dopo il filtraggio attraverso un filtro da 40μm, i nuclei sono stati centrifugati (3.000g, 5 min, 4 °C), risospesi in 1 ml di tampone B (320 mM saccarosio, 10 mg ml-1 BSA, 3 mM CaCl2, 2 mM magnesio acetato, 0.1 mM EDTA, 10 mM Tris-HCl, 1 mM DTT, 1× inibitore della proteasi, 0.12 U μl-1 RNaseIn, 0.06 U μl-1 SUPERasin) e purificato utilizzando una soluzione di gradiente Percoll 27%. La miscela di Percoll è stata centrifugata a 20.000g (15 min, 4 °C) e il pellet è stato risospeso in 200 μl di buffer B, seguito da centrifugazione (20.000g, 3 min, 4 °C). Dopo la colorazione Trypan Blue, i nuclei intatti sono stati contati utilizzando un emocitometro. I nuclei sono stati profilati utilizzando un controller di cromo (10X Genomics) secondo il protocollo del produttore.

Isolamento di singole cellule per il muscolo scheletrico

Il tessuto muscolare è stato lavato in 1 × PBS, pulito da qualsiasi deposito di grasso visibile e finemente tritato. Poi, 2 g del tessuto tritato è stato trasferito al tampone di digestione 1 (750 U ml-1 collagenasi tipo 2 in 1 × PBS) e incubato a 37 ° C in un bagno d’acqua per 90 minuti. Il tessuto parzialmente digerito è stato raccolto per centrifugazione (650g, 5 min, 4 °C) e il pellet è stato risospeso nel buffer di digestione 2 (100 U ml-1 collagenasi tipo 2, 2 U ml-1 dispase in PBS). Dopo 30 minuti di incubazione a 37 °C in un bagno d’acqua, la digestione è stata fermata dall’aggiunta di 2% FBS. Le cellule sono state filtrate attraverso un 100-μm e un 40-μm filtro di nylon (BD Falcon), raccolti per centrifugazione (650g, 4 ° C, 3 min) e lavato con 1 × PBS, 2% FBS. Successivamente, un gradiente Percoll 20% (15.000g, 4 ° C, 20 min) è stato utilizzato per la purificazione delle cellule. Lo strato contenente le cellule è stato raccolto, lavato in PBS contenente 2% FBS, e le cellule vitali sono stati contati da esclusione Trypan Blue utilizzando un emocitometro. I nuclei sono stati profilati utilizzando un Chromium Controller (10X Genomics) secondo il protocollo del produttore.

La tabella delle risorse chiave dei metodi è nella tabella supplementare 24.

Mappatura del trascrittoma

Dopo il sequenziamento, i campioni sono stati demultiplexati e memorizzati come file CRAM. Ogni campione è stato mappato rispetto al genoma umano di riferimento (GRCh38 v.3.0.0) fornito da 10X Genomics e utilizzando la suite CellRanger (v.3.0.1) con parametri predefiniti. I campioni di cellule singole sono stati mappati rispetto al riferimento così come è stato fornito. I campioni a singolo nucleo, il riferimento per il pre-mRNA, è stato creato utilizzando le istruzioni di 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references).

Elaborazione dei dati di conteggio

Dopo la mappatura, i campioni di ogni fonte di dati (singoli nuclei, singole cellule e cellule CD45+) sono stati raggruppati in singoli oggetti AnnData concatenando le raw_feature_bc_matrix_h5.h5 e aggiungendo le informazioni sui metadati appropriate. Per ogni oggetto fonte di dati, la media degli identificatori molecolari unici (UMI) (n_counts) è stata calcolata e utilizzata come soglia per le gocce vuote.

Rilevazione delle doppie

Dopo la rimozione delle gocce vuote, abbiamo applicato scrublet73 per assegnare un punteggio di doppietta (scrublet_score) a ogni cella. Queste cellule sono state raggruppate e visualizzate utilizzando il metodo UMAP74. Inoltre, ogni cella è stata elaborata per il rilevamento di doppietta utilizzando un metodo di percolazione per consentire una migliore rilevazione di doppiette75.

Cell controllo di qualità e filtraggio

Ogni fonte di dati è stato elaborato e annotato separatamente per tenere conto delle differenze di qualità specifiche della fonte. Queste metriche sono state incluse come covariate per l’ulteriore elaborazione. Le cellule totali e le cellule CD45+ sono state filtrate per i conteggi (500 < n_counts <15.000), i geni (200 < n_genes), i geni mitocondriali (percent_mito <20%), i geni ribosomiali (percent_ribo <20%) e il punteggio scrublet (scrublet_score <0.3). Singoli nuclei sono stati filtrati per i conteggi (500 < n_counts <15.000), geni (300 < n_genes <6.000), geni mitocondriali (percent_mito <5%), geni ribosomiali (percent_ribo <5%) e scrublet score (scrublet_score <0.3). Le stesse soglie di filtraggio sono state applicate al set di dati del muscolo scheletrico.

Scanpy toolkit 1.576 in Python v.3.7 è stato utilizzato per eseguire le analisi a valle, tra cui normalizzazione (normalize_per_cell: counts_per_cell_after = 10.000), trasformazione log (log1p), rilevamento del gene variabile (highly_variable_genes), regressione fuori fonti indesiderate di variazione (regress_out: n_counts e percent_mito), scalatura caratteristica dati (scala: max_value = 10) e PCA (pca: utilizzando geni altamente variabili) come precedentemente descritto77.

Allineamento in lotti usando deep variational autoencoder

Abbiamo costruito un manifold globale allineando tutte le fonti di dati e i donatori nei nostri dati. Questo è stato fatto in una procedura in tre fasi: (1) Ogni fonte è stata analizzata e annotata separatamente, allineando solo per i donatori utilizzando un passo di regressione lineare pericyte-space prima dell’allineamento batch con bbknn78. I geni differenzialmente espressi (DEG) sono stati calcolati utilizzando un test di somma di rango Wilcoxon con aggiustamento Bonferroni-Hochberg come implementato nel framework Scanpy. (2) Per annotare ogni cluster, abbiamo usato un approccio integrativo cercando i DEGs più significativi (P < 1 × 10-5) con un logFC >1 contro i database ToppFun79 e EnrichR80. I risultati significativi sui percorsi, la regolazione trascrizionale e i processi biologici sono stati classificati in ordine di priorità per annotare un dato cluster. Ogni compartimento cellulare è stato etichettato sotto lo slot adata.obs dopo aver raggruppato gli stati cellulari specifici della fonte. (3) Tutte le fonti sono state combinate in un singolo oggetto AnnData sotto l’etichetta adata.obs. I lotti sono stati allineati utilizzando la funzione batch_correction dell’autocodificatore variazionale scGen81. Prima abbiamo allineato per adata.obs, usando adata.obs come ancora. Successivamente, abbiamo allineato per adata.obs, usando adata.obs come ancora. Ogni giro di allineamento batch è stato eseguito per 50 epoche.

Manifold per le popolazioni adipociti, vascolare e immunitario cardiaco, così come l’analisi del muscolo scheletrico, sono stati creati utilizzando questo metodo e la precisione clustering è stato valutato con SCCAF82 (Extended Data Fig. 12d).

DEGs

Per aiutare con l’annotazione delle sottopopolazioni di ogni compartimento cellulare, abbiamo calcolato i DEGs utilizzando il Wilcoxon rank sum test come implementato nel flusso di lavoro scanpy e consigliato da recenti studi di benchmarking83. Un gene è stato considerato differenzialmente espresso se ha un fold change trasformato in log2 > 1 e un P < 1 × 10-5, se non diversamente indicato nella sezione analisi.

Interazioni cellula-cellula

Le matrici di espressione delle popolazioni in studio sono state esportate da AnnData, insieme a una tabella di metadati che conteneva i codici a barre delle cellule come indici. Abbiamo quindi eseguito CellPhoneDB come segue: cellphonedb method statistical_analysis meta.tsv counts.tsv-counts-data = gene_name-threads = 60. Le previsioni grezze di CellPhoneDB sono state filtrate rimuovendo quelle interazioni con un P > 1.0 × 10-5. Le coppie significative sono state poi presentate per l’analisi di arricchimento del gene in ReactomeDB, enrichR e ToppFun per la classificazione funzionale. Le cellule vascolari sono state sottocampionate casualmente a 39.000 cellule prima dell’analisi, e il gruppo di riparazione cardiaca (cardiomiociti atriali e ventricolari, FB e cellule immunitarie) è stato sottocampionato casualmente a 69.295 cellule prima dell’analisi.

Visualizzazione dell’espressione genica sui dati Visium di 10X Genomics

Abbiamo elaborato i dati Visium del miocardio ventricolare sinistro disponibili al pubblico da 10X Genomics (https://support.10xgenomics.com/spatial-gene-expression/datasets/1.0.0/V1_Human_Heart) usando il flusso di lavoro Scanpy v.1.5 adattato per l’analisi dei dati Visium di 10X Genomics (https://scanpy-tutorials.readthedocs.io/en/latest/spatial/basic-analysis.html). In breve, sono stati rimossi gli spot con meno di 500 UMI o più di 20.000 UMI e meno di 200 geni. I dati sono stati log-trasformati e normalizzati prima di tracciare.

Stima della velocità dell’RNA

Per calcolare la velocità dell’RNA delle singole cellule e delle singole cellule arricchite di CD45+, abbiamo usato il file BAM di uscita di CellRanger e il file GENCODE v33 GTF (ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_33/gencode.v33.chr_patch_hapl_scaff.annotation.gtf.gz) insieme al CLI velocyto84 v.0.17.17 per generare un file telaio contenente la quantificazione dell’RNA spliced e unspliced. Successivamente, abbiamo costruito un collettore, raggruppare le cellule e visualizzare le velocità di RNA utilizzando scVelo85.

Analisi delle sottopopolazioni di cardiomiociti atriali e ventricolari, FBs e cellule neuronali

Tutti i codici a barre etichettati nell’oggetto globale come cardiomiociti, fibroblasti e cellule neurali sono stati selezionati per ulteriori analisi delle sottopopolazioni. Ulteriori criteri di filtraggio specifici per la popolazione cellulare sono stati applicati ai nuclei come segue: conteggi di cardiomiociti (n_counts <12.500), geni (n_genes <4.000), geni mitocondriali (percent_mito <1%), geni ribosomiali (percent_ribo <1%) e punteggio scrublet (scrublet_score <0.25); FB geni mitocondriali (percent_mito <1%), geni ribosomiali (percent_ribo <1%); geni delle cellule neuronali (n_genes <4000), geni mitocondriali (percent_mito <1%), geni ribosomiali (percent_ribo <1%). Le cellule totali e CD45+ sono state escluse nei set di dati dei cardiomiociti atriali e ventricolari e non hanno contribuito all’analisi delle sottopopolazioni. Nessun ulteriore filtraggio di FBs o cellule neuronali totale e CD45 + cellule è stato applicato. Cardiomiociti e FBs sono stati poi ulteriormente suddivisi in due raggruppamenti in base alla regione di origine: (1) atrio sinistro e destro, e (2) ventricoli sinistro e destro, apice e setto interventricolare.

Gli effetti dei donatori sono stati allineati come descritto al punto (1) sopra. Per FB e cellule neuronali, le fonti sono state allineate come descritto al punto (3) sopra. Il clustering di Leiden e la visualizzazione UMAP sono stati eseguiti per identificare le sottopopolazioni e la visualizzazione86. Geni differenzialmente espressi sono stati calcolati utilizzando il test di somma di rango Wilcoxon. I geni sono stati classificati per punteggio.

Confronto cross-tissue delle popolazioni immunitarie cardiache con il muscolo scheletrico, rene e popolazioni immunitarie del sangue

Abbiamo raccolto i dati del trascrittoma monocellulare per reni adulti da rif. 99 (https://www.kidneycellatlas.org/), e sottoinsieme tutte le cellule immunitarie riportate nel loro studio. Per lo SKM abbiamo selezionato le cellule immunitarie annotate dal collettore fuso. Per il sangue umano, abbiamo usato il pubblico disponibile 10.000 singole cellule PBMC dataset fornito da 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/datasets/3.0.0/pbmc_10k_v3). Come precedentemente descritto87, abbiamo addestrato un modello di regressione logistica sulle cellule immunitarie cardiache utilizzando l’80% dei dati di espressione e testato la sua precisione sul restante 20% per produrre un modello con una precisione di 0,6862 (Extended Data Fig. 8f, Tabella supplementare 16). Abbiamo poi applicato questo modello per prevedere le popolazioni immunitarie cardiache analoghe nel rene adulto, SKM e PBMCs. Previsioni con una probabilità inferiore a 0,8 sono stati esclusi dalle analisi comparative a valle.

Analisi di arricchimento dell’ontologia genica

Per la popolazione di cardiomiociti ventricolari, abbiamo usato il pacchetto R gProfileR (https://cran.r-project.org/web/packages/gProfileR/index.html) con l’elenco dei geni classificati a punteggio di vCM4 come input e il set di geni espressi nei cardiomiociti ventricolari come sfondo (quei geni che hanno un conteggio UMI >1). Per eseguire l’analisi Gene Ontology sulle cellule vascolari, il top 500 DEGs significativo (P < 1 × 10-5) con un log-transformed fold change > 1 sono stati cercati contro il database di processo biologico Gene Ontology utilizzando ToppFun79 (Tabella supplementare 25). I primi cinque termini significativamente arricchiti (q < 0,05) per ogni sottopopolazione sono stati selezionati e tracciati su una mappa di calore. Per eseguire l’analisi del percorso sugli adipociti, il top 500 DEGs significativo (P < 1 × 10-5) con un log-trasformato fold change > 0,5 sono stati cercati contro ToppFun79 database percorso (Tabella supplementare 26). I primi cinque percorsi significativamente arricchiti (q < 0.05) per ogni sottopopolazione sono stati selezionati e tracciati su una mappa di calore.

Punteggio set genico

Utilizziamo la funzione score_genes come implementato in scanpy per calcolare l’arricchimento dei geni coinvolti nel percorso di Oncostatina M. Un elenco di geni è stato raccolto su ricerca in letteratura88,89. Per gene set arricchimento, solo geni altamente espressi sono stati considerati per ridurre il rumore (più di 500 UMI in tutte le cellule). La stessa analisi è stata eseguita per il confronto delle cellule immunitarie cardiache nel nostro studio con le osservazioni di studi precedenti su macrofagi residente cardiaco51, topo tessuto rimodellando macrofago45 e tuorlo sac origine lineage90.

Statistiche e riproducibilità

Tutte le analisi sono state eseguite utilizzando R Software, v.3.6.1. I test t di Student sono stati utilizzati per confrontare le distribuzioni dei tipi di cellule in ogni sito. P < 0,05 è stato considerato statisticamente significativo. I modelli di regressione lineare (correlazioni) sono stati ottenuti utilizzando la funzione R modello lineare (lm), che stima la probabilità statistica (valore P) di una relazione lineare. La correzione di Bonferroni è stata applicata per i test multipli.

Le micrografie RNAscope raffigurate nelle figure sono rappresentative. Le micrografie nelle Figg. 2g, 3c, h e Extended Data Fig. 3c (HAMP), Extended Data Fig. 3e (CNN1), Extended Data Figs. 4g, m, 6f sono state ripetute con risultati simili in due singole sezioni di tessuto. Le micrografie nelle Figg. 2h, 3f e nei dati estesi Fig. 3c (CNN1), dati estesi Fig. 3e (PCDH7), dati estesi Figg. 6e, h, 9d sono state ripetute con risultati simili in tre singole sezioni di tessuto. Le micrografie delle Figg. 1e, 2d, 3e e Extended Data Figs. 1f, 3c (FHL1) e Extended Data Fig. 6d sono state ripetute con risultati simili in quattro singole sezioni di tessuto. Le micrografie in Fig. 2c e Extended Data Fig. 3c (PRELID2), Extended Data Figs. 10e, 12a sono state ripetute con risultati simili in sei o più sezioni individuali di tessuto. I controlli positivi e negativi sono stati fatti una volta per i campioni utilizzati.

Analisi di arricchimento GWAS

Abbiamo scaricato le statistiche di riepilogo GWAS da cvdi ampio, catalogo EBI GWAS e atlante GWAS. Abbiamo selezionato i tratti con GWAS ben potenziati (n > 5.000 e numero di loci significativi >10). I set di dati GWAS sono riassunti nella tabella supplementare 27. I dati di espressione genica dei geni codificanti le proteine sono stati mappati sugli id dei geni Entrez e queste annotazioni geniche sono state utilizzate sull’assemblaggio del genoma umano hg19/37. Abbiamo usato solo i dati di espressione genica dai nuclei. Abbiamo implementato l’analisi precedentemente descritto64 in python e in R. I conteggi log-trasformati (più uno pseudoconte) sono stati utilizzati per calcolare i profili di espressione medi specifici del tipo di cella. Abbiamo eseguito analisi magma individuale per ogni tipo di cellula, sempre condizionando su covariate predefinite a livello di gene (ad esempio, la lunghezza del gene) e l’espressione genica media in tutte le cellule. Successivamente, abbiamo applicato il metodo Benjamini-Hochberg e selezionato le associazioni di tratti di tipo cellulare con FDR < 10%. Queste coppie sono state poi sottoposte ad analisi condizionale come precedentemente descritto64 per definire le coppie di associazioni “indipendenti”, “spiegate congiuntamente” e “parzialmente spiegate congiuntamente” (Tabella supplementare 28).

Distribuzioni di cellule disperse e nuclei isolati

Le diverse procedure per ottenere nuclei isolati e cellule disperse hanno portato a distribuzioni significativamente diverse dei tipi di cellule (Tabella supplementare 29, Dati estesi Fig. 2). In particolare, il 30,1% e il 49,2% dei nuclei isolati derivavano da cardiomiociti atriali e ventricolari nelle regioni atriali e ventricolari, mentre queste cellule erano per lo più escluse dalle preparazioni di cellule isolate e CD45-selezionate (Tabella supplementare 2).

Escludendo i cardiomiociti, la distribuzione dei tipi di cellule identificate da nuclei isolati e cellule disperse è rimasta distinta (Tabella supplementare 30). Anche se il 59,0% delle cellule disperse erano EC, solo il 15,7% dei nuclei derivava da EC. Al contrario, il 64,2% dei nuclei proveniva da FB (31,2%) e periciti (33,0%), mentre solo il 17,1% delle cellule disperse erano FB (2,3%) e periciti (14,8%). Queste differenze possono riflettere la sensibilità dei nuclei CE alle procedure di isolamento o la resistenza dei periciti e dei FB alla digestione enzimatica cellulare.

Nonostante le differenze nella distribuzione delle cellule tra i nuclei isolati e le cellule disperse, i profili di espressione genica dei lignaggi cellulari erano ragionevolmente correlati (r > 0,4 per ogni tipo di cellule). Per affrontare la concordanza dei geni catturati da cellule e nuclei, abbiamo confrontato l’espressione dei principali marcatori di tipo cellulare da Fig. 1c attraverso le tre fonti (Extended Data Fig. 1c). Poiché i nuclei mancano di RNA citoplasmatico, l’espressione di alcuni geni, in particolare i geni immunitari NKG7 e C1QA, era più bassa nei nuclei che nelle cellule. Tuttavia, la tendenza generale rispetto ai geni marcatori era coerente tra le tre fonti, e gli stessi geni distinguevano i singoli tipi di cellule indipendentemente dalla fonte.

Altra analisi delle cellule vascolari

Il PC3_str conteneva un contributo simile di cellule e nuclei, e aveva un punteggio scrublet sotto la soglia rigorosa utilizzata; tuttavia, il numero medio di geni e conteggi in questo cluster era superiore alla media. Quindi, nonostante il nostro filtro di qualità rigoroso, non possiamo escludere la possibilità che ci siano doppietti in questo cluster. EC10_CMC-like e PC4_CMC-like co-esprimono geni EC o pericyte con marcatori cardiomiociti e ulteriori studi sono necessari per capire se rappresentano stati cellulari precedentemente sconosciuti o doublets.

Le osservazioni del SMC arterioso e venoso sono supportate da studi precedenti, che prevedono che SMC arterioso sono più contrattile, e SMC venoso sono meno differenziati91.

EC3_cap arricchisce per trascrizioni che codificano i componenti di AP1 (JUN e FOS), che media molteplici decisioni di destino CE tra cui la risposta al VEGF, infiammatorie e segnali di stress, e ATF3, un gene di risposta adattativa indotta da diversi segnali92,93,94.

Caratterizzazione del muscolo scheletrico

Abbiamo raccolto campioni di muscolo scheletrico intercostale da cinque individui sani, compreso un donatore con tessuto cardiaco corrispondente, e profilato il trascrittoma di 35.665 singole cellule e 39.597 singoli nuclei. Analogamente al cuore, la combinazione di cellule e nuclei ci ha permesso di catturare e risolvere i principali lignaggi cellulari, tra cui cardiomiociti, fibroblasti, cellule endoteliali, cellule muscolari lisce, periciti, cellule immunitarie mieloidi e linfoidi e cellule satelliti (Dati estesi Fig. 11a, b, Tabella supplementare 31).

Un’ulteriore analisi delle cellule vascolari del muscolo scheletrico ha identificato dieci popolazioni distinte. Le cellule endoteliali hanno mostrato cinque cluster separati in base ai loro rispettivi letti vascolari con firme simili a quelle che osserviamo nel cuore. L’EC_cap esprime VWF e RGCC. Le EC_ven venose esprimono ACKR1 e PLVAP, mentre le EC_art arteriose mostrano SEMA3G e HEY1, in linea con i nostri dati del cuore (Dati estesi Fig. 11c, d, Tabella supplementare 32).

Le distribuzioni complessive delle popolazioni di cellule vascolari e stromali nel muscolo scheletrico e cardiaco erano simili, comprese le caratteristiche arteriose e venose delle EC; tuttavia, il muscolo scheletrico conteneva un singolo cluster SMC, potenzialmente legato alle minori dimensioni del dataset. Nel muscolo scheletrico, le interazioni cellula-cellula previste della EC_art e delle SMC includevano NOTCH1/4-JAG1 così come JAG1/JAG2/DLL4-NOTCH3, ma non JAG1/JAG2/DLL4-NOTCH2, dedotte nel cuore (Dati estesi Fig. 11e, f, Tabella supplementare 33).

Cellule immunitarie cardiache

Utilizzando il modello di regressione logistica, non abbiamo identificato alcuna controparte dei monociti IL17RA+ cardiaci nello SKM o nel rene, probabilmente a causa delle piccole dimensioni di questa popolazione.

Le cellule T ingenue (CD4+T_naive) identificate hanno espresso CCR7 e SELL, indicativo della loro natura ingenua e residente nei tessuti95. Le cellule T della memoria (CD8+T_tem) esprimevano BACH2, STAT4 e IL7R, associate alla memoria immunitaria a lungo termine96,97. Abbiamo ulteriormente caratterizzato le cellule linfoidi utilizzando scNym98, e addestrato utilizzando i dati pubblicati99,100. Il modello risultante è stato applicato alle nostre cellule immunitarie cardiache e quelle cellule, con un punteggio previsto superiore a 0,8 sono state presunte essere probabili candidati per la ri-annotazione. Usando questo approccio, abbiamo identificato i candidati per le cellule B del plasma (109), le cellule dendritiche (645), le cellule linfoidi innate (89), le cellule T MAIT (219), le cellule T helper (80) le cellule T regolatrici (11), le cellule T di memoria centrale (103), le cellule T γδ (30) e le cellule dendritiche plasmocitoidi (27). Queste annotazioni possono essere trovate nelle annotazioni dell’oggetto immunitario cardiaco sotto l’etichetta ‘scNym’ su www.heartcellatlas.org.

Reporting summary

Ulteriori informazioni sul disegno della ricerca sono disponibili nel Nature Research Reporting Summary collegato a questo articolo.