- Datenberichterstattung
- Forschungsethik für Spendergewebe
- Gewebegewinnung und -verarbeitung
- Isolierung einzelner Kerne
- Einzellpräparation
- CD45+-Zellanreicherung
- Chromium 10X library preparation
- Räumliche Validierung mittels smFISH mit RNAscope-Sonden
- Hämatoxylin- und Eosinfärbung
- Gewinnung von Skelettmuskelgewebe
- Kernisolierung für Skelettmuskeln
- Einzellisolierung für Skelettmuskel
- Transkriptom-Mapping
- Verarbeitung von Zähldaten
- Doublet-Erkennung
- Zellqualitätskontrolle und Filterung
- Batch-Alignment mit Deep Variational Autoencoder
- DEGs
- Zell-Zell-Interaktionen
- Visualisierung der Genexpression auf 10X Genomics Visium-Daten
- Schätzung der RNA-Geschwindigkeit
- Subpopulationsanalysen von atrialen und ventrikulären Kardiomyozyten, Fibroblasten und neuronalen Zellen
- Gewebeübergreifender Vergleich der Immunpopulationen des Herzens mit den Immunpopulationen des Skelettmuskels, der Niere und des Blutes
- Gene Ontology-Anreicherungsanalyse
- Gene set score
- Statistik und Reproduzierbarkeit
- GWAS-Anreicherungsanalyse
- Verteilungen von dispergierten Zellen und isolierten Kernen
- Weitere Analyse der vaskulären Zellen
- Charakterisierung der Skelettmuskulatur
- Herzimmunzellen
- Zusammenfassung der Berichterstattung
Datenberichterstattung
Es wurden keine statistischen Methoden verwendet, um die Stichprobengröße vorher zu bestimmen. Die Experimente wurden nicht randomisiert, und die Forscher waren während der Experimente und der Ergebnisbewertung nicht verblindet.
Forschungsethik für Spendergewebe
Herzgewebe (Spender D1-D7 und D11) wurde am Wellcome Sanger Institute (Hinxton, UK) verarbeitet und von verstorbenen Transplantationsorganspendern nach Genehmigung durch die Forschungsethikkommission (Ref. 15/EE/0152, East of England Cambridge South Research Ethics Committee) und informierter Zustimmung der Spenderfamilien gewonnen. Herzgewebe (Spender H2-H7) wurde an der Harvard Medical School (Boston, Massachusetts, USA) aufbereitet und von verstorbenen Organspendern nach Genehmigung durch das Human Research Ethics Board Pro00011739 (University of Alberta, Edmonton, Kanada) gewonnen. Die informierte Zustimmung der Spenderfamilien wurde über das institutionelle Human Organ Procurement and Exchange Program (HOPE) eingeholt. Die kardiovaskuläre Anamnese war bei allen Spendern unauffällig (ergänzende Tabelle 1).
Gewebegewinnung und -verarbeitung
Gewebe wurde von britischen und nordamerikanischen Spendern (D1-7 und 11, H2-7) nach dem Kreislauftod (DCD) (D2, D4-D7 und D11) und nach dem Hirntod (DBD) (D1, D3, H2-H7) gewonnen. Bei britischen DCD-Spendern wird nach einer fünfminütigen Wartezeit und bei DBD der Brustkorb geöffnet, die Aorta abgeklemmt und Herzproben entnommen. Bei nordamerikanischen DBD-Spendern wird die Aorta abgeklemmt, eine kalte Kardioplegie (Celsior) unter Druck über die Aorta verabreicht, um den Herzschlag zu stoppen, das Herz entnommen, in kalter Kochsalzlösung gespült und Proben entnommen. Bei allen Spenderproben handelte es sich um Vollhaut-Myokardbiopsien aus dem linken und rechten Vorhof, dem linken und rechten Ventrikel, der Herzscheidewand und dem Apex, wobei große epikardiale Fettablagerungen absichtlich ausgeschlossen wurden. Die für die Isolierung der einzelnen Zellkerne verwendeten Proben wurden tiefgefroren und bei -80 °C gelagert. Die Einzelzellisolierung und CD45+-Anreicherung wurde an frisch entnommenen Proben durchgeführt. Das nach der Kern- und Zellisolierung verbleibende Gewebe wurde für weitere Untersuchungen in Formalin fixiert oder in OCT eingefroren.
Alle Gewebe wurden bis zum Einfrieren oder zur Gewebedissoziation stets auf Eis gelagert und transportiert, um einen möglichen Transkriptionsabbau zu minimieren. Frühere Studien über die postmortale Gewebestabilität des GTEx-Konsortiums an Bulk-Gewebe68 und an einzelnen Zellen69 deuten darauf hin, dass sich die Gewebe innerhalb der ersten 24 Stunden postmortal nur geringfügig verändern, wenn sie unter kalten Bedingungen gelagert werden.
Isolierung einzelner Kerne
Einzelne Kerne wurden aus tiefgefrorenen Geweben durch mechanische Homogenisierung gewonnen, wie zuvor beschrieben70. Die Gewebe wurden mit einem 7-ml-Glas-Dounce-Gewebezerkleinerungsset (Merck) mit 8-10 Hüben eines losen Pistills (A) und 8-10 Hüben eines festen Pistills (B) in Homogenisierungspuffer (250 mM Saccharose, 25 mM KCl, 5 mM MgCl2, 10 mM Tris-HCl, 1 mM Dithiothreitol (DTT), 1× Proteaseinhibitor, 0.4 U μl-1 RNaseIn, 0,2 U μl-1 SUPERaseIn, 0,1% Triton X-100 in nukleasefreiem Wasser). Das Homogenat wurde durch ein 40-μm-Zellsieb (Corning) filtriert. Nach Zentrifugation (500g, 5 min, 4 °C) wurde der Überstand entfernt und das Pellet in Lagerungspuffer (1× PBS, 4% Rinderserumalbumin (BSA), 0,2 U μl-1 Protector RNaseIn) resuspendiert. Die Kerne wurden mit NucBlue Live ReadyProbes Reagenzien (ThermoFisher) angefärbt, und Hoechst-positive Einzelkerne wurden durch fluoreszenzaktivierte Zellsortierung (FACS) unter Verwendung von influx, XDP oder FACSAria (BD Biosciences) gereinigt (ergänzende Abb. 1). Die Reinigung und Unversehrtheit der Kerne wurde unter dem Mikroskop überprüft, und die Kerne wurden mit dem Chromium Controller (10X Genomics) gemäß dem Protokoll des Herstellers weiterverarbeitet.
Einzellpräparation
Herzgewebe (0.2-0,9 g) wurden aus der kardioplegischen Lösung in gentleMACS C-Röhrchen (Miltenyi Biotec) überführt, die eine enzymatische Verdauungsbasislösung (100 μg ml-1 Liberase TH Research grade und 50 μg ml-1 DNase I, HBSS 10 mM HEPES und 30 mM Taurin)71 enthielten. Das Gewebe wurde mit einer Schere (FST) zerkleinert und automatisch mit dem gentleMACS Octo Dissociator (Miltenyi Biotec) mit Heizgeräten verdaut. Kardiomyozyten-depletierte Einzelzellsuspensionen wurden mit Basislösung mit 20 % fötalem Rinderserum (FBS) (Gibco) gewaschen, durch ein 70-μm-Nylonsieb (BD Falcon) gefiltert, durch Zentrifugation (330 g, 10 min, 4 °C) gesammelt und in Basislösung mit 0,2 % FBS (Gibco) resuspendiert. Die Zellen wurden nach jeder Zentrifugation dreimal manuell durch Trypanblauausschluss gezählt und in einer Konzentration von mindestens 2 × 106 ml-1 resuspendiert. Einzelne Zellen wurden mit Chromium Controller (10X Genomics) gemäß dem Herstellerprotokoll verarbeitet.
CD45+-Zellanreicherung
Die Zellsuspension wurde wie oben beschrieben hergestellt und anschließend mit monoklonalen Anti-Human-CD45-Antikörpern konjugierten Microbeads gemäß dem Herstellerprotokoll (Miltenyi Biotec) markiert. Kurz gesagt wurden bis zu 107 Zellen 15 Minuten lang bei 4 °C in 80 μl PBS-, BSA- und EDTA-Puffer (1× PBS pH 7,2, 0,5 % BSA, 2 mM EDTA) mit 20 μl CD45-Mikrokügelchen inkubiert. Die Zellsuspension wurde einmal in PBS, BSA, EDTA-Puffer gewaschen und durch Zentrifugation (330 g, 10 min, 4 °C) gesammelt. Die resuspendierten Zellen wurden auf MACS LS-Säulen (Miltenyi Biotec) aufgetragen. Die CD45-depletierte Zellfraktion wurde nach dreimaligem Waschen mit PBS-, BSA- und EDTA-Puffer verworfen, und die CD45+-Zellfraktion wurde in PBS-, BSA- und EDTA-Puffer gesammelt, indem die Säulen vom Magnetfeld entfernt wurden. CD45+-Zellen wurden gezählt und in PBS, BSA und EDTA-Puffer bis zu einer Konzentration von mindestens 2 × 106 pro ml resuspendiert, bevor sie mit einem Chromium Controller (10X Genomics) gemäß dem Herstellerprotokoll weiterverarbeitet wurden.
Chromium 10X library preparation
Einzelzellen und Zellkerne wurden manuell durch Trypanblau-Ausschluss oder automatisch mit einem Countess II (Life Technologies) unter Verwendung von mindestens zwei separaten Zählungen gezählt. Die Zell- oder Kernsuspension wurde auf 400-1.000 Zellen pro Mikroliter eingestellt und auf den Chromium Controller (10X Genomics) mit einer angestrebten Zell- oder Kernwiederfindung von 4.000-10.000 pro Reaktion geladen. 3′-Genexpressionsbibliotheken wurden gemäß den Anweisungen des Herstellers der v2 oder v3 Chromium Single Cell Reagent Kits (10X Genomics) hergestellt. Die Qualitätskontrolle der cDNA und der endgültigen Bibliotheken wurde mit dem Bioanalyzer High Sensitivity DNA Analysis (Agilent) oder dem 4200 TapeStation System (Agilent) durchgeführt. Die Bibliotheken wurden mit HiSeq 4000 (Illumina) am Wellcome Sanger Institute und NextSeq 500 (Illumina) an der Harvard Medical School mit einer Mindesttiefe von 20.000-30.000 Lesepaaren pro Zelle oder Zellkern sequenziert (ergänzende Tabelle 22).
Räumliche Validierung mittels smFISH mit RNAscope-Sonden
Bei der Vorbereitung von formalinfixierten, paraffineingebetteten (FFPE) Proben wurde frisches Gewebe 18-36 h lang in neutral gepuffertem 10%igem Formalin fixiert und anschließend in Paraffinblöcke eingebettet. Fixierte und eingefrorene Gewebeproben wurden in 4 % Paraformaldehyd (ThermoFisher) fixiert. Die Schnitte wurden mit einem Mikrotom in 5 μm Dicke geschnitten und auf SuperFrost Plus Objektträger (VWR) gelegt. FFPE-Gewebeschnitte wurden automatisch mit BOND RX (Leica) und dem RNAscope Multiplex Fluorescent Reagent Kit v2 Assay (ACDBio) gemäß dem Herstellerprotokoll gefärbt. Fixiert-gefrorene Gewebeschnitte wurden nach dem Protokoll des RNAscope Multiplex Fluorescent Assay v1 (ACDBio) bearbeitet. RNAscope-Fertig- oder maßgeschneiderte Zielsonden wurden parallel zu Multiplex-Positiv- und Negativkontrollen eingesetzt (Erweiterte Daten, Abb. 12b, Ergänzende Tabelle 23). Alle Zellkerne wurden mit DAPI angefärbt. Alle FFPE-Gewebeschnitte wurden mit einem Opera Phenix High-Content konfokalen Screening-System (Perkin Elmer) mit einer Z-Schrittgröße von 1 μm und einem 20×-Wasserimmersionsobjektiv (NA 0,16, 0,299 μm pro Pixel) abgebildet. Kanäle: DAPI (Anregung 375 nm, Emission 435-480 nm), Atto 425 (Anregung 425 nm, Emission 463-501 nm), Opal 520 (Anregung 488 nm, Emission 500-550 nm), Opal 570 (Anregung 561 nm, Emission 570-630 nm), Opal 650 (Anregung 640 nm, Emission 650-760 nm). Fixiert-gefrorene Gewebeschnitte wurden mit einem konfokalen Mikroskop LSM710 (Zeiss) und einem 40×-Ölimmersionsobjektiv (1,3 Öl, DIC III) abgebildet. Kanäle: DAPI (Anregung 375 nm, Emission 435-480 nm), Alexa Fluor 488 (Anregung 492 nm, Emission 517 nm), Atto 550 (Anregung 560 nm, Emission 575 nm) und Atto 647 (Anregung 649 nm, Emission 662 nm). Visualisierung und Hintergrundentfernung (Rolling Ball Radius) erfolgten mit Fiji/ImageJ72. Zur besseren Visualisierung wurden Pseudofarben verwendet.
Hämatoxylin- und Eosinfärbung
Die Gewebeproben wurden bei -80 °C in Isopentan (ThermoFisher) frisch eingefroren und in OCT (VWR) eingebettet. Die Schnitte wurden mit einem Mikrotom in einer Dicke von 10 μm geschnitten, auf SuperFrostPlus-Objektträger (VWR) gelegt und nach einem Standardprotokoll für die Hämatoxylin- und Eosinfärbung weiterverarbeitet (Erweiterte Daten, Abb. 12a).
Gewinnung von Skelettmuskelgewebe
Interkostale Muskelproben wurden zwischen der zweiten und dritten Rippe auf der linken Seite entnommen. Dies ist typischerweise die tiefste Schicht des Muskels (am weitesten von der Haut entfernt). Die Proben wurden direkt in die kalte Konservierungslösung gegeben.
Kernisolierung für Skelettmuskeln
Das Muskelgewebe wurde in 1× PBS gewaschen, von sichtbaren Fettablagerungen befreit und zerkleinert, um Fragmente von etwa 1 mm3 zu erhalten. Pro Probe wurden etwa 0,3 g zerkleinertes Gewebe in 3 ml Puffer A (250 mM Saccharose, 10 mg ml-1 BSA, 5 mM MgCl2, 0,12 U μl-1 RNaseIn, 0,06 U μl-1 SUPERasIn, 1× Proteaseinhibitor) mit einem Dounce-Gewebezerkleinerungsset (Merck) mit 50 Hüben des losen Pistills homogenisiert (A). Das Homogenat wurde durch ein 100-μm-Zellsieb (Corning) filtriert und das Sieb mit 1 ml und anschließend 750 μl Puffer A gewaschen. Nach Zugabe von Triton X-100 (Endkonzentration 0,5 %) wurde die Mischung mit 50 Hüben des festen Pistills weiter homogenisiert (B). Nach dem Filtrieren durch ein 40-μm-Sieb wurden die Kerne zentrifugiert (3.000 g, 5 min, 4 °C) und in 1 ml Puffer B (320 mM Saccharose, 10 mg ml-1 BSA, 3 mM CaCl2, 2 mM Magnesiumacetat, 0.1 mM EDTA, 10 mM Tris-HCl, 1 mM DTT, 1× Proteaseinhibitor, 0,12 U μl-1 RNaseIn, 0,06 U μl-1 SUPERasin) resuspendiert und mit einer 27%igen Percoll-Gradientenlösung gereinigt. Die Percoll-Mischung wurde bei 20.000 g (15 min, 4 °C) zentrifugiert und das Pellet in 200 μl Puffer B resuspendiert, gefolgt von einer Zentrifugation (20.000 g, 3 min, 4 °C). Nach Trypanblau-Färbung wurden die intakten Zellkerne mit einem Hämozytometer gezählt. Die Kerne wurden mit einem Chromium Controller (10X Genomics) gemäß dem Herstellerprotokoll profiliert.
Einzellisolierung für Skelettmuskel
Muskelgewebe wurde in 1× PBS gewaschen, von allen sichtbaren Fettablagerungen befreit und fein zerkleinert. Dann wurden 2 g des zerkleinerten Gewebes in Verdauungspuffer 1 (750 U ml-1 Kollagenase Typ 2 in 1× PBS) überführt und 90 Minuten bei 37 °C im Wasserbad inkubiert. Das teilweise verdaute Gewebe wurde durch Zentrifugation (650 g, 5 min, 4 °C) gewonnen, und das Pellet wurde in Verdauungspuffer 2 (100 U ml-1 Kollagenase Typ 2, 2 U ml-1 Disase in PBS) resuspendiert. Nach 30 Minuten Inkubation bei 37 °C im Wasserbad wurde der Verdau durch Zugabe von 2 % FBS gestoppt. Die Zellen wurden durch ein 100-μm- und ein 40-μm-Nylonsieb (BD Falcon) filtriert, durch Zentrifugation (650 g, 4 °C, 3 min) gesammelt und mit 1× PBS, 2 % FBS gewaschen. Anschließend wurde ein 20%iger Percoll-Gradient (15.000g, 4 °C, 20 min) zur Zellreinigung verwendet. Die zellhaltige Schicht wurde gesammelt, in PBS mit 2 % FBS gewaschen und die lebensfähigen Zellen durch Trypanblau-Ausschluss mit einem Hämozytometer gezählt. Die Zellkerne wurden mit einem Chromium Controller (10X Genomics) gemäß dem Protokoll des Herstellers profiliert.
Die Tabelle mit den wichtigsten Ressourcen zu den Methoden ist in der ergänzenden Tabelle 24 zu finden.
Transkriptom-Mapping
Nach der Sequenzierung wurden die Proben demultiplexiert und als CRAM-Dateien gespeichert. Jede Probe wurde dem menschlichen Referenzgenom (GRCh38 v.3.0.0) zugeordnet, das von 10X Genomics zur Verfügung gestellt wurde, wobei die CellRanger-Suite (v.3.0.1) mit Standardparametern verwendet wurde. Einzelzellproben wurden gegen die bereitgestellte Referenz gemappt. Proben von Einzelkernen, die Referenz für prä-mRNA, wurde unter Verwendung der Anweisungen von 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references) erstellt.
Verarbeitung von Zähldaten
Nach dem Mapping wurden Proben aus jeder Datenquelle (Einzelkerne, Einzelzellen und CD45+-Zellen) in einzelne AnnData-Objekte gruppiert, indem die raw_feature_bc_matrix_h5.h5 verkettet und die entsprechenden Metadateninformationen hinzugefügt wurden. Für jedes Datenquellenobjekt wurde der Mittelwert der eindeutigen molekularen Identifikatoren (UMIs) (n_counts) berechnet und als Schwellenwert für leere Tröpfchen verwendet.
Doublet-Erkennung
Nach der Entfernung von leeren Tröpfchen wurde Scrublet73 angewendet, um jeder Zelle einen Doublet-Score (scrublet_score) zuzuweisen. Diese Zellen wurden geclustert und mit der UMAP-Methode74 visualisiert. Darüber hinaus wurde jede Zelle für die Dublettenerkennung mit einer Perkolationsmethode verarbeitet, um eine bessere Erkennung von Dubletten zu ermöglichen75.
Zellqualitätskontrolle und Filterung
Jede Datenquelle wurde separat verarbeitet und kommentiert, um quellenspezifische Qualitätsunterschiede zu berücksichtigen. Diese Metriken werden als Kovariaten in die weitere Verarbeitung einbezogen. Gesamtzellen und CD45+-Zellen wurden nach Anzahl (500 < n_counts <15.000), Genen (200 < n_genes), mitochondrialen Genen (percent_mito <20%), ribosomalen Genen (percent_ribo <20%) und Scrublet-Score (scrublet_score <0.3) gefiltert. Einzelne Kerne wurden nach Anzahl (500 < n_counts <15.000), Genen (300 < n_genes <6.000), mitochondrialen Genen (percent_mito <5%), ribosomalen Genen (percent_ribo <5%) und Scrublet-Score (scrublet_score <0,3) gefiltert. Die gleichen Filterschwellenwerte wurden auf den Skelettmuskeldatensatz angewandt.
Scanpy toolkit 1.576 in Python v.3.7 wurde verwendet, um nachgelagerte Analysen durchzuführen, einschließlich Normalisierung (normalize_per_cell: counts_per_cell_after = 10.000), Log-Transformation (log1p), Erkennung variabler Gene (highly_variable_genes), Regression unerwünschter Variationsquellen (regress_out: n_counts und percent_mito), Skalierung von Datenmerkmalen (scale: max_value = 10) und PCA (pca: using highly variable genes) wie zuvor beschrieben77.
Batch-Alignment mit Deep Variational Autoencoder
Wir erstellten eine globale Mannigfaltigkeit, indem wir alle Datenquellen und Spender in unseren Daten abglichen. Dies geschah in einem dreistufigen Verfahren: (1) Jede Quelle wurde separat analysiert und annotiert, wobei nur die Spender mit Hilfe eines linearen Regressionsschritts im Perizytenraum vor dem Batch-Alignment mit bbknn78 ausgerichtet wurden. Differenziell exprimierte Gene (DEGs) wurden mit einem Wilcoxon-Rangsummentest mit Bonferroni-Hochberg-Anpassung berechnet, wie im Scanpy-Framework implementiert. (2) Zur Annotation jedes Clusters verwendeten wir einen integrativen Ansatz, indem wir die wichtigsten DEGs (P < 1 × 10-5) mit einem logFC >1 in den Datenbanken ToppFun79 und EnrichR80 suchten. Signifikante Treffer zu Signalwegen, Transkriptionsregulation und biologischen Prozessen wurden priorisiert, um einen bestimmten Cluster zu annotieren. Jedes zelluläre Kompartiment wurde nach der Gruppierung quellenspezifischer Zellzustände unter dem adata.obs-Slot beschriftet. (3) Alle Quellen wurden in einem einzigen AnnData-Objekt mit der Bezeichnung adata.obs zusammengefasst. Die Batches wurden mit der batch_correction-Funktion des scGen Variations-Autoencoders81 ausgerichtet. Zunächst wurde für adata.obs ein Alignment durchgeführt, wobei adata.obs als Anker verwendet wurde. Anschließend wurde ein Alignment für adata.obs durchgeführt, wobei adata.obs als Anker verwendet wurde. Jede Batch-Alignment-Runde wurde für 50 Epochen durchgeführt.
Mit dieser Methode wurden Verzweigungen für die Adipozyten, die vaskulären und immunen Herzpopulationen sowie für die Skelettmuskelanalyse erstellt und die Clustering-Genauigkeit mit SCCAF82 bewertet (Extended Data Abb. 12d).
DEGs
Um die Annotation der Subpopulationen der einzelnen Zellkompartimente zu erleichtern, berechneten wir die DEGs mit dem Wilcoxon-Rangsummentest, wie er im Scanpy-Workflow implementiert ist und von neueren Benchmarking-Studien empfohlen wird83. Ein Gen galt als differentiell exprimiert, wenn es eine log2-transformierte Fold Change > 1 und einen P < 1 × 10-5 aufwies, sofern im Analyseabschnitt nicht anders angegeben.
Zell-Zell-Interaktionen
Expressionsmatrizen der untersuchten Populationen wurden aus den AnnData exportiert, zusammen mit einer Metadatentabelle, die die Zell-Barcodes als Indizes enthielt. Anschließend führten wir CellPhoneDB wie folgt aus: cellphonedb method statistical_analysis meta.tsv counts.tsv-counts-data = gene_name-threads = 60. Die CellPhoneDB-Rohvorhersagen wurden gefiltert, indem diejenigen Interaktionen mit einem P > 1,0 × 10-5 entfernt wurden. Signifikante Paare wurden dann zur Analyse der Anreicherung von Gensätzen in ReactomeDB, enrichR und ToppFun zur funktionellen Klassifizierung eingereicht. Die vaskulären Zellen wurden vor der Analyse nach dem Zufallsprinzip auf 39.000 Zellen und die kardiale Reparaturgruppe (atriale und ventrikuläre Kardiomyozyten, FBs und Immunzellen) vor der Analyse nach dem Zufallsprinzip auf 69.295 Zellen unterbeprobt.
Visualisierung der Genexpression auf 10X Genomics Visium-Daten
Wir verarbeiteten die öffentlich zugänglichen linksventrikulären Myokardium Visium-Daten von 10X Genomics (https://support.10xgenomics.com/spatial-gene-expression/datasets/1.0.0/V1_Human_Heart) mit dem Scanpy v.1.5, der für die Analyse von 10X Genomics Visium-Daten angepasst wurde (https://scanpy-tutorials.readthedocs.io/en/latest/spatial/basic-analysis.html). Kurz gesagt, wurden Spots mit weniger als 500 UMIs oder mehr als 20.000 UMIs und weniger als 200 Genen entfernt. Die Daten wurden log-transformiert und vor dem Plotten normalisiert.
Schätzung der RNA-Geschwindigkeit
Um die RNA-Geschwindigkeit der Einzelzellen und der mit CD45+ angereicherten Einzelzellen zu berechnen, verwendeten wir die CellRanger-Ausgabe-BAM-Datei und die GENCODE v33 GTF-Datei (ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_33/gencode.v33.chr_patch_hapl_scaff.annotation.gtf.gz) zusammen mit der velocyto84 CLI v.0.17.17, um eine Loom-Datei zu erstellen, die die Quantifizierung der gespleißten und ungespleißten RNA enthält. Anschließend wurde ein Manifold erstellt, die Zellen geclustert und die RNA-Geschwindigkeiten mit scVelo85 visualisiert.
Subpopulationsanalysen von atrialen und ventrikulären Kardiomyozyten, Fibroblasten und neuronalen Zellen
Alle Barcodes, die im globalen Objekt als Kardiomyozyten, Fibroblasten und neuronale Zellen gekennzeichnet waren, wurden für weitere Subpopulationsanalysen ausgewählt. Zusätzliche zellpopulationsspezifische Filterkriterien wurden wie folgt auf die Kerne angewandt: Anzahl der Kardiomyozyten (n_counts <12.500), Gene (n_genes <4.000), mitochondriale Gene (percent_mito <1%), ribosomale Gene (percent_ribo <1%) und scrublet score (scrublet_score <0.25); FB mitochondriale Gene (percent_mito <1%), ribosomale Gene (percent_ribo <1%); neuronale Zellgene (n_genes <4000), mitochondriale Gene (percent_mito <1%), ribosomale Gene (percent_ribo <1%). Gesamt- und CD45+-Zellen wurden in den Datensätzen für atriale und ventrikuläre Kardiomyozyten ausgeschlossen und trugen nicht zur Subpopulationsanalyse bei. Es wurde keine weitere Filterung von FBs oder neuronalen Gesamtzellen und CD45+ Zellen vorgenommen. Kardiomyozyten und FBs wurden dann in zwei Gruppen auf der Grundlage der Herkunftsregion aufgeteilt: (1) linker und rechter Vorhof und (2) linker und rechter Ventrikel, Apex und Interventrikularseptum.
Die Spendereffekte wurden wie in Schritt (1) oben beschrieben abgeglichen. Für FB und neuronale Zellen wurden die Quellen wie in Schritt (3) oben beschrieben ausgerichtet. Leiden-Clustering und UMAP-Visualisierung wurden zur Identifizierung von Subpopulationen und zur Visualisierung durchgeführt86. Differenziell exprimierte Gene wurden mit dem Wilcoxon-Rangsummentest berechnet. Die Gene wurden nach ihrer Punktzahl geordnet.
Gewebeübergreifender Vergleich der Immunpopulationen des Herzens mit den Immunpopulationen des Skelettmuskels, der Niere und des Blutes
Wir sammelten Einzelzell-Transkriptomdaten für erwachsene Nieren aus ref. 99 (https://www.kidneycellatlas.org/) und untersuchten alle Immunzellen, die in ihrer Studie berichtet wurden. Für das SKM wählten wir die annotierten Immunzellen aus dem fusionierten Manifold aus. Für das menschliche Blut verwendeten wir den öffentlich zugänglichen Datensatz von 10.000 einzelnen PBMC-Zellen, der von 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/datasets/3.0.0/pbmc_10k_v3) bereitgestellt wurde. Wie bereits beschrieben87 , trainierten wir ein logistisches Regressionsmodell für die kardialen Immunzellen unter Verwendung von 80 % der Expressionsdaten und testeten seine Genauigkeit an den verbleibenden 20 %, um ein Modell mit einer Genauigkeit von 0,6862 zu erhalten (Erweiterte Daten Abb. 8f, ergänzende Tabelle 16). Anschließend wendeten wir dieses Modell an, um analoge kardiale Immunpopulationen in der erwachsenen Niere, im SKM und in PBMCs vorherzusagen. Vorhersagen mit einer Wahrscheinlichkeit von weniger als 0,8 wurden von den nachgelagerten vergleichenden Analysen ausgeschlossen.
Gene Ontology-Anreicherungsanalyse
Für die ventrikuläre Kardiomyozytenpopulation verwendeten wir das R-Paket gProfileR (https://cran.r-project.org/web/packages/gProfileR/index.html) mit der Score-bewerteten Genliste von vCM4 als Eingabe und dem Satz von Genen, die in ventrikulären Kardiomyozyten exprimiert werden, als Hintergrund (jene Gene mit einer UMI-Anzahl >1). Um die Gene Ontology-Analyse für die vaskulären Zellen durchzuführen, wurden die 500 wichtigsten DEGs (P < 1 × 10-5) mit einer log-transformierten Fold-Change > 1 mit der Gene Ontology-Datenbank für biologische Prozesse unter Verwendung von ToppFun79 durchsucht (ergänzende Tabelle 25). Die fünf am stärksten angereicherten Begriffe (q < 0,05) für jede Subpopulation wurden ausgewählt und in einer Heatmap dargestellt. Um die Pfadanalyse auf den Adipozyten durchzuführen, wurden die Top 500 signifikanten DEGs (P < 1 × 10-5) mit einer log-transformierten Fold Change > 0,5 gegen ToppFun79 Pfaddatenbanken (ergänzende Tabelle 26) durchsucht. Die fünf am stärksten angereicherten Stoffwechselwege (q < 0,05) für jede Subpopulation wurden ausgewählt und auf einer Heatmap dargestellt.
Gene set score
Wir verwenden die score_genes-Funktion, wie sie in scanpy implementiert ist, um die Anreicherung von Genen zu berechnen, die am Oncostatin-M-Stoffwechselweg beteiligt sind. Eine Liste von Genen wurde anhand von Literaturrecherchen zusammengestellt88,89. Für die Anreicherung des Gensatzes wurden nur hoch exprimierte Gene berücksichtigt, um das Rauschen zu reduzieren (mehr als 500 UMIs in allen Zellen). Die gleiche Analyse wurde für den Vergleich der kardialen Immunzellen in unserer Studie mit den Beobachtungen früherer Studien über Makrophagen, die sich im Herzen befinden51, über gewebeumwandelnde Makrophagen der Maus45 und über die Abstammung aus dem Dottersack90 durchgeführt.
Statistik und Reproduzierbarkeit
Alle Analysen wurden mit der Software R, v.3.6.1, durchgeführt. Student’s t-Tests wurden verwendet, um die Verteilung der Zelltypen an jedem Standort zu vergleichen. P < 0,05 wurde als statistisch signifikant angesehen. Lineare Regressionsmodelle (Korrelationen) wurden mithilfe der R-Funktion für lineare Modelle (lm) erstellt, die die statistische Wahrscheinlichkeit (P-Wert) einer linearen Beziehung schätzt. Für Mehrfachtests wurde die Bonferroni-Korrektur angewendet.
Die in den Abbildungen dargestellten RNAscope-Mikroaufnahmen sind repräsentativ. Die mikroskopischen Aufnahmen in den Abbildungen 2g, 3c, h und Erweiterte Daten Abb. 3c (HAMP), Erweiterte Daten Abb. 3e (CNN1), Erweiterte Daten Abb. 4g, m, 6f wurden mit ähnlichen Ergebnissen in zwei einzelnen Gewebeschnitten wiederholt. Die mikroskopischen Aufnahmen in Abb. 2h, 3f und Erweiterte Daten Abb. 3c (CNN1), Erweiterte Daten Abb. 3e (PCDH7), Erweiterte Daten Abb. 6e, h, 9d wurden mit ähnlichen Ergebnissen in drei einzelnen Gewebeschnitten wiederholt. Die mikroskopischen Aufnahmen in den Abbildungen 1e, 2d, 3e und den erweiterten Daten in den Abbildungen 1f, 3c (FHL1) und den erweiterten Daten in Abbildung 6d wurden mit ähnlichen Ergebnissen in vier einzelnen Gewebeschnitten wiederholt. Die Schliffbilder in Abb. 2c und Erweiterte Daten Abb. 3c (PRELID2), Erweiterte Daten Abb. 10e, 12a wurden mit ähnlichen Ergebnissen in sechs oder mehr einzelnen Gewebeschnitten wiederholt. Positiv- und Negativkontrollen wurden einmal pro verwendeter Probe durchgeführt.
GWAS-Anreicherungsanalyse
Wir luden GWAS-Zusammenfassungsstatistiken aus dem breiten cvdi, dem EBI GWAS-Katalog und dem GWAS-Atlas herunter. Wir wählten Merkmale mit gut gepowerten GWAS aus (n > 5.000 und Anzahl der signifikanten Loci >10). Die GWAS-Datensätze sind in der ergänzenden Tabelle 27 zusammengefasst. Genexpressionsdaten von proteinkodierenden Genen wurden auf Entrez-Gen-IDs abgebildet, und diese Genannotationen wurden für die menschliche Genomzusammensetzung hg19/37 verwendet. Wir verwendeten nur Genexpressionsdaten aus Zellkernen. Wir implementierten die zuvor beschriebene Analyse64 in Python und R. Die log-transformierten Zählungen (plus eine Pseudozählung) wurden zur Berechnung der durchschnittlichen zelltypspezifischen Expressionsprofile verwendet. Wir führten individuelle Magma-Analysen für jeden Zelltyp durch, wobei wir immer die Standardkovariaten auf Genebene (z. B. Genlänge) und die durchschnittliche Genexpression über alle Zellen hinweg berücksichtigten. Anschließend wendeten wir die Benjamini-Hochberg-Methode an und wählten Zelltyp-Eigenschaftsassoziationen mit FDR < 10 % aus. Diese Paare wurden dann einer bedingten Analyse unterzogen, wie zuvor beschrieben64 , um „unabhängige“, „gemeinsam erklärte“ und „teilweise gemeinsam erklärte“ Paare von Assoziationen zu definieren (ergänzende Tabelle 28).
Verteilungen von dispergierten Zellen und isolierten Kernen
Die unterschiedlichen Verfahren zur Gewinnung von isolierten Kernen und dispergierten Zellen führten zu signifikant unterschiedlichen Verteilungen von Zelltypen (ergänzende Tabelle 29, erweiterte Daten, Abb. 2). Insbesondere stammten 30,1 % bzw. 49,2 % der isolierten Zellkerne aus atrialen und ventrikulären Kardiomyozyten in den Vorhof- und Kammerregionen, während diese Zellen bei den Präparationen von isolierten und CD45-selektierten Zellen größtenteils ausgeschlossen wurden (Ergänzungstabelle 2).
Unter Ausschluss der Kardiomyozyten blieb die Verteilung der Zelltypen, die aus isolierten Kernen und dispergierten Zellen identifiziert wurden, unterschiedlich (Ergänzungstabelle 30). Obwohl 59,0 % der dispergierten Zellen ECs waren, stammten nur 15,7 % der Zellkerne von ECs. Dagegen stammten 64,2 % der Zellkerne von FBs (31,2 %) und Perizyten (33,0 %), während nur 17,1 % der dispergierten Zellen FBs (2,3 %) und Perizyten (14,8 %) waren. Diese Unterschiede spiegeln möglicherweise die Empfindlichkeit der EC-Kerne gegenüber den Isolierungsverfahren oder die Resistenz der Perizyten und FBs gegenüber dem enzymatischen Zellaufschluss wider.
Trotz der Unterschiede in der Zellverteilung zwischen isolierten Kernen und dispergierten Zellen waren die Genexpressionsprofile der Zelllinien einigermaßen korreliert (r > 0,4 für jeden Zelltyp). Um die Übereinstimmung der von Zellen und Zellkernen erfassten Gene zu untersuchen, verglichen wir die Expression der wichtigsten Zelltyp-Marker aus Abb. 1c in den drei Quellen (Erweiterte Daten, Abb. 1c). Da den Zellkernen zytoplasmatische RNA fehlt, war die Expression bestimmter Gene, insbesondere der Immunitätsgene NKG7 und C1QA, in den Zellkernen geringer als in den Zellen. Dennoch war der allgemeine Trend bei den Markergenen in allen drei Quellen konsistent, und dieselben Gene unterschieden die einzelnen Zelltypen unabhängig von der Quelle.
Weitere Analyse der vaskulären Zellen
Die PC3_str enthielt einen ähnlichen Anteil an Zellen und Kernen und hatte einen Scrublet-Score, der unter dem verwendeten strengen Schwellenwert lag; dennoch war die durchschnittliche Anzahl von Genen und Zählungen in diesem Cluster höher als der Durchschnitt. Daher können wir trotz unserer strengen Qualitätsfilterung die Möglichkeit nicht ausschließen, dass in diesem Cluster Doubletten vorhanden sind. EC10_CMC-like und PC4_CMC-like ko-exprimieren EC- oder Perizyten-Gene mit Kardiomyozyten-Markern, und es sind weitere Studien erforderlich, um zu verstehen, ob sie bisher unbekannte Zellzustände oder Doubletten darstellen.
Die Beobachtungen der arteriellen und venösen SMC werden durch frühere Studien unterstützt, die vorhersagen, dass arterielle SMCs kontraktiler und venöse SMCs weniger differenziert sind91.
EC3_cap reichert sich für Transkripte an, die für Komponenten von AP1 (JUN und FOS) kodieren, das mehrere Entscheidungen über das Schicksal von EC vermittelt, einschließlich der Reaktion auf VEGF, Entzündungs- und Stresssignale, sowie ATF3, ein Gen für adaptive Reaktionen, das durch verschiedene Signale induziert wird92,93,94.
Charakterisierung der Skelettmuskulatur
Wir entnahmen interkostale Skelettmuskelproben von fünf gesunden Personen, darunter ein Spender mit passendem Herzgewebe, und erstellten Profile des Transkriptoms von 35.665 Einzelzellen und 39.597 Einzelkernen. Analog zum Herzen konnten wir durch die Kombination von Zellen und Kernen die wichtigsten Zelllinien erfassen und auflösen, darunter Kardiomyozyten, Fibroblasten, Endothelzellen, glatte Muskelzellen, Perizyten, myeloische und lymphoide Immunzellen und Satellitenzellen (Erweiterte Daten, Abb. 11a, b, ergänzende Tabelle 31).
Weitere Analysen der Gefäßzellen des Skelettmuskels ergaben zehn verschiedene Populationen. Die Endothelzellen wiesen fünf Cluster auf, die nach ihren jeweiligen Gefäßbetten getrennt waren und ähnliche Signaturen aufwiesen wie die, die wir im Herzen beobachten. Die EC_cap exprimieren VWF und RGCC. Venöse EC_ven exprimieren ACKR1 und PLVAP, während arterielle EC_art SEMA3G und HEY1 aufweisen, was mit unseren Herzdaten übereinstimmt (Erweiterte Daten Abb. 11c, d, Ergänzende Tabelle 32).
Die Gesamtverteilung der vaskulären und stromalen Zellpopulationen im Skelett- und Herzmuskel war ähnlich, einschließlich der arteriellen und venösen Merkmale der ECs; allerdings enthielt der Skelettmuskel einen einzigen SMC-Cluster, was möglicherweise mit der geringeren Größe des Datensatzes zusammenhängt. In der Skelettmuskulatur umfassten die vorhergesagten Zell-Zell-Interaktionen der EC_art und SMCs NOTCH1/4-JAG1 sowie JAG1/JAG2/DLL4-NOTCH3, aber nicht JAG1/JAG2/DLL4-NOTCH2, die im Herzen abgeleitet wurden (Extended Data Abb. 11e, f, Supplementary Table 33).
Herzimmunzellen
Mit Hilfe des logistischen Regressionsmodells konnten wir kein Gegenstück zu den kardialen IL17RA+ Monozyten im SKM oder in der Niere identifizieren, was möglicherweise auf die geringe Größe dieser Population zurückzuführen ist.
Naive T-Zellen (CD4+T_naive), die identifiziert wurden, exprimierten CCR7 und SELL, was auf ihre naive und gewebebewohnende Natur hinweist95. Gedächtnis-T-Zellen (CD8+T_tem) exprimierten BACH2, STAT4 und IL7R, was auf ein langfristiges Immungedächtnis hinweist96,97. Wir charakterisierten die lymphatischen Zellen weiter mit scNym98 und trainierten es anhand veröffentlichter Daten99,100. Das sich daraus ergebende Modell wurde auf unsere kardialen Immunzellen angewandt, und diejenigen Zellen, deren vorhergesagte Punktzahl höher als 0,8 war, wurden als wahrscheinliche Kandidaten für eine Neuannotation angesehen. Mit diesem Ansatz identifizierten wir Kandidaten für Plasma-B-Zellen (109), dendritische Zellen (645), angeborene lymphoide Zellen (89), MAIT-T-Zellen (219), T-Helferzellen (80), regulatorische T-Zellen (11), zentrale T-Gedächtniszellen (103), γδ-T-Zellen (30) und plasmozytoide dendritische Zellen (27). Diese Anmerkungen sind in den Anmerkungen zu den kardialen Immunobjekten unter der Bezeichnung „scNym“ auf www.heartcellatlas.org zu finden.
Zusammenfassung der Berichterstattung
Weitere Informationen zum Forschungsdesign sind in der Nature Research Reporting Summary zu finden, die mit diesem Artikel verlinkt ist.