- Informe de datos
- Etica de la investigación para los tejidos de los donantes
- Adquisición y procesamiento de tejidos
- Aislamiento de núcleos individuales
- Preparación de células individuales
- Enriquecimiento de células CD45+
- Preparación de la biblioteca de cromo 10X
- Validación espacial mediante smFISH con sondas RNAscope
- Tinción de hematoxilina y eosina
- Adquisición de tejido muscular esquelético
- Aislamiento de los núcleos del músculo esquelético
- Aislamiento de células individuales para el músculo esquelético
- Mapeo del transcriptoma
- Procesamiento de datos de recuento
- Detección de dobletes
- Control de calidad y filtrado de células
- Alineación por lotes usando autoencoder variacional profundo
- DEGs
- Interacciones célula-célula
- Visualización de la expresión génica en los datos de Visium de 10X Genomics
- Estimación de la velocidad del ARN
- Análisis de subpoblación de cardiomiocitos auriculares y ventriculares, fibroblastos y células neuronales
- Comparación entre tejidos de las poblaciones inmunitarias cardíacas con las poblaciones inmunitarias del músculo esquelético, el riñón y la sangre
- Análisis de enriquecimiento de la ontología de genes
- Puntuación del conjunto de genes
- Estadística y reproducibilidad
- Análisis de enriquecimiento de GWAS
- Distribuciones de células dispersas y núcleos aislados
- Análisis adicional de las células vasculares
- Caracterización del músculo esquelético
- Células inmunitarias cardíacas
- Resumen del informe
Informe de datos
No se utilizaron métodos estadísticos para predeterminar el tamaño de la muestra. Los experimentos no fueron aleatorios y los investigadores no estaban cegados a la asignación durante los experimentos y la evaluación de los resultados.
Etica de la investigación para los tejidos de los donantes
Los tejidos del corazón (donantes D1-D7 y D11) se procesaron en el Instituto Wellcome Sanger (Hinxton, Reino Unido) y se obtuvieron de donantes de órganos trasplantados fallecidos tras la aprobación del Comité de Ética de la Investigación (ref. 15/EE/0152, Comité de Ética de la Investigación del Este de Inglaterra, Cambridge Sur) y el consentimiento informado de las familias de los donantes. Los tejidos cardíacos (donantes H2-H7) se procesaron en la Harvard Medical School (Boston, Massachusetts, EE.UU.) y se obtuvieron de donantes de órganos fallecidos tras la aprobación del Comité Ético de Investigación Humana Pro00011739 (Universidad de Alberta, Edmonton, Canadá). Se obtuvo el consentimiento informado de las familias de los donantes a través del Programa de Obtención e Intercambio de Órganos Humanos (HOPE) institucional. Los antecedentes cardiovasculares de todos los donantes eran normales (Tabla suplementaria 1).
Adquisición y procesamiento de tejidos
Los tejidos se obtuvieron de donantes del Reino Unido y de Norteamérica (D1-7 y 11, H2-7) tras una muerte circulatoria (DCD) (D2, D4-D7 y D11) y tras una muerte cerebral (DBD) (D1, D3, H2-H7). En el caso de los donantes de DCD del Reino Unido, tras cinco minutos de espera y en el caso de la DBD, se abre el tórax, se pinza la aorta y se obtienen muestras cardíacas. En el caso de los donantes norteamericanos de DBD, se pinza la aorta, se administra cardioplejía fría (Celsior) bajo presión a través de la aorta para detener los latidos, se extirpa el corazón, se enjuaga en solución salina fría y se obtienen las muestras. Todas las muestras de los donantes eran biopsias miocárdicas de grosor completo de la aurícula izquierda y derecha, los ventrículos izquierdo y derecho, el tabique interventricular y el ápex, con exclusión intencionada de los grandes depósitos de grasa epicárdica. Las muestras utilizadas para el aislamiento de núcleos individuales se congelaron rápidamente y se almacenaron a -80 °C. El aislamiento de núcleos individuales y el enriquecimiento con CD45+ se llevaron a cabo en muestras recién recogidas. El tejido residual después de los procedimientos de aislamiento de núcleos y células se fijó con formalina o se congeló en OCT para estudios adicionales.
Todos los tejidos se almacenaron y transportaron en hielo en todo momento hasta la congelación o disociación del tejido para minimizar cualquier degradación transcripcional. Estudios anteriores sobre la estabilidad tisular post mortem del consorcio GTEx en tejidos a granel68 y en células individuales69 sugieren que sólo se producen cambios menores en los tejidos dentro de las primeras 24 horas post mortem cuando se almacenan en condiciones de frío.
Aislamiento de núcleos individuales
Los núcleos individuales se obtuvieron a partir de tejidos ultracongelados utilizando la homogeneización mecánica descrita previamente70. Los tejidos se homogeneizaron utilizando un juego de trituradora de tejidos Dounce de vidrio de 7 ml (Merck) con 8-10 golpes de un mortero suelto (A) y 8-10 golpes de un mortero apretado (B) en tampón de homogeneización (250 mM de sacarosa, 25 mM de KCl, 5 mM de MgCl2, 10 mM de Tris-HCl, 1 mM de ditiotreitol (DTT), 1× inhibidor de proteasa, 0.4 U μl-1 de RNasaIn, 0,2 U μl-1 de SUPERasaIn, 0,1% de Tritón X-100 en agua libre de nucleasas). El homogeneizado se filtró a través de un colador celular de 40-μm (Corning). Tras la centrifugación (500g, 5 min, 4 °C) se eliminó el sobrenadante y el pellet se resuspendió en tampón de almacenamiento (1× PBS, 4% de albúmina de suero bovino (BSA), 0,2 U μl-1 Protector RNaseIn). Los núcleos se tiñeron con reactivos NucBlue Live ReadyProbes (ThermoFisher) y los núcleos individuales positivos a Hoechst se purificaron mediante clasificación celular activada por fluorescencia (FACS) utilizando influx, XDP o FACSAria (BD Biosciences) (Fig. suplementaria 1). La purificación y la integridad de los núcleos se verificó bajo un microscopio, y los núcleos se procesaron posteriormente utilizando el Chromium Controller (10X Genomics) de acuerdo con el protocolo del fabricante.
Preparación de células individuales
Los tejidos del corazón (0.2-0,9 g) se transfirieron desde la solución cardiopléjica a tubos C gentleMACS (Miltenyi Biotec) que contenían una solución base de digestión enzimática (100 μg ml-1 de liberasa TH Research grade y 50 μg ml-1 de DNasa I, HBSS 10 mM HEPES y 30 mM de taurina)71. Los tejidos se picaron con tijeras (FST) y se digirieron automáticamente utilizando el Octo Disociador gentleMACS (Miltenyi Biotec) con calentadores. La suspensión unicelular agotada de cardiomiocitos se lavó con una solución base que contenía un 20% de suero bovino fetal (FBS) (Gibco), se filtró a través de un colador de nailon de 70 μm (BD Falcon), se recogió por centrifugación (330 g, 10 min, 4 °C) y se resuspendió en una solución base que contenía un 0,2% de FBS (Gibco). Las células se contaron manualmente tres veces por exclusión de azul Trypan después de cada centrifugación y se resuspendieron a una concentración de al menos 2 × 106 ml-1. Las células individuales se procesaron utilizando Chromium Controller (10X Genomics) de acuerdo con el protocolo del fabricante.
Enriquecimiento de células CD45+
La suspensión de células se preparó como se ha descrito anteriormente y posteriormente se marcó utilizando microperlas conjugadas con anticuerpos monoclonales CD45 antihumanos de acuerdo con el protocolo del fabricante (Miltenyi Biotec). En resumen, se incubaron hasta 107 células durante 15 minutos a 4 °C en 80 μl de tampón PBS, BSA, EDTA (1× PBS pH 7,2, 0,5% BSA, 2 mM EDTA) que contenía 20 μl de microperlas CD45. La suspensión celular se lavó en PBS, BSA, tampón EDTA una vez y se recogió por centrifugación (330g, 10 min, 4 °C). Las células resuspendidas se aplicaron a columnas MACS LS (Miltenyi Biotec). La fracción de células CD45 agotadas se descartó después de tres lavados con PBS, BSA y tampón EDTA y la fracción de células CD45+ se recogió en PBS, BSA y tampón EDTA retirando las columnas del campo magnético. Se contaron las células CD45+ y se resuspendieron en PBS, BSA y tampón EDTA hasta una concentración de al menos 2 × 106 por ml antes de su procesamiento posterior utilizando un controlador de cromo (10X Genomics) de acuerdo con el protocolo del fabricante.
Preparación de la biblioteca de cromo 10X
Las células individuales y los núcleos se contaron manualmente por exclusión de azul de Tripán o automáticamente utilizando un Countess II (Life Technologies) utilizando al menos dos recuentos separados. La suspensión de células o núcleos se ajustó a 400-1.000 células por microlitro y se cargó en el Chromium Controller (10X Genomics) con un objetivo de recuperación de células o núcleos de 4.000-10.000 por reacción. Se prepararon bibliotecas de expresión génica de 3′ según las instrucciones del fabricante de los kits de reactivos Chromium Single Cell v2 o v3 (10X Genomics). El control de calidad del ADNc y de las bibliotecas finales se realizó mediante el Bioanalyzer High Sensitivity DNA Analysis (Agilent) o el 4200 TapeStation System (Agilent). Las bibliotecas se secuenciaron utilizando HiSeq 4000 (Illumina) en el Instituto Wellcome Sanger, y NextSeq 500 (Illumina) en la Escuela de Medicina de Harvard con una profundidad mínima de 20.000-30.000 pares de lecturas por célula o núcleo (Tabla suplementaria 22).
Validación espacial mediante smFISH con sondas RNAscope
Durante la preparación de las muestras fijadas en formol e incluidas en parafina (FFPE) se fijó el tejido fresco en formol neutro al 10% durante 18-36 h y posteriormente se incluyó en bloques de parafina. Las muestras de tejido congeladas se fijaron en paraformaldehído al 4% (ThermoFisher). Se cortaron secciones de 5 μm de grosor con un micrótomo y se colocaron en portaobjetos SuperFrost Plus (VWR). Los portaobjetos de tejido FFPE se tiñeron automáticamente utilizando BOND RX (Leica) y el RNAscope Multiplex Fluorescent Reagent Kit v2 Assay (ACDBio) según el protocolo del fabricante. Los portaobjetos de tejido congelado se procesaron según el protocolo del ensayo fluorescente RNAscope Multiplex v1 (ACDBio). Las sondas diana de RNAscope, ya preparadas o hechas a medida, se ejecutaron en paralelo a los controles positivos y negativos del multiplex (Extended Data Fig. 12b, Tabla Suplementaria 23). Todos los núcleos se tiñeron con DAPI. Todos los portaobjetos de tejido FFPE se fotografiaron utilizando un sistema de cribado confocal Opera Phenix High-Content (Perkin Elmer) con un tamaño de paso z de 1μm y un objetivo de inmersión en agua de 20× (NA 0,16, 0,299 μm por píxel). Canales: DAPI (excitación 375 nm, emisión 435-480 nm), Atto 425 (excitación 425 nm, emisión 463-501 nm), opal 520 (excitación 488 nm, emisión 500-550 nm), opal 570 (excitación 561 nm, emisión 570-630 nm), opal 650 (excitación 640 nm, emisión 650-760 nm). Los portaobjetos de tejido congelado se fotografiaron con un microscopio confocal LSM710 (Zeiss) y un objetivo de inmersión en aceite de 40× (aceite de 1,3, DIC III). Canales: DAPI (excitación 375 nm, emisión 435-480 nm), Alexa Fluor 488 (excitación 492 nm, emisión 517 nm), Atto 550 (excitación 560 nm, emisión 575 nm) y Atto 647 (excitación 649 nm, emisión 662 nm). La visualización y la eliminación del fondo (radio de la bola rodante) se realizaron con Fiji/ImageJ72. Se utilizaron pseudocolores para una mejor visualización.
Tinción de hematoxilina y eosina
Las muestras de tejido se congelaron en isopentano (ThermoFisher) a -80 °C y se incrustaron en OCT (VWR). Se cortaron secciones con un grosor de 10 μm utilizando un micrótomo, se colocaron en portaobjetos SuperFrostPlus (VWR) y se procesaron de acuerdo con un protocolo estándar de tinción con hematoxilina y eosina (Datos ampliados Fig. 12a).
Adquisición de tejido muscular esquelético
Las muestras de músculo intercostal se obtuvieron entre la segunda y la tercera costilla del lado izquierdo. Se trata normalmente de la capa más profunda del músculo (la más alejada de la piel). Las muestras se recogieron directamente en la solución de conservación en frío.
Aislamiento de los núcleos del músculo esquelético
El tejido muscular se lavó en 1× PBS, se limpió de cualquier depósito de grasa visible y se picó para obtener fragmentos de aproximadamente 1 mm3. Por muestra, se homogeneizaron aproximadamente 0,3 g de tejidos picados en 3 ml de tampón A (250 mM de sacarosa, 10 mg ml-1 de BSA, 5 mM de MgCl2, 0,12 U μl-1 de RNasaIn, 0,06 U μl-1 de SUPERasIn, 1× de inhibidor de proteasas) utilizando el juego de trituradora de tejidos Dounce (Merck) con 50 golpes del mortero suelto (A). El homogeneizado se filtró a través de un colador celular de 100-μm (Corning) y el colador se lavó con 1 ml y luego con 750 μl de tampón A. Tras la adición de Tritón X-100 (concentración final del 0,5%), la mezcla se volvió a homogeneizar con 50 golpes del mortero apretado (B). Tras filtrar a través de un colador de 40-μm, los núcleos se centrifugaron (3.000g, 5 min, 4 °C), se resuspendieron en 1 ml de tampón B (320 mM de sacarosa, 10 mg ml-1 de BSA, 3 mM de CaCl2, 2 mM de acetato de magnesio, 0.1 mM EDTA, 10 mM Tris-HCl, 1 mM DTT, 1× inhibidor de proteasas, 0,12 U μl-1 RNaseIn, 0,06 U μl-1 SUPERasina) y se purificó utilizando una solución de gradiente Percoll al 27%. La mezcla de Percoll se centrifugó a 20.000g (15 min, 4 °C) y el pellet se resuspendió en 200 μl de tampón B, seguido de centrifugación (20.000g, 3 min, 4 °C). Tras la tinción con azul tripán, se contaron los núcleos intactos con un hemocitómetro. Los núcleos se perfilaron utilizando un controlador de cromo (10X Genomics) de acuerdo con el protocolo del fabricante.
Aislamiento de células individuales para el músculo esquelético
El tejido muscular se lavó en 1× PBS, se limpió de cualquier depósito de grasa visible y se picó finamente. A continuación, se transfirieron 2 g del tejido picado al tampón de digestión 1 (750 U ml-1 de colagenasa tipo 2 en 1× PBS) y se incubaron a 37 °C en un baño de agua durante 90 min. El tejido parcialmente digerido se recogió por centrifugación (650 g, 5 min, 4 °C) y el pellet se resuspendió en el tampón de digestión 2 (100 U ml-1 de colagenasa tipo 2, 2 U ml-1 de dispasa en PBS). Tras 30 minutos de incubación a 37 °C en un baño de agua, se detuvo la digestión mediante la adición de FBS al 2%. Las células se filtraron a través de un colador de nylon de 100-μm y 40-μm (BD Falcon), se recogieron por centrifugación (650g, 4 °C, 3 min) y se lavaron con 1× PBS, 2% FBS. Posteriormente, se utilizó un gradiente de Percoll al 20% (15.000g, 4 °C, 20 min) para la purificación de las células. Se recogió la capa que contenía las células, se lavó con PBS que contenía un 2% de FBS y se contaron las células viables por exclusión de Trypan Blue utilizando un hemocitómetro. Los núcleos se perfilaron utilizando un controlador de cromo (10X Genomics) de acuerdo con el protocolo del fabricante.
La tabla de recursos clave de los métodos se encuentra en la Tabla Suplementaria 24.
Mapeo del transcriptoma
Después de la secuenciación, las muestras se desmultiplexaron y se almacenaron como archivos CRAM. Cada muestra se mapeó con el genoma humano de referencia (GRCh38 v.3.0.0) proporcionado por 10X Genomics, y utilizando la suite CellRanger (v.3.0.1) con parámetros por defecto. Las muestras unicelulares fueron mapeadas contra la referencia tal y como fue proporcionada. Las muestras de núcleos únicos, la referencia para el pre-mRNA, se creó utilizando las instrucciones de 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references).
Procesamiento de datos de recuento
Después del mapeo, las muestras de cada fuente de datos (núcleos únicos, células únicas y células CD45+) se agruparon en objetos AnnData individuales concatenando la matriz raw_feature_bc_h5.h5 y añadiendo la información de metadatos apropiada. Para cada objeto fuente de datos, se calculó la media de identificadores moleculares únicos (UMI) (n_counts) y se utilizó como umbral para las gotas vacías.
Detección de dobletes
Después de eliminar las gotas vacías, aplicamos scrublet73 para asignar una puntuación de dobletes (scrublet_score) a cada célula. Estas células se agruparon y visualizaron utilizando el método UMAP74. Además, cada célula se procesó para la detección de dobletes utilizando un método de percolación para permitir una mejor detección de dobletes75.
Control de calidad y filtrado de células
Cada fuente de datos se procesó y anotó por separado para tener en cuenta las diferencias de calidad específicas de la fuente. Estas métricas se incluyen como covariables para el procesamiento posterior. Las células totales y las células CD45+ se filtraron para los recuentos (500 < n_counts <15.000), los genes (200 < n_genes), los genes mitocondriales (percent_mito <20%), los genes ribosomales (percent_ribo <20%) y la puntuación scrublet (scrublet_score <0,3). Los núcleos individuales se filtraron para los recuentos (500 < n_counts <15.000), los genes (300 < n_genes <6.000), los genes mitocondriales (percent_mito <5%), los genes ribosomales (percent_ribo <5%) y la puntuación scrublet (scrublet_score <0,3). Los mismos umbrales de filtrado se aplicaron al conjunto de datos del músculo esquelético.
Scanpy toolkit 1.576 en Python v.3.7 se utilizó para realizar los análisis posteriores, incluyendo la normalización (normalize_per_cell: counts_per_cell_after = 10.000), la transformación logarítmica (log1p), la detección de genes variables (highly_variable_genes), la regresión de las fuentes de variación no deseadas (regress_out: n_counts y percent_mito), el escalado de las características de los datos (scale: max_value = 10) y el PCA (pca: using highly variable genes) como se ha descrito previamente77.
Alineación por lotes usando autoencoder variacional profundo
Construimos un múltiple global alineando todas las fuentes de datos y donantes en nuestros datos. Esto se hizo en un procedimiento de tres pasos: (1) Cada fuente fue analizada y anotada por separado, alineando sólo para los donantes usando un paso de regresión lineal en el espacio de los pericitos antes de la alineación por lotes con bbknn78. Los genes expresados diferencialmente (DEG) se calcularon utilizando una prueba de suma de rangos de Wilcoxon con el ajuste de Bonferroni-Hochberg como se implementó en el marco de Scanpy. (2) Para anotar cada clúster, utilizamos un enfoque integrador mediante la búsqueda de los DEG más significativos (P < 1 × 10-5) con un logFC >1 en las bases de datos ToppFun79 y EnrichR80. Se priorizaron las coincidencias significativas en las vías, la regulación transcripcional y los procesos biológicos para anotar un determinado clúster. Cada compartimento celular se etiquetó en la ranura adata.obs después de agrupar los estados celulares específicos de la fuente. (3) Todas las fuentes se combinaron en un único objeto AnnData bajo la etiqueta adata.obs. Los lotes se alinearon utilizando la función batch_correction del autoencoder variacional scGen81. Primero alineamos para adata.obs, utilizando adata.obs como ancla. A continuación, alineamos para adata.obs, utilizando adata.obs como ancla. Cada ronda de alineación por lotes se ejecutó durante 50 épocas.
Los mosaicos para las poblaciones de adipocitos, vascular y cardiaca inmune, así como el análisis del músculo esquelético, se crearon utilizando este método y la precisión de la agrupación se evaluó con SCCAF82 (Extended Data Fig. 12d).
DEGs
Para ayudar a la anotación de las subpoblaciones de cada compartimento celular, calculamos los DEGs utilizando la prueba de suma de rangos de Wilcoxon, tal y como se implementa en el flujo de trabajo de scanpy y se recomienda en recientes estudios de evaluación comparativa83. Se consideró que un gen estaba diferencialmente expresado si tenía un cambio de pliegue transformado en log2 > 1 y una P < 1 × 10-5, a menos que se indicara lo contrario en la sección de análisis.
Interacciones célula-célula
Las matrices de expresión de las poblaciones en estudio se exportaron desde el AnnData, junto con una tabla de metadatos que contenía los códigos de barras de las células como índices. A continuación, ejecutamos CellPhoneDB de la siguiente manera: cellphonedb method statistical_analysis meta.tsv counts.tsv-counts-data = gene_name-threads = 60. Las predicciones en bruto de CellPhoneDB se filtraron eliminando aquellas interacciones con un P > 1,0 × 10-5. Los pares significativos se sometieron entonces a un análisis de enriquecimiento del conjunto de genes en ReactomeDB, enrichR y ToppFun para su clasificación funcional. Las células vasculares se submuestrearon aleatoriamente hasta 39.000 células antes del análisis, y el grupo de reparación cardíaca (cardiomiocitos auriculares y ventriculares, FBs y células inmunes) se submuestreó aleatoriamente hasta 69.295 células antes del análisis.
Visualización de la expresión génica en los datos de Visium de 10X Genomics
Procesamos los datos de Visium del miocardio izquierdo disponibles públicamente de 10X Genomics (https://support.10xgenomics.com/spatial-gene-expression/datasets/1.0.0/V1_Human_Heart) utilizando el flujo de trabajo Scanpy v.1.5 adaptado para el análisis de los datos de 10X Genomics Visium (https://scanpy-tutorials.readthedocs.io/en/latest/spatial/basic-analysis.html). En resumen, se eliminaron los spots con menos de 500 UMIs o más de 20.000 UMIs, y menos de 200 genes. Los datos se transformaron logarítmicamente y se normalizaron antes de trazarlos.
Estimación de la velocidad del ARN
Para calcular la velocidad del ARN de las células individuales y de las células individuales enriquecidas con CD45+, utilizamos el archivo BAM de salida de CellRanger y el archivo GENCODE v33 GTF (ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_33/gencode.v33.chr_patch_hapl_scaff.annotation.gtf.gz) junto con el CLI velocyto84 v.0.17.17 para generar un archivo loom que contiene la cuantificación del ARN empalmado y no empalmado. A continuación, construimos un manifold, agrupamos las células y visualizamos las velocidades del ARN utilizando scVelo85.
Análisis de subpoblación de cardiomiocitos auriculares y ventriculares, fibroblastos y células neuronales
Todos los códigos de barras etiquetados en el objeto global como cardiomiocitos, fibroblastos y células neuronales fueron seleccionados para posteriores análisis de subpoblación. Se aplicaron criterios de filtrado adicionales específicos de la población celular a los núcleos de la siguiente manera: recuentos de cardiomiocitos (n_counts <12.500), genes (n_genes <4.000), genes mitocondriales (percent_mito <1%), genes ribosomales (percent_ribo <1%) y scrublet score (scrublet_score <0.25); genes mitocondriales FB (percent_mito <1%), genes ribosómicos (percent_ribo <1%); genes de células neuronales (n_genes <4000), genes mitocondriales (percent_mito <1%), genes ribosómicos (percent_ribo <1%). Las células totales y CD45+ se excluyeron en los conjuntos de datos de cardiomiocitos auriculares y ventriculares y no contribuyeron al análisis de subpoblación. No se aplicó ningún otro filtro de FBs o células neuronales totales y CD45+. Los cardiomiocitos y los FBs se dividieron además en dos agrupaciones basadas en la región de origen: (1) aurícula izquierda y derecha, y (2) ventrículos izquierdo y derecho, ápice y tabique interventricular.
Los efectos de los donantes se alinearon como se describe en el paso (1) anterior. Para las células FB y neuronales, las fuentes se alinearon como se describe en el paso (3) anterior. Se realizó la agrupación de Leiden y la visualización UMAP para identificar subpoblaciones y la visualización86. Los genes expresados diferencialmente se calcularon mediante la prueba de suma de rangos de Wilcoxon. Los genes se clasificaron por puntuación.
Comparación entre tejidos de las poblaciones inmunitarias cardíacas con las poblaciones inmunitarias del músculo esquelético, el riñón y la sangre
Recogimos datos del transcriptoma de una sola célula para riñones adultos de la ref. 99 (https://www.kidneycellatlas.org/), y subconjuntamos todas las células inmunes reportadas en su estudio. Para el SKM seleccionamos las células inmunes anotadas del manifold fusionado. Para la sangre humana, utilizamos el conjunto de datos de 10.000 células PBMC individuales disponible públicamente proporcionado por 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/datasets/3.0.0/pbmc_10k_v3). Como se describió anteriormente87 , entrenamos un modelo de regresión logística en las células inmunitarias cardíacas utilizando el 80% de los datos de expresión y probamos su precisión en el 20% restante para producir un modelo con una precisión de 0,6862 (Datos extendidos Fig. 8f, Tabla suplementaria 16). A continuación, aplicamos este modelo para predecir poblaciones inmunes cardíacas análogas en el riñón adulto, SKM y PBMCs. Las predicciones con una probabilidad inferior a 0,8 se excluyeron de los análisis comparativos posteriores.
Análisis de enriquecimiento de la ontología de genes
Para la población de cardiomiocitos ventriculares, utilizamos el paquete R gProfileR (https://cran.r-project.org/web/packages/gProfileR/index.html) con la lista de genes con puntuación de vCM4 como entrada y el conjunto de genes expresados en los cardiomiocitos ventriculares como fondo (aquellos genes que tienen un recuento de UMI >1). Para realizar el análisis de la ontología de genes en las células vasculares, se buscaron los 500 DEG más significativos (P < 1 × 10-5) con un cambio de pliegue transformado en logaritmo > 1 en la base de datos de procesos biológicos de la ontología de genes utilizando ToppFun79 (tabla suplementaria 25). Los cinco principales términos significativamente enriquecidos (q < 0,05) para cada subpoblación fueron seleccionados y trazados en un mapa de calor. Para llevar a cabo el análisis de la vía en los adipocitos, la parte superior 500 DEGs significativa (P < 1 × 10-5) con un logaritmo de cambio de pliegues > 0,5 fueron buscados en contra de ToppFun79 bases de datos de la vía (Tabla Suplementaria 26). Los cinco principales vías significativamente enriquecidas (q < 0,05) para cada subpoblación fueron seleccionados y trazados en un mapa de calor.
Puntuación del conjunto de genes
Utilizamos la función score_genes implementada en scanpy para calcular el enriquecimiento de los genes implicados en la vía de la Oncostatina M. Se recopiló una lista de genes a partir de la investigación bibliográfica88,89. Para el enriquecimiento del conjunto de genes, sólo se consideraron los genes altamente expresados para reducir el ruido (más de 500 UMIs en todas las células). Se realizó el mismo análisis para comparar las células inmunitarias cardíacas de nuestro estudio con las observaciones de estudios anteriores sobre macrófagos residentes en el corazón51, macrófagos remodeladores de tejidos de ratón45 y linaje de origen del saco vitelino90.
Estadística y reproducibilidad
Todos los análisis se realizaron utilizando el software R, v.3.6.1. Se utilizaron pruebas t de Student para comparar las distribuciones de los tipos de células en cada sitio. P < 0,05 se consideró estadísticamente significativo. Los modelos de regresión lineal (correlaciones) se obtuvieron utilizando la función de modelo lineal de R (lm), que estima la probabilidad estadística (valor P) de una relación lineal. Se aplicó la corrección de Bonferroni para las pruebas múltiples.
Las micrografías de RNAscope representadas en las figuras son representativas. Las micrografías de las Figs. 2g, 3c, h y Extended Data Fig. 3c (HAMP), Extended Data Fig. 3e (CNN1), Extended Data Figs. 4g, m, 6f se repitieron con resultados similares en dos secciones de tejido individuales. Las micrografías de las Figs. 2h, 3f y Extended Data Fig. 3c (CNN1), Extended Data Fig. 3e (PCDH7), Extended Data Figs. 6e, h, 9d se repitieron con resultados similares en tres secciones individuales de tejido. Las micrografías de las Figs. 1e, 2d, 3e y Extended Data Figs. 1f, 3c (FHL1) y Extended Data Fig. 6d se repitieron con resultados similares en cuatro secciones individuales de tejido. Las micrografías de la Fig. 2c y Extended Data Fig. 3c (PRELID2), Extended Data Figs. 10e, 12a se repitieron con resultados similares en seis o más secciones individuales de tejido. Los controles positivos y negativos se realizaron una vez por cada muestra utilizada.
Análisis de enriquecimiento de GWAS
Descargamos las estadísticas de resumen de GWAS de cvdi amplio, el catálogo de GWAS de EBI y el atlas de GWAS. Seleccionamos rasgos con GWAS bien potenciados (n > 5.000 y número de loci significativos >10). Los conjuntos de datos GWAS se resumen en la Tabla Suplementaria 27. Los datos de expresión génica de los genes codificadores de proteínas se asignaron a los identificadores de genes Entrez y estas anotaciones de genes se utilizaron en el ensamblaje del genoma humano hg19/37. Sólo utilizamos los datos de expresión génica de los núcleos. Implementamos el análisis descrito previamente64 en python y en R. Los recuentos transformados en logaritmos (más un pseudoconteo) se utilizaron para calcular los perfiles de expresión promedio específicos del tipo de célula. Realizamos análisis magmáticos individuales para cada tipo de célula, condicionando siempre las covariables a nivel de gen por defecto (por ejemplo, la longitud del gen) y la expresión media de los genes en todas las células. Posteriormente, aplicamos el método Benjamini-Hochberg y seleccionamos las asociaciones de rasgos del tipo celular con FDR < 10%. Estos pares se sometieron a un análisis condicional como se ha descrito previamente64 para definir pares de asociaciones «independientes», «explicadas conjuntamente» y «parcialmente explicadas conjuntamente» (Tabla Suplementaria 28).
Distribuciones de células dispersas y núcleos aislados
Los diferentes procedimientos para obtener núcleos aislados y células dispersas dieron lugar a distribuciones de tipos celulares significativamente diferentes (Tabla Suplementaria 29, Extended Data Fig. 2). En particular, el 30,1% y el 49,2% de los núcleos aislados procedían de cardiomiocitos auriculares y ventriculares en las regiones auriculares y ventriculares, mientras que estas células se excluyeron mayoritariamente de las preparaciones de células aisladas y seleccionadas por CD45 (Tabla suplementaria 2).
Excluyendo los cardiomiocitos, la distribución de los tipos celulares identificados a partir de los núcleos aislados y las células dispersas siguió siendo distinta (Tabla suplementaria 30). Aunque el 59,0% de las células dispersas eran CE, sólo el 15,7% de los núcleos procedían de CE. Por el contrario, el 64,2% de los núcleos procedían de CE (31,2%) y pericitos (33,0%), mientras que sólo el 17,1% de las células dispersas eran CE (2,3%) y pericitos (14,8%). Estas diferencias pueden reflejar la sensibilidad de los núcleos de las CE a los procedimientos de aislamiento o la resistencia de los pericitos y FBs a la digestión enzimática celular.
A pesar de las diferencias en las distribuciones celulares entre los núcleos aislados y las células dispersas, los perfiles de expresión génica de los linajes celulares estaban razonablemente correlacionados (r > 0,4 para cada tipo celular). Para abordar la concordancia de los genes captados por las células y los núcleos, comparamos la expresión de los principales marcadores de tipo celular de la Fig. 1c entre las tres fuentes (Extended Data Fig. 1c). Como los núcleos carecen de ARN citoplasmático, la expresión de ciertos genes, especialmente los genes inmunitarios NKG7 y C1QA, fue menor en los núcleos que en las células. No obstante, la tendencia general con respecto a los genes marcadores fue consistente en las tres fuentes, y los mismos genes distinguieron los tipos de células individuales independientemente de la fuente.
Análisis adicional de las células vasculares
El PC3_str contenía una contribución similar de células y núcleos, y tenía una puntuación scrublet por debajo del estricto umbral utilizado; no obstante, el número medio de genes y recuentos en este cluster era superior a la media. Por lo tanto, a pesar de nuestro estricto filtro de calidad, no podemos excluir la posibilidad de que haya dobletes en este cluster. EC10_CMC-like y PC4_CMC-like coexpresan genes de CE o pericitos con marcadores de cardiomiocitos y se requieren más estudios para entender si representan estados celulares previamente desconocidos o dobletes.
Las observaciones de las SMC arteriales y venosas están respaldadas por estudios anteriores, que predicen que las SMC arteriales son más contráctiles y las venosas están menos diferenciadas91.
EC3_cap enriquece los transcritos que codifican componentes de AP1 (JUN y FOS), que median en múltiples decisiones de destino de las CE, incluyendo la respuesta a VEGF, señales inflamatorias y de estrés, y ATF3, un gen de respuesta adaptativa inducido por diversas señales92,93,94.
Caracterización del músculo esquelético
Recogimos muestras de músculo esquelético intercostal de cinco individuos sanos, incluyendo un donante con tejido cardíaco compatible, y perfilamos el transcriptoma de 35.665 células individuales y 39.597 núcleos individuales. Al igual que en el corazón, la combinación de células y núcleos nos permitió capturar y resolver los principales linajes celulares, incluidos los cardiomiocitos, los fibroblastos, las células endoteliales, las células musculares lisas, los pericitos, las células inmunitarias mieloides y linfoides y las células satélite (Datos ampliados Fig. 11a, b, Tabla suplementaria 31).
El análisis posterior de las células vasculares del músculo esquelético identificó diez poblaciones distintas. Las células endoteliales mostraron cinco grupos separados en base a sus respectivos lechos vasculares con firmas similares a las que observamos en el corazón. Las EC_cap expresan VWF y RGCC. Las EC_venosas expresan ACKR1 y PLVAP, mientras que las EC_art arteriales muestran SEMA3G y HEY1, en consonancia con nuestros datos del corazón (Extended Data Fig. 11c, d, Tabla Suplementaria 32).
Las distribuciones generales de las poblaciones de células vasculares y estromales en el músculo esquelético y cardíaco fueron similares, incluyendo las características arteriales y venosas de las EC; sin embargo; el músculo esquelético contenía un único cluster de SMC, potencialmente relacionado con el menor tamaño del conjunto de datos. En el músculo esquelético, las interacciones célula-célula predichas de las EC_art y SMC incluían NOTCH1/4-JAG1 así como JAG1/JAG2/DLL4-NOTCH3, pero no JAG1/JAG2/DLL4-NOTCH2, inferidas en el corazón (Datos extendidos Fig. 11e, f, Tabla suplementaria 33).
Células inmunitarias cardíacas
Usando el modelo de regresión logística, no identificamos ninguna contrapartida de los monocitos cardíacos IL17RA+ en SKM o riñón, posiblemente debido al pequeño tamaño de esta población.
Las células T ingenuas (CD4+T_naive) identificadas expresaban CCR7 y SELL, lo que indica su naturaleza ingenua y residente en el tejido95. Las células T con memoria (CD8+T_tem) expresaron BACH2, STAT4 e IL7R, asociadas a la memoria inmunitaria a largo plazo96,97. Además, caracterizamos las células linfoides utilizando scNym98, y lo entrenamos utilizando datos publicados99,100. El modelo resultante se aplicó a nuestras células inmunitarias cardíacas y se presumió que aquellas células con una puntuación predicha superior a 0,8 eran probables candidatas a ser reanotadas. Utilizando este enfoque, identificamos candidatos para células B plasmáticas (109), células dendríticas (645), células linfoides innatas (89), células T MAIT (219), células T helper (80), células T reguladoras (11), células T de memoria central (103), células T γδ (30) y células dendríticas plasmocitoides (27). Estas anotaciones pueden encontrarse en las anotaciones del objeto inmunológico cardíaco bajo la etiqueta ‘scNym’ en www.heartcellatlas.org.
Resumen del informe
Más información sobre el diseño de la investigación está disponible en el resumen del informe de Nature Research vinculado a este artículo.