- Relato de dados
- Éticas de pesquisa para tecidos de doadores
- Aquisição e processamento de tecidos
- Solamento de núcleos únicos
- Preparação de células únicas
- Enriquecimento de células CD45+
- Preparação da biblioteca de cromo 10X
- Validação espacial usando smFISH com sondas RNAscope
- Haematoxilina e coloração de eosina
- Aquisição de tecido muscular esquelético
- Isolamento do músculo esquelético do núcleo
- Isolamento de células únicas para músculo esquelético
- Mapeamento de transcritores
- Count data processing
- Detecção de gotas duplas
- Controle de qualidade e filtragem de células
- Alinhamento de lotes usando autoencoder de variação profunda
- DEGs
- Interações célula-célula
- Visualização da expressão gênica em 10X Genomics Visium dados
- Estimation of RNA velocity
- Análises de subpopulação de cardiomiócitos atriais e ventriculares, FBs e células neuronais
- Comparação entre os tecidos das populações imunológicas cardíacas com as populações imunológicas esqueléticas, renais e sanguíneas
- Análise de enriquecimento em ontologia de genes
- Escore do conjunto de genes
- Estatistica e reprodutibilidade
- Análise de enriquecimento de GWAS
- Distribuições de células dispersas e núcleos isolados
- Outras análises de células vasculares
- Caracterização do músculo esquelético
- Células imunes cardíacas
- Reporting summary
Relato de dados
Não foram usados métodos estatísticos para predeterminar o tamanho da amostra. Os experimentos não foram randomizados, e os investigadores não foram cegos para alocação durante os experimentos e avaliação dos resultados.
Éticas de pesquisa para tecidos de doadores
Tecidos de coração (doadores D1-D7 e D11) foram processados no Wellcome Sanger Institute (Hinxton, UK) e obtidos de doadores de órgãos de transplante falecidos após aprovação pelo Comitê de Ética em Pesquisa (ref 15/EE/0152, East of England Cambridge South Research Ethics Committee) e consentimento informado das famílias doadoras. Os tecidos cardíacos (doadores H2-H7) foram processados na Harvard Medical School (Boston, Massachusetts, EUA) e obtidos de doadores de órgãos falecidos após aprovação do Human Research Ethics Board Pro00011739 (University of Alberta, Edmonton, Canadá). O consentimento informado das famílias doadoras foi adquirido através do Programa Institucional de Procura e Intercâmbio de Órgãos Humanos (HOPE). O histórico cardiovascular não foi notável para todos os doadores (Tabela Complementar 1).
Aquisição e processamento de tecidos
Os tecidos foram adquiridos de doadores britânicos e norte-americanos (D1-7 e 11, H2-7) após morte circulatória (DCD) (D2, D4-D7 e D11) e após morte cerebral (DBD) (D1, D3, H2-H7). Para doadores de DCD do Reino Unido, após um stand-off de cinco minutos e para DDD, o tórax é aberto, a aorta é pinçada transversalmente e as amostras cardíacas são adquiridas. Para doadores norte-americanos de DBD, a aorta é grampeada, a cardioplegia fria (Celsior) é administrada sob pressão através da aorta para parada de batimentos, o coração é excisado, enxaguado em soro fisiológico frio e as amostras adquiridas. Todas as amostras doadoras foram biópsias miocárdicas de plena espessura do átrio esquerdo e direito, ventrículos esquerdo e direito, septo interventricular e ápice, com exclusão intencional de grandes depósitos de gordura epicárdica. As amostras utilizadas para isolamento de um único núcleo foram congeladas com flash e armazenadas a -80 °C. O isolamento de célula única e o enriquecimento do CD45+ foi realizado em amostras recém-colhidas. O tecido residual após os procedimentos de isolamento de núcleos e células foi fixado com formol ou congelado na TOC para estudos adicionais.
Todos os tecidos foram armazenados e transportados em gelo a todo o momento até o congelamento ou dissociação do tecido para minimizar qualquer degradação transcripcional. Estudos anteriores sobre a estabilidade tecidual post mortem do consórcio GTEx em tecidos a granel68 e em células únicas69 sugerem apenas pequenas alterações nos tecidos nas primeiras 24 horas post mortem quando armazenados em condições frias.
Solamento de núcleos únicos
Núcleos únicos foram obtidos a partir de tecidos congelados com flash usando homogeneização mecânica como descrito anteriormente70. Os tecidos foram homogeneizados utilizando um conjunto de 7 ml de vidro Dounce tissue grinder (Merck) com 8-10 golpes de um pilão solto (A) e 8-10 golpes de um pilão apertado (B) em tampão de homogeneização (250 mM sacarose, 25 mM KCl, 5 mM MgCl2, 10 mM Tris-HCl, 1 mM dithiothreitol (DTT), 1× inibidor de protease, 0.4 U μl-1 RNaseIn, 0.2 U μl-1 SUPERaseIn, 0.1% Triton X-100 em água livre de nucleases). O homogeneizado foi filtrado através de um filtro de células de 40-μm (Corning). Após a centrifugação (500g, 5 min, 4 °C) o sobrenadante foi removido e o pellet foi ressuspenso em tampão de armazenamento (1× PBS, 4% albumina de soro bovino (BSA), 0,2 U μl-1 Protector RNaseIn). Os núcleos foram corados com NucBlue Live Reagents (ThermoFisher) e Hoechst-positive single nuclei foram purificados por meio de classificação de células ativadas fluorescentes (FACS) usando influxo, XDP ou FACSAria (BD Biosciences) (Suplemento Fig. 1). A purificação e integridade dos núcleos foi verificada sob um microscópio, e os núcleos foram processados posteriormente usando o Controlador de Cromo (10X Genomics) de acordo com o protocolo do fabricante.
Preparação de células únicas
Tecidos de cornos (0.2-0,9 g) foram transferidos da solução cardioplégica para os tubos C de MACS (Miltenyi Biotec) contendo solução base de digestão enzimática (100 μg ml-1 liberase TH Research grade e 50 μg ml-1 DNase I, HBSS 10 mM HEPES e 30 mM taurina)71. Os tecidos foram picados com uma tesoura (FST) e digeridos automaticamente com o suave MACS Octo Dissociator (Miltenyi Biotec) com aquecedores. As suspensões monocelulares de cardiomiócitos foram lavadas com solução base contendo 20% de soro fetal bovino (FBS) (Gibco), filtradas através do filtro de nylon 70-μm (BD Falcon), coletadas por centrifugação (330g, 10 min, 4 °C) e ressuspendidas em solução base contendo 0,2% de FBS (Gibco). As células foram contadas manualmente três vezes por exclusão do Trypan Blue após cada centrifugação e ressuspendidas a uma concentração de pelo menos 2 × 106 ml-1. As células individuais foram processadas usando o Controlador de Cromo (10X Genomics) de acordo com o protocolo do fabricante.
Enriquecimento de células CD45+
Suspensão de células foi preparada como descrito acima e posteriormente etiquetada usando micro esferas monoclonais conjugadas com anticorpos CD45 anti-humanos de acordo com o protocolo do fabricante (Miltenyi Biotec). Em resumo, até 107 células foram incubadas durante 15 min a 4 °C em 80 μl de PBS, BSA, tampão EDTA (1× PBS pH 7,2, 0,5% BSA, 2 mM EDTA) contendo 20 microbolas CD45 μl. A suspensão celular foi lavada em PBS, BSA, tampão EDTA uma vez e coletada por centrifugação (330g, 10 min, 4 °C). As células ressuspensas foram aplicadas nas colunas MACS LS (Miltenyi Biotec). A fração de célula CD45 foi descartada após três lavagens com tampão PBS, BSA e EDTA e a fração de célula CD45+ foi coletada em tampão PBS, BSA e EDTA através da remoção das colunas do campo magnético. As células CD45+ foram contadas e ressuspendidas em tampão PBS, BSA e EDTA a uma concentração de pelo menos 2 × 106 por ml antes de serem processadas usando um controlador de cromo (10X Genomics) de acordo com o protocolo do fabricante.
Preparação da biblioteca de cromo 10X
Células individuais e núcleos foram contadas manualmente por exclusão azul de Trypan ou automaticamente usando uma Condessa II (Life Technologies) usando pelo menos duas contagens separadas. A suspensão de células ou núcleos foi ajustada para 400-1.000 células por microlitro e carregada no Controlador de Cromo (10X Genomics) com uma recuperação alvo de células ou núcleos de 4.000-10.000 por reacção. 3′ bibliotecas de expressão gênica foram preparadas de acordo com as instruções do fabricante dos Kits de Reagente de Crómio de Célula Única v2 ou v3 (10X Genomics). O controle de qualidade do cDNA e das bibliotecas finais foi feito usando Análise de DNA de Alta Sensibilidade do Bioanalisador (Agilent) ou Sistema 4200 TapeStation (Agilent). As bibliotecas foram sequenciadas usando HiSeq 4000 (Illumina) no Wellcome Sanger Institute, e NextSeq 500 (Illumina) na Harvard Medical School com uma profundidade mínima de 20.000-30.000 pares de leitura por célula ou núcleo (Tabela Complementar 22).
Validação espacial usando smFISH com sondas RNAscope
Durante a preparação das amostras de formalina fixadas em parafina (FFPE), o tecido fresco foi fixado em formalina com tampão neutro a 10% durante 18-36 h e subsequentemente embutido em blocos de parafina. As amostras de tecido congelado fixo foram fixadas em paraformaldeído a 4% (ThermoFisher). As seções foram cortadas em 5-μm de espessura usando um microtomo e colocadas em lâminas de SuperFrost Plus (VWR). As lâminas de tecido FFPE foram automaticamente coradas usando BOND RX (Leica) e o Kit de Reagente Fluorescente Multiplex RNAscope v2 (ACDBio) de acordo com o protocolo do fabricante. As lâminas teciduais congeladas foram processadas de acordo com o protocolo do ensaio Multiplex Fluorescent Assay v1 (ACDBio) do RNAscope. As sondas alvo RNAscope prontas ou feitas sob medida foram executadas em paralelo aos controles multiplex positivos e negativos (Dados Estendidos Fig. 12b, Tabela Complementar 23). Todos os núcleos foram manchados com DAPI. Todas as lâminas de tecido FFPE foram imersas usando um sistema de triagem confocal de alto conteúdo Opera Phenix (Perkin Elmer) com um tamanho 1-μm z-step e 20× objetiva de imersão em água (NA 0,16, 0,299 μm por pixel). Canais: DAPI (excitação 375 nm, emissão 435-480 nm), Atto 425 (excitação 425 nm, emissão 463-501 nm), opal 520 (excitação 488 nm, emissão 500-550 nm), opal 570 (excitação 561 nm, emissão 570-630 nm), opal 650 (excitação 640 nm, emissão 650-760 nm). As lâminas de tecido congelado fixo foram imitadas utilizando um microscópio confocal LSM710 (Zeiss) e uma objectiva de imersão de 40× em óleo (1,3 óleo, DIC III). Canais: DAPI (excitação 375 nm, emissão 435-480 nm), Alexa Fluor 488 (excitação 492 nm, emissão 517 nm), Atto 550 (excitação 560 nm, emissão 575 nm) e Atto 647 (excitação 649 nm, emissão 662 nm). A visualização e remoção do fundo (raio da esfera rolante) foram feitas usando Fiji/ImageJ72. Pseudocores foram utilizados para melhor visualização.
Haematoxilina e coloração de eosina
Amostras de tecido foram congeladas frescas em isopentano (ThermoFisher) a -80 °C e embutidas em OCT (VWR). As seções foram cortadas a uma espessura de 10 μm usando um micrótomo, colocadas em lâminas SuperFrostPlus (VWR) e posteriormente processadas de acordo com um protocolo de coloração padrão de hematoxilina e eosina (Extended Data Fig. 12a).
Aquisição de tecido muscular esquelético
Amostras de músculo íncostal foram obtidas entre a segunda e terceira costela do lado esquerdo. Esta é tipicamente da camada mais profunda do músculo (mais afastada da pele). As amostras foram coletadas diretamente na solução de preservação a frio.
Isolamento do músculo esquelético do núcleo
Tecido muscular foi lavado em 1× PBS, limpo de qualquer deposição de gordura visível e picado para obter fragmentos de aproximadamente 1mm3. Por amostra, aproximadamente 0,3 g de tecido picado foi homogeneizado em 3 ml de tampão A (250 mM sacarose, 10 mg ml-1 BSA, 5 mM MgCl2, 0,12 U μl-1 RNaseIn, 0,06 U μl-1 SUPERasIn, 1× inibidor de protease) utilizando o conjunto triturador de tecido de ressalto (Merck) com 50 golpes do pilão solto (A). O homogeneizado foi filtrado através de um filtro de 100-μm células (Corning) e o filtro foi lavado com 1 ml e depois com 750 μl de tampão A. Após a adição de Triton X-100 (concentração final 0,5%), a mistura foi homogeneizada ainda mais com 50 golpes do pilão apertado (B). Após filtração através de um filtro de 40-μm, os núcleos foram centrifugados (3.000g, 5 min, 4 °C), ressuspendidos em 1 ml de tampão B (320 mM sacarose, 10 mg ml-1 BSA, 3 mM CaCl2, 2 mM acetato de magnésio, 0.1 mM EDTA, 10 mM Tris-HCl, 1 mM DTT, 1× inibidor de protease, 0.12 U μl-1 RNaseIn, 0.06 U μl-1 SUPERasin) e purificado com uma solução de 27% de gradiente percentual. A mistura Percoll foi centrifugada a 20.000g (15 min, 4 °C) e o sedimento foi ressuspenso em 200 μl de tampão B, seguido de centrifugação (20.000g, 3 min, 4 °C). Após a coloração Trypan Blue, os núcleos intactos foram contados usando um hemocitômetro. Os núcleos foram perfilados usando um Controlador de Cromo (10X Genomics) de acordo com o protocolo do fabricante.
Isolamento de células únicas para músculo esquelético
Tipo muscular foi lavado em 1× PBS, limpo de qualquer deposição de gordura visível e finamente picado. Em seguida, 2 g de tecido picado foi transferido para o tampão de digestão 1 (750 U ml-1 de colagenase tipo 2 em 1× PBS) e incubado a 37 °C em banho-maria durante 90 min. O tecido parcialmente digerido foi coletado por centrifugação (650 g, 5 min, 4 °C) e o sedimento foi ressuspenso em tampão de digestão 2 (100 U ml-1 de colagenase tipo 2, 2 U ml-1 de dispersão em PBS). Após 30 min de incubação a 37 °C em banho-maria, a digestão foi interrompida com a adição de 2% de FBS. As células foram filtradas por um filtro de 100-μm e um filtro de nylon de 40-μm (BD Falcon), recolhido por centrifugação (650g, 4 °C, 3 min) e lavado com 1× PBS, 2% FBS. Posteriormente, foi utilizado um gradiente percentual de 20% (15.000g, 4 °C, 20 min) para a purificação celular. A camada contendo células foi coletada, lavada com PBS contendo 2% de FBS, e células viáveis foram contadas pela exclusão de Trypan Blue usando um hemocitômetro. Os núcleos foram perfilados usando um controlador de cromo (10X Genomics) de acordo com o protocolo do fabricante.
A tabela de recursos-chave dos métodos está na Tabela Complementar 24.
Mapeamento de transcritores
Após o sequenciamento, as amostras foram desmultiplexadas e armazenadas como arquivos CRAM. Cada amostra foi mapeada para o genoma de referência humano (GRCh38 v.3.0.0) fornecido pela 10X Genomics, e usando a suite CellRanger (v.3.0.1) com parâmetros padrão. Amostras de uma única célula foram mapeadas contra a referência como ela foi fornecida. Amostras single-nuclei, a referência para pré-mRNA, foi criada usando as instruções 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references).
Count data processing
Após o mapeamento, amostras de cada fonte de dados (núcleos simples, célula simples e célula CD45+) foram agrupadas em objetos AnnData individuais concatenando a característica bruta_bc_matrix_h5.h5 e adicionando a informação de metadados apropriada. Para cada objeto fonte de dados, a média de identificadores moleculares únicos (UMIs) (n_counts) foi calculada e usada como um limiar para gotas vazias.
Detecção de gotas duplas
Após a remoção de gotas vazias, aplicamos o scrublet73 para atribuir um escore duplo (scrublet_score) a cada célula. Estas células foram agrupadas e visualizadas usando o método UMAP74. Além disso, cada célula foi processada para detecção de doublet usando um método de percolação para permitir melhor detecção de doublets75,
Controle de qualidade e filtragem de células
Cada fonte de dados foi processada e anotada separadamente para contabilizar as diferenças de qualidade específicas da fonte. Estas métricas estão incluídas como covariáveis para processamento posterior. Células totais e células CD45+ foram filtradas para contagens (500 < n_contas <15.000), genes (200 < n_genes), genes mitocondriais (%_mito <20%), genes ribossomais (%_ribo <20%) e escore scrublet (scrublet_score <0,3). Núcleos individuais foram filtrados para contagens (500 < n_contas <15.000), genes (300 < n_genes <6.000), genes mitocondriais (percentagem_mito <5%), genes ribossomais (percentagem_ribo <5%) e scrublet score (scrublet_score <0,3). Os mesmos limiares de filtragem foram aplicados ao conjunto de dados do músculo esquelético.
Scanpy toolkit 1.576 em Python v.3.7 foi usado para realizar análises downstream, incluindo normalização (normalize_per_cell: counts_per_cell_after = 10.000), transformação de log (log1p), detecção de genes de variáveis (altamente_variable_genes), regressando fontes indesejadas de variação (regressess_out: n_counts e percent_mito), escalonamento de características de dados (escala: max_value = 10) e PCA (pca: usando genes altamente variáveis) como descrito anteriormente77.
Alinhamento de lotes usando autoencoder de variação profunda
Construímos um manifold global alinhando todas as fontes de dados e doadores em nossos dados. Isto foi feito em um procedimento de três etapas: (1) Cada fonte foi analisada e anotada separadamente, alinhando apenas para doadores usando um passo de regressão linear pericilo-espacial antes do alinhamento dos lotes com bbknn78. Os genes diferencialmente expressos (DEGs) foram calculados usando um teste de Wilcoxon rank sum com ajuste Bonferroni-Hochberg como implementado na estrutura Scanpy. (2) Para anotar cada cluster, usamos uma abordagem integrativa, pesquisando os DEGs mais significativos (P < 1 × 10-5) com um logFC >1 contra as bases de dados ToppFun79 e EnrichR80. Foram priorizados acertos significativos em caminhos, regulação transcripcional e processos biológicos para anotar um dado cluster. Cada compartimento celular foi rotulado sob o slot adata.obs após o agrupamento dos estados celulares específicos da fonte. (3) Todas as fontes foram combinadas em um único objeto AnnData sob o rótulo adata.obs. Os lotes foram alinhados usando a função batch_correction do autoencoder variacional scGen81. Primeiro alinhamos para adata.obs, usando adata.obs como âncora. Em seguida, alinhamos para adata.obs, usando adata.obs como âncora. Cada rodada de alinhamento de lote foi realizada para 50 épocas.
Manifolds para os adipócitos, populações vasculares e imunocardíacas, assim como a análise do músculo esquelético, foram criadas usando este método e a precisão do agrupamento foi avaliada com SCCAF82 (Extended Data Fig. 12d).
DEGs
Para ajudar na anotação das subpopulações de cada compartimento celular, calculamos os DEGs usando o teste Wilcoxon rank sum como implementado no fluxo de trabalho do scanpy e recomendado por estudos recentes de benchmarking83. Um gene foi considerado como diferentemente expresso se tiver uma mudança de dobra log2-transformada > 1 e um P < 1 × 10-5, a menos que indicado de outra forma na seção de análise.
Interações célula-célula
Matrizes de expressão das populações em estudo foram exportadas do AnnData, juntamente com uma tabela de metadados que continha os códigos de células como índices. Em seguida, executamos CellPhoneDB da seguinte forma: cellphonedb method statistical_analysis meta.tsv counts.tsv-counts-data = gene_name-threads = 60. As previsões brutas da CellPhoneDB foram filtradas removendo essas interações com um P > 1.0 × 10-5. Pares significativos foram então submetidos para análise de enriquecimento do conjunto genético em ReactomeDB, enrichR e ToppFun para classificação funcional. As células vasculares foram subamostragens aleatórias para 39.000 células antes da análise, e o grupo de correção cardíaca (cardiomiócitos atriais e ventriculares, FBs e células imunes) foi subamostragem aleatória para 69.295 células antes da análise.
Visualização da expressão gênica em 10X Genomics Visium dados
Processamos os dados públicos disponíveis do miocárdio ventricular esquerdo Visium de 10X Genomics (https://support.10xgenomics.com/spatial-gene-expression/datasets/1.0.0/V1_Human_Heart) usando o Scanpy v.1.5 adaptado para a análise dos dados 10X Genomics Visium (https://scanpy-tutorials.readthedocs.io/en/latest/spatial/basic-analysis.html). Em resumo, as manchas foram removidas com menos de 500 IAMs ou mais de 20.000 IAMs e menos de 200 genes. Os dados foram log-transformados e normalizados antes da plotagem.
Estimation of RNA velocity
Para calcular a velocidade do RNA das células únicas e CD45+ células únicas enriquecidas, usamos o arquivo BAM de saída CellRanger e o arquivo GENCODE v33 GTF (ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_33/gencode.v33.chr_patch_hapl_scaff.annotation.gtf.gz) junto com o velocyto84 CLI v.0.17.17 para gerar um arquivo de tear contendo a quantificação do RNA emendado e não emendado. Em seguida, construímos um manifold, agrupamos as células e visualizamos as velocidades do RNA usando scVelo85.
Análises de subpopulação de cardiomiócitos atriais e ventriculares, FBs e células neuronais
Todos os códigos de barras rotulados no objeto global como cardiomiócitos, fibroblastos e células neurais foram selecionados para análises adicionais de subpopulação. Critérios adicionais de filtragem específicos da população celular foram aplicados aos núcleos da seguinte forma: contagem de cardiomiócitos (n_contas <12.500), genes (n_genes <4.000), genes mitocondriais (percentagem_mito <1%), genes ribossomais (percentagem_ribo <1%) e escore de scrublet (scrublet_score <0.25); genes mitocondriais FB (percentagem_mito <1%), genes ribossomais (percentagem_ribo <1%); genes de células neuronais (n_genes <4000), genes mitocondriais (percentagem_mito <1%), genes ribossomais (percentagem_ribo <1%). As células totais e CD45+ foram excluídas nos conjuntos de dados de cardiomiócitos atriais e ventriculares e não contribuíram para a análise da subpopulação. Nenhuma filtragem adicional de PBs ou total de células neuronais e células CD45+ foi aplicada. Cardiomiócitos e FBs foram então divididos em dois agrupamentos, com base na região de origem: (1) átrio esquerdo e direito, e (2) ventrículos esquerdo e direito, ápice e septo interventricular.
Os efeitos doador foram alinhados conforme descrito no passo (1) acima. Para células FB e neuronais, as fontes foram alinhadas conforme descrito no passo (3) acima. O agrupamento de Leiden e a visualização UMAP foram realizados para identificação de subpopulações e visualização86. Os genes diferencialmente expressos foram calculados usando o teste Wilcoxon rank sum. Os genes foram classificados por escore.
Comparação entre os tecidos das populações imunológicas cardíacas com as populações imunológicas esqueléticas, renais e sanguíneas
Coletamos dados de transcriptoma de uma célula para rins adultos a partir do ref. 99 (https://www.kidneycellatlas.org/), e subconjuntos de todas as células imunológicas relatadas em seu estudo. Para o SKM seleccionámos as células imunitárias anotadas do colector fundido. Para o sangue humano, utilizamos o conjunto de dados de 10.000 células PBMC único disponível publicamente fornecido pela 10X Genomics (https://support.10xgenomics.com/single-cell-gene-expression/datasets/3.0.0/pbmc_10k_v3). Como descrito anteriormente87, treinamos um modelo de regressão logística sobre as células imunes cardíacas usando 80% dos dados de expressão e testamos sua precisão nos 20% restantes para produzir um modelo com precisão de 0,6862 (Dados Estendidos Fig. 8f, Tabela Suplementar 16). Aplicamos então este modelo para prever populações imunológicas cardíacas análogas no rim adulto, SKM e PBMCs. Predições com probabilidade menor que 0,8 foram excluídas das análises comparativas a jusante.
Análise de enriquecimento em ontologia de genes
Para a população de cardiomiócitos ventriculares, usamos o pacote R gProfileR (https://cran.r-project.org/web/packages/gProfileR/index.html) com a lista de genes com pontuação de vCM4 como input e o conjunto de genes expressos em cardiomiócitos ventriculares como fundo (aqueles genes com contagem de IAM >1). Para realizar a análise da Ontologia Genética nas células vasculares, os 500 principais DEGs significativos (P < 1 × 10-5) com uma mudança de prega log-transformada > 1 foram pesquisados na base de dados do processo biológico da Ontologia Genética usando ToppFun79 (Tabela Suplementar 25). Os cinco primeiros termos significativamente enriquecidos (q < 0,05) para cada subpopulação foram selecionados e traçados em um mapa de calor. Para realizar a análise da via nos adipócitos, os 500 DEGs significativos do topo (P < 1 × 10-5) com uma mudança de dobra log-transformada > 0,5 foram pesquisados em bancos de dados de vias do ToppFun79 (Tabela Suplementar 26). As cinco principais vias significativamente enriquecidas (q < 0,05) para cada subpopulação foram selecionadas e plotadas em um mapa de calor.
Escore do conjunto de genes
Usamos a função score_genes como implementada em scanpy para calcular o enriquecimento dos genes envolvidos na via Oncostatin M. Uma lista de genes foi coletada em pesquisa bibliográfica88,89. Para o enriquecimento do conjunto de genes, apenas genes altamente expressos foram considerados para reduzir o ruído (mais de 500 UMIs em todas as células). A mesma análise foi realizada para comparação de células imunes cardíacas em nosso estudo com as observações de estudos anteriores sobre macrófagos residentes no coração51, macrófagos removedores de tecido de camundongos45 e linhagem de saco vitelino90,
Estatistica e reprodutibilidade
Todas as análises foram realizadas usando o Software R, v.3.6.1. Os testes t de Student foram usados para comparar as distribuições do tipo de célula em cada local. P < 0,05 foi considerado estatisticamente significativo. Modelos de regressão linear (correlações) foram obtidos usando a função do modelo linear R (lm), que estima a probabilidade estatística (valor de P) de uma relação linear. A correção de Bonferroni foi aplicada para testes múltiplos.
As micrografias RNAscope representadas nas figuras são representativas. As micrografias nas Figs. 2g, 3c, h e Dados Estendidos Fig. 3c (HAMP), Dados Estendidos Fig. 3e (CNN1), Dados Estendidos Figs. 4g, m, 6f foram repetidas com resultados semelhantes em dois cortes individuais de tecido. Os micrografos nas Figs. 2h, 3f e Dados Estendidos Figs. 3c (CNN1), Dados Estendidos Figs. 3e (PCDH7), Dados Estendidos Figs. 6e, h, 9d foram repetidos com resultados semelhantes em três cortes individuais de tecido. Os micrografos nas Figs. 1e, 2d, 3e e Dados Estendidos Figs. 1f, 3c (FHL1) e Dados Estendidos Figs. 6d foram repetidos com resultados semelhantes em quatro cortes individuais de tecido. Os micrografos nas Fig. 2c e Dados Estendidos Fig. 3c (PRELID2), Dados Estendidos Figs. 10e, 12a foram repetidos com resultados semelhantes em seis ou mais cortes individuais de tecido. Controles positivos e negativos foram feitos uma vez por amostra usada.
Análise de enriquecimento de GWAS
Fizemos o download da estatística resumida de GWAS do amplo cvdi, catálogo EBI de GWAS e atlas de GWAS. Selecionamos características com GWAS bem alimentado (n > 5.000 e número de loci significativos >10). Os conjuntos de dados de GWAS estão resumidos na Tabela Suplementar 27. Os dados de expressão gênica dos genes codificadores de proteínas foram mapeados nos ids gênicos Entrez e estas anotações gênicas foram usadas na montagem do genoma humano hg19/37. Usamos apenas os dados de expressão gênica dos núcleos. Implementamos a análise descrita anteriormente64 em python e em R. As contagens log-transformadas (mais uma pseudocontagem) foram usadas para calcular perfis de expressão específicos do tipo celular médio. Realizamos análises magmáticas individuais para cada tipo de célula, sempre condicionando em covariáveis de nível genético padrão (por exemplo, comprimento do gene) e expressão gênica média em todas as células. Em seguida, aplicamos o método Benjamini-Hochberg e associações de traços de tipo celular selecionados com FDR < 10%. Estes pares foram então submetidos à análise condicional como descrito anteriormente64 para definir pares de associações ‘independentes’, ‘explicadas conjuntamente’ e ‘parcialmente explicadas conjuntamente’ (Tabela Suplementar 28).
Distribuições de células dispersas e núcleos isolados
Os diferentes procedimentos para obter núcleos isolados e células dispersas resultaram em distribuições significativamente diferentes dos tipos de células (Tabela Suplementar 29, Dados Estendidos Fig. 2). Notavelmente, 30,1% e 49,2% dos núcleos isolados foram derivados de cardiomiócitos atriais e ventriculares nas regiões atrial e ventricular, enquanto que estas células foram, em sua maioria, excluídas das preparações de células isoladas e CD45-selecionadas (Tabela Suplementar 2).
Excluindo cardiomiócitos, a distribuição dos tipos celulares identificados a partir dos núcleos isolados e células dispersas permaneceu distinta (Tabela Suplementar 30). Embora 59,0% das células dispersas fossem CE, apenas 15,7% dos núcleos eram derivados de CE. Em contraste, 64,2% dos núcleos eram de PBs (31,2%) e pericíticos (33,0%), enquanto apenas 17,1% das células dispersas eram de PBs (2,3%) e pericíticos (14,8%). Essas diferenças podem refletir a sensibilidade dos núcleos de CE aos procedimentos de isolamento ou resistência dos pericíticos e FBs à digestão enzimática celular.
Despeito das diferenças nas distribuições celulares entre núcleos isolados e células dispersas, os perfis de expressão gênica das linhagens celulares foram razoavelmente correlacionados (r > 0,4 para cada tipo de célula). Para abordar a concordância dos genes capturados pelas células e núcleos, comparamos a expressão dos principais marcadores de tipos celulares da Fig. 1c através das três fontes (Dados Estendidos Fig. 1c). Como os núcleos não possuem RNA citoplasmático, a expressão de certos genes, especialmente os genes imunes NKG7 e C1QA, foi menor nos núcleos do que nas células. Entretanto, a tendência geral com relação aos genes marcadores foi consistente entre as três fontes, e os mesmos genes distinguiram tipos de células individuais independentemente da fonte.
Outras análises de células vasculares
O PC3_str continha contribuição similar de células e núcleos, e tinha um escore de scrublet abaixo do limite rigoroso utilizado; entretanto, o número médio de genes e contagens neste cluster foi maior que a média. Assim, apesar da nossa filtragem de qualidade rigorosa, não podemos excluir a possibilidade de haver doublets neste cluster. EC10_CMC-like e PC4_CMC-like co-expressam genes EC ou pericócitos com marcadores cardiomiócitos e estudos adicionais são necessários para entender se eles representam estados celulares previamente desconhecidos ou doublets.
As observações dos SMC arteriais e venosos são suportadas por estudos anteriores, que predizem que os SMC arteriais são mais contráteis, e os SMC venosos são menos diferenciados91.
EC3_cap enrich for transcripts encoding components of AP1 (JUN and FOS), que medeia múltiplas decisões de destino da CE incluindo resposta ao VEGF, sinais inflamatórios e de estresse, e ATF3, um gene adaptativo-resposta induzido por diversos sinais92,93,94.
Caracterização do músculo esquelético
Recolhemos amostras de músculo esquelético intercostal de cinco indivíduos saudáveis, incluindo um doador com tecido cardíaco compatível, e traçamos o perfil do transcriptoma de 35.665 células únicas e 39.597 núcleos únicos. Analogamente ao coração, a combinação de células e núcleos nos permitiu capturar e resolver grandes linhagens celulares, incluindo cardiomiócitos, fibroblastos, células endoteliais, células musculares lisas, pericíticos, células imunes mieloides e linfóides e células satélites (Dados Estendidos Fig. 11a, b, Tabela Suplementar 31).
Outras análises das células vasculares do músculo esquelético identificaram dez populações distintas. As células endoteliais apresentaram cinco grupos separados com base em seus respectivos leitos vasculares com assinaturas semelhantes às que observamos no coração. O EC_cap expressa VWF e RGCC. A EC_ven venosa expressa ACKR1 e PLVAP, enquanto a EC_art arterial mostra SEMA3G e HEY1, em linha com nossos dados cardíacos (Dados Estendidos Fig. 11c, d, Tabela Suplementar 32).
As distribuições gerais das populações de células vasculares e estromais no músculo esquelético e cardíaco foram semelhantes, incluindo as características arteriais e venosas das ECs; entretanto, o músculo esquelético continha um único aglomerado de EC_ven, potencialmente relacionado ao menor tamanho do conjunto de dados. No músculo esquelético, as interações celulares previstas da EC_art e CMS incluíram NOTCH1/4-JAG1, bem como JAG1/JAG2/DLL4-NOTCH3, mas não JAG1/JAG2/DLL4-NOTCH2, inferidas no coração (Dados Estendidos Fig. 11e, f, Tabela Suplementar 33).
Células imunes cardíacas
Usando o modelo de regressão logística, não identificamos nenhuma contraparte dos monócitos cardíacos IL17RA+ em SKM ou rim, possivelmente devido ao pequeno tamanho desta população.
Células T ingênuas (CD4+T_naive) identificadas expressas CCR7 e SELL, indicativas de sua natureza ingênua e tecido-residente95. Células T de memória (CD8+T_tem) expressas em BACH2, STAT4 e IL7R, associadas à memória imune de longo prazo96,97. Caracterizamos ainda as células linfóides usando scNym98, e treinamos usando dados publicados99,100. O modelo resultante foi aplicado às nossas células imunitárias cardíacas e presumiu-se que essas células, com uma pontuação prevista superior a 0,8, seriam provavelmente candidatas a uma nova anotação. Usando esta abordagem, identificamos candidatos para células B plasmáticas (109), células dendríticas (645), células linfóides inatas (89), células T MAIT (219), células T helper (80) células T reguladoras (11), células T de memória central (103), γδ células T (30) e células dendríticas plasmocitóides (27). Estas anotações podem ser encontradas nas anotações de objetos imunes cardíacos sob o rótulo ‘scNym’ em www.heartcellatlas.org.
Reporting summary
Outras informações sobre o design da pesquisa estão disponíveis no Nature Research Reporting Summary ligado a este artigo.