Información

Transformación logarítmica y GWAS

Transformación logarítmica y GWAS



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Antes de realizar cualquier GWAS (estudio de asociación de todo el genoma) es necesario comprobar la normalidad de la distribución fenotípica. Si el fenotipo se distribuye normalmente solo una vez que se ha transformado logarítmicamente, ¿qué datos fenotípicos tengo que usar mientras hago el GWAS? ¿El no transformado o el transformado logarítmicamente?


Sí, usa el fenotipo transformado logarítmicamente. si desea utilizar un término de error distribuido normalmente, y esto solo ocurrirá si el fenotipo se transforma en logaritmos, entonces debe transformar el fenotipo en logaritmos.

El fenotipo debe distribuirse de la misma manera que el término de error en su modelo de regresión de GWAS.

$ fenotipo = beta_1 X_D + beta_2 X_A + epsilon $

$ epsilon = mathcal {N} (x | mu, sigma) $

Siguiendo el teorema del límite central, la mayoría de los fenotipos se distribuyen normalmente. Sin embargo, hay casos en los que una distribución de Bernoulli es correcta y se debe utilizar una regresión de estilo logístico.


Reflejos

Las técnicas de MF infieren una estructura de baja dimensión a partir de datos ómicos de alta dimensión para permitir la visualización y la inferencia de procesos biológicos complejos (CBP).

Diferentes MF aplicados a los mismos datos aprenderán diferentes factores. El análisis de datos exploratorios debe emplear múltiples MF, mientras que una pregunta biológica específica debe emplear un MF específico adaptado a ese problema.

Los MF aprenden dos conjuntos de representaciones de baja dimensión (en cada factor de matriz) a partir de datos de alta dimensión: uno que define las relaciones moleculares (amplitud) y otro que define las relaciones a nivel de muestra (patrón).

Las vías funcionales basadas en datos, los biomarcadores y las interacciones epistáticas se pueden aprender de la matriz de amplitud.

Agrupación, descubrimiento de subtipos, en silico la microdisección y el análisis del curso del tiempo se habilitan mediante el análisis de la matriz de patrones.

MF permite tanto análisis multiómicos como análisis de datos de una sola celda.

Los datos ómicos contienen señales de las interacciones inter e intracelulares moleculares, físicas y cinéticas que controlan los sistemas biológicos. Las técnicas de factorización matricial (MF) pueden revelar una estructura de baja dimensión a partir de datos de alta dimensión que reflejan estas interacciones. Estas técnicas pueden descubrir nuevos conocimientos biológicos a partir de diversos datos ómicos de alto rendimiento en aplicaciones que van desde el descubrimiento de vías hasta el análisis del curso del tiempo. Revisamos aplicaciones ejemplares de MF para análisis a nivel de sistemas. Discutimos las aplicaciones apropiadas de estos métodos, sus limitaciones y nos enfocamos en el análisis de resultados para facilitar una interpretación biológica óptima. La inferencia de características biológicamente relevantes con MF permite el descubrimiento de datos de alto rendimiento más allá de los límites del conocimiento biológico actual, respondiendo preguntas de datos de alta dimensión que aún no hemos pensado hacer.


Artículo de Investigación Original

  • 1 Departamento de Biología Celular, 2011 Centro Colaborativo de Innovación de Tianjin para la Epigenética Médica, Laboratorio Clave de Epigenética Médica de Tianjin, Universidad Médica de Tianjin, Tianjin, China
  • 2 Center for Applied Genomics, Children & # x2019s Hospital of Philadelphia, Filadelfia, PA, Estados Unidos
  • 3 División de Genética Humana, Hospital de Niños y # x2019 de Filadelfia, Filadelfia, PA, Estados Unidos
  • 4 Departamento de Pediatría, Facultad de Medicina Perelman, Universidad de Pensilvania, Filadelfia, PA, Estados Unidos

La artritis idiopática juvenil (AIJ) es la enfermedad reumática crónica más común entre los niños y puede causar una discapacidad grave. Los estudios genómicos han descubierto un número sustancial de loci de riesgo para JIA, sin embargo, el mecanismo de cómo estos loci afectan el desarrollo de JIA no se comprende completamente. El neutrófilo es un tipo de célula importante involucrado en enfermedades autoinmunes. Para comprender mejor la función biológica de los loci genéticos en los neutrófilos durante el desarrollo de la AIJ, adoptamos un enfoque multiómico integrado para identificar genes diana en los loci de riesgo de AIJ en los neutrófilos y construimos una red de interacción proteína-proteína mediante un enfoque de aprendizaje automático. Identificamos genes que probablemente sean genes dirigidos a loci de riesgo de AIJ en neutrófilos que podrían contribuir al desarrollo de AIJ.


Referencias

Pickrell, J. K. et al. Comprender los mecanismos que subyacen a la variación de la expresión génica humana con secuenciación de ARN. Naturaleza 464, 768–772 (2010).

Consorcio GTEx. El proyecto Genotype-Tissue Expression (GTEx). Nat. Gineta. 45, 580–585 (2013).

Gamazon, E. R. y col. Un método de asociación basado en genes para mapear rasgos utilizando datos de transcriptomas de referencia. Nat. Gineta. 47, 1091–1098 (2015).

Li, X. y col. El impacto de una variación rara en la expresión génica en los tejidos. Naturaleza 550, 239–243 (2017).

Edwards, S. L., Beesley, J., French, J. D. & amp Dunning, A. M. Más allá de los GWAS: iluminando el camino oscuro de la asociación a la función. Soy. J. Hum. Gineta. 93, 779–797 (2013).

Segal, E., Raveh-Sadka, T., Schroeder, M., Unnerstall, U. & amp Gaul, U. Predicción de patrones de expresión a partir de secuencias reguladoras en Drosophila segmentación. Naturaleza 451, 535–540 (2008).

Beer, M. A. & amp Tavazoie, S. Predicción de la expresión génica a partir de la secuencia. Celda 117, 185–198 (2004).

Yuan, Y., Guo, L., Shen, L. & amp Liu, J. S. Predicción de la expresión génica a partir de la secuencia: un reexamen. PLoS Comput. Biol. 3, e243 (2007).

Bussemaker, H. J., Li, H. & amp Siggia, E. D. Detección de elementos reguladores mediante correlación con expresión. Nat. Gineta. 27, 167–171 (2001).

Kreimer, A. et al. Predicción de la expresión génica en ensayos informadores masivamente paralelos: un estudio comparativo. Tararear. Mutat. 38, 1240–1250 (2017).

Zhou, J. & amp Troyanskaya, O. G. Predicción de efectos de variantes no codificantes con modelo de secuencia basado en aprendizaje profundo. Nat. Métodos 12, 931–934 (2015).

Aguet, F. et al. Efectos genéticos locales sobre la expresión génica en 44 tejidos humanos. Naturaleza 550, 204–213 (2017).

Battle, A., Brown, C. D., Engelhardt, B. E. & amp Montgomery, S. B. Efectos genéticos sobre la expresión génica en tejidos humanos. Naturaleza 550, 204–213 (2017).

Westra, H.-J. et al. Identificación sistemática de trans eQTL como impulsores putativos de asociaciones de enfermedades conocidas. Nat. Gineta. 45, 1238–1243 (2013).

Ramasamy, A. et al. Variabilidad genética en la regulación de la expresión génica en diez regiones del cerebro humano. Nat. Neurosci. 17, 1418–1428 (2014).

Fairfax, B. P. et al. La genética de la expresión génica en las células inmunitarias primarias identifica los reguladores maestros específicos del tipo celular y las funciones de los alelos HLA. Nat. Gineta. 44, 502–510 (2012).

Tewhey, R. et al. Identificación directa de cientos de variantes moduladoras de la expresión mediante un ensayo indicador multiplexado. Celda 165, 1519–1529 (2016).

MacArthur, J. y col. El nuevo Catálogo NHGRI-EBI de estudios publicados de asociación de todo el genoma (Catálogo GWAS). Ácidos nucleicos Res. 45, D896 – D901 (2017).

Germain, M. et al. Genética de la trombosis venosa: conocimientos de un nuevo estudio de asociación de todo el genoma. Más uno 6, e25581 (2011).

Tang, W. y col. Un estudio de asociación de todo el genoma para el tromboembolismo venoso: el consorcio de cohortes extendidas para la investigación del corazón y el envejecimiento en epidemiología genómica (CHARGE). Gineta. Epidemiol. 37, 512–521 (2013).

Plagnol, V. et al. Análisis de asociación de todo el genoma de la positividad de autoanticuerpos en casos de diabetes tipo 1. PLoS Genet. 7, e1002216 (2011).

Chu, X. y col. Un estudio de asociación de todo el genoma identifica dos nuevos loci de riesgo para la enfermedad de Graves. Nat. Gineta. 43, 897–901 (2011).

Sawcer, S. et al. Riesgo genético y papel principal de los mecanismos inmunitarios mediados por células en la esclerosis múltiple. Naturaleza 476, 214–219 (2011).

Graham, R. R. y col. Variantes genéticas cercanas TNFAIP3 en 6q23 se asocian con lupus eritematoso sistémico. Nat. Gineta. 40, 1059–1061 (2008).

Bentham, J. y col. Los análisis de asociación genética implican una regulación aberrante de genes de inmunidad innata y adaptativa en la patogénesis del lupus eritematoso sistémico. Nat. Gineta. 47, 1457–1464 (2015).

Lee, Y.-C. et al. Dos nuevos loci de susceptibilidad para la enfermedad de Kawasaki identificados mediante análisis de asociación de todo el genoma. Nat. Gineta. 44, 522–525 (2012).

Xi, H. y col. El análisis de motivos sobrerrepresentados en promotores centrales humanos revela roles reguladores duales de YY1. Genome Res. 17, 798–806 (2007).

Stenson, P. D. y col. Base de datos de mutaciones de genes humanos: actualización de 2008. Genome Med. 1, 13 (2009).

Nagaizumi, K. et al. Dos mutaciones dobles heterocigotas en el F7 gen muestran diferentes manifestaciones. Br. J. Haematol. 119, 1052–1058 (2002).

Feldmann, J. et al. Munc13-4 es esencial para la fusión de los gránulos citolíticos y está mutado en una forma de linfohistiocitosis hemofagocítica familiar (FHL3). Celda 115, 461–473 (2003).

Ng, Y.-S., Wardemann, H., Chelnis, J., Cunningham-Rundles, C. & amp Meffre, la tirosina quinasa de E. Bruton es esencial para la tolerancia de las células B humanas. J. Exp. Medicina. 200, 927–934 (2004).

Yamagata, K. et al. Mutaciones en el gen del factor nuclear 4α de los hepatocitos en la diabetes joven de inicio en la madurez (MODY1). Naturaleza 384, 458–460 (1996).

Servitja, J.-M. et al. Hnf-1α (MODY3) controla los programas transcripcionales específicos de tejido y ejerce efectos opuestos sobre el crecimiento celular en los islotes pancreáticos y el hígado. Mol. Celda. Biol. 29, 2945–2959 (2009).

Huang, F. W. y col. Altamente recurrente TERT mutaciones promotoras en el melanoma humano. Ciencias 339, 957–959 (2013).

Vinagre, J. et al. Frecuencia de TERT mutaciones promotoras en cánceres humanos. Nat. Comun. 4, 2185 (2013).

Pasaniuc, B. & amp Price, A. L. Disección de la genética de rasgos complejos utilizando estadísticas de asociación de resumen. Nat. Rev. Genet. 18, 117–127 (2017).

Parkes, M. y col. Variantes de secuencia en el gen de la autofagia IRGM y muchos otros loci replicantes contribuyen a la susceptibilidad a la enfermedad de Crohn. Nat. Gineta. 39, 830–832 (2007).

Consorcio de control de casos de Wellcome Trust. Estudio de asociación de todo el genoma de 14.000 casos de siete enfermedades comunes y 3.000 controles compartidos. Naturaleza 447, 661–678 (2007).

Barrett, J. C. et al. La asociación de todo el genoma define más de 30 loci de susceptibilidad distintos para la enfermedad de Crohn. Nat. Gineta. 40, 955–962 (2008).

Franke, A. et al. El metanálisis de todo el genoma aumenta a 71 el número de loci confirmados de susceptibilidad a la enfermedad de Crohn. Nat. Gineta. 42, 1118–1125 (2010).

Jostins, L. et al. Las interacciones huésped-microbio han dado forma a la arquitectura genética de la enfermedad inflamatoria intestinal. Naturaleza 491, 119–124 (2012).

Liu, J. Z. et al. Los análisis de asociación identifican 38 loci de susceptibilidad para la enfermedad inflamatoria intestinal y destacan el riesgo genético compartido entre las poblaciones. Nat. Gineta. 47, 979–986 (2015).

Kirino, Y. et al. El análisis de asociación de todo el genoma identifica nuevos loci de susceptibilidad para la enfermedad de Behçet y la epistasis entre HLA-B * 51 y ERAP1. Nat. Gineta. 45, 202–207 (2013).

Jiang, D. K. y col. Variantes genéticas en cinco nuevos loci que incluyen CFB y CD40 predisponen a la hepatitis B crónica. Hepatologia 62, 118–128 (2015).

de Souza, N. El proyecto ENCODE. Nat. Métodos 9, 1046 (2012).

Bernstein, B. E. et al. El Consorcio de Mapeo de Epigenómica Roadmap de los NIH. Nat. Biotechnol. 28, 1045–1048 (2010).

Chen, T. y Guestrin, C. XGBoost. en Actas de la 22a Conferencia Internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos, 785–794 (ACM, San Francisco, 2016).

Bühlmann, P. Impulso para modelos lineales de alta dimensión. Ana. Stat. 34, 559–583 (2006).

Consorcio Proyecto 1000 Genomas. Una referencia mundial para la variación genética humana. Naturaleza 526, 68–74 (2015).

Efron, B. Tamaño, potencia y tasas de falsos descubrimientos. Ana. Stat. 35, 1351–1377 (2007).

Kircher, M. y col. Un marco general para estimar la patogenicidad relativa de variantes genéticas humanas. Nat. Gineta. 46, 310–315 (2014).

Gonzàlez-Porta, M., Frankish, A., Rung, J., Harrow, J. & amp Brazma, A. El análisis del transcriptoma de tejidos humanos y líneas celulares revela una transcripción dominante por gen. Genome Biol. 14, R70 (2013).

Uhlen, M. y col. Mapa basado en tejidos del proteoma humano. Ciencias 347, 1260419–1260419 (2015).

Forrest, A. R. R. y col. Un atlas de expresión de mamíferos a nivel de promotor. Naturaleza 507, 462–470 (2014).


Agradecimientos

Agradecemos a M. Picciotto, C. Pittenger y A. Che por leer críticamente el manuscrito. Agradecemos a R. Terwilliger por la asistencia técnica. Agradecemos a las familias que donaron para esta investigación. Este trabajo fue apoyado con recursos y el uso de instalaciones en el Sistema de Atención Médica de VA Connecticut, West Haven, CT, el Sistema de Atención Médica de Veteranos de Texas Central, Temple, TX, el Sistema de Atención Médica de Durham VA, Durham, NC, la Atención Médica de VA San Diego System, La Jolla, CA, VA Boston Healthcare System, Boston, MA, EE. UU., Y el Centro Nacional para el TEPT, Departamento de Asuntos de Veteranos de EE. UU. La investigación informada aquí fue apoyada por el Departamento de Asuntos de Veteranos, la Administración de Salud de Veteranos, el Premio al Desarrollo Profesional VISN1 y un Premio al Joven Investigador de la Fundación de Investigación del Cerebro y el Comportamiento otorgado a M.J.G. y por NIMH otorga MH093897 y MH105910 a R.S.D. Las opiniones expresadas aquí pertenecen a los autores y no reflejan necesariamente la posición o la política del Departamento de Asuntos de Veteranos (VA) o del gobierno de los EE. UU.


Materiales y métodos

Recolección de parásitos y adaptación de cultivos.

Plasmodium falciparum Se recolectaron muestras de sangre infectadas durante los años 2004-2011 de pacientes febriles que asistían a clínicas locales ubicadas a lo largo de la frontera entre China y Myanmar. Sin complicaciones P. falciparum la malaria se identificó mediante microscopía. El estudio ha sido aprobado por las Juntas de Revisión Institucional de la Universidad de Penn State, la Universidad Médica de Kunming y el Departamento de Salud de Kachin, y se obtuvo el consentimiento informado de todos los participantes adultos y de los padres / tutores de los niños. La recolección y el procesamiento de muestras de sangre venosa se realizaron de acuerdo con las pautas de Tecnología Apropiada en Salud (PATH). Un total de 94 cepas de parásitos (2 en 2004, 8 en 2007 15 en 2008 58 en 2009 8 en 2010 y 4 en 2011), determinadas como infecciones monoclonales mediante la genotipificación de tres marcadores de antígenos polimórficos msp1, msp2 y proteína rica en glutamato, fueron recuperados de un archivo de parásitos adaptados a cultivos y utilizados para in vitro ensayo de fármacos y genotipado. Los cultivos de rutina de los parásitos se mantuvieron en glóbulos rojos humanos tipo O + en medio completo suplementado con suero AB humano al 6% en una atmósfera de 90% N2/ 5% O2/ 5% CO2.

In vitro ensayo de drogas e IC50 cálculo

Se utilizó el ensayo de fluorescencia estándar SYBR Green I para evaluar la susceptibilidad de los parásitos a 10 fármacos antipalúdicos: DHA, AS, AM, PND, LMF, PPQ, MQ, CQ, QN y SP (S: P = 20: 1, w / w), de los cuales CQ y SP sirvieron como controles internos para validar el análisis. DHA, AS, AM, MQ, CQ, QN y SP se adquirieron de Sigma (St. Louis, MO, EE. UU.), Mientras que PND, LMF y PPQ se obtuvieron de Kunming Pharmaceutical Co. (Kunming, Yunnan, China). La solución madre de AM se disolvió en dimetilsulfóxido (DMSO) y SP en DMSO al 40%. Otros se prepararon como se describió anteriormente 10. In vitro los cultivos se sincronizaron con dos rondas de tratamiento con D-sorbitol al 5%, y se ensayó la sensibilidad al fármaco de los parásitos en etapa de anillo en placas de microtitulación de 96 pocillos al 1% de hematocrito y al 0,5% de parasitemia. Se probaron tres réplicas biológicas para cada aislado y cada concentración de fármaco se repitió dos veces. Para reducir las variaciones entre placas, siempre se incluyó como referencia el clon estándar de laboratorio 3D7. Se realizó RSA para medir la susceptibilidad de los parásitos en etapa de anillo al DHA siguiendo el Procedimiento operativo estándar INV10 10. IC50 se midió utilizando un modelo de regresión no lineal en GraphPad Prism 5 (GraphPad Software, Inc. La Jolla, CA, EE. UU.). La distribución normal de los valores del ensayo se probó mediante la prueba de Shapiro-Wilk. Media geométrica del IC50 y se calculó el intervalo de confianza del 95% para los datos distribuidos normalmente. Se calcularon la mediana y el rango intercuartílico si los datos no tenían una distribución normal. La correlación entre los ensayos de fármacos se evaluó mediante los coeficientes de correlación de Spearman en R. Student t-La prueba se aplicó para investigar las diferencias potencialmente significativas en los valores medios del ensayo entre los aislados de campo y 3D7.

Matriz SNP e imputación de datos

El ADN genómico del parásito se extrajo de los aislados cultivados utilizando el kit de purificación de ADN genómico Wizard® (Promega, WI, EE. UU.). El ADN genómico se genotipificó utilizando una matriz Affymetrix SNP de alta densidad que permite interrogar a más de 17.000 SNP realizados en RML Genomics Unit, Research Technologies Branch, NIAID. El algoritmo BRLMM-P se utilizó para llamar a los SNP como se informó anteriormente 32. Los genotipos se transfirieron a una hoja de cálculo para realizar análisis adicionales. SNP dentro var, rifin y Stevor se excluyeron los genes para reducir los artefactos debidos a secuencias duplicadas. También se eliminaron los SNP con tasas de llamadas inferiores al 90%. A continuación, se imputaron los datos de SNP mediante el software BEAGLE v3.3.2 33. Este conjunto de datos se filtró aún más para eliminar los SNP multialélicos y de baja frecuencia con MAF de & lt2% mediante PLINK 1.9.

Medición de LD y determinación de la estructura de la población

El LD por pares de todo el genoma se midió mediante PLINK 1.9, estableciendo un indicador de -ld-window-r 2 en 0 para incluir todos los pares de SNP. Se utilizó un ajuste de este indicador a 0,3 para medir los pares de SNP con R 2 & gt 0,3. Los valores de LD se trazaron utilizando el paquete de software R. La estructura de la población fue investigada por PCA sobre la base de la matriz de relación estandarizada de varianza utilizando PLINK 1.9.

Los fenotipos se transformaron mediante el logaritmo natural y la transformación normal inversa basada en el rango. Para tener en cuenta los ceros en los resultados de RSA, se agregó 0.5% a todos los valores para la transformación logarítmica. GWAS se realizó utilizando múltiples paquetes de software, GEMMA, PLINK 1.9, regresión lineal y regresión no paramétrica en R. Además, el WarpedLMM recientemente desarrollado que estima la transformación óptima de los fenotipos también se aplicó al análisis. Para PLINK, R y WarpedLMM, los tres componentes principales principales como covariables se aplicaron para corregir la inflación y reducir las influencias de la estructura de la población. GEMMA estima la relación genética de los genotipos y ajusta automáticamente la inflación. PAG Se obtuvieron valores de cada modelo y se utilizó un umbral después de la corrección de Bonferroni (0,05 / número de SNP analizados) para evaluar la significación de todo el genoma. Gráficos Q-Q para PAG Se utilizaron valores para evaluar la robustez de diferentes modelos para minimizar la inflación debido a la estratificación de la población. El factor de inflación genómico lambda (λ) se calculó para cada fenotipo de susceptibilidad al fármaco mediante un paquete R snpStats. Los gráficos de Manhattan se generaron mediante scripts modificados del paquete R CMplot.

Análisis de diversidad SNP

La diversidad genética en los loci de resistencia se evaluó mediante la heterocigosidad promedio. Calculamos la heterocigosidad esperada usando la ecuación, donde Él es la heterocigosidad esperada, norte es el tamaño de la muestra y Pi es la frecuencia de la Ith alelo. Los valores de heterocigosidad se promediaron por gen, y si solo había un SNP en un gen o no había anotación para un SNP, se agrupaba en el gen vecino dentro de los 10 kb.

Selección direccional reciente

La selección positiva en los loci de resistencia fue examinada por EHH en el paquete R rehh 60, un método que detecta la transmisión de un haplotipo extendido sin recombinación. Los SNP en S220A en pfcrt, C59R en pfdhfr y T38N en pfatg18 sirvió como los SNP focales en el análisis EHH. El iHS, que también se implementó en rehh, se utilizó para identificar la selección direccional de largo alcance en todo el genoma. El iHS es el log-ratio estandarizado de la homocigosidad de haplotipos extendidos integrados para los alelos ancestrales y derivados en un SNP central, con valores positivos grandes que indican haplotipos largos que llevan el alelo ancestral y valores negativos grandes que indican haplotipos largos que llevan el alelo derivado. Tanto las puntuaciones iHS extremas positivas como negativas son potencialmente interesantes, ya que los alelos ancestrales pueden hacer autostop con el sitio seleccionado que tiene una puntuación positiva grande 45. Por lo tanto, utilizamos los valores absolutos de iHS para capturar haplotipos inusualmente largos que rodean ambos tipos de alelos.


4 Análisis de asociación de todo el genoma

4.1 Análisis de asociación de polimorfismos de un solo nucleótido tipificados (paso 7)

El análisis de asociación generalmente implica la regresión de cada SNP por separado en un rasgo dado, ajustado por factores clínicos, demográficos y ambientales a nivel del paciente. El supuesto modelo genético subyacente de asociación para cada SNP (p. Ej., Dominante, recesivo o aditivo) afectará los hallazgos resultantes; sin embargo, debido a la gran cantidad de SNP y las relaciones generalmente no caracterizadas con el resultado, generalmente se selecciona un único modelo aditivo. . En este caso y como se ilustra en el código proporcionado, cada SNP se representa como el número correspondiente de alelos menores (0, 1 o 2). En particular, la codificación de variables SNP basadas en modelos alternativos (por ejemplo, dominante o recesivo) es sencilla, y el análisis de asociación descrito procede de manera idéntica 26, 27. En la práctica, se utiliza un umbral de significación de todo el genoma corregido por Bonferonni de 5 × 10 −8 para el control de la tasa de error familiar. Este límite se basa en la investigación, lo que sugiere aproximadamente un millón de SNP independientes en todo el genoma (por ejemplo, 28), por lo que tiende a aplicarse independientemente del número real de SNP tipificados o imputados que se están investigando.

En nuestro entorno, dos SNP genotipados en la región del gen de la proteína de transferencia de éster de colesterilo (CETP), rs1532625 y rs247617, sugieren asociación (pag & lt 5 × 10 −6) con los respectivos pag-valores de 8,92 × 10 −8 y 1,25 × 10 −7. CETP es un gen bien caracterizado que se ha asociado previamente con HDL-C (p. Ej., 26). Se proporciona más información sobre estos SNP y el proceso de interrogación posanalítica en los pasos 9 y 10 posteriores.

4.2 Análisis de asociación de datos imputados (paso 8)

En esta etapa, asignamos 70 SNP imputados a la región CETP, de los cuales 16 son significativos en el umbral de asociación sugerente de 5 × 10 −6.


SM diseñó el estudio. SM, HN y DI supervisaron el estudio. TVH, JDB, HN, DH y SM realizaron la prueba de campo y generaron datos. Datos analizados por DFC, SDM, JA, HS, DH y SM. SM, DFC y SDM escribieron el manuscrito con aportes de los otros autores.

Los autores agradecen a Alex de Vliegher y a su equipo del Flanders Research Institute for Agriculture, Fisheries and Food (ILVO) por la gestión de ensayos de campo, a los miembros de varios laboratorios del VIB-UGent Center for Plant Systems Biology por su asistencia con la cosecha, Karl Kremling para asesoramiento sobre el análisis de los datos del panel de diversidad, Ethalinda Cannon por facilitar en gran medida la recuperación de datos de MaizeGDB, y tres revisores anónimos por comentarios muy útiles. El financiamiento para la generación de datos de RNA-seq y metabolómica y el financiamiento para el trabajo de DH y TVH fueron proporcionados por Syngenta Crop Protection, LLC. SDM es miembro de la Research Foundation-Flanders (FWO, beca 1146319N).


Jeroen van Rooij y Pooja R. Mandaviya contribuyeron igualmente como primeros autores.

Peter A. C. ’t Hoen, Bas Heijmans y Joyce B. J. van Meurs contribuyeron igualmente como los últimos autores.

Afiliaciones

Departamento de Medicina Interna, Centro Médico Erasmus, Rotterdam, Países Bajos

Jeroen van Rooij, Pooja R. Mandaviya y Joyce B. J. van Meurs

Centro de Biología de Sistemas de Maastricht (MaCSBio), Universidad de Maastricht, Maastricht, Países Bajos

Facultad de Ciencias Médicas, Universidad de Groningen, Groningen, Países Bajos

The Generation R Study Group, Departamento de Epidemiología, Centro Médico Erasmus, Rotterdam, Países Bajos

The Generation R Study Group, Departamento de Pediatría, Centro Médico Erasmus, Rotterdam, Países Bajos

Departamento de Psicología Biológica, Vrije Universiteit Amsterdam, Amsterdam, Países Bajos

Departamento de Psiquiatría, Centro Médico de la Universidad VU, Ámsterdam, Países Bajos

Departamento de Genética, Universidad de Groningen, Groningen, Países Bajos

Departamento de Genética Humana, Centro Médico de la Universidad de Leiden, Leiden, Países Bajos

Centro de Informática Molecular y Biomolecular, Radboud Institute for Molecular Life Sciences, Radboud University Medical Center Nijmegen, Nijmegen, Países Bajos

Epidemiología Molecular, Departamento de Ciencias de Datos Biomédicos, Centro Médico de la Universidad de Leiden, Leiden, Países Bajos


Resultados

Análisis de asociación de todo el genoma

Para detectar nuevos loci que confieren susceptibilidad a la infección persistente por VHB, llevamos a cabo un GWAS en dos etapas (Fig. 1 complementaria). En la etapa de descubrimiento de GWAS, utilizamos genotipos de 12.027 individuos mediante varias plataformas de genotipado que proporcionan una cobertura de todo el genoma (Tabla 1 y nota complementaria) 12,13,14,15. Con el plasma / suero disponible de estos sujetos, determinamos quiénes de ellos eran IP (casos) o SR (controles) mediante el cribado del antígeno de superficie de la hepatitis B (HBsAg) y anticuerpos contra el HBsAg (anti-HBs) y el antígeno del núcleo de la hepatitis B (anti-HBc). En total, 1.251 casos y 1.057 controles estuvieron involucrados en la etapa de GWAS, todos de ascendencia china reclutados en las provincias de Guangxi, Guangdong y Jiangsu, respectivamente (Tabla 1, Tabla complementaria 1a y Nota complementaria). En la etapa de replicación, se incluyeron cuatro conjuntos de muestras independientes de ascendencia china que fueron reclutados en las provincias de Jiangsu, Guangxi, Guangdong y Beijing, respectivamente (Nota complementaria). Con los mismos criterios de inclusión y exclusión de la muestra que los utilizados en la etapa de descubrimiento GWAS, la etapa de replicación consistió en su totalidad en 3.905 casos y 3.356 controles (Tabla 1 y Tabla complementaria 1a) 16,17.

Para extender la cobertura a la región genómica en la etapa GWAS, usamos genotipos de SNP autosómicos que pasaron estrictos controles de calidad para imputar genotipos de SNP en los cromosomas para todos los sujetos (sección de Métodos y Tabla complementaria 2). Realizamos tres rondas de imputación utilizando los datos de la fase II del proyecto HapMap, la fase III del proyecto HapMap y el Proyecto 1000 Genomas como referencias, respectivamente, y generamos genotipos de 2.177.782, 1.059.015 y 4.494.311 SNP, respectivamente (Tabla complementaria 3). Para evaluar la precisión del genotipado y la imputación, volvimos a secuenciar una región genómica de ∼ 127-Kb en 1p36.22 en 274 sujetos seleccionados al azar de la etapa GWAS (nota complementaria). En estos individuos se observó una excelente concordancia entre el genotipado y la secuenciación de la matriz (98,6% PAG& lt2.2 × 10 −16, Tabla complementaria 4 de la prueba Kappa). También se observó una alta consistencia entre la imputación y la secuenciación (correlación de Pearson r=0.94, PAG& lt2.2 × 10 −16 Fig.2a complementaria). Además, notamos que los SNP con alta calidad de imputación (imputación r 2 & gt0.8) mostraron una mayor consistencia entre la imputación y la secuenciación que aquellos con baja calidad de imputación (correlación de Pearson r= 0,95 y 0,86, respectivamente Fig. Complementaria 2b, c).

Habiendo demostrado la validez de los datos de imputación y genotipado de matrices en la etapa GWAS, luego llevamos a cabo análisis de asociación genotipo-fenotipo utilizando números de alelos no enteros en el modelo de regresión logística, con ajuste por edad, sexo y corrección basada en componentes principales para la estratificación de la población. (Sección de métodos y Fig. 3 complementaria). Un gráfico de cuantiles-cuantiles mostró una buena coincidencia entre las distribuciones de observadas PAG valores y los esperados por azar (factor de inflación λ= 1.05 Fig. 4 complementaria), que indica una inflación general mínima de los resultados estadísticos de todo el genoma.

Se replicaron varios SNP informados anteriormente

Los GWAS recientes han identificado una serie de SNP que se asociaron significativamente con el riesgo de infección persistente por VHB. En este estudio, confirmamos los efectos genéticos de HLA-DP (índice rs9277535, PAG= 3.8 × 10 −6 y rs3077, PAG=2.3 × 10 −3 ), HLA-DQ (rs2856718, PAG= 1.8 × 10 −3 y rs7453920, PAG=5.5 × 10 −6 ), CFB (rs12614, PAG= 4.0 × 10 −3) y CD40 (rs1883832, PAG= 6,9 × 10 −3) (Tabla complementaria 5), ​​que se han identificado en GWAS anteriores (refs 6, 7, 10). Sin embargo, otros cuatro SNP (rs652888, rs1419881, rs3130542 y rs4821116) en o cerca EHMT2, TCF19, HLA-C y UBE2L3 loci 8,9 no se pudo replicar en este estudio (todos PAG& gt0.05 Tabla complementaria 5). Es poco probable que estos resultados sean causados ​​por el error de imputación, ya que estos cuatro SNP fueron genotipados directamente o imputados con alta calidad de imputación (imputación r 2 & GT0,96). También revisamos los estudios de asociación basados ​​en genes candidatos previos de la infección persistente por VHB. Además de los SNP en HLA-DP y HLA-DQ, los SNP en el gen microARN MIR219A1 en 6p21.32 (ref.18) también se replicaron (PAG= 2.6 × 10 −6 y 1.3 × 10 −6 para rs421446 y rs107822, respectivamente Tabla complementaria 6). Sin embargo, los otros SNP informados anteriormente no mostraron asociaciones consistentes en este estudio (Tabla complementaria 6). Estas asociaciones inconsistentes entre nuestro estudio y los estudios anteriores pueden deberse al diseño diferente del estudio o la diversidad racial.

Para explorar más a fondo las asociaciones entre los HLA alelos clásicos e infección persistente por VHB, realizamos HLA genotipado de alelos en silico sobre la base de los genotipos de SNP conocidos (nota complementaria) utilizando el paquete R HIBAG (ref. 19). Cuatro alelos previamente identificados (HLA-DPB1 * 201, HLA-DQA1 * 301, HLA-DQB * 301 y HLA-DQB * 302) fueron replicados en el presente estudio (todos PAG& lt5 × 10 −3 Tabla complementaria 7) (ref. 9). Además, identificamos recientemente el alelo HLA-DPB1 * 501 (PAG= 4.0 × 10 −4), que estaba en desequilibrio de ligamiento moderado (LD) con los SNP previamente identificados rs3077 (r 2 = 0,30) y rs9277535 (r 2 = 0,56) (Tabla complementaria 7).

Los GWAS recientes también han identificado varios SNP que están asociados con fenotipos hepáticos relacionados con el VHB. Entre esos SNP, varios en HLA-DP y HLA-DQ que se asociaron significativamente con la respuesta a la vacuna contra la hepatitis B o el CHC relacionado con el VHB también mostraron asociaciones sugerentes con la infección persistente por el VHB (Tabla complementaria 8), lo que refleja los factores de riesgo genéticos compartidos entre los fenotipos relacionados con el VHB. Sin embargo, todos los demás SNP no mostraron asociaciones con la infección persistente por VHB en nuestros datos de GWAS (Tabla complementaria 8), lo que sugiere que los mecanismos moleculares entre estos fenotipos son en gran medida diferentes.

Se identificó un nuevo locus de susceptibilidad en 8p21.3

Además de los SNP informados anteriormente en HLA-DP, HLA-DQ y MIR219A1, setenta y dos loci mostraron asociaciones significativas con PAG≤1 × 10 −4 en la etapa de descubrimiento GWAS en este estudio. Luego, seleccionamos todas estas 72 señales principales para la replicación (sección de Métodos de datos suplementarios 1 y Tabla 9 complementaria) en un conjunto de muestra independiente (etapa de replicación 1, población de Jiangsu). De estos 72 SNP probados, 6 SNP mostraron asociaciones significativas en la misma dirección que se observó en la etapa GWAS (Datos suplementarios 1). Estos 6 SNP se genotiparon aún más en otro conjunto de muestras (etapa de replicación 2, población de Guangxi), y solo se replicaron rs7000921 en 8p21.3 (Datos suplementarios 1). De manera consistente, rs7000921 mostró evidencia de asociación en la etapa de replicación 3 (población de Guangdong) y la etapa 4 (Datos suplementarios de población de Beijing 1). En los análisis combinados, rs7000921 (odds ratio (OR) = 0,78, PAGmeta= 3,2 × 10-12) alcanzaron significación en todo el genoma para la asociación con la infección persistente por VHB (Fig. 1a, Tabla 2 y Fig. 5 complementaria). No se observó evidencia de heterogeneidad para los valores de OR de rs7000921 entre todos estos conjuntos de muestras (PAGheterogeneidad= 0,29 Tabla 2).

(a) Los resultados de la asociación genética se mostraron para los SNP en la región 1-Mb hacia arriba o hacia abajo del índice SNP rs7000921. Las posiciones genómicas se basan en NCBI Build 36. En el metanálisis, el PAG El valor de rs7000921 se muestra como diamantes púrpuras, con su inicial PAG valor en la etapa GWAS mostrado como puntos morados. Los valores LD (r 2) a rs7000921 para los otros SNP se indican mediante el color del marcador. Rojo significa r 2 ≥0,8, naranja 0,6≤r 2 & lt0.8, verde 0.4≤r 2 & lt0.6, azul claro 0.2≤r 2 & lt0.4 y azul r 2 & lt0.2. Las tasas de recombinación estimadas (de la fase II del proyecto HapMap) se representan en azul claro. Los genes dentro de la región que rodea a rs7000921 están anotados, y las posiciones de las transcripciones se muestran mediante flechas. (B,C) Los niveles de expresión de ARNm de genes cercanos en sujetos con diferentes genotipos rs7000921 (CC, Connecticut y TT) fueron mostrados. Los niveles de expresión de ARNm se transformaron en log2. Los niveles de expresión de cada gen se normalizaron al nivel medio de homocigotos para el alelo principal de rs7000921 (TT genotipo) en 31 (B) o 88 (C) muestras de tejido hepático humano. Entre las 31 muestras de hígado, una muestra no pudo ser genotipada para el rs7000921, por lo que los análisis solo se restringieron en las 30 muestras restantes. Entre las 88 muestras de hígado, tres sujetos se consideraron valores atípicos (sus niveles de ARNm de INTS10& gtmean + 3 s.d. o & ltmean -3 s.d.), por lo que los análisis se restringieron en las 85 muestras restantes. PAG los valores se derivaron de análisis de regresión lineal y se consideraron significativos cuando estaban por debajo de 0,05 después de la corrección de Bonferroni multiplicando el número de comparaciones. Las barras de error indican un s.e.m.

Además, investigamos el efecto de rs7000921 sobre la infección persistente por VHB mediante la estratificación por sexo y edad. En las muestras combinadas de casos y controles, no encontramos una variación apreciable de los efectos entre los subgrupos estratificados por edad o sexo para rs7000921 (PAGheterogeneidad=0.088 and 0.26, respectively Supplementary Table 10). The interaction effects between rs7000921 and viral factors (for example, HBV genotypes and mutations, and viral load) were not assessed because these data were not fully available in our samples. Therefore, the possibility that the association signals detected by rs7000921 reflect some other aspects of disease biology related to persistent HBV infection risk cannot be completely ruled out.

INTS10 was identified as the causative gene at 8p21.3

The SNP rs7000921 is located at intergenic region on chromosome 8p21.3. Six genes (CSGALNACT1, INST10, LPL, SLC18A1, ATP6V1B2 y LZTS1) are located within 1 Mb from this SNP (Fig. 1a). To identify potentially causative gene(s) at 8p21.3, we performed eQTL analyses based on liver tissues from 31 patients with persistent HBV infection (Methods section). We found that the protective minor allele C of rs7000921 was significantly associated with elevated transcript levels of INST10 (PAG=6.8 × 10 −3 Fig. 1b and Supplementary Data 2). This liver eQTL finding was then replicated in an independent sample set of 88 human liver tissues (PAG=3.1 × 10 −3 Fig. 1c, Supplementary Data 2 and Methods section) 20,21 . In these two sample sets, the expression of INST10 in protective allele carriers (TC o CC of rs7000921) showing 22–31% elevation compared with that in risk allele carriers (TT Fig. 1b,c). The associations remained significant even after Bonferroni correction for multiple comparisons. When these two sample sets were pooled together, we achieved a more significant eQTL signal (Fisher’s combined PAG=2.5 × 10 −4 ). No significant eQTL signals were found between the rs7000921 and the other five genes at 8p21.3. Taken together, these results suggest a potential role for INTS10 in persistent HBV infection. However, the allele-specific changes of INST10 expression in liver tissues were not seen in lymphocytes of HapMap populations, suggesting that the underlying regulatory mechanism is tissue-specific.

To investigate candidate causative variants, we performed functional annotation for the genetic variants that are tagged by the index SNP rs7000921 (r 2 >0.7) on the basis of publically available data sets or tools (Supplementary Note and Supplementary Table 11). All the SNPs highly correlated with rs7000921 are located at intergenic regions, of which rs11991803 (r 2 =0.739) and rs4922214 (r 2 =0.729) are in conserved regions predicted to have high regulatory potential scores (Supplementary Table 11). The eQTL analyses of rs11991803 and rs4922214 showed genotype-specific expression of INST10, similar to the results of rs7000921 (Supplementary Fig. 6). We further checked the data from the Encyclopedia of DNA Elements (ENCODE) database, and found that the rs11991803 was within a transcriptional repressor CCCTC-binding factor–binding site detected in multiple cell types including the human hepatoma cell line HepG2, suggesting that this variant might be involved in gene regulation (Supplementary Fig. 7). Taken together, these observations suggest that the causative variants at 8p21.3 may have long-range action in the regulation of INTS10 expression in certain cell types and merit further investigation in the future.

INTS10 suppresses HBV replication

INTS10 is a subunit of the integrator complex, which can interact with RNA polymerase II to mediate 3′ end processing of small nuclear RNAs U1 and U2, the core components of spliceosome 22,23,24 . In addition, the integrator complex mediates transcriptional initiation, pause release and transcriptional termination at diverse classes of gene targets, including host small nuclear RNAs and coding genes and viral microRNAs 25,26,27 . INTS10 is expressed in a wide range of tissue types including in liver tissues, according to the RNA-Seq Atlas database 28 . However, the specific roles of INTS10 in diseases, for example, in persistent HBV infection, remain unclear.

To investigate whether the INTS10 plays a role on HBV replication, we used in vitro cell culture assay systems. The immortalized human hepatocyte cell line L02 was transfected with pAAV-HBV1.2 vectors, together with either pLV-EGFP-INTS10 or pLV-EGFP control vectors (Fig. 2a). Compared with the cells expressing control vectors, the significantly decreased levels of HBV markers, including replicative intermediates of HBV DNAs, HBV RNAs, HBsAg and hepatitis B e antigen (HBeAg), were observed in cells stably expressing exogenous INTS10 (all PAG<0.01 Fig. 2b–e and Supplementary Table 12). Consistent with these findings, knockdown by two independent siRNAs targeting INTS10 led to significantly elevated levels of HBV DNAs, HBV RNAs, HBsAg and HBeAg (all PAG<0.05 Fig. 2a,f–i). The antiviral activity of INTS10 against HBV is not limited to the L02 cells. INTS10 can also efficiently reduce the HBV markers in human hepatoma cell line HepG2.2.15 which constitutively produces HBV (Fig. 2j–r), and in human hepatoma cell line HepG2 which was co-transfected with the pAAV-HBV1.2 vectors (Supplementary Fig. 8). Taken together, these results suggest that INST10 plays a role in suppressing HBV replication in vitro.

(a) Protein levels of INTS10 in cellular lysates of L02 cells. L02 cells ( ∼ 2 × 10 5 ) were transfected with pAAV-HBV1.2 vectors, together with pLV-EGFP-INTS10 vector (INTS10) or pLV-EGFP control vector(Vector) (up) or with INTS10-specific siRNAs (Si-INTS10#1 and Si-INTS10#2) or non-targeting scrambled siRNA (Si-Ctrl) (down). (B,C) Levels of HBV DNAs (B), 3.5 Kb pregenomic RNAs (pgRNAs) and 2.4/2.1 Kb Pre-S/S RNAs (C) in L02 cells with INTS10 overexpression. (D,mi) Levels of HBsAg (D) and HBeAg (mi) in supernatants of L02 cells with INTS10 overexpression. (F,gramo) Levels of HBV DNAs (F), pgRNAs and Pre-S/S RNAs (gramo) in L02 cells with INTS10 knockdown. (h,I) Levels of HBsAg (h) and HBeAg (I) in supernatants of L02 cells with INTS10 knockdown. (j) Protein levels of INTS10 in cellular lysates of HepG2.2.15 cells. HepG2.2.15 cells ( ∼ 2 × 10 5 ) were transfected with INTS10 or control vectors (up), or with INTS10-specific or control siRNAs(down). (k,l) Levels of HBV DNAs (k), pgRNAs and Pre-S/S RNAs (l) in HepG2.2.15 cells with INTS10 overexpression. (metro,norte) Levels of HBsAg (metro) and HBeAg (norte) in supernatants of HepG2.2.15 cells with INTS10 overexpression. (o,pag) Levels of HBV DNAs (o), pgRNAs and Pre-S/S RNAs (pag) in HepG2.2.15 cells with INTS10 knockdown. (q,r) Levels of HBsAg (q) and HBeAg (r) in supernatants of HepG2.2.15 cells with INTS10 knockdown. All the supernatants and cells were collected 72 h post-transfection. Protein levels of INTS10 were examined by western blot analyses. HBV DNA levels in cells were measured by Southern blot analysis (left) and quantitative real-time PCR (qRT-PCR right). The pgRNAs and Pre-S/S RNAs of HBV in cells were measured by northern blot analysis with 18S ribosome RNA (rRNA) indicating RNA loading in each lane (left), and qRT-PCR normalized to human β-actin gene ACTB (Derecha). The levels of HBsAg and HBeAg in supernatants were measured by enzyme-linked immunosorbent assays (ELISA). Error bars indicate s.d. PAG values were determined using two-tailed unpaired t-prueba. *PAG& lt0.05, **PAG<0.01 and ***PAG& lt0.001. rcDNA, relaxed circular DNA dsDNA, double-stranded DNA ssDNA, single-stranded DNA.

INTS10 suppresses HBV replication via IRF3-dependent manner

We then sought to explore the underlying mechanisms by which INTS10 suppresses HBV replication by analysing mRNA expression profiles of liver tissues from 31 HBV carriers (Supplementary Note). Comparing samples with high INTS10 expression to samples with low INTS10 expression, we identified 402 differentially expressed genes (false discovery rate Q value<0.01 and fold change>1.2 Supplementary Data 3a) in determining biological pathways that are altered after INTS10 dysregulation. Intriguingly, we observed significant enrichment and activation of the spliceosome (PAGnominal=1.5 × 10 −5 , ranks the first) and the retinoic acid-inducible gene-I-like receptor (RLR) signalling pathway (PAGnominal=1.8 × 10 −3 , ranks the second Supplementary Data 3b) in samples with high INTS10 expresión. Given the important roles of integrator complex in spliceosome, the enrichment of term spliceosome may reflect the intrinsic physiologic function of INTS10. Notably, however, the RLR members such as retinoic acid-inducible gene-I (RIG-I) and melanoma differentiation-associated gene 5 (MDA5) have been shown to sense the HBV and activate innate immune signalling in hepatocytes to suppress virus replication 29,30,31 . To determine whether the RLR signalling pathway was regulated by INTS10 in other independent samples, we performed similar analyses in two data sets from the Gene Expression Omnibus (GEO) database (accession number GSE25097 and GSE22058), which contain 289 and 96 liver tissues, respectively (Supplementary Data 3c,d). Again, the term spliceosome ranked the first in both data sets (PAGnominal=1.0 × 10 −8 and 2.6 × 10 −3 , respectively), and the RLR-related pathway ranked the third (PAGnominal=2.6 × 10 −2 ) and ninth (PAGnominal=0.20), respectively (Supplementary Data 3b). Taken together, these results suggest that INST10 may be involved in inhibition of HBV replication through the RLR pathway.

Binding of RLRs to virus-derived nucleic acids activates the downstream signalling pathways in a manner dependent on the adaptor protein mitochondrial antiviral signalling protein (also known as IPS-1, VISA or Cardif), leading to the activation of the IRF3 and NF-κB and the subsequent production of type I interferons (IFNs, including IFN-α and IFN-β) and type III IFNs (that is, IFN-λ, including IFNL1 (also known as IL29), IFNL2 (IL28A) and IFNL3 (IL28B)) and inflammatory cytokines 32 . Thus, we examined whether the HepG2.2.15 cells transfected with the INTS10 expression plasmid could activate the IRF3 and NF-κB. We found that overexpression of INTS10 could increase IRF3 phosphorylation (p-IRF3), whereas the NF-κB could not be activated (Fig. 3a). Consistent with these findings, knockdown of INTS10 by siRNAs led to significantly decreased levels of p-IRF3, whereas not influencing the activity of NF-κB (Fig. 3b). Furthermore, we found that overexpression of INTS10 could potently activate IFN-stimulated response element (ISRE) in reporter assays (PAG<0.01 Fig. 3c) and elevate mRNA levels of type III IFNs (IFNL1 y IFNL2/3 PAG<0.05 Fig. 3d and Supplementary Table 12), but not influence the type I IFNs. Consistent with these findings, knockdown of INTS10 significantly reduced the activity of ISRE reporter and mRNA levels of IFNLN1 y IFNLN2/3 (Fig. 3e,f). To ensure that these observations could be applied to other types of hepatocytes, we then did the same experiments in L02 and HepG2 cells co-transfected with HBV1.2 vectors and obtained identical results (Supplementary Figs 9 and 10). Next, we investigated whether the IRF3 pathway is required for the INTS10-elicited immunity against HBV infection. Indeed, we found that the activation of ISRE reporter, elevation of mRNA levels of type III IFNs and the reduction of HBV markers by enforced INTS10 expression were weakened when cells were transfected with siRNAs targeting IRF3 (Fig. 3g–m and Supplementary Fig. 11). Accordingly, in the liver tissues of patients persistently infected with HBV, we observed that the protein levels of INTS10 were positively correlated with those of p-IRF3 (ρ=0.38, PAG=0.015), but not p-p65 (Fig. 4a–c and Supplementary Table 13). Taken together, these results suggest that INTS10 suppresses HBV replication in an IRF3-dependent manner.

(a,B) Levels of phosphorylated (p-) or total proteins in lysates of HepG2.2.15 cells measured by western blot analyses, with GAPDH or Tubulin indicating protein loading in each lane. The cells were transfected with pLV-EGFP-INTS10 vector (INTS10) or pLV-EGFP control vector (Vector) (a), or with INTS10-specific siRNAs (Si-INTS10#1 and Si-INTS10#2) or non-targeting scrambled siRNA controls (Si-Ctrl) (B). (C) Luciferase activity of ISRE reporter plasmids 48 h after co-transfection into cells with INTS10 or control vectors. RLU, relative luciferase units. (D) The mRNA levels of IFNL1 y IFNL2/3 measured by quantitative real-time PCR (qRT-PCR) normalized to human β-actin gene ACTB in cells transfected with INTS10 or control vectors. (mi) Luciferase activity of ISRE reporter plasmids 48 h after co-transfection into cells with INTS10-specific or control siRNAs. (F) The mRNA levels of IFNL1 y IFNL2/3 measured by qRT-PCR normalized to ACTB in cells transfected INTS10-specific or control siRNAs. (gramo) Luciferase activity of ISRE reporter plasmids 48 h after co-transfection into cells with INTS10 or control vectors and an IRF3-specific siRNA (Si-IRF3#1) or non-targeting scrambled siRNA controls (Si-Ctrl). (h) Levels of INTS10 and IRF3 measured by western blot analyses, with GAPDH indicating protein loading in each lane. (I) The mRNA levels of IFNL1 (izquierda) y IFNL2/3 (right) measured by qRT-PCR normalized to ACTB in cells co-transfected with INTS10 or control vectors and IRF3-specific or control siRNAs. (j,k) Levels of HBV DNAs (j), 3.5 Kb pregenomic RNAs (pgRNAs) and 2.4/2.1 Kb Pre-S/S RNAs (k) in cells co-transfected with INTS10 or control vectors andIRF3-specific or control siRNAs measured by qRT-PCR normalized to ACTB. (l,metro) Levels of HBsAg (l) and HBeAg (metro) in supernatants of cells co-transfected with INTS10 or control vectors and IRF3-specific or control siRNAs measured by enzyme-linked immunosorbent assays (ELISA). All histograms show mean values from three independent experiments error bars indicate s.d. PAG values were determined using two-tailed unpaired t-prueba. *PAG& lt0.05, **PAG<0.01 and ***PAG& lt0.001.

(a) Representative images from the liver tissues by immunohistochemistry staining are shown for INTS10, p-p65 and p-IRF3, respectively. The scale bar represents 50 μm. (B,C) The correlation of protein levels between INTS10 and p-IRF3 (B), or between INTS10 and p-p65 (C). Protein levels of INTS10, p-p65 and p-IRF3 were measured in the non-tumour liver tissues of patients with HBV-related HCC by immunohistochemistry staining (norte=40). The size of the circle is proportional to the number of samples. A Spearman’s test was used, and the correlation coefficiency (ρ) and the two-tailed PAG values are shown. (D) The concentration of the plasma INTS10 in persistently HBV infected subjects (PIs) and spontaneously recovered subjects (SRs). The plasma INTS10 levels were measured by enzyme-linked immunosorbent assays (ELISA) in 216 PIs and 80 SRs. Horizontal bars indicate the mean value of each subset. The significance was calculated using two-tailed unpaired t prueba. (mi) Correlation between the plasma INTS10 and HBV DNA load in PIs with positive HBeAg (left) and PIs with negative HBeAg (right). The plasma INTS10 and HBV DNA load were log10 transformed. The correlation coefficiency (r) and the two-tailed PAG values were then evaluated by Pearson’s test. PAG values were considered to be significant when below 0.05.

INTS10 correlates with the persistence of HBV infection

To further validate the roles of INTS10 in facilitating HBV clearance, we investigated the plasma INTS10 from subjects persistently infected HBV or those spontaneously recovered from HBV infection. Consistent with the eQTL result in liver tissues, we observed elevated INTS10 protein levels in the plasma of rs7000921 C allele carriers (PAG=0.020, unpaired t-test Supplementary Fig. 12). Furthermore, the levels of plasma INTS10 in 216 PIs were significantly lower than those in 80 SRs (PAG=2.0 × 10 −19 , fold change=2.0 Fig. 4d and Supplementary Table 1b). In addition, we found significantly negative correlation between the INTS10 levels and HBV DNA load in the plasma of PIs with positive HBeAg (Pearson correlation coefficient r=−0.41, PAG=2.5 × 10 −3 ) and those with negative HBeAg (r=−0.17, PAG=0.028 Fig. 4e). Taken together, these results further support our genetic and functional findings, indicating that insufficiency of INTS10 may contribute to the persistence of HBV infection.


Fondos

The National Institutes of Health (grant numbers R01 EB022574, R01 LM011360, U01 AG024904, R01 AG19771, P30 AG10133, R01 CA129769, UL1 TR001108 and K01 AG049050) Department of Defense (grant numbers W81XWH-14-2-0151, W81XWH-13-1-0259 and W81XWH-12-2-0012) and National Collegiate Athletic Association (grant number 14132004), as well as by the Indiana University Network Science Institute (IUNI), the Alzheimer’s Association, the Indiana Clinical and Translational Science Institute and the Indiana University/IU Health Strategic Neuroscience Research Initiative (in part).

Jingwen Yan is an assistant professor in the Department of BioHealth Informatics, School of Informatics and Computing, Indiana University Purdue University Indianapolis, USA.

Shannon L. Risacher is an assistant professor in the Department of Radiology and Imaging Sciences, Indiana University School of Medicine, USA.

Li Shen is an associate professor in the Department of Radiology and Imaging Sciences, Indiana University School of Medicine, USA.

Andrew J. Saykin is a professor in the Department of Radiology and Imaging Sciences, Indiana University School of Medicine, USA.


Ver el vídeo: Capítulo 7- Qué son los GWAS? (Agosto 2022).