Semana 3: Identificación de fasiRNA de regiones de genes codificantes utilizando perfiles de ARN pequeños de soja
Puede ser más exacto entender que el sitio PHAS que produce el fasiRNA se superpone con la región del gen que codifica la proteína.
Invasión y eliminación
El ARN pequeño es un tipo de inhibidor multifuncional y ubicuo, que incluye (1) microARN (miARN), que se procesa a partir de la estructura de tallo-bucle formada por el ARNm; (2) ARN pequeño de interferencia (ARNip), a menudo derivado en plantas mediante un proceso que requiere ARN polimerasa dependiente de ARN. Construimos y analizamos un mapa de expresión de ARN pequeños de soja e identificamos más de 500 sitios que producen ARNip en fase de 21 nucleótidos (fasiARN; derivados de loci PHAS), 483 de los cuales se superponen con genes codificadores de proteínas anotados. Mediante el análisis de datos integrados de miARN y extremos de ARN (PARE), se detectaron 20 objetivos de miARN en 127 sitios PHAS. La categoría principal de sitios PHAS (208, 41%) correspondió a genes NB-LRR; un subconjunto de estos pequeños ARN se acumularon preferentemente en los nódulos de las raíces. En los sitios PHAS, también se observaron representantes novedosos y patrones de fase no clásicos de TAS3. Los loci PHAS no codificantes activados por miR4392 se acumulan preferentemente en las anteras; se predice que los fasiRNA se dirigen a elementos transponibles con máxima abundancia en el desarrollo reproductivo de la soja. Por tanto, los fasiRNA muestran una gran diversidad entre dicotiledóneas. Identificamos nuevos miARN y evaluamos la precisión de los miARN de soja registrados en miRBase, mejoramos significativamente la anotación de miARN de soja, facilitamos la mejora de las anotaciones de miRBase e identificamos nuevos miARN de alta rigurosidad y sus objetivos.
Qué hace el artículo:
Los pequeños ARN no codificantes desempeñan funciones importantes en el desarrollo, la diferenciación celular, la adaptación al estrés biótico y abiótico y la estabilidad del genoma. La principal actividad de los ARN pequeños es regular negativamente patrones de expresión genética o ARNm específicos mediante la degradación del objetivo, la represión traduccional o dirigiendo modificaciones de la cromatina. Hasta la fecha se han identificado varios tipos diferentes de ARN pequeños. En las plantas, los ARN pequeños más estudiados son los microARN (miARN) y los pequeños ARN de interferencia (ARNip), estos se producen a partir de diferentes precursores y por diferentes vías; Los miARN, normalmente de 21 a 22 nucleótidos de longitud, se derivan de largos precursores de ARN no codificantes transcritos a partir de genes MIARN mediante la ARN polimerasa II. El precursor de miARN forma una estructura de tallo-bucle que es procesada por DICER-LIKE1 (DCL1) u otras enzimas DCL (muy pocas) para producir un único dúplex de ARN pequeño (miARN/miARN*) con un saliente de dos nucleótidos en el extremo 3'. . Una hebra del pequeño dúplex de ARN es el miARN maduro, llamado hebra guía, que se une a la proteína Argonauta (AGO) para formar un complejo efector (el llamado complejo silenciador inducido por ARN - RISC), que produce degradación directa o traslacional. represión de objetivos de miARN. La otra hebra del dúplex, el miARN* o hebra pasajera, se degrada rápidamente y normalmente no se acumula. El ARNip generalmente se deriva de precursores de ARN bicatenario largo (ARNds) totalmente complementarios, que generalmente se forman mediante ARN polimerasa dependiente de ARN (RDR) o pueden formarse a partir de transcripciones sentido/antisentido hibridadas. Se han definido varias clases de ARNip en plantas, siendo la clase principal los ARNip heterocromáticos, que desempeñan un papel clave en el establecimiento y mantenimiento de la metilación de la citosina y las modificaciones represivas de las histonas. El ARNip también puede actuar como una señal móvil, permitiendo que los efectos silenciadores se propaguen de células a otras células o a distancias más largas mediante el movimiento del ARNip.
Los científicos han identificado una clase bastante interesante de ARNip, que son productos de la escisión gradual de precursores de ARN bicatenario largos en incrementos de 21 nucleótidos, produciendo ARN pequeños en fases o completamente espaciados.
Estos ARNip, denominados ARNip alineados en fase (phasiRNA), se generan mediante escisión de miARN guía específica, siguiendo un patrón de clic simple o doble, correspondiente al sitio objetivo de un miARN de 22 nt o dos miARN de 21 nt, respectivamente. El producto de ARNm escindido y sin tapar sirve como sustrato para RDR6, produciendo un precursor de ARNbc, que luego es escindido por DCL4 para producir un ARNip en fase de 21 nucleótidos. Se ha demostrado que algunos ARNip en fase desempeñan un papel en la transregulación de genes diana, por lo tanto, esta clase de ARNip se llamó inicialmente tasiRNA, pero muchos más loci de genes producen el mismo patrón de fase con ARNip de transacciones desconocidas (locus PHAS). por lo que generalmente se describe como "fasiARN". tasiRNA regula el mRNA escindiendo sitios objetivo complementarios, al igual que muchos miRNA de plantas. El tasiRNA más conocido es una colección de factores de respuesta de ARN-auxina de interferencia transpequeños (tasiARF) producidos por el TRANS-ACTING SIRNA GENE3 (TAS3). tasiARF funciona reprimiendo genes del factor de respuesta a auxina (ARF2, ARF3/ETTIN y ARF4). Se han identificado muchos phasiRNA en muchas especies de plantas, incluidas Arabidopsis thaliana, arroz (Oryza sativa) y uva (Vitis vinifera). El número de loci PHAS conocidos varía ampliamente entre especies, desde más de 800 en el arroz silvestre (Oryza rufipogon) hasta menos de 30 en Arabidopsis thaliana. Entre las leguminosas, se identificaron 114 y 41 loci PHAS en Medicago truncatula y soja (Glycine max), respectivamente.
La soja es la legumbre de mayor importancia económica en el mundo y es una de las principales fuentes de proteínas y aceite comestible. La secuencia del genoma de la soja ya está disponible públicamente. La secuencia del genoma, junto con los datos generados por tecnologías de secuenciación de próxima generación, permite la identificación y cuantificación de ARN pequeños a escala de todo el genoma. Hasta la fecha, se han identificado cientos de miARN en la soja. Sin embargo, muchos miARN recientemente anotados y sus objetivos no han sido bien validados, e incluso los miARN anotados a menudo se corrigen después de datos experimentales más potentes. Los loci PHAS están peor anotados que los miARN. En comparación con Medicago truncatula, se han identificado muchos menos loci PHAS en la soja. Con datos extensos de ARN pequeños y una mayor profundidad de secuenciación, se pueden descubrir más PHAS. En este estudio, analizamos una gran cantidad de pequeñas bibliotecas de ARN creadas a partir de diferentes tejidos para construir perfiles de expresión de ARN pequeños e identificar de manera integral loci PHAS en la soja. Demostramos que muchos genes codificadores de proteínas en la soja son loci PHAS. Además de NB-LRR, previamente identificado como un locus PHAS de leguminosas, descubrimos cientos de otros genes codificadores de proteínas que producen fasiRNA. Integramos análisis paralelos de datos de extremos de ARN (PARE) para identificar desencadenantes de miARN para estos loci PHAS. A partir de estos datos, validamos los miARN de soja registrados en miRBase (versión 20) e identificamos nuevos miARN, lo que demuestra que muchos miARN informados anteriormente tienen características de siARN. Basándonos en el análisis de expresión, demostramos la expresión específica de fasiRNA, así como de miRNA conocidos y recientemente descubiertos, en diferentes tejidos y bajo diferentes tratamientos.
Resumen
La atención se centra en el diagrama de flujo y las condiciones del filtro
Se exploraron las diferencias en el enriquecimiento de miARN en diferentes tejidos (o combinaciones de tejidos).
Figura 1. Perfiles de expresión de miRNAs novedosos y preferidos por tejidos.
(A) Los nuevos miARN identificados en este estudio incluyen muchos que están enriquecidos diferencialmente en tejidos u órganos específicos.
(B) El análisis de los miARN de soja descritos previamente también reveló una variedad de sesgos tisulares en flores, hojas y nódulos de raíces.
Figura 2. Gen PHAS que codifica la proteína.
El genoma de la soja contiene más loci productores de fasiRNA codificantes de proteínas que cualquier otro genoma vegetal estudiado.
(A) Categorías y números de loci que codifican PHAS.
(B) Perfil de expresión y agrupamiento jerárquico de genes PHAS en la familia NB-LRR.
(C) Distribución y agrupamiento de genes fasi-NB-LRR en el genoma de la soja.
Figura 3. Desencadenantes y mecanismo de procesamiento del TAS3 TasiRNA de soja.
(A) Patrones de enriquecimiento de tasiRNA de los seis loci TAS3 presentes en el genoma de la soja en tejidos de flores, hojas, nódulos de raíces y semillas. TAS3a y TAS3b son idénticos y, por tanto, no se pueden medir individualmente.
(B) TasiARF derivado de TAS3a/b/c/d/e/f. Los objetivos validados de todos los ARNip TAS3 598D () y 597D () están dentro de la familia del factor de respuesta a auxina (ARF), de acuerdo con sus secuencias relativamente bien conservadas (datos no mostrados).
(C) La presencia de dos o tres sitios objetivo de miR390 en el locus TAS3 de la soja y las direcciones de fase relativas a estos sitios objetivo indican que hay 21 nucleótidos en TAS3e y TAS3f. El miARN desencadena la no- dirección de procesamiento canónico de siRNA.
Figura 4. ARF3 PHAS-Locus activado por TasiARF.
(A) TasiARF derivado de TAS3 de soja se dirige a ARF3 en dos sitios idénticos, el sitio 59 donde se verificó la escisión mediante PARE (panel inferior) y el sitio 39 donde no se observó escisión. Esta actividad tasiARF de doble clic genera ARNip en fases (panel central). El eje y es la "puntuación" de fase, que es el valor P estimado para la importancia de la fase (ver Métodos). Las dos imágenes inferiores son nuestros navegadores web y muestran datos de ARN pequeños (en el medio) o PARE (abajo), con la línea discontinua naranja que indica el sitio de escisión de tasiARF. Las manchas de colores son ARN pequeños que muestran abundancia en el eje y; las manchas de color azul claro representan ARNs de 21 nucleótidos, el verde representa ARNs de 22 nucleótidos, el naranja representa ARNs de 24 nucleótidos y otros colores corresponden a otros tamaños de ARNs. Los cuadros rojos son exones anotados (los rosados son regiones no traducidas). La línea violeta indica la frecuencia k-mer de la región de repetición.
(B) Los datos del panel A indican una cascada de biogénesis de fasiARN de dos impactos en la que el miR390 de 21 nucleótidos (nt) desencadena la biogénesis de tasiARF de 21 nt y, a través de un mecanismo de dos impactos, tasiARF desencadena la generación de ARNip secundarios adicionales a partir de ARF3 y ARF4 (consulte la Figura 7 complementaria en línea). El ARNip de ARF puede actuar en cis o trans.
Figura 5. PhasiRNA altamente enriquecido en anteras derivadas del locus de arogenato deshidrogenasa.
(A) Vías bioquímicas que implican a la andrógeno deshidrogenasa.
(B) Proceso esquemático de producción de fasiRNA a partir de loci relacionados con la andrógeno deshidrogenasa. A la izquierda, el fragmento del gen que forma la horquilla se procesa en fasiARN.
(C) Lea los niveles de abundancia (barras rojas) y los niveles de expresión génica (barras verdes) de los activadores de miARN y fasiARN de dos genes PHAS de arogenato deshidrogenasa en diferentes tejidos, normalizados a RP5M y RP25M.
¿Cómo determinar si el ARNt, el ARNr, el ARNsn y el ARNsno coinciden?
Secuenciación de degradomas: /custom/LC_BIO/100427/index.htm