Cómo encontrar vías basadas en los resultados del análisis de secuenciación de genes
Figura 1 Evaluación de la longitud de lectura, precisión y continuidad del genoma de diferentes tecnologías de secuenciación
Principios de la tecnología de secuenciación de tercera generación
Principios de secuenciación PacBio
Adopte el método de secuenciación durante la síntesis, usando una cadena de ADN como plantilla, usando ADN polimerasa para sintetizar la otra cadena, y la señal de fluorescencia se convierte aún más en una señal de base. Al mismo tiempo, PacBio actualizó el modo de secuenciación CCS para obtener lecturas de alta fidelidad (HiFi) de 15 kb con una longitud de lectura larga, mejorando así la precisión del ensamblaje del genoma.
Figura 2 Principio de secuenciación PacBio de tercera generación
Principio de secuenciación de nanoporos
Cuando una molécula de ADN monocatenario pasa a través del nanoporo, cada nucleótido obtendrá una señal de corriente diferente. Los cambios en la corriente iónica en cada pocillo se registran y se convierten en secuencias básicas basadas en modelos de Markov o redes neuronales recurrentes. Además, las lecturas ultralargas (ULR) son otra característica importante de la plataforma ONT y tienen el potencial de facilitar el ensamblaje de genomas grandes.
Contenido de análisis de información
¿Alemania? Contenido de investigación de Novo
Empalme de software múltiple del empalme del genoma y evaluación de los resultados del empalme
Predicción de genes y anotación de genes codificantes; anotación de secuencias repetitivas y clasificación de componentes transponibles; ; anotación de pseudogenes, etc.
Evaluación efectiva de datos del ensamblaje del genoma asistido por Hi-C; análisis de agrupación, clasificación y orientación de contig; evaluación de resultados de ubicación
Análisis de problemas biológicos
Investigación genómica comparativa
Agrupación de familias de genes;
Construcción de árboles filogenéticos;
Análisis de expansión y contracción de familias de genes;
Cálculo del tiempo de divergencia de especies;
Estimación del tiempo de formación de LTR;
Eventos de duplicación del genoma completo;
Análisis de presión selectiva
Específicos El análisis de problemas biológicos combina ómicas Métodos de investigación para realizar un análisis en profundidad de los problemas biológicos de una especie.
Análisis de conglomerados de la familia de genes de fresa
Análisis de eventos de duplicación del genoma completo de Coix
Análisis de contracción y expansión del árbol filogenético y de la familia de genes de pistacho.
Análisis lineal del subgenoma del algodón americano (upland)
Proceso de servicio técnico
Entrega de muestras
Construcción de base de datos y secuenciación
Análisis de datos
Publicación del informe
Preguntas y respuestas posventa
Ventajas del producto
La empresa fue fundada en 2009 y ha estado profundamente involucrados en el campo de la secuenciación del genoma durante 11 años. Llevamos mucho tiempo comprometidos a convertirnos en expertos en el ensamblaje preciso del genoma;
Tenemos las plataformas de secuenciación de tercera generación más populares del mundo (plataforma de secuenciación PacBio y secuenciación de nanoporos). plataforma), con ensamblaje de plataforma dual de decenas de miles de especies y rica experiencia en ensamblaje de genomas.
La biblioteca de tecnología de captura de conformación de cromatina Hi-C tiene una alta proporción de datos efectivos y la eficiencia de carga llega al 99%. Con una rica experiencia en el estudio de especies poliploides, los colegas que obtuvieron genomas a nivel de cromosomas combinados con el ensamblaje del genoma de tercera generación mejoraron aún más la calidad del ensamblaje del genoma.
Con su tecnología líder de análisis y secuenciación del genoma desarrollada de forma independiente, ha obtenido 23 patentes de invención y más de 150 derechos de autor de software central.
Ejemplos de experiencia de proyectos
Casos de términos de cooperación
Caso 1
Basado en el genoma A del algodón asiático actualizado, 243 muestras diploides de algodón Investigación sobre rasgos agronómicos importantes
¿Resecuenciación de 243 materiales de algodón diploides? Identificación de la base genética de rasgos agronómicos clave basados en genomas actualizados
Revista: Nature Genetics
Factor de impacto: 27,125
Unidad editorial: Instituto de Investigación del Algodón, Chino Academia de Ciencias Agrícolas, Beijing Baimeike Biotechnology Co., Ltd., etc.
Año de publicación: 2065438+mayo de 2008
Antecedentes de la investigación:
El algodón es un recurso valioso para estudiar la poliploidía de las plantas. Los antepasados del algodón asiático y del algodón herbáceo son los donantes del subgenoma del algodón alotetraploide moderno. Este estudio utilizó tecnologías PacBio y Hi-C de tercera generación para reensamblar el genoma del algodón asiático de alta calidad, analizar la estructura poblacional y las tendencias de diferenciación del genoma de 243 germoplasmas diploides de algodón e identificar algunos candidatos que pueden contribuir a la mejora genética de la fibra de algodón. rendimiento. loci genéticos.
Resultados de la investigación:
1. El ensamblaje del genoma de tercera generación del algodón asiático.
El ensamblaje del genoma del algodón asiático se combina con la secuenciación de tercera generación, Hi-. C * * * Se obtuvieron 142,54 Gb y se ensambló un genoma de algodón asiático de 1,71 Gb. El cóntig N50 = 1,1 Mb, y el cóntig más largo es de 12,37 Mb. Se utilizó tecnología Hi-C para asignar 1573 Mb de datos de ensamblaje a 13 cromosomas. En comparación con el genoma publicado, las inconsistencias fuera de la diagonal se redujeron significativamente cuando los datos de Hi-C se compararon con el genoma actualizado (Fig. 1a-b).
Figura 1 Comparación de datos HI-C entre dos versiones del genoma del algodón asiático
2 Análisis de la evolución genética de poblaciones diploides de algodón;
Comparación de 230. Se volvieron a secuenciar copias de algodón asiático y 13 muestras de algodoncillo. La comparación del genoma, el árbol filogenético, el análisis de la estructura poblacional, el PCA, el LD y el análisis de eliminación selectiva mostraron que el algodón asiático y el pasto algodonero (a) divergieron simultáneamente con Gossypium raimondii. El algodón asiático se originó en el sur de China y luego se extendió a las cuencas de los ríos Yangtze y Amarillo. La mayoría de las accesiones con rasgos relacionados con la domesticación experimentaron aislamiento geográfico (Fig. 2).
Figura 2 Análisis de la evolución poblacional y de la estructura poblacional del algodón diploide
3. Estudio de asociación de todo el genoma (GWAS) del algodón asiático:
Análisis completo de las poblaciones. de diferentes entornos Se llevó a cabo un estudio de asociación de todo el genoma de 11 rasgos importantes del algodón asiático y se identificaron 98 loci significativamente relacionados para 11 rasgos agronómicos importantes del algodón asiático. Las sustituciones sinónimas de GaKASIII (sustitución cisteína/arginina) conducen a la composición de ácidos grasos en la semilla de algodón (C16:0 y C16). Se descubrió que la resistencia al marchitamiento por fusarium del algodón está relacionada con la activación de la expresión del gen GaGSTF9. Se seleccionaron 158 materiales de algodón con pelusa y 57 sin pelusa del germoplasma de algodón asiático para el análisis de correlación GWAS, y se encontró información relacionada con el desarrollo de fibra y cabello epidérmico (Figura 3).
Evolución poblacional y análisis estructural del algodón diploide.
Conclusión de la investigación:
La recombinación del genoma del algodón asiático se completó mediante secuenciación de tercera generación + tecnología Hi-C, y el índice de ensamblaje del genoma aumentó de 72? El Kb aumentó a 1,1 Mb, sentando las bases para investigaciones posteriores sobre genética de poblaciones del algodón asiático. A través del análisis de correlación de la evolución genética de la población, se encontró que el algodón asiático y Gossypium gossypii (tipo A) y Raymond gossypium (tipo D) se diferenciaron al mismo tiempo, lo que demuestra que el algodón asiático se originó en el sur de China y fue introducido en el Yangtze y el Amarillo. Cuencas fluviales. Al integrar los métodos de análisis GWAS y QTL, se localizaron genes relacionados con el contenido de ácidos grasos, la resistencia a enfermedades y el crecimiento y desarrollo de la fibra del algodón asiático y se verificaron sus funciones relacionadas, promoviendo la mejora de rasgos agronómicos complejos del algodón asiático.
Caso 2,
El análisis comparativo del genoma de maní diploide, silvestre y tetraploide cultivado revela evolución asimétrica y mejora de los subgenomas.
¿Comparación de maní? ¿Genomas diploides y tetraploides cultivados? Revelando la evolución y mejora del subgenoma asimétrico del maní
Revista: Advanced Science
Factor de impacto: 15.804
Unidad editorial: Universidad Agrícola de Henan, Beijing Baimeike Biotechnology Ltd.
Año de publicación: 2019 11.
Antecedentes de la investigación:
Como cultivo económico importante en mi país, el maní es la base para proporcionar proteínas y aceites importantes. El género Arachis incluye 30 especies diploides, 1 Arachis silvestre alotetraploide (Arachis) y 1 Arachis cultivada (Arachis). Como importante donante de recursos silvestres para mejorar las características agronómicas del maní cultivado, el maní tetraploide silvestre siempre ha sido un punto de investigación para los académicos nacionales y extranjeros. Se estudió el genoma del maní, la única especie alotetraploide silvestre del género Arachis.