Red de conocimiento de abogados - Derecho de sociedades - En el empalme de secuencia, ¿por qué se dice que cuanto mayor sea el n50, mejor será el efecto de empalme?

En el empalme de secuencia, ¿por qué se dice que cuanto mayor sea el n50, mejor será el efecto de empalme?

Porque si n50 es mayor, significa que hay más lecturas que contienen más bases, es decir, hay muchas lecturas largas y, por supuesto, el efecto de empalme será mejor.

Por ejemplo, si el tamaño de un genoma es 1M, se obtienen varias lecturas mediante secuenciación y estas lecturas se empalman, si es que se pueden unir, la secuencia sin espacios en el medio. se llama contig, que significa continuo. Si hay un espacio en el medio, pero se puede conocer la longitud del espacio, dicha secuencia se denomina andamio, que significa andamio (no continuo).

Luego, organice el contig y el andamio de largo a corto, y luego súmelos. Cuando se suma exactamente el 50% de 1M, que es 500k, la longitud de ese contig o andamio se llama Contig N50. y Andamio N50. Evidentemente, cuanto mayor sea el valor, mejor será la calidad del montaje. ?

Es decir: cuenta atrás desde el más largo hasta los fragmentos cuya longitud sea la mitad de la longitud total. Cuanto más largo sea el último fragmento contado, más fragmentos largos habrá y mejor será la calidad del ensamblaje final. . ?

Principio del análisis de empalme:

El instrumento de secuenciación solo puede medir una longitud limitada a la vez y generalmente realiza mediciones de saturación en las secuencias de la muestra. Contienen una gran cantidad de datos de diferentes ubicaciones en el gen, secuencias cortas de diferentes longitudes. El empalme funciona organizando estas secuencias cortas en un orden determinado y filtrando las partes repetitivas para sintetizar secuencias largas.