Q30 y valor de Phred

Q30

Indica el valor de calidad de una base y también representa el porcentaje de tasa de error de la base. Q30 significa que el valor de calidad base es 30, la tasa de error es 0,1 y la tasa de precisión es 99,99. De la misma manera, Q40 significa que la tasa de error es 0,01 y la tasa de precisión es 99,999.

En la secuenciación de segunda generación, cada base medida dará un valor de calidad correspondiente. Este valor de calidad es una medida de la precisión de la secuenciación. Una base de valor de calidad 13 tiene una tasa de error de 5, 20 tiene una tasa de error de 1 y 30 tiene una tasa de error de 0,1. En la industria, Q20 y Q30 representan el porcentaje de bases con un valor de calidad ≥20 o 30. Por ejemplo, si se mide un volumen de datos de 1G y hay 0,9G de valores de calidad base mayores o iguales a 20, entonces Q20 es 90.

En primer lugar, el valor de calidad de la base es un indicador importante para medir la calidad de la secuenciación. Cuanto mayor sea el valor de calidad (Q), menor será la probabilidad (P) de que la base se detecte incorrectamente. La fórmula de cálculo es Q=-10lgP.

Los funcionarios de Illumina generalmente usan Q30 como estándar de evaluación. Tomando como ejemplo la secuenciación 2 × 100PE de la plataforma HiSeq 2000 más utilizada actualmente, los funcionarios de Illumina garantizan que la precisión de> 80 bases alcanza Q30.

Phred

La tasa de error de secuenciación de cada base se obtiene convirtiendo el valor de calidad de la base de secuenciación (puntuación de Phred, Qphred) mediante una fórmula

Q20: Original El número de bases con un valor de Phred superior a 20 en los datos representa el porcentaje del número total de bases.

P30: El número de bases con un valor de Phred superior a 30 en los datos originales representa el porcentaje del número total de bases.

Referencia 1: Secuenciación Q20 Q30 Q40

Referencia 2: Información importante: Preguntas frecuentes sobre la secuenciación del transcriptoma