EMBL de base de datos de ADN
Una base de datos de secuencias de ácidos nucleicos creada por el Instituto Europeo de Bioinformática (EBI). Las fuentes de datos del EMBL provienen principalmente de dos partes: una parte es enviada directamente por investigadores científicos o ciertas instituciones de secuenciación del genoma a través de redes informáticas, y la otra parte proviene de literatura científica o patentes (Stoesser et al., 1998). EMBL tiene una relación de cooperación con DDBJ y GenBank. Recopilan información sobre secuencias de ácidos nucleicos en todo el mundo e intercambian datos recién descubiertos o actualizados entre sí todos los días.
El tamaño de las bases de datos de ADN está creciendo exponencialmente, duplicándose en menos de 9 meses de media. En enero de 1998, el número de secuencias incluidas en EMBL superó el millón, incluidas 15.500 especies, de las cuales más del 50% procedían de organismos modelo, incluidos humanos (Homo sapiens), nematodos (Caenorhabditis elegans) y levadura de cerveza (Saccharomyces). cerevisiae), ratón (Mus musculus) y Arabidopsis thalania.
El sistema de consulta de secuencias SRS (Sequence Retrieval System) se puede utilizar para extraer información relevante de la base de datos EMBL (Etzold et al., 1996). El sistema de consulta de secuencias SRS conecta bases de datos de secuencias de ADN con varias bases de datos, como secuencias de proteínas, sitios funcionales, estructuras, mapas de genes y resúmenes de literatura de MEDLINE a través de enlaces de hipertexto. Se puede buscar homología de secuencia desconocida en la base de datos EMBL utilizando el programa BLAST o FastA proporcionado en el sitio web de EBI.