OLTP frente a OLAP

Con la aplicación profunda de la tecnología de big data en todos los ámbitos de la vida, la demanda de análisis de datos masivos se ha vuelto cada vez más prominente y la tecnología OLAP se ha ido acercando gradualmente a la visión de las personas. , pero se refieren a diferentes tipos de sistemas de bases de datos. Todos son sistemas de procesamiento en línea. Este artículo presentará la diferencia entre los dos

Introducción

OLTP, también llamado procesamiento de transacciones en línea (procesamiento de transacciones en línea), significa un sistema muy transaccional, que generalmente tiene alta disponibilidad en línea. Los sistemas se centran principalmente en pequeñas transacciones y pequeñas consultas. Al evaluar el sistema, generalmente observamos la cantidad de transacciones y ejecutar SQL ejecutados por segundo. En un sistema de este tipo, una sola base de datos a menudo procesa más de cientos o miles de transacciones por segundo, y el volumen de ejecución de declaraciones Select es de miles o incluso decenas de miles por segundo. Los sistemas OLTP típicos incluyen sistemas de comercio electrónico, bancos, valores, etc., como las bases de datos comerciales de eBay en los Estados Unidos. Las bases de datos relacionales (mysql, PostgreSQL, DB2, Oracle ...) son bases de datos OLTP muy típicas.

Características

Sistema OLTP

Requisitos de diseño de bases de datos

Introducción

OLAP (Procesamiento analítico en línea, Online Analytical Processing) es una colección de varias operaciones orientadas al análisis basadas en el modelo multidimensional del almacén de datos. En la década de 1960, E.F. Codd, el padre de la base de datos relacional, propuso el modelo relacional, que impulsó el desarrollo del procesamiento de transacciones en línea. (OLTP) (los datos se almacenan en tablas en lugar de archivos). En 1993, E.F. Codd propuso el concepto OLAP, creyendo que OLTP ya no puede satisfacer las necesidades de los usuarios finales para consultas y análisis de bases de datos. Las ventajas de OLAP se basan en el almacenamiento de datos de los almacenes de datos orientados a temas, integrados, históricos e inmutables. y modelos multidimensionales. Forma de organización de datos multinivel en perspectiva. Si se separa de estos dos puntos, OLAP ya no existirá y no habrá ninguna ventaja. En el análisis empresarial real, el análisis en línea OLAP se refiere más a una solución para el análisis de datos. Actualmente, existen motores OLAP de código abierto muy populares en la industria del big data como Hive, SparkSQL, FlinkSQL, Clickhouse, Elasticsearch, Druid, Kylin, Presto, Impala, etc. Sin embargo, se puede decir que ningún motor puede alcanzar la perfección en En términos de volumen de datos, flexibilidad y rendimiento, los usuarios deben realizar selecciones según sus propias necesidades.

Funciones

Clasificación

OLAP es un método informático que permite a los usuarios analizar datos de forma fácil y rápida desde diferentes perspectivas. OLAP convencional se puede dividir en tres categorías: OLAP multidimensional (OLAP multidimensional), OLAP relacional (OLAP relacional) y OLAP híbrido (OLAP híbrido).

Sistema OLAP

División de jerarquía de datos OLAP

Estructura de datos multidimensionales OLAP

Análisis de datos multidimensionales OLAP

OLTP Es la aplicación principal de la base de datos relacional tradicional, principalmente para el procesamiento básico de transacciones diarias, como las transacciones bancarias. OLAP es la principal aplicación de los sistemas de almacenamiento de datos, que admite operaciones de análisis complejas, se centra en la toma de decisiones y proporciona resultados de consultas intuitivos y fáciles de entender.

El sistema OLTP enfatiza la eficiencia de la memoria de la base de datos, la velocidad de comando de varios indicadores de memoria, las variables vinculantes y las operaciones concurrentes. El sistema OLAP enfatiza el análisis de datos, el mercado de ejecución de SQL, la E/S del disco y la partición. Los cuellos de botella más comunes en los sistemas OLTP son la CPU y el disco. OLTP es adecuado para escenarios con pequeños volúmenes de datos, DML frecuente y muchos procesamientos de transacciones paralelas. OLAP es adecuado para grandes cantidades de datos y menos DML.