Red de conocimiento del abogados - Ley de patentes - Conversación con Alibaba Cloud Li Feifei: cinco predicciones importantes sobre las bases de datos nativas de la nube

Conversación con Alibaba Cloud Li Feifei: cinco predicciones importantes sobre las bases de datos nativas de la nube

Autor: Wang Huixian

Almacenamiento de datos, análisis de datos, seguridad de datos... Hoy en día, cada vez hay más temas relacionados con los "datos", y cada vez está más cerca de la vida de las personas.

De desconocido a familiar, los datos no solo están "fuera del círculo", sino que incluso han alcanzado la posición C. El año pasado, el gobierno central emitió las "Opiniones sobre la construcción de un sistema y mecanismo más completos para la asignación de factores orientada al mercado", que afirmaban claramente que los datos se han convertido en el quinto factor de producción más importante, después de la tierra, el trabajo, el capital y la tecnología.

Después de ingresar a la era de la información, la base de datos, el sistema operativo y el middleware, como los tres software más básicos de las computadoras, respaldan el funcionamiento normal de las empresas.

Cuando los datos se conviertan en un factor de producción, inevitablemente experimentarán un crecimiento explosivo y las necesidades de almacenamiento y procesamiento de datos de las empresas se liberarán aún más. Más importante aún, la epidemia ha acelerado el ritmo de la transformación digital y la velocidad con la que las empresas migran a la nube.

De la informatización a la digitalización, los cambios de los tiempos siempre traerán cambios en el mundo empresarial. Cómo utilizar las bases de datos bajo una arquitectura nativa de la nube se ha convertido en un problema para las empresas y una oportunidad para los proveedores de la nube, Werner Vogels, CTO de Amazon AWS, ha enfatizado muchas veces: "Las bases de datos son la batalla definitiva en la computación en la nube". >

En datos En la era de la inteligencia, ¿qué significa nativo de la nube? ¿Cuáles son las principales ventajas de las bases de datos nativas de la nube en comparación con las bases de datos tradicionales? ¿Mover la base de datos a la nube significa que es nativa de la nube? Sobre la base de estas cuestiones, Lei Feng.com inició un diálogo con Li Feifei, vicepresidente del Grupo Alibaba y jefe de la división de productos de bases de datos en la nube de Alibaba.

Las bases de datos nacionales nativas de la nube eliminan el "dolor cortante"

Hoy en día, el mundo empresarial de las bases de datos está dividido en dos facciones principales debido a la aparición y el desarrollo de la nube. .

Un grupo es la base de datos comercial tradicional representada por Oracle, y el otro grupo es la base de datos nativa de la nube representada por AWS extranjera y Alibaba Cloud nacional, que son productos de la "revolución de la OIE".

De hecho, en los primeros días había tres tipos populares de bases de datos: bases de datos jerárquicas, bases de datos de red y bases de datos relacionales.

En el libro "Top of the Wave", el autor Wu Jun escribió este punto de vista: "El ascenso de Oracle se debe en gran medida a su visión más temprana de las perspectivas del mercado de las bases de datos relacionales, y en The El modelo de negocio es mejor que el de IBM".

Por lo tanto, antes de la "entrada de la base de datos nativa de la nube", el mundo de las bases de datos siempre ha sido Oracle, y la mayoría de las empresas nacionales de Internet tienen que adoptar Oracle + minicomputadora IBM + EMC. Modo . para mantener las operaciones normales.

El elevado coste hace que los gigantes de Internet con una gran demanda de bases de datos sean "insoportables".

En 2009, el número de nodos del clúster Oracle RAC de Alibaba alcanzó un récord de 20. Sin embargo, debido a que Oracle no tiene capacidades de expansión elástica, solo puede comprar minicomputadoras y bases de datos en función del tráfico pico. Como resultado, Alibaba pagó la mayor parte de las ganancias del crecimiento empresarial a Oracle.

En el segundo año, Ali comenzó a emprender el camino hacia "IOE". Construyó AliSQL basado en MySQL de código abierto y pasó con éxito la prueba de Taobao Double 11. Se pueden considerar bases de datos nacionales nativas de la nube. como deshacerse oficialmente del "dolor cortante de la piel" ha sido gradualmente reconocido por el mercado.

Por otro lado, la extranjera AWS anunció en 2015 Amazon Aurora, una base de datos de desarrollo propio basada en la computación en la nube. Aurora es una base de datos relacional que puede replicar 6 copias de datos en 3 regiones disponibles. Su característica más importante es el alto rendimiento y la alta disponibilidad.

La entrada de los gigantes de la computación en la nube ha hecho que las bases de datos nativas de la nube se conviertan paso a paso en algo común en el país y en el extranjero. Según las predicciones de Gartner, para 2021, las bases de datos en la nube representarán por primera vez el 50% de todo el mercado de bases de datos, y para 2023, el 75% de las bases de datos se ejecutarán en plataformas en la nube.

En cuanto a las bases de datos nativas de la nube, a medida que emergen gradualmente del círculo, el enfoque de la gente ha cambiado de "¿Qué es?" a "¿Qué otros problemas puede resolver?"

Pero las bases de datos nativas de la nube tienen el problema de las islas de datos. Si no se pueden conectar varios sistemas de datos, las empresas estarán "bajo una gran presión" en el procesamiento y la gestión de datos, e incluso puede haber peligros ocultos en la seguridad de los datos.

Los almacenes de datos tradicionales generalmente construyen almacenes de datos fuera de línea basados ​​en la integración de datos T+1 para respaldar diversos análisis y servicios de la empresa. Las soluciones tradicionales no sólo afectarán la estabilidad de los negocios en línea, sino que también serán difíciles de satisfacer las necesidades en tiempo real de las empresas.

Por lo tanto, en opinión de Li Feifei, la base de datos nativa de la nube ha alcanzado la etapa 2.0. Los problemas a resolver en esta etapa son los puntos débiles mencionados anteriormente.

El 26 de septiembre, en la Cumbre de Innovación en la Nube de Bases de Datos de Alibaba Cloud, Alibaba Cloud lanzó la primera solución integral de almacenamiento de datos ágil. Esta solución combina la plataforma integral de gestión de datos DMS y el almacén de datos nativo de la nube AnalyticDB (abreviatura: ADB) para lograr una arquitectura técnica integrada de almacenes y proporcionar capacidades de almacenamiento de datos en línea en tiempo real, instantáneas periódicas T+1, y la construcción de almacenes bajo demanda, la latencia de los datos es tan baja como segundos y continúa potenciando los negocios en línea, lo que permite a las empresas liberar un mayor valor de sus datos en línea.

En comparación con las soluciones tradicionales, la solución integral de almacén de datos ágil de Alibaba Cloud tiene cuatro ventajas principales:

1. Tiene poco impacto en el lado comercial y no se concentrará debido a agregación de datos y el procesamiento en tiempo real afecta el funcionamiento normal del lado comercial, y el uso de CPU y memoria es inferior al 5%

2. La secuencia de transacciones y la precisión de los datos están garantizadas y el procesamiento; El enlace es corto y se admite el procesamiento de datos en línea en tiempo real. La eficiencia de la transmisión de datos es de 100 m/s, el retraso de los datos es de 10 segundos.

3. Admite lógica de cálculo y procesamiento de datos complejos en tiempo real

4. La operación con código bajo puede mejorar enormemente; reducir el tiempo real La dificultad de construcción del almacén de datos mejora la eficiencia de la construcción al tiempo que admite varios escenarios en tiempo real en el proceso de transformación digital de las empresas.

Además de los escenarios de análisis estadístico en tiempo real, para satisfacer las necesidades del análisis de datos periódico, las empresas necesitan crear instantáneas completas periódicas.

La solución de integración periódica de volumen completo de los almacenes de datos tradicionales tendrá un impacto en la estabilidad del negocio de producción, la puntualidad de la integración de volumen completo es deficiente y no puede cumplir con los requisitos comerciales del cliente para el seguimiento de datos en ningún momento. punto en el tiempo.

Para escenarios de integración periódica T+1, la solución integral de almacenamiento de datos ágil admite instantáneas de datos completas T+1 basadas en tablas zip. Los usuarios pueden generar varios datos a pedido mediante unos simples pasos. o instantánea incremental del ciclo.

Además, las empresas también pueden realizar un seguimiento de los datos en cualquier momento según sea necesario para resolver rápidamente las anomalías de los datos.

Hablando sobre la tendencia de desarrollo futuro de las bases de datos, Li Feifei mencionó los siguientes cinco puntos:

1. Nativo de la nube + distribuido debe ser la configuración estándar de las bases de datos, y distribuida ya es una debe. Una base de datos distribuida se compone de múltiples bases de datos interconectadas y aparece como una única base de datos para los usuarios. Las bases de datos distribuidas nativas de la nube tienen las características de facilidad de uso, alta escalabilidad, iteración rápida y ahorro de costos, desde la agrupación de recursos hasta la expansión elástica, la operación y el mantenimiento inteligentes y la integración en línea y fuera de línea, pueden resolver las demandas centrales de las empresas. usuarios.

2. AI para DB (base de datos, en referencia a base de datos) y DB para AI serán la tendencia principal. El uso de IA para inteligenteizar la gestión de operación y mantenimiento de la base de datos es más importante, especialmente bajo la premisa de nube nativa + distribuida, porque la base de datos no es solo la capacidad del núcleo para ser flexible, altamente disponible y escalable, sino que, lo que es más importante, es la complejidad. de aplicaciones posteriores a la implementación y operación y mantenimiento El grado se reducirá considerablemente. En la base de datos, frente a cada vez más datos no estructurados, las capacidades analíticas son muy importantes.

3. La seguridad y la confiabilidad de los datos se han vuelto cada vez más importantes en el entorno actual. Cómo garantizar que todo el sistema de base de datos proporcione capacidades de cifrado, capacidades informáticas seguras multipartitas y la capacidad de proteger la privacidad. una tendencia muy importante.

4. Las capacidades de procesamiento de datos multimodo serán cada vez más importantes. Por ejemplo, las capacidades de procesamiento multimodal de las nuevas bases de datos desempeñarán un papel cada vez más importante en escenarios de aplicaciones como el etiquetado de empresas de automóviles de nueva energía y la predicción inteligente de baterías.

5. Un dato, múltiples motores de procesamiento de datos: realice la integración del almacén, la vinculación del almacén, la conexión del almacén y un flujo fluido entre los datos.

La sentencia anterior también refleja la dirección de Alibaba Cloud Database desde el exterior. No hay duda al respecto. Pero aparte de eso, lo que más preocupa a la industria es el código abierto.

En los últimos seis meses, muchos fabricantes nacionales han propuesto sucesivamente estrategias de código abierto. La razón detrás de esto es obvia: para construir un ecosistema.

En la Cumbre de Alibaba Cloud de este año, Zhang Jianfeng (Hua Ming Xingpin), presidente de Alibaba Cloud Intelligence y decano de DAMO Academy, resumió las palabras clave de desarrollo de Alibaba Cloud en 2021 como: brindar buenos servicios, profundizar las bases y fortalecer los sectores medio y Plataforma, fortalecer la ecología.

Mejorar el servicio y la ecología se ha convertido en el objetivo unánime de los fabricantes hoy en día, y el código abierto es la mejor opción.

Cuando Lei Feng.com preguntó: "En el futuro, ¿Alibaba Cloud Database abrirá todas sus capacidades?", la respuesta de Li Feifei fue: "No".

¿La razón de esto? La respuesta es que tiene algunos juicios y opiniones sobre el código abierto.

Li Feifei dijo que estas partes son originalmente la versión comercial de la base de datos Alibaba Cloud.

De hecho, la mayoría de los proveedores de bases de datos de la industria no abrirán el código fuente de sus capacidades principales, como los componentes principales de gestión y control de TiDB y TiFlash.

A diferencia de los proveedores de bases de datos como MongoDB, Cassandra y CouchDB, que comenzaron como código abierto, el código abierto es solo la estrategia de Alibaba Cloud Database, no el elemento vital de Alibaba Cloud Database.

En los últimos años, algunas personas en la industria dijeron que cuando se enfrentan al código abierto, las bases de datos nacionales primero deben resolver cuestiones como la confianza y los derechos de propiedad intelectual del código abierto. "El código abierto hará que los fabricantes piensen más seriamente en las cuestiones de derechos de autor y patentes. De hecho, elegir el código abierto planteará mayores requisitos para los fabricantes de bases de datos".

Li Feifei cree que el código abierto es sólo una opción, y bases de datos El éxito del código abierto no significa que la comercialización será exitosa, y la falta de código abierto no significa que los fabricantes no estén avanzados.

Para ser más precisos, el código abierto es solo un medio eficaz.

En última instancia, Alibaba Cloud Database espera que los clientes puedan utilizar rápidamente la tecnología del producto Alibaba Cloud Database a través de la versión de código abierto y poder participar en el proceso de iteración de productos técnicos y aprovechar las capacidades profesionales de Equipo en algunas capacidades de alto nivel y las capacidades de servicio de Alibaba Cloud para convertirse en un buen socio comercial. Estos son algunos de los pensamientos básicos de Li Feifei y Alibaba Cloud Database sobre el código abierto. Red Lei Feng Red Lei Feng Red Lei Feng