Red de conocimiento del abogados - Cuestiones jurídicas del divorcio - Conversación con Alibaba Cloud y Li Feifei: cinco predicciones sobre las bases de datos nativas de la nube

Conversación con Alibaba Cloud y Li Feifei: cinco predicciones sobre las bases de datos nativas de la nube

Autor: Wang Huixian

Almacenamiento de datos, análisis de datos, seguridad de datos... Cada vez hay más temas relacionados con los "datos" y se acercan cada vez más a la vida de las personas.

De lo desconocido a lo familiar, los datos no sólo se han "fuera del círculo", sino que incluso han alcanzado la posición C. El año pasado, las "Opiniones sobre la construcción de un sistema y mecanismo de asignación de mercados de factores más completos" emitidas por el gobierno central establecieron claramente que los datos se han convertido en el quinto factor de producción más importante después de la tierra, la mano de obra, el capital y la tecnología.

Después de ingresar a la era de la información, las bases de datos, los sistemas operativos y el middleware, como los tres software más básicos de las computadoras, respaldan el funcionamiento normal de las empresas.

Cuando los datos se conviertan en un factor de producción, inevitablemente experimentarán un crecimiento explosivo y las necesidades de almacenamiento y procesamiento de datos de las empresas se liberarán aún más. Más importante aún, la epidemia ha acelerado el ritmo de la transformación digital y la migración de las empresas a la nube.

De la informatización a la digitalización, los cambios de los tiempos siempre traerán cambios en el mundo empresarial. Cómo utilizar bases de datos bajo una arquitectura nativa de la nube se ha convertido en un problema para las empresas y una oportunidad para los proveedores de la nube. Werner Weigel, CTO de Amazon AWS, ha enfatizado muchas veces: "Las bases de datos son la batalla definitiva para la computación en la nube".

En la era de la inteligencia digital, ¿qué significa ser nativo de la nube? ¿Cuáles son las principales ventajas de las bases de datos nativas de la nube sobre las bases de datos tradicionales? ¿Mover la base de datos a la nube es nativo? Sobre la base de estas cuestiones, Lei Feng.com inició un diálogo con Li Feifei, vicepresidente del Grupo Alibaba y jefe de la división de productos de bases de datos en la nube de Alibaba.

Bases de datos nacionales nativas de la nube, para deshacerse del "dolor punzante"

Hoy en día, el mundo empresarial de las bases de datos está dividido en dos facciones debido a la aparición y el desarrollo de la nube. .

Una es una base de datos comercial tradicional representada por Oracle y la otra es una base de datos nativa de la nube representada por AWS extranjera y Alibaba Cloud nacional. Ambos son productos de la "revolución de la OIE".

De hecho, al principio había tres bases de datos populares: bases de datos jerárquicas, bases de datos de red y bases de datos relacionales.

En el libro "Top of the Wave", el autor Wu Jun escribió este punto de vista: "El ascenso de Oracle depende en gran medida de su primer vistazo a las perspectivas del mercado de bases de datos relacionales. En los negocios Mejor que IBM en términos de modelo”.

Así que antes de la llegada de las bases de datos nativas de la nube, el mundo de las bases de datos estaba dominado por Oracle, y la mayoría de las empresas nacionales de Internet tuvieron que adoptar el modelo Oracle+minicomputadora IBM+EMC. para mantenerlo en funcionamiento normal.

El alto coste lo hace "insoportable" para los gigantes de Internet con una enorme demanda de bases de datos.

En 2009, el número de nodos del clúster Oracle RAC de Alibaba alcanzó un récord de 20. Sin embargo, debido a que Oracle no tiene capacidades de expansión flexibles, solo puede comprar minicomputadoras y bases de datos en función del tráfico pico, lo que hace que Alibaba pague la mayor parte de las ganancias del aumento del negocio a Oracle.

En el segundo año, Ali comenzó a embarcarse en el camino "IOE", construyó AliSQL basado en MySQL de código abierto y pasó con éxito la prueba Taobao Double 11. Las bases de datos nacionales nativas de la nube se han librado oficialmente del "dolor de piel" y el mercado las reconoce gradualmente.

Por otro lado, la empresa extranjera AWS anunció en 2015 Amazon Aurora, una base de datos de desarrollo propio basada en computación en la nube. Aurora es una base de datos relacional que puede replicar seis copias de datos en tres zonas de disponibilidad. Su característica más importante es el alto rendimiento y la alta disponibilidad.

Con la entrada de los gigantes de la computación en la nube, las bases de datos nativas de la nube se han convertido gradualmente en algo común en el país y en el extranjero. Según las predicciones de Gartner, para 2021, las bases de datos en la nube representarán por primera vez el 50% de todo el mercado de bases de datos, y para 2023, el 75% de las bases de datos se ejecutarán en plataformas en la nube.

En cuanto a las bases de datos nativas de la nube, a medida que salen gradualmente del círculo, el foco de atención de las personas ha cambiado de "¿Qué es?" a "¿Qué otros problemas se pueden resolver?".

Sin embargo, las bases de datos nativas de la nube tienen el problema de las islas de datos. Si no se puede acceder a múltiples sistemas de datos, las empresas estarán "bajo una gran presión" en el procesamiento y la gestión de datos, e incluso puede haber riesgos para la seguridad de los datos.

Los almacenes de datos tradicionales generalmente construyen almacenes de datos fuera de línea basados ​​en la integración de datos T+1 para respaldar diversos análisis y servicios de las empresas. Las soluciones tradicionales no solo afectan la estabilidad de los negocios en línea, sino que también tienen dificultades para satisfacer las necesidades en tiempo real de las empresas.

Por lo tanto, en opinión de Li Feifei, la base de datos nativa de la nube ha alcanzado la etapa 2.0. Los problemas a resolver en esta etapa son los puntos débiles mencionados anteriormente.

El 26 de septiembre, en la Cumbre de Innovación en la Nube de Bases de Datos de Alibaba Cloud, Alibaba Cloud lanzó su primera solución integral de almacenamiento de datos ágil. Esta solución combina la plataforma integral de gestión de datos DMS y el almacén de datos nativo de la nube AnalyticDB (ADB) para realizar la arquitectura técnica de integración del almacén, proporcionando almacenamiento en tiempo real de datos en línea, instantáneas periódicas T+1 y almacén bajo demanda. apertura, etcétera. La latencia de los datos es tan baja como unos segundos, lo que mantiene los negocios en línea continuamente y permite a las empresas liberar un mayor valor de los datos en línea.

En comparación con las soluciones tradicionales, la solución integral de almacenamiento de datos ágil de Alibaba Cloud tiene cuatro ventajas principales:

1. Tiene poco impacto en el aspecto empresarial y no se perderá debido a La agregación de datos y el procesamiento en tiempo real afectarán el funcionamiento normal del extremo comercial, y el uso de CPU y memoria es inferior al 5%.

2. Garantizar la secuencia de transacciones y la precisión de los datos, enlaces de procesamiento cortos; Admite procesamiento y descarga de datos en línea en tiempo real, mayor eficiencia. La eficiencia de la transmisión de datos es de 100 m/s y el retraso de los datos es de 10 segundos;

3. Admite lógica de cálculo y procesamiento de datos complejos en tiempo real;

4. Reduzca en gran medida el costo de la dificultad de construcción de almacenes en tiempo real, mejore la eficiencia de la construcción y admita varios escenarios en tiempo real en el proceso de transformación digital de las empresas.

Además de los escenarios de análisis estadístico en tiempo real, las empresas también necesitan crear instantáneas completas periódicas para satisfacer las necesidades del análisis de datos periódico.

La solución tradicional de integración general regular para varios almacenes tendrá un impacto estable en el negocio de producción. La puntualidad de la integración general es deficiente y no puede satisfacer las necesidades comerciales de los clientes para el seguimiento de datos en ningún momento.

Para escenarios de integración periódica T+1, la solución integral de almacenamiento de datos ágil admite instantáneas de datos de calibre completo T+1 basadas en tablas zip. Los usuarios pueden generar diversos datos según sea necesario mediante unos sencillos pasos. Una instantánea completa o incremental de una época.

Además, la empresa también puede realizar un seguimiento de los datos en cualquier momento según sea necesario para resolver rápidamente las anomalías de los datos.

Al hablar sobre la tendencia de desarrollo futuro de las bases de datos, Li Feifei mencionó los siguientes cinco puntos:

1. La nube nativa + distribuida debe ser el estándar para las bases de datos, y la distribuida ya es un estándar. debe. . Una base de datos distribuida consta de varias bases de datos interconectadas, mientras que una base de datos orientada al usuario aparece como una única base de datos. La base de datos distribuida nativa de la nube tiene las características de facilidad de uso, alta escalabilidad, iteración rápida y ahorro de costos. , desde la agrupación de recursos hasta la expansión elástica, pasando por la operación y el mantenimiento inteligentes y la integración fuera de línea, para resolver las demandas principales de los usuarios empresariales.

2.AI para DB (base de datos) y DB para AI serán la tendencia principal. Lo que es más importante es utilizar la IA para hacer que la operación y el mantenimiento de la base de datos sean inteligentes, especialmente bajo la premisa de nube nativa y distribuida, porque la base de datos no solo es flexible, disponible y escalable, sino que la complejidad de la aplicación, la operación y el mantenimiento después de la implementación es también muy reducido. En la base de datos, frente a cada vez más datos no estructurados, las capacidades analíticas son muy importantes.

3. En el entorno actual, la seguridad y confiabilidad de los datos son cada vez más importantes. También es una tendencia muy importante cómo garantizar que todo el sistema de base de datos pueda proporcionar capacidades de cifrado, capacidades informáticas seguras de múltiples partes y capacidades de protección de la privacidad en el proceso de procesamiento de enlaces de datos.

4. Las capacidades de procesamiento de datos multimodales serán cada vez más importantes. Por ejemplo, las capacidades de procesamiento multimodal de la nueva base de datos desempeñarán un papel cada vez más importante en escenarios de aplicaciones como el etiquetado y la predicción inteligente de baterías para empresas de vehículos de nueva energía.

5. Un dato, múltiples motores de procesamiento de datos: realice la integración del almacén, la vinculación del almacén, la apertura del almacén y un flujo de datos fluido.

El juicio anterior también refleja la tendencia de Alibaba Cloud Database desde el exterior. No hay duda al respecto. Pero más allá de eso, la industria está más preocupada por el código abierto.

En los últimos seis meses, muchos fabricantes nacionales han propuesto estrategias de código abierto y las razones detrás de ellas son obvias. Para crear una ecología. En la Cumbre de Alibaba Cloud de este año, Zhang Jianfeng, presidente de Alibaba Cloud Intelligence y decano de DAMO Academy, resumió las palabras clave para el desarrollo de Alibaba Cloud en 2021 como: buen servicio, base sólida, China fuerte y ecología sólida.

Brindar buenos servicios y ecología se ha convertido en el objetivo de los fabricantes actuales, y el código abierto es la mejor opción.

Cuando Lei Feng.com preguntó "¿Alibaba Cloud Database abrirá todas las capacidades en el futuro?" Cuando se le hizo esta pregunta, la respuesta de Li Feifei fue: "No".

La razón Respondió de esta manera porque tiene algunos juicios y opiniones sobre el código abierto.

Li Feifei dijo que estas partes son las versiones comerciales de la base de datos de Alibaba Cloud.

De hecho, la mayoría de los proveedores de bases de datos de la industria no abrirán el código fuente de sus capacidades principales, como los componentes de control principales de TiDB y TiFlash.

A diferencia de los proveedores de bases de datos como MongoDB, Cassandra y CouchDB, que comenzaron confiando en el código abierto, el código abierto es solo la estrategia de Alibaba Cloud Database, no el elemento vital de Alibaba Cloud Database.

Hace unos años, algunas personas en la industria dijeron que cuando las bases de datos nacionales se enfrentaban al código abierto, primero debían resolver cuestiones como la confianza y los derechos de propiedad intelectual del código abierto. "El código abierto hará que los proveedores consideren más seriamente los derechos de autor y las patentes. De hecho, después de elegir el código abierto, han planteado requisitos más altos para los proveedores de bases de datos".

Li Feifei cree que el código abierto es solo una opción. y bases de datos El éxito del código abierto no significa que la comercialización tendrá éxito, ni tampoco que los fabricantes no estén avanzados.

Para ser más precisos, el código abierto es sólo un medio eficaz.

Finalmente, Alibaba Cloud Database espera que los clientes puedan utilizar rápidamente la tecnología de los productos de base de datos de Alibaba Cloud a través de la versión de código abierto y participar en el proceso de iteración de productos técnicos. En términos de algunas capacidades de alto nivel, pueden aprovechar las capacidades profesionales del equipo y las capacidades de servicio de Alibaba Cloud para convertirse en buenos socios comerciales. Estas son algunas ideas básicas sobre código abierto de Li Feifei y Alibaba Cloud Database.

Red Lei Feng Red Lei Feng Red Lei Feng