Red de conocimiento del abogados - Ley de patentes - ¿Qué es Unicode? ¿Qué formato de archivo es Unicode?

¿Qué es Unicode? ¿Qué formato de archivo es Unicode?

Unicode es Unicode.

Unicode, también llamado Código Universal y Unicode (Unicode), es un estándar industrial en el campo de la informática, que incluye conjuntos de caracteres, esquemas de codificación, etc. Unicode se creó para resolver las limitaciones de los esquemas de codificación de caracteres tradicionales. Establece una codificación binaria unificada y única para cada carácter en cada idioma para cumplir con los requisitos de conversión y procesamiento de texto entre idiomas y plataformas. La investigación y el desarrollo comenzaron en 1990, la versión 1.0 se lanzó oficialmente en 1994 y la versión 13.0 se lanzará en 2020.

Características de Unicode:

El proyecto Unicode utiliza 17 planos y hay 17*65536=1114112 puntos de código en una capa. En la versión Unicode 5.0.0, solo hay 238605 puntos de código definidos, distribuidos en el plano 0, plano 1, plano 2, plano 14, plano 15 y plano 16. Entre ellos, el plano 15 y el plano 16 solo definen dos áreas privadas (PrivateUseArea), cada una de las cuales ocupa 65534 puntos de código, que son 0xF0000-0xFFFFD y 0x100000-0x10FFFD respectivamente.

El plano 0 también tiene un área dedicada: 0xE000-0xF8FF, con 6400 puntos de código. El 0xD800-0xDFFF del plano 0, con 2048 puntos de código, es un área especial llamada Surrogate. El propósito de Surrogate es utilizar dos caracteres UTF-16 para representar caracteres distintos de BMP.