¿Qué es la DMAE?
Perfil de la empresa AMD (la abreviatura en inglés de Advanced Micro Devices, Wei Chao Semiconductor Nota: Avanzado significa avanzado, Micro significa pequeño) se traduce literalmente como micro semiconductor avanzado, pero la empresa AMD se nombró a sí mismo. Wei Chao Semiconductor en chino, por lo que también podría llamarlo Super Micro Semiconductor. El término oficial utilizado aquí es 1969 y tiene su sede en Sunnyvale, California. AMD se especializa en diseñar y fabricar microprocesadores innovadores, memoria flash y soluciones de procesadores de bajo consumo para las industrias de informática, comunicaciones y electrónica de consumo. AMD se compromete a brindar soluciones basadas en estándares y centradas en el cliente a los usuarios de tecnología, desde empresas y agencias gubernamentales hasta consumidores individuales. Su participación en el mercado de CPU es superada sólo por Intel.
AMD tiene oficinas comerciales en todo el mundo, plantas de fabricación en Estados Unidos, China, Alemania, Japón, Malasia, Singapur y Tailandia, y oficinas de ventas en las principales ciudades del mundo, con más de 6.543.800 empleados. gente. En 2004, las ventas de AMD ascendieron a 5 mil millones de dólares.
AMD obtiene más del 70% de sus ingresos de los mercados internacionales y es una empresa verdaderamente multinacional. La empresa cotiza en la Bolsa de Valores de Nueva York con el símbolo AMD.
[Editar este párrafo]
En el desarrollo comercial de AMD, nos adherimos al concepto de "orientado al cliente e impulsado por la innovación", que es el principio central que guía todos los negocios de AMD. operaciones.
Para obtener una comprensión más profunda de las necesidades de los clientes, AMD ha establecido relaciones de cooperación exitosas con los clientes. AMD trabaja en estrecha colaboración con líderes tecnológicos para desarrollar soluciones de próxima generación, expandir los mercados globales y promover la marca AMD. También nos hemos asociado con algunos de los líderes mundiales que han superado obstáculos desalentadores y han dependido de la tecnología para tener éxito.
Hasta ahora, más de 2.000 desarrolladores de software y hardware, fabricantes de equipos originales y distribuidores de todo el mundo han anunciado soporte para la tecnología AMD64. ¿Más de 75 de las 100 empresas de Forbes Global 2000 utilizan AMD Opteron? El sistema de procesador ejecuta aplicaciones de nivel empresarial y su rendimiento ha mejorado enormemente.
[Editar este párrafo]
Línea de productos informáticos de AMD
AMD ofrece una serie de soluciones para usuarios empresariales que requieren infraestructura informática y de TI de alto rendimiento. plan.
1981, AMD 287 FPU, usando núcleo Intel 80287. El posicionamiento en el mercado y el rendimiento del producto son básicamente consistentes con Intel 80287. Sigue siendo AMD.
El único producto FPU producido por la empresa es muy raro.
AMD 8080(1974), 8085(1976), 8086(1978), 8088(1979), 80186(186). El posicionamiento en el mercado y el rendimiento del producto son básicamente consistentes con el producto de Intel del mismo nombre.
El microprocesador AMD 386 (1991), código de núcleo P9, se divide en SX y DX, compatibles con Intel 80386SX y DX respectivamente. AMD 386DX e Intel 386DX son procesadores de 32 bits. La diferencia es que AMD 386SX es un procesador completo de 16 bits, mientras que Intel 386SX es un procesador de casi 32 bits: bus interno de 32 bits, procesador externo de 16 bits. El rendimiento del AMD 386DX es similar al del Intel 80386DX y era uno de los productos principales en ese momento. AMD también ha desarrollado 386 DE y otros productos integrados basados en el núcleo 386.
Microprocesador AMD 486DX (1993), código de núcleo P4, producto 486 de primera generación diseñado y producido por AMD. Luego se lanzarán otros 486 niveles uno tras otro.
Los modelos comunes incluyen: 486DX2, código de núcleo P24; 486DX4, código de núcleo P24C; Otros modelos derivados incluyen el 486DE y el 486DXL2, que son relativamente raros.
La frecuencia más alta de AMD 486 es 120MHz (DX4-120). Esta es la primera vez que AMD supera a su fuerte competidor Intel en frecuencia.
El microprocesador AMD 5X86 (1995), con código de núcleo X5, es el arma de AMD en el mercado de los 486. A finales de la era 486, TI (Texas Instruments) lanzó el rentable TI486DX2-80, que rápidamente ocupó el mercado de gama baja. Intel también lanzó la serie Pentium de gama alta. Para aprovechar la brecha del mercado, AMD lanzó la serie de CPU 5x86 (lanzada casi al mismo tiempo que Cyrix 5x86). Es un producto de 486 niveles, con la frecuencia más alta: 33 * 4, 133 MHz, proceso de fabricación de 0,35 micrones, caché de reescritura de nivel uno de 16 KB incorporado, rendimiento directamente comparable al Pentium 75 y menor consumo de energía.
Microprocesador AMD K5 (1997), lanzado al mercado en 1997. Debido a cuestiones de investigación y desarrollo, su tiempo de lanzamiento fue mucho más tarde que el del "Classic Pentium" de su competidor Intel, y su rendimiento no fue muy bueno. Este producto fallido una vez hizo que AMD perdiera mucha participación de mercado. El rendimiento del K5 es muy mediocre. Su capacidad de cálculo de números enteros no es tan buena como la del Cyrix 6x86, pero es ligeramente mejor que la del "Pentium clásico". La capacidad de presupuesto de punto flotante no es tan buena como la del "Pentium clásico", pero es ligeramente mejor que la del Cyrix 6x86. En conjunto, K5 es un producto con resistencia promedio, y su bajo precio y rendimiento en las primeras etapas de su lanzamiento son más atractivos para los consumidores. Además, el K5-RP200 de alta gama se produce en cantidades muy pequeñas (convencional: ) y no se vende en China continental.
El procesador AMD K6 (1997) está al mismo nivel que el Intel PentiumMMX. Fue AMD quien adquirió NexGen y lo integró en el entonces avanzado NexGen.
Una obra maestra tras la tecnología 686. También contiene el conjunto de instrucciones MMX y un caché L1 de 64 KB, ¡que es el doble del tamaño del Pentium MMX! Proporción general
En comparación, el K6 es un producto exitoso, pero en términos de rendimiento, la potencia de cálculo de punto flotante sigue siendo inferior a la del Pentium MMX.
Los microprocesadores de la serie K6-2 (1998) alguna vez fueron los productos estrella de AMD, y ahora los llamamos clásicos. Para derrotar a su rival Intel, los microprocesadores de la serie AMD K6-2 han realizado mejoras significativas basadas en K6, la más importante de las cuales es la adición de soporte de instrucciones "3DNow!". El comando "3DNow!" es un gran avance para el sistema X86. La ventaja de esta tecnología es que mejora enormemente las capacidades de procesamiento 3D de la computadora y nos brinda un rendimiento 3D realmente excelente. Puedes ver cuánto potencial tiene el K6-2 cuando utilizas un software optimizado para "3DNow!" Además, la mayor parte del K6-2 no está bloqueada en frecuencia y, con el bajo calor generado por el proceso de fabricación de 0,25 micrones, es fácil realizar overclock. Es decir, a partir de K6-2, el overclocking ya no es un término propietario de Intel. Al mismo tiempo, .k62 también hereda la tradición de AMD. El precio del modelo de la misma frecuencia es aproximadamente un 25% más bajo que el de los productos Intel y las ventas en el mercado son asombrosas. Al comienzo de su lanzamiento, la serie K6-2 se llamó "k63d" ("3D" significa "3DNow!". No pasó a llamarse "K6-2" hasta su lanzamiento oficial). Debido a esto, la mayoría de K6 3D son ES (algunas versiones oficiales, después de todo, no hay producción en masa :). K6 3D alguna vez tuvo un producto de 250MHz no estándar, pero no apareció en la serie oficial K6-2. La frecuencia más baja del K6-2 es de 200MHz y la frecuencia más alta es de 550MHz.
AMD lanzó el microprocesador de la serie K6-3 (1998) con nombre en código "Sharptooth" en febrero de 1999. Esta fue la última CPU compatible con AMD en la superarquitectura y el paquete CPGA. K6-3 utiliza un proceso de fabricación de 0,25 micrones, integra una caché L2 de 256 KB (el nuevo Celeron de la competencia Intel tiene 128 KB) y funciona a la velocidad del reloj de la CPU. K6-3 reconoce automáticamente L2 en la placa base Socket 7 como L3 en este momento, lo que sin duda es muy ventajoso para CPU de alta frecuencia, aunque el funcionamiento de punto flotante de K6-3 todavía no es satisfactorio.
Debido a varias razones, el K6-3 fue difícil de encontrar después de su lanzamiento al mercado y el precio no era accesible, incluso después de que apareció el K6-3 más avanzado.
AMD lanzó la arquitectura K8 en 2001 y 10. Aunque K8 y K7 usan el mismo número de ventanas de programación de punto flotante, las unidades enteras se expanden de 18 a 24 en K7. Además, AMD también ha mejorado la unidad de predicción de ramas del K7. En comparación con Athlon, el búfer del contador de historial global (utilizado para registrar el acceso de la CPU a los datos dentro de un cierto período de tiempo, llamado búfer de conteo de historial completo) es 4 veces más grande y la canalización puede acomodar más instrucciones antes de la depuración de sucursales. Las mejoras de AMD en la programación de números enteros permiten que la profundidad del pipeline del K8 sea dos niveles mayor que la del Athlon. El propósito de aumentar la profundidad del conducto de dos etapas es aumentar la frecuencia central del K8. En K8, AMD agregó buffers de traducción de respaldo para satisfacer las enormes necesidades de memoria de Opteron en aplicaciones de servidor.
AMD lanzó la arquitectura K10 en la segunda mitad de 2007.
La arquitectura K10 de Barcelona es de cuatro núcleos y cuenta con 463 millones de transistores. Barcelona es el primer procesador de cuatro núcleos de AMD y su arquitectura nativa se basa en la tecnología de proceso de 65 nm. A diferencia del Intel Kentsfield de cuatro núcleos, Barcelona no incluye dos núcleos duales, sino un verdadero quad-core de un solo chip.
● Análisis de las novedades de Barcelona: Presentación de la nueva tecnología SSE128.
Una mejora importante para Barcelona es una tecnología que AMD denomina "SSE128". En la arquitectura K8, el procesador puede procesar dos instrucciones SSE en paralelo, pero la unidad de ejecución SSE generalmente solo tiene un ancho de banda de 64 bits. Para una operación SSE de 128 bits, el procesador K8 debe tratarla como dos instrucciones de 64 bits. En otras palabras, al recuperar una instrucción SSE de 128 bits, primero es necesario decodificarla en dos microoperaciones. Por lo tanto, una sola instrucción también ocupa puertos de decodificación adicionales y reduce la eficiencia de ejecución.
Barcelona amplía la unidad de ejecución de 64 bits a 128 bits, por lo que ya no es necesario decodificar todas las operaciones SSE de 128 bits y dividirlas en dos operaciones de 64 bits. admite operaciones SSE de 128 bits, lo que mejora la eficiencia de ejecución.
Aumentar el ancho de banda de la unidad de ejecución de instrucciones SSE también traerá algunos cambios nuevos, que también se puede decir que son un nuevo cuello de botella: el ancho de banda de acceso a las instrucciones. Para maximizar la cantidad de decodificaciones del procesador paralelo, Barcelona comenzó a admitir 32 bytes de acceso a instrucciones por ciclo de reloj, mientras que la arquitectura K8 anterior solo admitía 16 bytes. El ancho de banda de acceso a instrucciones de 32 bytes no sólo es útil para el código SSE del procesador, sino también para instrucciones de números enteros.
● Análisis de las novedades de Barcelona: Se ha vuelto a reforzar el controlador de memoria.
Cuando AMD integró el controlador de memoria en la CPU, vimos una nueva y potente arquitectura K8. Ahora, el controlador de memoria de Barcelona volverá a estar diseñado para mejorar significativamente el rendimiento de la memoria.
Una ventaja de toda la memoria FB-DIMM utilizada en los servidores Intel Xeon es que puede realizar comandos de lectura y escritura en el AMB simultáneamente, mientras que con la memoria DDR2 estándar solo puede realizar una operación a la vez, conmutación entre lectura y escritura será muy caro. Si se trata de una serie de ejecuciones mixtas aleatorias, provocará un desperdicio de recursos muy grave. Sin embargo, si todas las lecturas se realizan primero y luego se convierten en escrituras, se puede evitar la pérdida de rendimiento. El controlador de memoria K8 utiliza una estrategia de lectura antes de escribir para mejorar la eficiencia operativa, pero Barcelona es más inteligente.
Pero los datos leídos se almacenarán primero en el búfer en lugar de escribirse directamente, pero se desbordarán cuando su capacidad alcance el límite. Para evitar esta situación, es necesario realizar una conmutación de lectura y escritura antes, lo que también puede mejorar la eficiencia del ancho de banda y la latencia. El núcleo K8 está equipado con un único controlador de memoria con un ancho de 128 bits, pero en Barcelona, AMD lo dividió en dos controladores de 64 bits, cada controlador puede ejecutarse de forma independiente, por lo que puede aportar muchas mejoras de eficiencia, especialmente En un entorno de ejecución de cuatro núcleos, cada núcleo puede ocupar de forma independiente recursos de acceso a la memoria.
El puente norte integrado en Barcelona (tenga en cuenta que no el puente norte de la placa base) también está diseñado con mayor ancho de banda, y un búfer más profundo permitirá una mayor utilización del ancho de banda. Al mismo tiempo, el propio Northbridge ya puede utilizar futuras tecnologías de memoria, como DDR3.
La función de captación previa del controlador de memoria es una función muy utilizada y muy importante. La captación previa puede reducir el impacto negativo de la latencia de la memoria en el rendimiento general. Cuando NVIDIA lanzó la placa base nForce2, introdujo principalmente la función de captación previa inteligente de 128 bits del chipset nForce2. Cuando Intel lanzó los procesadores Core 2, también destacó la arquitectura central con tres unidades de captación previa por núcleo.
Cada núcleo en la arquitectura K8 tiene dos captadores previos, uno es el captador previo de instrucciones y el otro es el captador previo de datos. Barcelona, que utiliza la arquitectura K8L, mantiene el número 2, pero su rendimiento ha mejorado mucho. Una mejora obvia es que el captador previo de datos registra los datos directamente en la caché L1. En comparación con el método de la arquitectura K8 de registrar datos en la caché L2, el nuevo captador previo de datos es más preciso y rápido, lo que beneficiará el rendimiento de la memoria y el rendimiento general de la CPU.
●Análisis de nuevas funciones de Barcelona: Innovación - Caché de nivel 3
Debido a la tecnología, la capacidad de caché de los procesadores AMD siempre ha estado por detrás de Intel. La propia AMD sabe que no puede agregar más transistores al precioso chip para lograr una caché de gran capacidad, pero la innovadora AMD ha encontrado una mejor manera: un controlador de memoria integrado.
Se puede decir que el controlador de memoria integrado del procesador es una obra maestra. La arquitectura K8 con controlador de memoria integrado puede derrotar al oponente Pentium 4 con sólo 512 KB de caché L2. Hasta ahora, el Athlon 64 X2 todavía mantenía el búfer L2 de 512 KB obsoleto de Intel de 2002.
Ahora que el Core 2 tiene una caché L2 de 4 MB, parece que la brecha de caché entre Intel y AMD se mantendrá, porque la caché L2 de Barcelona sigue siendo de 512 KB. En comparación, los chips Kentsfield de cuatro núcleos de Intel tienen 8 MB de caché L2, y los nuevos chips Penryn, que saldrán a la venta a finales de 2007, tendrán 12 MB de caché L2.
El sistema de almacenamiento en caché de Barcelona es similar a la arquitectura de K8 hasta cierto punto. Cada uno de sus cuatro núcleos tiene 64 KB de caché L1 y 512 KB de caché L2. Desde la perspectiva de simplificar el diseño del chip, cuatro núcleos que comparten una enorme caché L2 no son adecuados para la arquitectura K8L, por lo que AMD lanzó la caché L3. Gracias al proceso de 65 nm, Barcelona integra cuatro núcleos y una caché L2 con una capacidad de 2 MB en un único chip. En otras palabras, la caché L3 y el quad-core están de forma nativa en la misma oblea y la capacidad es de al menos 2 M. Al igual que la caché L2, la caché L3 es independiente y los datos almacenados en caché por las cachés L1 y L3 no se repetirán.
La forma en que funciona la caché de Barcelona es que la caché L2 es un espacio libre para la caché L1. La caché L1 almacena los datos que la CPU más necesita actualmente. Cuando no hay suficiente espacio, algunos datos sin importancia se transferirán a la caché L2. Cuando se vuelva a necesitar en el futuro, se moverá nuevamente de la caché L2 a la caché L1. El caché L3 recién agregado continúa desempeñando el papel de caché L2, y los cuatro cachés L2 principales almacenan temporalmente datos desbordados en el caché L3.
La caché L1 y la caché L2 siguen siendo de 2 y 16 vías respectivamente, y la caché L3 es de 32 vías. La rápida caché L3 de 32 vías no sólo puede satisfacer mejor los requisitos del paralelismo multitarea, sino que también tiene un efecto positivo en la ejecución de tareas individuales. Especialmente en aplicaciones 3D, la caché L3 de 2 MB mejorará enormemente el rendimiento.