Los servidores necesitan aceleradores de inferencia de IA rápidos y eficientes para el análisis en tiempo real de videos o procesamiento de voz en el centro de datos. AMD ya anunció el Alveo V70 en CES, que está disponible como tarjeta PCIe de 75 vatios. En Computex, Gigabyte mostró un servidor con dos AMD Epyc 9004, incluidos 16 aceleradores Alveo V70. Según AMD/Xilinx, cada tarjeta ofrece 202 BFloat16 Tera OPS (202 TOps) y hasta 404 TOP con INT8.
AMD/Xilinx 1.1 a través de GitHub das Unified Inference Frontend (UIF). ONNX está listo para integrar mejor marcos de aprendizaje automático como PyTorch, TensorFlow y Windows ML con hardware. AMD Unified AI Stack 2.0 está planeado para el futuro.
La tecnología XDNA también está presente en el procesador móvil Ryzen 7040U
Si bien la mayoría de los chips de teléfonos inteligentes ya tienen aceleradores de inferencia de IA como Neural Engine (ANE) de Apple, estas unidades apenas comienzan a aparecer en los procesadores x86 de AMD e Intel. Sin embargo, las unidades AVX de las CPU x86 modernas como VNNI, los comandos principales de IA y los sombreadores de GPU de los procesadores de gráficos integrados también se pueden usar para la inferencia.
Pero solo los procesadores móviles x86 con Intel Meteor Lake y AMD Ryzen 7040U, también conocido como Phoenix, vienen con unidades de IA dedicadas, que Intel llama VPU y AMD llama «Ryzen AI» o XDNA. La «X» también se refiere a la división FPGA adquirida Xilinx, que ha estado desarrollando «núcleos Versal AI» durante años.
Microsoft comenzó a trabajar en la integración de aceleradores de aprendizaje automático en el sistema operativo Windows y lanzó API Windows ML (WinML) con ONNX hace 5 años. Por ejemplo, Windows 11 incluye Windows Studio Effects para el procesamiento en tiempo real de imágenes de cámaras web mediante WinML/DirectML.
(nota)
«Amante de los viajes extremos. Fanático del tocino. Alborotador. Introvertido. Apasionado fanático de la música».