Inicio CEVA Procesadores de IA en el edge NeuPro-M

Procesadores de IA en el edge NeuPro-M

2607
0

Con una arquitectura que les permite ofrecer un rendimiento que parte de los 20 TOPS, los procesadores de IA en el edge NeuPro-M pueden llegar hasta los 1.200 TOPS.

CEVA, compañía especializada en conectividad inalámbrica y tecnologías de sensorización inteligente, presenta los NPM11 y NPM18, sus nuevos procesadores de inteligencia artificial para aplicaciones en el borde de la red (edge) pertenecientes a la gama NeuPro-M.

Pensados para abordar tareas de inferencia de inteligencia artificial y machine learning (AI/ML), los procesadores de IA en el edge NeuPro-M está basado en una arquitectura heterogénea autocontenida que se compone de múltiples coprocesadores especializados y aceleradores de hardware configurables que procesan de forma simultánea diversas tareas de redes neuronales profundas. Con esto, incrementan su rendimiento multiplicándolo por un factor de cinco o diez respecto a la serie inmediatamente predecesora.

Características destacables

Soportan tanto la escalabilidad SoC (system-on-chip) como la HSoC (Heterogeneous SoC), y consiguen ofrecer un rendimiento de hasta 1.200 TOPS. Además, y para mejorar la seguridad de los sistemas a los que equipan, integran arranque seguro y privacidad de datos de extremo a extremo.

El NPM11 dispone de un único motor NeuPro-M, funciona a 1,25 GHz y es capaz de entregar un rendimiento de hasta 20 TOPS, mientras que el NPM18 integra ocho motores NeuPro-M funcionando a la misma frecuencia de reloj de 1,25 GHz, con lo que ofrece un rendimiento de hasta 160 TOPS.

Procesadores de IA en el edge NeuPro-M

NeuPro-M es capaz de procesar todas las arquitecturas de red neuronal conocidas, así como de integrar soporte nativo para la próxima generación de redes, como transformadores, convolución 3D, autoatención, y todos los tipos de redes neuronales recurrentes. Ha sido optimizado para procesar más de 250 redes neuronales, más de 450 kernels (núcleos) IA, y más de 50 algoritmos.

Entre sus principales características arquitecturales tenemos que la matriz de la cuadrícula principal consiste en 4.000 MACs (Multiply And Accumulates) con precisión mixta de 2-16 bits, motor de transformación Winograd para pesos y activaciones, lo que les permite reducir el tiempo de convolución en un factor de 2X y permite un procesamiento de convolución de 8 bits con una degradación de precisión de menos del 0,5%.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.