Inicio Cadence Acelerador de redes neuronales profundas

Acelerador de redes neuronales profundas

2631
0

Escalable desde un sólo chip hasta los que se necesiten, este acelerador de redes neuronales profundas proporciona las herramientas necesarias para soportar futuras capas de red no provistas a día de hoy, estando con ello preparado para afrontar el futuro.

La californiana Cadence Design Systems ha anunciado su nuevo procesador IP Tensilica DNA 100 para su uso como acelerador en redes neuronales profundas (DNA por sus siglas en inglés).

Este chip busca proporcionar alto rendimiento combinado con un consumo eficiente a un abanico de computadoras que va desde los 0,5 TeraMAC (TMAC) hasta centenares de TMAC. Los tipos de aplicaciones para los que puede resultar útil con este enfoque son las de redes neuronales de inferencia en dispositivos como, por ejemplo, vehículos autónomos, asistencia avanzada al pilotaje (ADAS), vigilancia, robótica, drones, realidad aumentada y virtual (AR/VR), smartphones, domótica (hogar inteligente), e IoT.

Según afirman desde Cadence, el Tensilica DNA 100 proporciona un rendimiento que mejora en un factor de 4,7 el rendimiento por vatio y lo aumenta en un factor de 2,3 en comparación con otras soluciones con dimensiones de array multiplicador-acumulador (MAC) similares.

Este acelerador de redes neuronales profundas dispone de un hardware especializado que elimina el consumo innecesario en la carga y multiplicación de zeros que presentan otros procesadores.

Esto, que dota a este procesador de mayor eficiencia, permite al Tensilica DNA 100 maximizar el rendimiento con un array de menor tamaño. Como muestra de esto, tenemos su habilidad para conseguir un rendimiento de inferencia en dispositivo estimado de 2.550 fps (frames por segundo) y hasta 2,4 TMACs/W (en 16 nm) en ResNet 50 para una configuración MAC 4K.

Acelerador de redes neuronales profundasSoftware para el acelerador de redes neuronales profundas

Cadence también se ha encargado de dotar a su más reciente creación de una completa plataforma software de inteligencia artificial. La compatibilidad con la última versión del compilador Tensilica Neural Network proporciona el soporte para frameworks avanzados de inteligencia artificial tales como Caffe, TensorFlow, TensorFlow Lite, así como a un amplio espectro de redes neuronales, incluyendo convolution y redes recurrentes.

También dispone de soporte para la API de red neuronal de Android (ANN) para inferencia AI en dispositivos equipados con Android.

Uno solo de estos procesadores es capaz de ejecutar todas las capas de la red neuronal, incluyendo convolution, fully connected, LSTM, LRN, y pooling, además de poder escalar de forma simple desde 0,5 hasta 12 TMACs efectivos. En el caso de múltiples unidades, estas pueden ser apiladas para llegar a los centenares de TMACs antes citados. Y también soporta el compilador abierto de machine learning Facebook Glow.

El Tensilica DNA 100 incorpora también un DSP Tensilica que le permitiría acomodar cualquier capa de red neuronal que no sea soportada actualmente por los motores hardware dentro del procesador. Está, por lo tanto, asegurado ante el futuro.

Por si esto último fuera poco, ofrece la extensibilidad y programabilidad del núcleo Tensilica Xtensa utilizando las instrucciones Tensilica Instruction Extension, disponiendo de su propio acceso directo a memoria (DMA). Esto último le permite correr otro código de control sin requerir un controlador separado.

El retoque de imágenes, la detección de rostros y su clasificación o identificación, o la asistencia al uso del lenguaje natural por parte de asistentes de voz son algunas de las tareas en las que puede ser empleado.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.