Un nuevo procesador fotónico desarrollado por científicos del MIT promete revolucionar el aprendizaje automático al permitir cálculos ultrarrápidos y altamente eficientes en energía. Este chip, que utiliza luz para realizar operaciones de redes neuronales profundas, supera las limitaciones del hardware electrónico tradicional. Capaz de completar tareas de clasificación en menos de medio nanosegundo con más del 92% de precisión, el dispositivo combina módulos ópticos y unidades funcionales no lineales para ejecutar tanto operaciones lineales como no lineales directamente en el chip. Esta innovación podría transformar aplicaciones exigentes como la telemetría y la investigación científica, ofreciendo un enfoque escalable y eficiente para el futuro del procesamiento de datos.
Los modelos de redes neuronales profundas que sustentan las aplicaciones más exigentes de aprendizaje automático han alcanzado un tamaño y complejidad tales que están poniendo a prueba los límites del hardware informático electrónico tradicional. En este contexto, el hardware fotónico, capaz de realizar cálculos de aprendizaje automático utilizando luz, se presenta como una alternativa más rápida y eficiente en términos de energía. Sin embargo, existen ciertos tipos de cálculos de redes neuronales que no pueden ser ejecutados por dispositivos fotónicos, lo que requiere el uso de electrónica externa u otras técnicas que afectan la velocidad y eficiencia.
Un equipo de científicos del MIT y otras instituciones ha desarrollado un nuevo chip fotónico que supera estos obstáculos. Este procesador fotónico completamente integrado puede llevar a cabo todas las operaciones clave de una red neuronal profunda ópticamente en el propio chip.
El dispositivo óptico logró completar las operaciones esenciales para una tarea de clasificación en aprendizaje automático en menos de medio nanosegundo, alcanzando más del 92% de precisión, un rendimiento comparable al del hardware tradicional. El chip está compuesto por módulos interconectados que forman una red neuronal óptica y se fabrica utilizando procesos industriales convencionales, lo cual podría facilitar la escalabilidad de la tecnología y su integración con sistemas electrónicos.
A largo plazo, este procesador fotónico podría revolucionar el aprendizaje profundo para aplicaciones computacionales exigentes como lidar, investigaciones científicas en astronomía y física de partículas, o telecomunicaciones de alta velocidad.
“Existen muchos casos donde no solo importa cómo funciona el modelo, sino también qué tan rápido se obtiene una respuesta. Ahora que tenemos un sistema integral capaz de ejecutar una red neuronal en óptica a escala temporal nanosegundos, podemos comenzar a pensar a un nivel superior sobre aplicaciones y algoritmos”, afirma Saumil Bandyopadhyay, científico visitante en el Grupo de Fotónica Cuántica e IA dentro del Laboratorio de Electrónica (RLE) y autor principal del artículo sobre este nuevo chip.
Bandyopadhyay comparte autoría con otros investigadores destacados en el campo. La investigación se publica hoy en Nature Photonics.
Las redes neuronales profundas están compuestas por múltiples capas interconectadas de nodos o neuronas que operan sobre datos de entrada para producir una salida. Una operación clave en estas redes implica el uso del álgebra lineal para realizar multiplicaciones matriciales, transformando así los datos a medida que son transmitidos entre capas.
No obstante, además de estas operaciones lineales, las redes neuronales profundas llevan a cabo operaciones no lineales que permiten al modelo aprender patrones más complejos. Estas funciones no lineales son fundamentales para resolver problemas intrincados.
En 2017, el grupo liderado por Englund demostró una red neuronal óptica en un único chip fotónico capaz de realizar multiplicaciones matriciales con luz. Sin embargo, esa versión inicial no podía ejecutar operaciones no lineales directamente en el chip; los datos ópticos debían convertirse en señales eléctricas para ser procesados digitalmente.
“La no linealidad en óptica es bastante desafiante porque los fotones no interactúan fácilmente entre sí. Esto hace que sea muy costoso energéticamente activar no linealidades ópticas”, explica Bandyopadhyay. Para superar este desafío, diseñaron unidades llamadas NOFUs (unidades funcionales ópticas no lineales), que combinan electrónica y óptica para implementar operaciones no lineales directamente en el chip.
El sistema desarrollado codifica inicialmente los parámetros de la red neuronal profunda en luz. Luego, un conjunto de divisores programables realiza la multiplicación matricial necesaria. Los datos pasan luego a los NOFUs programables, que implementan funciones no lineales mediante la conversión parcial de luz a corriente eléctrica sin necesidad de amplificadores externos, lo cual minimiza el consumo energético.
“Nos mantenemos siempre dentro del dominio óptico hasta el final cuando queremos leer la respuesta. Esto nos permite lograr latencias ultra bajas”, añade Bandyopadhyay. Gracias a esta baja latencia, lograron entrenar eficientemente una red neuronal profunda directamente en el chip.
El sistema fotónico alcanzó más del 96% de precisión durante las pruebas de entrenamiento y más del 92% durante la inferencia, cifras comparables al hardware tradicional. Además, las operaciones clave se realizan en menos de medio nanosegundo.
“Este trabajo demuestra que la computación —en esencia, la asignación de entradas a salidas— puede ser compilada en nuevas arquitecturas basadas en física lineal y no lineal que permiten una ley fundamentalmente diferente sobre la escalabilidad del cálculo frente al esfuerzo requerido”, concluye Englund.
La fabricación del circuito completo se llevó a cabo utilizando procesos industriales similares a los empleados para producir chips informáticos CMOS. Esto abre la puerta a la posibilidad de manufacturar estos chips a gran escala con técnicas probadas que introducen mínimos errores durante su fabricación.
Bandyopadhyay señala que uno de los principales enfoques futuros será escalar su dispositivo e integrarlo con sistemas electrónicos reales como cámaras o sistemas telemáticos. También desean explorar algoritmos capaces de aprovechar las ventajas ópticas para acelerar los procesos formativos con mejor eficiencia energética.
Dicha investigación ha sido financiada parcialmente por la Fundación Nacional Científica estadounidense (NSF), la Oficina de Investigación Científica de la Fuerza Aérea estadounidense y NTT Research.
Cifra | Descripción |
---|---|
92% | Precisión alcanzada en tareas de clasificación |
0.5 ns | Tiempo para completar cálculos clave |
96% | Precisión durante las pruebas de entrenamiento |
Un procesador fotónico es un tipo de hardware que utiliza luz para realizar cálculos, ofreciendo una alternativa más rápida y eficiente en términos de energía para las aplicaciones de aprendizaje automático.
El nuevo procesador fotónico puede realizar todos los cálculos clave de una red neuronal profunda ópticamente en el chip, completando tareas de clasificación en menos de medio nanosegundo con más del 92% de precisión, lo que es comparable al hardware tradicional.
La eficiencia energética se logra manteniendo los datos en el dominio óptico durante la mayor parte del procesamiento y utilizando dispositivos llamados unidades funcionales ópticas no lineales (NOFUs) para implementar operaciones no lineales sin necesidad de amplificadores externos, lo que consume muy poca energía.
La tecnología podría llevar a un aprendizaje profundo más rápido y eficiente energéticamente para aplicaciones computacionales exigentes como lidar, investigación científica en astronomía y física de partículas, o telecomunicaciones de alta velocidad.
El estudio se centró en superar las limitaciones actuales del hardware electrónico mediante la creación de un chip fotónico totalmente integrado que puede realizar tanto operaciones lineales como no lineales necesarias para el aprendizaje profundo.