人工智能数据中心对可扩展互连的迫切需求,正推动基于微机电系统(MEMS)的光电路交换技术(OCS)迎来关键突破。

同时,为了在有限空间里塞下更多连接(提升端口密度),大家想到了用双向光模块(一个端口当两个用)。这招确实让端口数翻倍了,但也得用定制的、非标准的光收发器。更头疼的是,控制整个系统的软件复杂度一下子激增,因为得时刻盯着,防止两条方向相反的光在同一路径上“撞车”(冲突检测)。
那些小镜子的活动关节(铰链)得超级耐用,要能承受住天文数字般的开关次数(比如10¹⁵次,相当于连续工作20年不停)。温度变化会让镜子位置漂移,导致光路不准,所以还得有实时监测和补偿的闭环系统。目前,能把MEMS做到电信级高可靠性的厂商很少,像有些厂商在波长选择开关上有十几万台设备的部署经验。但要把同样的可靠性和精度搬到数据中心用的OCS产品上,并且能大规模量产保证良率,这还是个挑战。
首先,混合架构成为必然选择,指望OCS包打天下不现实。比较可行的方案是让它处理AI训练里那种持续不断的、大块的数据流(比如AllReduce通信),而把零碎的小数据包交给传统的以太网电交换机去处理。这就要求背后的控制系统非常智能,能动态感知流量类型并灵活调度。
如数据中心中的光电路开关(蓝框)
现在一个端口通常只处理一路光。未来技术会实现在一个端口内,对多个不同波长的光信号分别进行调度(就像把一条大路分成多条车道),这样频谱利用效率会大幅提升。
最后, 把OCS和“共封装光学”(CPO)技术结合起来,能省掉可插拔光模块,进一步减少信号损耗。另外,利用AI去分析那些控制镜子偏转的数据,可以提前预测可能出现的故障,让整个系统运行得更稳当。
感谢阅读!