用户头像
TONGE2022
 · 河南  

$恒为科技(SH603496)$

最有预期差的ocs光交换机——恒为科技

今年的第39届SIGCOMM 2025 将于9 月8日-11日在葡萄牙科英布拉举行。届时,恒为科技将公布更详细的OCS光交换产品系统方案细节。


区域性光路互联 + 全局数据包交换网络:基于训练通信测量与结构性分析,MixNet使用区域OCS(Optical Circuit Switch)按需连接处于同一专家组的GPU,极大降低光端口需求与硬件成本;同时,所有节点通过电交换网络(EPS)实现全局互联,确保灵活性与可达性。该光电混合架构兼具 OCS的高带宽与EPS的可扩展性,可支持至万卡甚至十万卡规模。
训练中动态拓扑重配置:根据每轮训练中活跃专家对的通信需求,MixNet在all-to-all通信前按需重配置光路,精准匹配流量拓扑,提升通信效率、减少资源浪费。
支持GPU/NIC故障恢复与训练连续性:MixNet结合OCS和EPS备份路径与区域重映射机制,支持单 GPU、单NIC故障容忍与整节点故障恢复,保障大规模分布式训练的可靠性。
研究团队在真实系统(32端口毫秒级OCS光交换机 + 32×A100 GPU)上完成了MixNet的原型验证,并使用大规模数据包级仿真对其进行了系统评估。结果显示,MixNet可逼近理想Fat-tree / Rail-optimized网络性能,同时将网络部分的性价比提升2.5倍。

S恒为科技(sh603496)S(来自韭研公社APP)