太空算力是个很糟糕的题材,我认为目前的技术来说,太空算力根本不现实,性价比极低。它有很多问题现有的各种解决方案都没有正面回应。
一是电力问题,太空装光伏发电效果并不会太理想,迄今为止最大的太空太阳能板就在国际空间站,峰值功率200千瓦以上,但是光伏板面积巨大,约为2500㎡,超过半个美式橄榄球场。而的 H200 显卡功耗约为 0.7kW,实际运行可能需要 1kW 的电源。国际空间站的太阳能板只够供电200个 H200。作为比较,OpenAI 即将在挪威建设的数据中心计划容纳10万个 GPU,每个的功耗可能都比 H200 更高。如果可控核聚变突破,那么这个问题或许会有效解决,但是可控核聚变的商业化堆落地也很久
二是散热问题,由于处于真空环境,目前的航天器都是无法通过热传导和热对流与外界交换能量,只能通过热辐射,而热辐射散热的速度效率极低,所以我们可以看到空间站上都是装着巨大的散热片。目前在太空 GPU 的散热唯一方式是液冷,通过液体将热量传递到散热板,再辐射到太空(散热板必须放置在远离太阳的一面)。空间站就采用辐射散热。它的散热系统非常复杂,散热上限为 16kW,大约相当于16个 H200,略多于一个地面服务器机架的四分之一。国际空间站的散热板尺寸为13.6m×3.12m,即大约42.5㎡。如果要为200个 H200 散热,面积需要扩大12.5倍,即大约531㎡。这个面积是同样功率太阳能板的2.6倍。这样一来,太空数据中心将变得非常庞大,远超国际空间站,而容量只相当于地面的三个标准机架。我看了下,1Gw的数据中心需要约 240万㎡ 的辐射散热板,相当于 336 个足球场的面积。我觉得这根本不现实。这么大面积你从地面都能看到空中有一大片阴影。且不说维护成本,它还可能引起政治及太空环境保护问题。
三是粒子射线问题,太空有各种高速粒子,由于没有大气层保护,它们可以直接撞击芯片材料造成损伤。最常见的后果是单粒子翻转(SEU),即粒子直接撞击晶体管,导致某个比特翻转。太空数据中心必须长期运行,还存在总剂量效应,即反复的粒子撞击导致晶体管开关速度变慢,进而停止工作。所以需要有一个屏蔽层,但是最强的宇宙射线可以穿透惊人厚度的铅层。而且受限于飞船的运送能力,太空中不可能部署很厚的屏蔽层。为了增加 GPU 和内存的抗辐射能力,有必要为太空环境重新设计芯片,增加容错性能。但是,这样的芯片性能将远不及目前地球上的 GPU。
四是通讯问题,大多数卫星通过无线电与地面通信,速率超过 1Gbps 都很困难。虽然有一些激光方案可以提高带宽,但需要良好的大气条件才能实现。此外1G的通信速度下电话,传消息,定位是没问题的,如果要做算力,Ai计算,我觉得很扯淡。要知道地球上的数据中心之间的通讯,以现在最新的光模块技术都要到1.6T了。而天地通信还可能存在丢包的问题。
马斯克他们的方案里面都没有正面回应这些存在的问题。我也不知道它是怎么解决这些问题。所以我对太空算力持怀疑态度,你说商业航天或许还有一些业务场景支持,太空算力现在纯是PPT。