首个在太空数据中心训练的大模型已经诞生

当人们还在争论,在太空建立数据中心是否可行时,Starcloud已经利用前不久通过SpaceX火箭发射到太空的搭载英伟达H100 GPU芯片的太空数据中心完成了人类历史上首个在太空训练的大模型工作。

Starcloud在不久前将一颗H100 GPU送入太空,其计算能力比以往任何进入太空的GPU都要强100倍。Starcloud利用H100芯片在轨道上运行了NanoGPT,并使用莎士比亚全集进行训练。这使得该模型能够用莎士比亚式的英语进行交流。

首个在太空数据中心训练的大模型已经诞生
Starcloud-1卫星2025年11月2日由 SpaceX火箭发射升空

装载这颗GPU的 Starcloud-1 目前正在太空运行,并可以向谷歌开源大语言模型Gemma查询响应。

工程师们在地面通过互联网与这颗卫星进行了首次交互。Starcloud-1 利用其训练的大模型向人类返回了深刻的问候。

“地球人,你们好!或者,我更喜欢称你们为——一群迷人的蓝绿色生物,”

首个在太空数据中心训练的大模型已经诞生
来自太空大模型的对话

目前这只是一个实验,Starcloud以此证明在太空建立数据中心的可行性。利用太空良好的电力供应和散热能力,可以让人工智能的运算成本直线下降。

未来,Starcloud打算在太空建设一个5吉瓦的太空数据中心,其太阳能电池板和冷却板的宽度和高度均约为4公里。这依赖科技水平的支持,特别是卫星通信和降低的火箭发射成本。但是种种迹象表明,这一设想正在变为现实。

我们也注意到,随着人工智能,大模型技术的发展,人类需要进行分析和处理的数据越来越多,算力已经成为产业发展的瓶颈。

首个在太空数据中心训练的大模型已经诞生
Starcloud太空数据中心构想

然而这些数据中,本身就有很多数据来自于卫星。包括气象,图像,军事,通信等领域。如果让这些卫星数据资源直接在太空进行训练,只需针对应用反馈给地面结果,这将是高效且有吸引力的。

现在看来,在太空领域的卫星通信竞争很快就会开辟新的战场,将地面的算力竞争引入太空。这将进一步增加火箭发射的需求,未来几年的太空运力紧张,短时间内无法得到缓解。无论是科技领域还是资本领域,主战场仍然是太空。

本文仅代表个人观点,只做交流分享之用。部分资料来源与网络,如有侵权请随时联系处理。发布者:章鱼评测,未经作者本人授权,禁止任何形式转载本网站内容。微信:15711082980:https://500miao.com/?p=3314

(0)
章鱼评测章鱼评测
上一篇 1小时前
下一篇 1小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注