今天东芯股份的成交量很大,我不知道说什么,对于买卖点,我也不知道,总觉得要做点什么?要不就学习一下砺算的7G100吧。
首先我来回答一个问题:消费级芯片不是不能跑模型,现场部署了deep seek的推理模型也是没有问题的。只是卡不能相互通信,比如说你有10个16G显存的显卡,消费级的就是10个16G,相关之间不能通信。而算力级的可以是160G 的显存,显卡相互之间可以通信,这样才能跑很大的数据中心。目前已经是在限制条件下,国内能做的最好的消费级显卡了。从研发难度上来讲,CPU是1,GPU是0.4,算力GPU是0.1。本身7G100就有算力,能不能联网就看国内有没有代工6nm的能力。这个我说得很明白了吧!
下面的答案都是砺算科技发布的,我给大家整理一下。 问:为什么要自研架构? 砺算自研TrueGPU架构,系针对新一代高性能图形渲染的需求以及AI应用普惠化浪潮对芯片的新要求而设计的第一代GPU融合架构,也是业界第一个融合了高性能图形渲染和高性能人工智能推理能力的GPU架构。GPU芯片研发,许多公司选择购买现成的IP,这就好比别人已经为你搭建好了一座房子的框架,你只需在这个基础上进行一些装修和调整。然而,这种做法有诸多限制,就像你不能随意改变房子的结构一样。相比之下,砺算科技选择自主研发架构,这相当于要从一块空地开始,设计并建造一座全新的房子。从规划蓝图到挖掘地基,从搭建房屋框架到装修每一个细节,都需要自己亲力亲为。这意味着砺算科技需要在软件和硬件两个领域同时进行深入探索和研究。
研发周期方面,购买IP研发GPU芯片的公司如同来料组装通常开发工作不多,很快可以流片。而砺算科技却是从市场需求出发,定义产品规格,基于产品规格,前期就需要化费很多时间在架构设计上。从算法、顶层架构设计到微架构设计,他们要反复推敲架构的合理性,就像建筑师反复修改设计图纸,确保每一个细节都符合要求,这一过程可能就需要数月甚至以年计。然后在硬件设计上,通过世界先进的设计理念,他们要从最基本的模块开始,一点一滴地构建起全新的 GPU 架构。这个过程充满了挑战,需要不断地试验和调整。在软件层面,为了确保与硬件架构的完美匹配,软件团队需要同步进行驱动程序和编译器等开发工作。这就像是在没有完全建好房子的情况下,就开始设计装修方案和家具摆放位置,需要不断地根据房子的建设进度调整计划。而这样软硬件协同设计的优势,在研发后期和快速量产阶段,就会显现出来。当有的公司在芯片生产出来之后,还需要冗长的软件开发时间和调试时间,持续的一直更新驱动的时候,砺算GPU是在流片前就已经完成了软件开发。这个in house开发的软硬件协同设计的体系,是处于世界前沿的专有先进研发体系,是砺算的核心能力之一。
问:TrueGPU架构作为砺算自研内核GPU的精髓,有什么独特之处呢? TrueGPU架构就像是一个全能战士,它将高性能图形渲染和AI推理能力融合在一起,使得我们的芯片在处理图形渲染和AI计算任务时能够无缝衔接。在图形渲染方面,该GPU支持高算力,大显存以及AI辅助渲染技术。这就好比一个超大规模的渲染工厂,拥有无数个高速画笔和流水线,配有大型的物流仓储;可以计算、存储海量的图形数据并在瞬间完成复杂的图形绘制;能够轻松应对高分辨率、高帧率的3A游戏场景,也能满足专业图形设计软件对图形处理能力的苛刻要求。另外该架构原生支持各类主流图形以及计算API,如DirectX12、Vulkan1.3、OpenGL4.6和OpenCL 3.0等,这使得砺算GPU能够与现有图形生态无缝对接,开发者可以充分利用这些 API 的功能,开发出更高效、复杂的图形应用程序。
问:在AI推理方面,这颗GPU又有哪些优势呢? 这颗GPU的AI算力数倍于市面的AIPC,这使其在处理复杂的AI任务时表现出色。无论是Copilot,RAG,还是Coding等AI Agents,它都能以惊人的速度提供高精度的计算支持。为了让普通用户在PC上更方便的使用人工智能,我们从设计之初就考虑到了兼容和移植问题,用户可以无缝地完成任务迁移。未来相信国内的各类大模型也可以与砺算GPU的底层ISA完成进一步的适配优化,从而丰富自己的生态体系。
问:第一颗GPU在实际应用中的性能表现将会如何? 它的性能在图形渲染和AI推理方面的性能表现堪称卓越。除了高算力,大显存的优势,它对现有生态的兼容支持也非常完善,为开发者提供了广泛的开发灵活性。通过片上自有的AI算力为图形渲染进行辅助加速,提升渲染效率和效果。我们自研的NRSS神经网络模型在提升画质方面表现出色,能够与国外竞品的DLSS、FSR等技术相媲美。这就像给传统的绘画工具配备了一个智能助手,能够自动优化画质、提高分辨率和输出帧率,并使图像保持清晰自然,这对3A游戏场景的性能体验非常有益。
问:除了图形渲染和AI推理,它在其他方面还有哪些优势? 借助自研内核的优势,我们的GPU还具备一些独特的技术特性。例如:更高效的硬件虚拟化技术,为高性能的云桌面和其他GPU资源分配应用提供了高性价比、高品质的选择。这就好比一个多功能的会议室,可以同时满足多个团队的工作需求。在家里你甚至一个PC,两个人同时使用,互不干扰;另外显示端的FreeSYNC技术,可以像GSYNC一样为用户提供渲染输出的丝滑体验,告别撕裂和跳帧,并提供高动态范围的超高分辨输出,此外,我们的Max-E低功耗技术通过动态的主动功耗管理和应用性能调整,极大地提升了芯片的性能功耗比。在长时间运行图形密集型应用时,该技术可以有效降低芯片的发热和能耗,延长设备的使用寿命。
问:TrueGPU架构是如何支持这些强大的性能表现的呢? TrueGPU架构的创新之处在于它不仅融合了图形与AI能力,还通过高性能计算单元和多任务处理能力,确保了芯片在复杂应用场景中的高效表现。基于 unified shader+tensor engine的核心运算单元,TrueGPU架构能够更好地兼容AI生态,提供高效的计算能力。这种架构设计使得芯片在处理多种任务时具有更高的灵活性和效率。 TrueGPU架构支持多种图形和AI工作负载的组合处理,提供了强大的多任务并行处理能力。这使得砺算首代系列GPU能够在各类复杂的应用场景中保持高性能表现,从而满足用户对多样化应用的需求。