24日,所长到南京调研了一家做云计算大数据企业——云创数据,之所以会想着去调研这家公司,核心在于,他能一定程度解决国内大模型算力卡脖子的问题,并且值得一提的是,他家的解决方案可以说是世界首创。
在腾讯三季度投资者交流中,有投资者就美国高端芯片禁令询问对公司大模型训练的影响,对此,腾讯也承认有不小影响且给出了两点解决办法,其一,尝试是否可以把大量的推理能力下放到更低的性能行程中,如此就可以保留大部分的高性能人工智能芯片用于训练;其二,便是寻求国产替代。
虽然腾讯给出了自己的应对方案,但从回答还是不难看出,这个解决方案还是很被动的,高端芯片禁令还是会极大影响到咱们国内企业大模型的突破。

对于这点,有挖比特币经验的朋友应当非常了解,比特币刚开始诞生时,用个人电脑(CPU)就能挖,后面随着数据越来越庞大,普通电脑就不行了,得用GPU,再后面,比特币全网算力创新高的速度越来越快,很快GPU也不行了,于是有了专业的ASIC比特币矿机,就这短短几年间,ASIC矿机也经历了从110nm、55nm、28nm、16nm、7nm的迭代升级,挖一枚比特币的成本越来越高,而且如果你不用最先进的矿机,你就甭想挖到比特币。这个道理放在AI大模型训练上也是一样的,你不用最高端的芯片,就很难训练出足够智能的AI。
不过,让人意想不到的是,这样一个棘手难题的解,竟然在云创这家看似不太起眼的公司身上,说太复杂了大家也不爱听,简单讲就是,云创数据做了很多研发,与硬件研发企业一起设计了向量计算一体机,这个向量一体机基本可以理解为从硬件层面实现了向量数据库。
云创数据的向量计算一体机相当于可以做到用算法+CPU代替GPU,从而实现基于硬件加速的向量计算,再说直白一点就是,公司的向量计算一体机相当于在大模型方面,可以做到用低端芯片实现高端芯片的效果。
按照公司的说法,这款产品一秒钟能做7亿次向量计算,比我们用GPU卡强了足足40倍。单台设备相当于 60 台普通服务器的处理能力,可以大幅降低算力成本,从而解决高维向量计算中算力不足的卡脖子难题。
从理论上讲,只要算力充足,AI可以进行一切计算,包括对人类行为进行预测,但问题的关键在于,算力是有限的。
举个例子,有车的朋友在遭遇堵车时应当都有畅想过,如果有人工智能接管城市的交通规划,对全局作出最佳规划,包括红绿灯如何开放、车辆如何调配、每辆车到目的地采取哪种路线最佳……从而提升交通运输的效率,让大家出行不再拥堵,理论上是可以的,但面对这样牵一发而动全身的庞大复杂的局面,以当下的技术水平而言,即便将全世界所有的算力资源利用起来,都算不出来。
为什么Chat GPT用户这么多至今还不赚钱,就是因为其算力成本太高了,换句话说,如果以后技术水平进步到一定程度,可以低成本进行天量计算,那么很多问题都不会再是问题。
因此,所长认为,云创的向量计算一体机,价值惊人!
为何是云创?
那么问题来了,这个世界性难题,为什么是云创解决了?
成立于2011年的云创数据当下的主营业务是大数据处理和存储,在疫情前,公司的业绩整体呈现超高速增长势态,营业收入在2016-2020五年间从0.98亿元迅速攀升至3.63亿元,之所以能涨得这么快,核心在于有大数据存储业务为公司奠定扎实基础。

大数据要得到处理和计算的前提,就是先要把它存储下来,我们当下的智能手机容量大概有几百个G,但大数据的存储单位往往是TB(1TB等于1024GB)。以安防为例,咱们生活的城市中到处都有摄像头,这些摄像头24小时昼夜不停地工作,一个城市一天往往就会产生无数TB的数据,这些信息要保存下来,需要天量的硬件,由于人类社会产生的大数据越来越多,所以,高密度(即同样的硬件存下更多的数据)、低成本地保存这些天量数据,是所有企业共同的追求。
而云创通过多年的探索,最终凭借自己的努力成功开发出cStor超低功耗云存储系统。这款产品可为用户提供超低功耗、高密度的云存储服务,单个国标尺寸机柜(42U)最大可容纳5300TB存储容量,功耗低于9500W,能支持万亿级文件规模,相比传统存储模式而言,可提升约3倍存储密度、5倍节能性,还能做到编码冗余数据安全可靠,因此,公司已与华为服务器合作实现全国产化支持。

根据公司的说法,其大数据存储技术已用于5个省的中国移动公司,并且从没出现过差错,似南瑞集团(国家电网直属科研单位)、中国移动、南京公安局等等政府/事业单位都是公司的客户。

看到这里,想必大家已经差不多能理解了,为什么是云创搞出前文提到的可通过算法+CPU的方式实现对GPU的替代,从而实现基于硬件加速的向量计算。
因为先前在存储领域,公司就是用类似的思路做到了用同样的国标尺寸机柜(42U)实现比以往更好的效果,换句话说,公司对于如何最大程度利用每一块硬件的价值非常有心得。
看吧,人生没有白走的路,每一步都算数。
经过在行业内十余年的深耕,目前,云创数据已与华为、Intel、希捷、联想、浪潮等多家知名企业开展了深度合作,产品与服务已在环保、地震、公安、教育、广电等10多个领域建立600+合作伙伴,实现100+区域覆盖,拥有1500+落地案例及500+客户。
2023上半年,公司捷报不断,不仅得到多个权威认证拿下技术大奖,还收获了跨国大厂A.O史密斯的订单,据说,公司和A.O史密斯只接触了一天,史密斯立马就拍板,“这就是我们要找的东西”,于是第二天就直接战略合作了。

在可预见的将来,随着AI时代的临近,云创数据这样有实力、有技术、有客户的企业,确实是非常值得期待的。$云创数据(SZ835305)$ $腾讯控股(HK|00700)$$恒生电子(SH600570)$
(来源:价值事务所的财富号 2023-11-27 09:00) [点击查看原文]