时间:2023-03-07 10:18:01来源:界面新闻
行业人士认为,动辄超千亿参数的大模型研发不是单一的算法问题,而是囊括底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要有超大规模智算基础设施的支持。
从过往实践来看,目前国内的确只有阿里具备支撑超万亿参数大模型研发的技术实力。阿里云在张北和乌兰察布建设有两座超级智算中心,建设规模分别为12 EFLOPS(每秒1200亿亿次浮点运算)和3 EFLOPS(每秒300亿亿次浮点运算)AI算力,规模超过谷歌和特斯拉。该智算中心由飞天智算平台支撑建设,可对万卡规模的AI集群提供无拥塞、高性能的集群通讯能力,将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
在ChatGPT引爆AI领域类似应用的爆发后,更多的算力需求将传递至于阿里云。此前,互联网行业的兴起让企业上云成为“刚需”,云计算厂商曾因此获得阶段性的高速增长。此番AI浪潮,将是移动互联网之后又一轮的算力爆发点。
阿里云进入新的增长周期判断一项业务增长的潜力,不仅取决于其自身的产品力和所处的行业环境,公司对于业务的战略性思考也在其长远发展的道路上起到举足轻重的作用。从目前的动作来看,2023年的阿里云有底气迎来新的增长周期。
去年12月29日,阿里巴巴集团董事会主席兼CEO张勇兼任阿里云智能总裁。此举意味着阿里云在集团的战略地位又一次升级。
2月23日晚间,在财报发布后的电话会上,张勇强调,云计算是阿里巴巴面向未来的核心战略之一,是阿里全面扎根实体经济、服务数实融合的基本支撑。
张勇称,目前,云计算和人工智能的结合正处于技术突破和发展的关键时期,生成式AI正在发生颠覆性突破,阿里巴巴将全力构建好自己的AI预训练大模型,并为市场上风起云涌的模型和应用提供好算力的支撑。
过去的实践中,阿里云用一些难以替代的实力确立了头部厂商的位置。利用自研的软硬一体技术,阿里云正在重构数据中心,实现更高性能、更低成本。在市场需求激增之后,其“自研”技术或将有更多落地机会,逐步释放竞争力。
硬件方面,自研CPU倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%。云数据中心专用处理器CIPU对计算、存储和网络资源进行管理和加速,让性能了提升20%以上。
软件层面,作为中国唯一云操作系统,阿里云“飞天操作系统”是驱动阿里云增长的核心核心推动力,正在全面兼容X86、ARM、RISC-V等多种芯片架构,实现"一云多芯"。
中信证券发布研究报告称,ChatGPT在全球的流行正在推动AIGC产业化正在全面提速。目前AI相关应用主要依赖云厂商庞大的算力与网络资源支持,且需求量日渐增长,未来有望推动相关硬件基础设施的不断扩容升级。此番浪潮掀起,市场端需求爆发,阿里云将是最直接的受益者。