时间:2023-03-20 00:47:02来源:界面新闻
2018年百度自主设计、2019年流片成功、2020年实现量产、2021年升级的百度昆仑AI芯片也已经得到大规模应用。此外,百度还研发出鸿鹄语音芯片,打破了卡脖子问题,使中国公司不再完全依靠外来输入。
国际欧亚科学院院士李世鹏认为,在一些核心软件领域,国产基础软件受重视的程度并没有想象中那么深入。基础软件的重要性,与底层的芯片算力同等重要。百度从“芯片”到“基础软件”的技术架构,有效地扩展了人工智能技术的通用性,使得 AI 技术的开发和应用门槛不断降低。透过百度等头部公司的努力与取得的成果,我们看到了更多国产基础软件努力向上的动作。
百度各业务都有AI应用,在AI的三要素,算力、算法和数据上,百度也拥有领先优势,而且大多都源于日常业务累积。文心一言的官宣,恰恰是百度长期在AI技术与大模型领域投入的体现。
2019 年,百度推出了文心大模型ERNIE 1.0。ERNIE 3.0目前每天接受数十亿用户的搜索请求和其他百度移动生态app的训练。随着时间的推移,文心一言将基于一个庞大的、标注清晰的数据池,实现快速的改进和学习。
在搜索方面,自2019年3月以来,文心大模型在改进搜索结果方面发挥了重要作用,带来排名改进和多模态搜索能力;在云方面,AI专业知识为制造、能源等传统行业提供特定的AI解决方案和应用;智能驾驶业务是百度AI能力护城河又一证明,比如,guidehouse自动驾驶产业排名,百度位居全球领导者之列,是中国唯一上榜企业。
但更深层次的原因是人类进入人工智能时代后,IT技术的技术栈发生了根本性的变化。过去分为芯片层,操作系统层和应用层,现在则可以分为四层:芯片层、框架层、模型层和应用层。
百度是全球为数不进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术。文心一言位于模型层。
百度在技术栈四层架构中,可以实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。
当然能够在软硬件各个层面都具备文心一言诞生的基础,这一切都来源于百度常年在AI领域马拉松式的研发投入。
数据显示,百度在近十年累计研发投入超过 1000 亿元。2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。
高研发投入让百度储备先发优势,面对大模型惊人的算力需求做到游刃有余。跑通一次100亿以上参数量的模型,算力至少需要1000张GPU卡。GPU芯片中领先者如A100售价达1万美元, 微软Azure云服务为ChatGPT布署了超过1万枚英伟达A100 芯片。即使不使用顶级芯片,按照一张GPU五万元的市场均价计算,1000张GPU意味着单月至少5000万的成本。业界测算,gpt-3单次训练成本至少460万元。
在中国互联网大公司中,鲜有人愿意如此长期、大规模地对技术进行投入。而百度做到了,文心一言的诞生也因此顺理成章,它是百度追逐技术改变世界的产物,也或许能真正改变中国AI产业的发展。
文心一言将如何改变世界?从用户层面上来说,文心一言可以服务亿万用户,尤其是中国用户,有数据显示在未来十年中,人工智能可以将知识工作者的生产力提高4倍以上。文心一言开始使用后,将建立真实用户反馈、开发者调用和模型迭代的飞轮,进步速度将非常快。
对于企业和AI产业来说,很显然,大模型是没有人想错过的巨大机会。
文心一言不仅会影响搜索或者互联网公司,而且会影响到每一家公司。文心一言的定位是人工智能基座型的赋能平台,通过新技术帮助企业创建最好的客户体验,让任何公司有机会离客户更近,从而深刻地影响千行百业中每一家公司,实现智能化变革、效率提升,获得更强的竞争优势,创造更大的商业价值。
第一类是大模型基础设施公司。这类公司其商业模式是MaaS,通过云计算输出能力和服务。文心一言,将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来更多会看框架、模型,以及模型、框架、芯片、应用这四层之间协同。