时间:2024-10-18 01:35:01来源:界面新闻
在10月10日举办的vivo开发者大会上,AI成为了绝对的主角。
大会期间,vivo发布了全新AI战略——「蓝心智能」,以及完整升级的自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统2,以及vivo在安全、人文、生态合作等方面的最新成果。
自ChatGPT引发的生成式AI风潮兴起之后,AI成为智能手机领域当下最炙手可热的概念。但在过去一年的时间里,由于行业技术尚未完全成熟、基础设施不健全等原因,市面上的AI手机大多还只停留在单一功能点创新的阶段,并没有出现令用户期待的颠覆式革新,AI手机的概念也在爆火后迎来沉寂。
行业沉寂之时,恰恰是参与者深度思考的好时机。手机厂商试图解答围绕端侧AI的核心问题:它到底能够做什么,以及应该实现怎样的目标?
蛰伏11个月之后,vivo带来了一张新答卷——将大模型技术与手机操作系统深度融合的蓝心智能。它以蓝心大模型为技术底座,能够理解用户的个人情景和偏好,通过更自然、更符合直觉的交互,来为用户提供个人化的专属服务。为此,vivo做了一系列系统重构的工作,也重新定义了人与设备、人与数字世界、人与物理世界的交互与连接。
从单点创新,到系统重构提起AI手机,大部分用户可能会第一时间联想到文生图、路人消除、会议纪要等生成式AI相关功能。在ChatGPT 3.5时代,这些功能为用户提供了眼前一亮的体验,但绝不是对AI手机的全部定义。手机厂商意识到,大模型要真正在端侧发挥功效,最难且最核心的挑战,一定在于对系统的重构。
蓝心智能就是一次突破性的尝试。在OriginOS 5中,vivo对于AI手机的构想有了更完整的落地。vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围将vivo在过去11个月的努力总结成三件事:升级已有功能、构建公共能力并向第三方开放,以及构建具有执行能力、真正服务于人的智能体。
第一件事是用AI来升级现有的手机功能。以搜索为例,这是用户在手机上最常使用的功能之一。过去的搜索限定在特定APP的搜索框内,用户需要复制关键文字,再切入特定APP内进行操作,这种做法显然低效。
OriginOS 5内置的小V圈搜功能,采用了一种更符合直觉的人机沟通方式:通过长按导航条的形式将它呼出,直接用手指圈选手机上的图片、文件、文字等任意内容并向下拖拽,即可完成一次搜索。这还不仅仅是一次简单的搜索,也能够融合用户的个人数据来做下一步操作的意图识别,用更本地化的思维做主动的理解和思考。
于是,人与设备的交互开始变得更自然。Origin OS 5搭载的「原子岛」功能,将原有的通知功能结合了蓝心小V的意图识别能力,能够不断分析和判断用户当前需求,主动提供后续服务。用户可以通过一按一复制,融易新媒体消息,或一按一拖拽的交互形式来布置任务;新升级的「小V建议」以桌面常驻组件的形式,根据用户所处的时间地点,不间断地为用户提供打车建议、登机口提醒、旅行城市攻略等。
改变了交互形式之后,vivo做的第二件事是重构数字服务体验,这不能只依靠vivo一家的力量。
过去用户需要下载不同的APP来满足不同的需求,但同时也带来了内存负担,且体验不够智能。vivo一边搭建好基础设施,一边将自有的AI能力向第三方合作伙伴开放,让用户在需要作业指导时,可以用教育智能体来进行在线辅导,有就医需求时,用医疗的智能体来帮助挂号。
第三件事也是最具挑战性的一件事,即真正让AI代替用户来执行部分操作。
OriginOS 5搭载了vivo自研的手机智能体「PhoneGPT」,这是一个可基于用户意图和习惯,实时自主拆解需求并主动规划路径的多模态助理。例如其中的「小V订座助手」功能,通过语音对话说出想要预订的餐厅类型、时间,和人数后,它可以自主跳转相关APP,找到符合需求的餐厅,识别餐厅电话并自动进行电话预约。
从理解订餐意图到完成电话预约,这是一个极其复杂的链路,它需要让PhoneGPT尽可能接近于人,像人一样会识别界面、会与餐厅交流。这是完全由vivo训练的大模型,在数十万应用投喂训练的之后,vivo把一个操作步骤的执行时间速度缩短到了2秒,而这仅仅是一个起点。随着PhoneGPT逐渐强大,相应的功能也会变得更加丰富。
做符合直觉、遵循常识的事OriginOS 5是vivo对 AI 手机阶段性解答。事实上,AI手机到底应该怎么做,所有手机厂商都在摸着石头过河。