时间:2023-06-24 20:33:02来源:界面新闻
界面新闻记者 | 于浩
近日,美图一口气发布了AI视觉创作工具WHEE、AI口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、主打AI商业设计的美图设计室2.0、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision等7款产品。
此次美图发布的新产品大多会于7月份正式上线,视觉大模型MiracleVision也将于近期开始在美图旗下产品内测。美图公司创始人、董事长兼首席执行官吴欣鸿强调,7款产品发布后,美图逐步形成了由底层、中间层和应用层构建的AI产品生态。
应用层,美图在AI图片、AI视频、AI设计、AI数字人领域探索,并由美图秀秀实现AI影像服务聚合;中间层,美图提供了美图AI开放平台、美图创意平台、美图AI助手RoboNeo的组合;底层则是MiracleVision视觉大模型,为美图全系产品提供AI模型能力。
美图给此次发布的视觉大模型MiracleVision打上的标签为“懂美学”。据美图介绍,MiracleVision从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化,擅长亚洲人像摄影、国风国潮、商业设计等生成方向。
与文本相比,视觉大模型的训练所消耗的算力会更大;在数据采集方面,图像数据较文本数据更难获取、数据质量也更加参差不齐。如何优化模型结构降低算力消耗、更高效地实现数据的收集和清洗,这些问题都增加了视觉大模型的研发难度。
美图公司技术副总裁兼美图影像研究院负责人刘洛麒也表示,即便图像模型参数规模扩大至与文本大模型相近的程度,可能还是不够的。他认为,文本本质上是一种压缩过的抽象化表达,而图像则是对真实世界的客观展现,本身带有密度很高的冗余信息。因此,图像模型需要更大的参数规模,这也会是未来需要去突破的技术难点。
AI相关的投入、视觉大模型的研发成本在美图的财报中也有所体现。2022年美图公司研发投入为人民币5.86亿元,同比2021年增长7.5%。面对研发成本问题,美图选择以构建模型生态的方式来分摊压力。
吴欣鸿提及,未来创作者可以基于MiracleVision进行二次训练,其训练的模型可以在美图旗下产品进行分发,还可以通过API或SDK进行商业使用从中获益。借由这种方式,美图试图围绕MiracleVision搭建起模型生态,以此来反哺模型所需的计算资源、优化模型。
另一方面,美图也在积极开源以补充其在AI方面的投入。2022年美图公司经调整后归属于母公司权益持有人的净利润为人民币1.11亿元,同比增长29.9%。能够实现全年盈利的一大原因就是VIP订阅业务及SaaS相关业务的营收增长。
据吴欣鸿透露,截至6月18日,美图的全球VIP会员数从去年影像节公布的450万增长至719万。2022年美图公司VIP订阅业务实现收入7.82亿元,同比增长57.4%。作为简单直接的变现方式,开放VIP订阅服务迅速为美图创造了营收新增长点,但另一方面也带来了用户流失的潜在可能。
对此,美图公司集团高级副总裁,影像产业事业群总裁陈剑毅回应称,在设计VIP功能时美图会秉持“抓小众、刚需”的思路。他以发际线修补功能为例,覆盖的用户不会很多,但是对应到具体用户群时就会成为痛点需求,这类功能才会考虑被列入VIP功能,以此来平衡用户体验与商业化之间的冲突。
在此次影音节上,吴欣鸿曾多次强调了美图正在经历由服务生活场景向生产力场景的变化,融易新媒体,这背后正是美图所找到的另一个增长点。上述服务场景转型的思路,在此次美图所发布的新产品矩阵中多有体现。其中,如桌面端AI视频编辑工具WinkStudio就是由原先的Wink产品孵化而来。
在美图的服务场景中,一项底层技术在B端与C端两侧可能会衍生出不同的使用场景。如C端用户用来截取人像的抠图功能,就能够应用到电商商家生成商品图的场景中,而两者在底层技术上是共通的。
“美图算是主动求变,”吴欣鸿表示,“今天美图产品的工具属性已经发生变化。在AI时代,除生活场景外,美图将提供更多生产力场景的服务,如视觉创作、商业摄影、专业视频编辑、商业设计等等。”与之相对应,2022年美图SaaS及相关收入同比增长1093.2%至4.63亿元。