OPPO AI战略发布会群访:希望整个生态一起去探索AI手机

GodWen | 2024-02-23 15:35

2 月 8 日年三十,OPPO 召开了一场相当短暂且特殊的发布会,宣布他们正式进入 AI 手机时代,开启了「千万用户 AI 升级计划」,并为旗下的众多机型进行了全新的 AI 新春版系统更新,将 AI 功能带到用户手中。

转眼来到年后,OPPO 也召开了一场更详细的 AI 战略发布会,我们也受邀来到了会议现场,与 OPPO 首席产品官刘作虎、OPPO AI 中心产品总监张峻以及现场的众多友媒一同,就“OPPO AI 战略”这一话题,进行了深入的沟通与交流(访谈内容有精简)。

问:大年三十 OPPO 公布了 AI 战略,all in AI 似乎是今年手机转型的一个方向,但在刚刚的圆桌论坛上,似乎大家对于 AI 手机的概念并不是特别明确,摒弃传统的 APP 界面似乎是一个共识,通过语音交互似乎又是一个共识,具体 AI 手机在您的心目中应该是什么样,能描述一下吗?

刘作虎:刚刚在发布会上,我讲了 OPPO 对 AI 手机的定义,也发布了 OPPO AI 白皮书,这是目前 1.0 的 AI 手机版本。

未来是什么样?我们也希望整个生态一起去探索中国的 AI 手机,不能简单地只说手机形态的变化,或者手机交互界面的变化,这只是很表层的东西,核心 OPPO 一直思考的是 AI 手机带来的行业变化和对用户的价值。

今天讲的这四个能力,是 OPPO 对 AI 手机的定义,未来只有具备这四种能力的手机,才叫 AI 手机。你刚才问到的反而是 AI 手机给用户带来的交互体验变化,我举一些让大家更有感受的例子。

今天你说订机票,要打开携程;要订餐,打开美团,每一个 APP 都是独立的孤岛,并不是以用户为中心。而未来的 AI 手机会像一个超级助理,真正变成一个以人为中心的手机。它会把手机里面的「孤岛 APP」连在一起,通过自学习,越来越聪明,进而提供一站式的服务。

其实用户对于手机,需求的是服务,手机就应该以用户为中心,提供用户需要的一站式服务。拿这个问题展开来说,未来 AI 手机交互的界面可能会改变,比如说语音可能是一个入口,视觉也是一个入口,这些入口可能都会存在,用户使用手机的习惯会出现变化,但核心在于 AI 手机的使用体验会完全不一样,以后不用再复杂地打开每一个 APP。

回到比较官方的关于 AI 手机定义的回答,就是发布会讲的 OPPO 关于 AI 手机的定义,必须要具备那四个功能,才能叫 AI 手机。但是AI手机可以带给用户的使用体验,还会有很多其他的方式。比如说你是年轻的帅小伙,你想从手机里找你女朋友的一张照片,你今天的做法是不是要不断地去翻手机相册?翻起来太麻烦了,以后不就是一句话就能实现吗?这些体验,我觉得是很快就能实现的,大家以后就能感受到。

问:我们知道现在所有的智能手机都是基于 GUI(图形用户界面),现在有些人提出能不能慢慢弱化,甚至是脱离 GUI,就像现在比较火的 Regie,或者像比较早的类似 AI Pin 这样的产品,直接用自然语言输入,然后机器直接给我们自然语言输出;相比于现在所有智能手机厂商都在走的那种,还是基于 GUI,但是用 AI 的力量给它加持,这两种路线,您觉得哪种更符合您心中对于未来人机交互终极的形象?

刘作虎:我有一个观点。首先,不管什么时候,人跟世界的联系无非就是眼睛、耳朵、触觉,类似这些东西。但是人获取信息最主要的渠道是什么?这个大家肯定看过那个数据,一定是眼睛,所以视觉是人从这个世界获取信息的最主要来源。基于这个观点,是不是存在只需要一个声音或者听觉去跟它交互就可以呢?我不能说这种场景不存在,在一些差异化的场景或者特殊的需求下,肯定会有这样一些创新产品存在,但视觉还是人获取信息最主要的渠道。

基于这个底层的逻辑,再看理想的交互方式应该是什么,这个时候大家可能会说有屏幕,还有投影,还有 VR 这样的产品,但是我自己的判断,手机至少在 10 年之内肯定是一个人最不可离开的一个设备,它的形态有可能会发生一些变化,但我认为不会发生根本性的变化。我的意思不是说其他类似 AI Pin 那种产品不会存在,可能它也会差异化存在,但是我认为手机还是一个最主要的载体。

手机的交互跟现在相比会有变化,从输入的角度来讲,语音会不会成为更直接、更高效的输入?但也不能排除其他文本的输入,比如在电梯里面不好意思用语音去输入,在不同的场景下,用户会有不一样的交互需求。

从整体看,GUI 还是一个非常重要的交互方式。

 

张峻:我接着补充回答,大家想问的其实是这个问题:AI 手机作为一个新概念,它相比于现在的智能手机到底有多大区别?其实今天我们跟 IDC 的霍总在做白皮书的时候,我们也探讨过一个问题。一个能支持 AI 功能的智能手机和一个 AI 手机,它的区别到底是什么?这就是为什么 OPPO 今天抛出了 AI 手机的四个特点。每一个特点,都可以跟支持 AI 功能的智能机对比一下,智能机现在是不是具备。

第一,它具备自主学习能力。自主学习能力不仅是意味着模型本身,而是意味着交互体验的变化。

第二,它具备高效利用计算资源的能力。现在各家都在谈大模型端侧化部署,大模型端侧化意味着对手机硬件算力资源的再分配,无论是叫 XPU,还是 NPU,当然也会涉及到其他的 PU,还是内存的使用,还是功耗、底线占用的资源分配原则,这些都会相应地发生变化。这是底层的,用户感觉不到,但是这些变化的目的是为了可以把大模型装进手机里,这就意味着将来真正把模型装进手机了以后,不换 AI 手机用不了这些功能。

第三,它具备创作能力。也就是生成,现在大家看到的还是比较单点的生成,比如说 AI 消除,把图片中的行人消掉,生成缺失的背景,这件事情本身你觉得跟手机没关系。但是今后手机提供给用户的服务可能都是生成的。大家现在看我桌面上这张泛在卡的,它是事先做好的,只是说没有提前给到用户。但是当我真正需要的时候,比如说要出门,AI 就会把航班信息、天气预报、打车信息全部生成在一张卡上,那个时候就是手机的 AI 在生成,而不只是在手机里面加载那个 AI 功能,所以这也就是说这个手机本身是有生成的能力,但是它生成的是什么,其实有很大的想象空间,卡片也只是一种可能性而已。

最后,是它具备更强的感知能力。这种感知能力是基于这些传感带来的手机全方位体验的智慧化。打比方说,你现在用的麦克风、扬声器,因为它有传感能力,能感觉到你环境的内容,而带来不一样的音量,这就是手机本身的 AI 化,所以 AI 手机其实现在确实坦白讲,这个概念听起来有点抽象,但是事实上在我们看来,它是一个全栈 AI 化演进的革命。

问:刚刚有提到一个真实世界感知的问题,我想了解一下目前你们觉得手机本身的传感器是不是已经足够来做这些关于真实世界的感知,比如刚才提到的麦克风、摄像头,是不是还可以感知一下温度、湿度什么之类的?我不太了解,手机厂商方面有没有其他的想法?

张峻:首先传感器这一部分,存在即合理,现在手机上存在的一系列传感器都有它们目前的传感价值,而且我们也认为它的传感价值可以进一步深化。但是你要说在上面会不会叠加新的传感器,我觉得一定会。因为随着技术的演进,甚至包括化学的技术和其他相关技术的演进,传感的方向、传感的数据类型、传感的灵敏度和精准度,这些都一定会进步。随着这些进步,我觉得一定会有新的传感。但是它现在是什么,我没有办法回答你,如果我们真的要做了,那就是敬请期待。

问:OPPO 认为制约手机上的 AI 因素有哪些?目前有做哪些提前布局吗?

张峻:这个问题挺大的,其实这个是在问 AI 手机本身的关键要素。从 AI 手机本身的布局来讲,我们认为是是全栈。

第一层是从硬件平台开始,OPPO也确实在跟芯片厂商联合探究怎么样更好地去适配AI的部署、AI的算力、异构计算、资源分配、高效利用等方面的这些问题,包括传感器。

第二层,从 OS 的角度来说,是多元化的。第一个是最接近硬件那一部分的底层软件架构,它本身就会因为 AI 的变化进行适配,它的资源需要重新分配,考虑它的重新分配策略,比如说功耗、比如说算力、比如说内存管理。那么再往上,就是智能体,今天发布会上有提到,它可能是智慧OS的核心了,这部分基于各种大模型的能力,包括智能体本身的这种能力。今天可能讲得比较抽象,我再举一些例子。

比如说智能体,我们讲它有规划、记忆和工具能力。到底是什么意思呢?就是我们正常在用手机的时候,一系列的动作是我们自己做的,比如说我们真的要出去玩,订机票、订酒店、查景点、规划行程等等,这些是我们自己做的。但是智能体,它有规划能力是意味着它有复杂任务自动化的规划能力,你告诉它,我要出门了,国庆节想去新疆,它会把这个行程生成出来,当然你可以去让它修改。修改后,它会帮你去规划,修改完这个行程是你认可的,它告诉你可能在哪些平台上有什么合适的机票,哪些平台上的景点有合适的门票。所以它是有复杂任务自动化规划能力的,这是智能体的第一个特点。

第二个特点,记忆,它就像真的是一个助理一样,因为它是你个人的,所以它会有长期记忆,你跟它聊过天,你这个人的风格比较幽默,可能你让我生成朋友圈文案的时候,我就会生成得好玩一点。这个人可能平常总是跟我聊一些特别严肃的事情,我生成朋友圈文案可能就会严肃一点,那么这些它是基于不断地跟你交互的记忆带来的。

第三个能力就是工具能力。是因为智能体不是无所不能的,我相信有一段时间,大家在讲大模型好像计算不太行,后来它修复好了,但确实它不是无所不能。有很多垂直领域,比如说今天你问它一个金融问题,明天你问它一个法务问题,后天算汇率了,大后天可能又是什么,它并不是什么都会。但是它有去选择调用合适三方工具的能力,就是当你问它这件事情,它知道该找谁,该用什么来帮你解决这个问题,这是智能体的能力。

这三个能力加在一起其实就很强了,因为这是一个很强的助理。所以这三个加在一起的智能体其实就是这个智慧 OS 的核心。在这个基础上,我们谈多模态交互,大家肯定想听一些更具象的交互模式,我只能透个底说我们确实在做,敬请期待,它会跟现在的交互不一样。

刘作虎:我补充回答你刚才的问题。AI 对手机的挑战是什么?事实上 AI,我觉得最大的几个挑战,一是如何精准感知这个真实世界;二是要有足够强的算力;三是要有算法的先进性。我觉得这个不管是对手机也好,对任何的AI设备,这几个都会是挑战。

首先对手机算力的要求,现在最大的瓶颈是 CPU 跟内存之间的带宽,这个传输的速度是现在大家都在探索的,解决这个问题需要理解芯片。OPPO 有相应的团队在这方面也在持续探索,甚至会涉及到整个硬件平台架构的变化,这会是一个相对长期的探索。

谈到感知,现在摄像头或者麦克风达到了真正感知真实世界的标签吗?肯定没有。科技的进步是一步一步的,永远是在往前走,我相信未来硬件的感知能力一定会比现在的要强很多。

至于算法的先进性,OPPO 在这方面肯定要投入很多,怎么样真正地去理解用户,这个模型怎么去建, OPPO也 在训练自己的大模型。

以上 3 个是 OPPO 目前比较重要的能力投入方向。

问:大家在宣传出发点可能会用“自研”这样的字眼,无论传播上可能会有更好的效果,但 OPPO 没有出于这样的角度用“自研”这样的字眼,在传播上或者表述上是怎么去做的决策或者怎么看待这个事?

刘作虎:实事求是,我们肯定有自研的大模型。未来大模型也不会说全世界只有一个模型,它也会有多个模型,甚至包括还有一些基于我们的大模型,就像你是电子专业的,那个是计算机专业的,在某个垂域更好的这种模型,实际上我们可能在一些知识和百科里面,我们自己自研模型训练的效果也很好。但是可能在某个领域里面,你不一定是最好的,我们就是大家一起去合作,在这方面一起去训练一个模型。毕竟今天没有谁的模型是完全每一行代码都是自研,所以我觉得这个客观表述就行。

问:OPPO 这边是怎么看待全新的硬件形态的,有没有可能做?做的话,会是什么时候? 

刘作虎:我觉得未来 10 年,手机还是一个最核心的终端形态,但是其他的也会有,我们会保持关注。如果说另外一种形态的产品是一个非常小众的或者是在某个特定场景的,则必要性不大,影响用户每天日常生活的我觉得我们才会去关注。我举个例子,我们 VR 也一直在做,但是一直没有产品上市,它还是一直处在一个探索阶段,在没有想清楚的时候就不会去把它量产上市。但是我们会关注其他的产品,要客观、冷静地去看它是否是一个用户长期使用的东西,所以我说回到底层,就是视觉,视觉是人获取信息的主要渠道。如果未来我用一个很简单的方式,比如就戴一个眼镜可以分辨率很高,也许会有那一天的,但是现在我还没有看到一个自己满意的形态。

问:虎哥怎么看友商喊 All in 这件事呢?

刘作虎:这只是一个态度吧,我觉得也没什么问题。

作为一项新潮的概念,AI 大模型终于在近几年迎来了爆发。向上,它获得了更多的能力,并且能更精准地理解用户的意图,给出更符合需求的反应和回复;向下,AI 大模型变得更加精简,可以在智能手机这样的终端设备上端侧搭载,随身随时即可调用,降低了使用的门槛。

显然,这样的发展势头还只是一个开始。随着硬件对 AI 能力的进一步磨合与适配,未来终端设备上自然也会出现更多的 AI 发展空间,自然也就为终端的 AI 能力提供了更加肥沃的土壤。我们也期待,像 OPPO 这样的手机厂商们能深入开发,让这些新锐的能力优化我们的日常使用体验,实现“智能手机”到“AI 手机”的奇妙转变。而从他们在这一场群访之中的答复来看,这并非奢望,甚至那样美好的未来或许还会来得比我们所想的更快。

喜欢数码科技资讯的你,就记得点击订阅啦。
关注「锋潮评测室」微信公众号【微信号:fengchaopingceshi】,还会送上更多你想要的哦~

相关标签: oppo
22