多模态和Agent成为大厂AI的新赛点
未来入口的两个支柱。 这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。 大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟 通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多模态能力;后者则需要依托于Agent产品生态的不断成熟。 多模态方面,字节、百度、谷歌、OpenAI都在近期推出了多模态能力更强的基础大模型产品,为相应的应用创新带来了可能。阿里旗下的AI to C产品夸 克,就在本周上线了基于「通义推理及多模态大模型+后训练」实现的「拍照问夸克」功能。 代理执行层面,在Manus指出方向之后,类似的通用Agent产品也在近期纷纷上线。其中就包括了字节旗下的扣子空间、百度的心响App、360的纳米AI、 前百度高管的Genspark等。这些产品都主打一站式完成用户通过自然语言布置的复杂任务,并且都具有编写代码和连接第三方数据、工具的能力。 相比国内,海外巨头会更倾向于打造服务于单一场景的Agent。Not ...