2
“刚需”的误区
很多人在讨论大模型(LLM)与“刚需”问题时,往往会陷入一个误区:那就是以当下的、静止的视角,来看待人们对LLM的需求。
实际上,如果用“刚需”的逻辑来看待当初的抖音、快手,那它们根本就不应该存在。
因为以当时的标准来看,它们根本就不“刚需”。
其实,所谓的需求,不是一成不变的,今天很多理所当然的“刚需”,也不是当时就产生的。
它本质上是一个随着技术逻辑运动,而不断发展的结果。
具体来说,抖音、小红书这样非工具性、非刚需的APP之所以会出现并爆火,本质上是移动互联网技术逻辑的一种运动结果。
在移动互联网的技术逻辑中,最重要的有两点,一是便捷性,二是个性化。
便携性,使得用户可以随时随地访问互联网,获取信息。
这种情况下,用户的时间变得更加碎片化了。在等待、通勤、休息等场景下,用户希望利用碎片时间进行娱乐、学习或购物等活动。
于是,人们使用手机等移动设备的需求,开始变得越来越多样了。那么,面对如此多样的内容,用户该如何选择?
这时,推荐算法和大数据登场了。
移动互联网的普及,使得用户在移动设备上产生了大量的数据,这些数据为推荐算法和大数据分析提供了丰富的数据来源。
通过对这些数据的分析,各大APP可以更好地了解用户的兴趣和需求,从而提供个性化的内容和推荐。
于是乎,在便携性和个性化两大技术逻辑的推动下,抖音、小红书这些爆款APP就诞生了。
它们可以说是移动互联网技术逻辑的一种终极体现,必然结果。
由此可见,在分析某种新兴技术是否能满足“刚需”时,我们除了关注“人”想要什么,还必须要关注“技术”想要什么。
那么,按照这样的逻辑,今天以ChatGPT为首的LLM,究竟想要什么呢?
从最近大半年LLM的发展趋势,以及昨日OpenAI发布会的情况来看,目前的LLM,至少显现出了两大越来越明显的倾向:
一是想“看”到和“听”到更多,即多模态方向的发展;
二是想与更多的“同伴”协作,即智能体(Agent)方向的发展。
而这两大愈发明显的倾向,就构成了未来LLM发展的两大技术逻辑——信息融合和自主决策。
信息融合,意味着LLM可以通过融合多种模态的信息(如视觉、听觉等),实现对跨模态、跨领域任务的深入理解,从而更好地胜任不同场景的需求。
而自主决策,则通过多个智能体之间自动化的协作、配合,使LLM能实现在复杂环境、任务中的自主决策和行动,从而大大地解放了人类的时间、心智。
正如移动互联网的诞生,催生了碎片化时间的场景一样,上述两大逻辑的演化和推进,也终将催生出一些人们从来没见过的,新的场景与需求。
3
可能的应用形态
在自主决策和信息融合催生的新场景与需求中,最能代表其本质的,就最有可能产生新时代的“抖音”。
从上述技术逻辑的特点来看,至少有两个方向的需求,可能性是最高的。
一是个性化的智能助理。
由于多模态技术的存在,这样的智能助理,将很有可能脱离单一领域,或单一模态的限制,从而最大限度地深入人们的生活。
举例来说,如果某人使用了某个翻译类的GPT,那么该用户也许在翻译之外,还希望该应用兼具机票预订的功能,帮跨境出行做好准备,又或是在此基础上,成为一个智能的跨境电商的助手,对比不同国家、地区的商品。
第二个方向的需求,则是智能决策支持
如果一种技术,用与不用有很大区别时,它就会逐渐成为一种“刚需”。而智能决策,也许正在创造这样的需求。
自动化的智能体系统,最大的意义,不在于让打工人每天节省那么几个小时的时间,干些批量处理文档之类的“牛马活”,而在于其通过快速、高效和多角度的分析,为用户提供“单一大脑”所难以得出的洞见。
例如,最近一家名为Fantsy的企业,就用了类似于ChatGPT和Bard的机器学习技术,创建了一些具有详细背景和思想、性格的智能体,让它们在虚拟的小组中进行讨论,从而对尚未发布的产品进行评估。
同样的,类似的技术思路,也可以用于个人的财务规划、职业规划中,从而为个人在现实中的生活、工作,提供高质量的辅助决策。
综上所述,GPT商店的出现,虽然为各类AI应用的繁茂生长提供了土壤,但所谓“爆款应用”,却并非完全靠人为的、主观的“穷思竭虑”就能想出来的。
所谓爆款的诞生,本质上仍然要遵从技术发展的一般规律,唯有参透了这样的规律,并在此基础上思考、构建产品,才能长久地在智能时代扎下根脉。
(AI新智能)