虽然OpenAI的GPT5迟迟没有发布,但已经初具“思考/推理”能力的o1让大众看到了AI大模型新的发展趋势。由此也将影响应用端的落地。
在投资层面,近日AI应用相关A股概念股遭遇热捧,也显示出市场对AI落地的热情。
近日,《Gartner十大战略技术趋势报告》发布,Gartner研究副总裁高挺接受21世纪经济报道等媒体采访时指出,Gartner前几年发布的趋势报告偏向强调技术架构变化,对明年的展望则更强调技术本身。“因为前几年信息技术看起来没有很大突破,但从去年开始,由于AI不断迭代,我们似乎又进入一个技术发展的加速期。”
其中主要涉及三类主题:AI落地趋势和风险、计算新范式和人机协同的未来走向。“我认为其中发展较快的是‘代理型AI’,Gartner预测未来2-3年将陆续落地;随之要关注‘AI治理平台’,预计2-4年;此外是‘虚假信息安全’和‘多功能机器人’(大约3-10年落地)。”他续称,这些领域也将最早带来经济效益。
与消费者最为密切的当属“代理型AI”。记者发现,多家终端厂商在今年推出AI大模型相关技术时,已经开始谈到对AI Agent或AIOS的落地规划,只是目前产业链间对此做出的畅想还相对单一、应用也在初级阶段,距离“人人都有AI代理”的阶段还有多远?
探路个人“代理”
AI大模型演进至今,寻求杀手级应用成为核心命题。由此,今年以来多家头部大模型厂商宣布token使用降价甚至部分产品免费。Agent就被普遍认为是一大关键应用。
高挺分析,代理型AI也称“AI智能体”,还包括“代理型搜索”或“多代理的系统”等含义。其通过自主规划和采取行动实现用户定义的目标,为实现能够分担和补充人类工作的虚拟劳动力带来了希望。
Gartner预测,到2028年,至少15%的日常工作决策将由代理型AI自主做出,而2024年这一比例还是0%。
高挺介绍,日常决策主要包括:重复性、数据密集型任务;面向内部、可提高后台工作效率的任务;决策路径较短、有人类参与协同的任务。“我们认为先落地的场景有搜索、个人生活助理、客户服务、软件开发和测试,以及传统RPA场景的拓展,代理型AI最终效果是对自动化的进一步提升。”
至于代理型AI的具体落地进展,将与AI大模型的实际能力演进相关。
OpenAI此前提出过AI五个发展阶段:第一阶段具备语言能力,产品多指向聊天机器人;第二阶段具备推理能力,可以帮助人类解决一定问题;第三阶段就是代理能力,开始帮助人类行动;第四阶段AI可以融入发明创造过程,第五阶段具备体系化工作能力。
目前来看,当前正处在第二阶段向第三阶段演进,是为“代理”能力铺路的过程。
高挺分析,“代理型AI”有两个明显特点:提供一个整体目标后,可以根据外部环境自动计划任务并执行;需要至少有记忆、计划、感知和调用工具这四大模块。
“我们未来会看到人机交互模式有新变化。”他续称,在上世纪八九十年代的交互是采用命令行界面;此后Windows、MAC类的出现,让人机交互进入图形用户界面(GUI);未来会走向人机对话的自然语言交互界面(NLUI)。“我们认为‘代理型AI’的终局就是人类和AI融合。”
但目前“代理”能力还相对初级。此前备受关注的某手机发布会现场,发言人通过对手机下命令,为现场千余人点咖啡的场景显然还相对简单。
高挺对21世纪经济报道记者分析,的确当前代理型AI还处在相对早期阶段。其最重要的发展瓶颈就是错误率较高、推理能力还不够强,尤其面对决策路径长、执行任务多的复杂目标场景时。
“代理型AI的落地主要取决于模型推理能力,目前OpenAI的推理模型只发布了第一代,至少要迭代2-3个版本才具备比较高的实用性,预计2025年代理型AI仍然处于发展期。”他续称。
计算多元化
支撑AI发展的底层基础设施之一就是计算能力,尤其在数字化、智能化的当下,计算正无处不在渗透到生活中,也意味着对计算的需求走向多元化。
Gartner认为的2025年十大战略技术中就包括多类型计算,如混合计算、节能计算、空间计算等。
在芯片领域发展多年的异构计算就属于混合计算的其中一个分支,只是后者边界更广泛。
高挺介绍,混合型计算是指结合不同计算、存储、网络基础来解决计算问题,比如结合神经形态、量子计算、光计算、生物和碳计算技术,最终愿景是把不同的计算范式融合,通过一个编排系统让其发挥各自优势。“比如量子计算在药物发现和材料科学领域表现出独特能力。但难点是其中涉及诸多新兴技术,它的成熟至少需要3-10年。”
伴随AI计算火热的是,多家国际科技巨头先后重启旗下核电站,显示出背后惊人的耗电量,因此后续如何节能也尤为重要。
高挺分析,在2024年,碳足迹是大多数IT组织的首要考虑因素。尤其涉及计算密集型应用,例如AI训练、模拟、优化和媒体渲染等由于能耗最高而可能成为企业碳足迹“大户”。节能计算的需求就应运而生。
“这并不是一蹴而就的。短期策略,可以使用绿色能源,降低能效比或者提高计算利用率的方式,比如把一些工作负载转移到碳排放更低的云区域。中期策略,可以用更高效的编码架构和算法提高能效比,并且把专门的计算任务移植到特定、高效的硬件上去。长期策略方面,我们预计在2030年之前将出现光学计算或光计算系统用于特殊任务,其能耗效率可能比硅基芯片高100倍甚至更多。从更长远角度看,DNA存储、陶瓷存储、量子计算等技术对能耗的需求也比传统计算低得多。”他进一步指出。
空间计算偏向AI能力的应用层面,此前苹果发布旗下首款XR眼镜Vision Pro时也谈到了这一趋势,即将物理空间与数字空间融合交互。
虽然XR眼镜在今年遭遇发展瓶颈期,但更轻量级、功能精简的AI眼镜出乎意料快速冲破100万台出货大关,引发市场关注。有从业者对21世纪经济报道记者指出,未来AI眼镜的增量空间或许是取代传统近视眼镜或墨镜类产品,为其丰富功能属性。
高挺对21世纪经济报道记者分析,未来AI眼镜与AR眼镜将是并行发展的关系,前者是在传统眼镜中增添AI功能,后者则是增强现实,二者并不冲突。
“我认为苹果提出的空间计算仍然有机会成为下一代移动终端中心。只是短期来说,苹果此前发布的Vision Pro被认为体验令人惊艳,但难题是现有硬件条件下较难以精进。这背后涉及成本、硬件产业链技术等多维度命题,导致目前的头戴式显示设备价格昂贵、重量难以妥协、续航时间不足、操作界面复杂、设备整体碎片化等。最核心是尚未出现杀手级应用。”他续称。
Gartner预计在未来五到七年内,空间计算的使用将通过简化工作流程和增强协作能力来提高企业效率;到2033年,空间计算市场将从2023年的1100亿美元增长至1.7万亿美元。
警惕伴生风险
在推进AI技术和应用落地的同时,风险也伴随而生,当前阶段已经不能忽视由此可能产生的隐患。
高挺分析,生成式AI的出现大幅增加了人类可能面临技术失控的风险,很多企业开始关注用AI治理平台去解决这一担忧。
AI治理平台是指可以从法律、伦理道德方面帮助组织管理和监督AI系统的技术解决方案。其主要能力包括模型生命周期管理、模型透明度和可解释性、模型验证、AI系统监控、AI系统相关的法律、政策合规管理等。
Gartner预测到2028年,采用综合AI治理平台的企业将比没有这类系统的企业减少40%与AI相关的伦理事件。
虚假信息则是伴随互联网诞生便存在,只是AI技术的出现可能会令挑战加码。
“AI和机器学习工具的广泛可用性令其一旦被用于恶意目的,预计将增加针对企业的虚假信息事件数量。如果这种趋势不被加以控制,那么虚假信息可能会对企业造成重大且持久的损害。”高挺分析道,“虚假信息安全”是应用在信息传播中,确保其完整性、评估真实性,防止冒充和追踪有害信息传播的一系列技术,例如采用大语言模型驱动的监控系统。
“已经有厂商在提供相应解决方案。例如,一些社交媒体平台和新闻网站开始实施自动化虚假信息检测系统,能够实时监测用户生成的内容,并及时标记或删除虚假信息。”他续称,但目前仍有缺点,包括面临较高的计算成本、泛化能力不足、有数据依赖性可能会存在偏见等。
Gartner预测,到2028年将有50%的企业开始采用专为应对虚假信息安全用例而设计的产品、服务或功能,目前这一比例还不到5%。