从“人机交互”到“人人对话”——AI智能体，构建智慧生活新图景

来源：人民日报海外版
时间：2024-11-01

“可以给我设计一个北京一日游计划吗？”近日，2024世界智能网联汽车大会现场，在极狐阿尔法S5上体验北汽AI智能体的李先生，感觉自己有了一名随叫随到的“出行顾问”，“只需一句语音指令，AI智能体就能自动规划好路线，方便极了”。

近年来，AI（人工智能）大模型技术的涌现，掀起新一代AI研究热潮，而今，AI智能体（AI Agent）正成为行业新热点。从智能汽车中的语音助手到网络直播间的数字人主播，AI智能体正以其独特的自主性和交互性，深度改造应用生态，持续构建智慧生活新图景。

重塑人与机器的互动方式

顾名思义，AI智能体就是具备AI能力的一个智能实体，其可能是硬件装置，也可能是软件系统。它能够感知环境、进行决策，并依托AI能力执行动作，最终实现特定的目标任务。

“通俗来讲，AI智能体就像一个有智商、有情商、能理解、会帮忙的‘小助手’。”北京通用人工智能研究院先进技术中心副主任陈浩表示，这个“小助手”不仅能理解人类的语言，还能通过学习和分析数据来不断提高自己在特定领域的技能水平。

为何AI智能体能成为行业关注的热点？其与大模型技术的关系是怎样的？

字节跳动豆包大模型相关负责人接受本报采访时表示，AI智能体是基于大模型技术出现的，AI智能体“有手有脚”，可以自己干活、自己执行，而大模型就是它的“大脑”。

但AI智能体是更“立体化”的智能系统，除了提供大模型广泛使用的语言交流服务，AI智能体还能根据上下文进行智能推理和情感分析，并模仿人类行为进行相应的操作。

比如，下达“帮我做一道菜”这项任务指令，“大模型厨师”只能输出一份食谱并指出需要哪些食材；“AI智能体厨师”则不仅能提供食谱，还会根据指令人的口味偏好和营养需求，选择最合适的食材自动下单购买，甚至能够监控烹饪过程，确保食物的质量和口感。

“传统的人机对话往往受限于固定的模式和预设的规则，难以实现真正自然的交流。”百度集团资深副总裁梁志祥指出，依托大模型在理解、生成、逻辑、记忆方面的四大能力，AI智能体已经能够模拟出更加贴近人类真实对话的方式，这使得“人机交互”变得如同“人人对话”一样流畅自然。

事实上，获益于大模型的通用性和可扩展性，AI智能体的使用门槛得以大幅降低。无论是大型企业还是中小企业，甚至是个人开发者，无需新硬件或大量额外的训练数据，都能快速搭建起自己的AI智能体应用。

前不久，百度“文小言”大模型App推出“一句话创建智能体”的新功能。每个人可以根据需求创建专属于自己的AI智能体，其性格、音色、身份设定都取决于用户的个性化选择。创建者可与“专属智能体”进行视频对话、英语口语练习，还可以模拟求职面试等。据相关统计，百度文心智能体平台已吸引了10万家企业、60万名开发者，覆盖了上百个应用场景。

“未来，如果用户使用及生成自己的AI智能体都更加便捷，这将真正释放AI智能体的价值。”梁志祥说，“下一步，我们将把AI智能体精准、高效地分发给更多的用户，让每个人都能成为AI智能体的‘开发者’。”

应用场景持续拓宽

当前，一系列AI智能体技术正在蓬勃发展，应用场景持续拓展。

“一年半以前，北汽极狐就开始着手研究AI智能体，主要应用于研发效率提升、标准化语言编译以及用户服务等多个方面。”北汽研究总院智能网联中心主任冯硕介绍，AI赋能的驾驶舱告别了机械式、固定指令式“人机问答”的旧模式，可实现灵活性、定制化的“智能交互”，例如，AI智能体会根据驾乘人的工作习惯安排日程表，捕捉驾乘人的喜好、情绪推荐音乐、电影等。

当识别出驾乘人过度疲劳时，AI智能体会迅速生成包括预订车位、调节车内环境、设定休息时长等在内的服务方案，为用户提供更加安全的智能驾驶体验。“未来，AI智能体还有望搭载‘一句话订外卖’等功能，更方便驾乘人使用。”冯硕说。

与此同时，AI智能体技术也在快速发展并逐步落地到各种小型终端设备中。

“豆包豆包，寺中这个罗汉是谁？”“这是摩诃迦叶，释迦牟尼的十大弟子之一……”自媒体运营者小范回忆道，在国庆假期参观浙江台州国清寺时，他与耳机Ola Friend之间常有这样的问答。

据了解，Ola Friend是字节跳动旗下豆包大模型发布的首款AI智能体耳机，除了常规的声乐播放功能，还能在信息查询、旅游出行等场景为用户提供即时帮助。

豆包大模型相关负责人介绍称，Ola Friend可随时化身为用户的“私人导游”，并且用户还能根据兴趣点进行“追问”，如逛画展时，用户可以就某件具体的展品让Ola Friend帮自己介绍，再延伸追问该展品创作者的艺术风格、其他代表作品等，在一问一答中获取更多知识。

今年以来，越来越多的手机厂商也纷纷加入AI智能体布局。vivo近期发布了名为PhoneGPT的手机智能体，能够基于用户意图准确操作手机应用以完成任务，如打电话、发短信、订餐厅等，极大提升用户体验；华为将智慧助手小艺升级为系统级智能体，不仅问答能力再进阶，而且具备更强的感知推理能力；OPPO则推出了“1+N”智能体生态战略，由AI超级智能体和AI Pro开发平台组成，旨在提供更符合用户偏好的个性化服务模式。

在商业服务场景中，AI智能体正与消费者进行深度互动。

百度电商数字人直播平台“慧播星”5分钟就能生成一个带货智能体，不仅可以24小时在线，且整个直播间实现了完全智能化、无人化。数字人主播和数字人副播各司其职，及时回答消费者提问，展示和讲解商品时配合流畅自然，对来不及口头回复的问题，还有AI助理进行文字回复。

“因为有了数字人直播智能体技术，电商直播行业的成本高、时间受限、质量不稳定等难题得到有效缓解。”梁志祥称，截至目前，“慧播星”已累计帮助数万家商家实现收益增长，平均带来62%的商品交易总额的提升。

当前，AI智能体还在其他诸多场景中得到应用，如编程、内容创作、工业制造等，展现出强大的应用潜力和市场价值。

带给未来生活更多可能

不少业内人士认为，AI智能体将是未来趋势所在。

腾讯发布《2024数字科技前沿应用趋势报告》认为，大模型将走向多模态，AI智能体有望成为下一代平台。国际管理咨询公司埃森哲在《技术展望2024》报告中称，96%的企业高管认为AI智能体将在未来3年内为其所在企业带来重大发展机遇。

业内人士表示，在可预见的未来，AI智能体将帮助多个行业构建起以“人+AI数字员工”为核心的智能化运营新常态。例如，在医疗领域，AI智能体可以协助医生进行诊断、治疗和健康管理；在交通领域，AI智能体可以通过分析数据和实时路况，为交通管理和规划提供科学依据；在教育领域，AI智能体可以提供智能辅导和自适应学习系统，帮助学生更好掌握知识。

专家指出，随着机器学习和深度学习技术的不断进步，AI智能体的特性和学习能力还将变得愈发强大，未来将更好地适应复杂多变的现实世界，为社会发展带来更多可能。

尽管AI智能体技术为未来生活带来了更多可能，但目前其仍然处于起步阶段——已出现的AI智能体仅能完成较为简单、固定的工作，且应用功能同质化严重。

有观点指出，AI智能体的发展瓶颈之一在于目前的大模型缺乏足够的推理能力，无法在没有人工介入的情况下真正解决复杂的问题。大模型技术本身就因算法等因素存在不可预测的先天缺陷，容易为AI智能体带来一系列安全隐患。

除了技术风险，AI智能体也面临伦理和隐私等问题。业内人士表示，AI智能体在提供服务的过程中会收集大量数据，有可能导致个人隐私信息的泄露，比如AI智能体可能会根据用户的购物习惯推断出他们的某些私人爱好。这种“窥探”行为，无疑是对用户隐私的侵犯。

专家认为，目前需尽快根据智能体的功能用途、使用时限进行分类管理，尤其对高风险智能体的开发生产及应用部署进行持续监管，并及时制定相关法律法规，改进现有互联网标准，从而更好地预防智能体引发的各种风险。

对不起，我们不支持 IE 浏览器

Sorry, we do not support IE browsers

Chrome

Firefox

行业新闻

从“人机交互”到“人人对话”——AI智能体，构建智慧生活新图景