游戏会
    • Mobile
    • Nintendo
    • PC
    • Roblox
    • Rogue Heroes: Ruins of Tasos
    游戏会
    Home»指导»可以玩原神的人工智能——Lumine-Agent 到底是什么?
    可以玩原神的人工智能——Lumine-Agent 到底是什么?
    可以玩原神的人工智能——Lumine-Agent 到底是什么?

    可以玩原神的人工智能——Lumine-Agent 到底是什么?

    16 11 月, 2025

    你是否曾经希望拥有一个人工智能伴侣,不仅能在游戏中听从你的命令,还能理解游戏世界、解决谜题,甚至能够独自击败boss? 这不再是科幻小说。最近,一个名为 发光剂 已经席卷了互联网,展示了它能够连续玩几个小时的《原神》等复杂的 3D 开放世界游戏。 但这不仅仅是一个复杂的机器人;这是创建通用人工智能代理的突破性一步,可以在复杂的数字世界中感知、推理和行动。

    发光剂到底是什么?

    光 是字节跳动Seed团队开发的一款全能型AI智能体。其核心任务是以类似人类的方式与 3D 开放世界环境进行交互。 Lumine 基于强大的 70 亿参数视觉语言模型 (Qwen2-VL) 构建,纯粹通过视觉输入(屏幕上的原始像素)处理游戏,并通过输出精确的键盘和鼠标操作来控制游戏。

    它的与众不同之处在于其统一的“感知-理性-行动”范式。 它不只是做出反应,而是做出反应。它认为。 Lumine 采用“混合思维”策略,自适应地生成内部独白,以推理当前状况并在执行行动之前计划下一步行动。这使得它能够处理需要规划和适应的长期任务。

    它的与众不同之处在于其统一的“感知-理性-行动”范式。

    提示: 最多可保存 35% 为您的游戏充值 — 立即登录 LDShop 享受折扣!

    它能做什么?

    展示熟练程度和概括能力

    Lumine 主要在 Genshin Impact 中接受培训,学习了一系列对于开放世界探索至关重要的技能。

    掌握核心游戏玩法:它可以可靠地完成各种任务, 包括:

    战斗: 动态追踪敌人,切换角色进行连击,甚至了解boss机制来躲避强大的攻击并打击弱点。

    解谜: 激活元素纪念碑,完成计时赛,并乘着风流在半空中收集物品。

    导航与交互: 遵循视觉引导,穿越复杂的地形,并与人群中的特定 NPC 可靠地交谈。

    图形用户界面操作: 在 3D 世界和 2D 菜单之间无缝切换来烹饪食物、传送或更换设备。

    完成长达数小时的任务: 最令人惊叹的成就是它能够自主完成《原神》蒙德施塔特地区整个五小时三幕的主要故事情节,效率与专业人类玩家相当。

    出色的“零样本”概括: Lumine 的功能并不局限于其训练数据。它展示了令人印象深刻的概括:

    • 前往未曾见过的地区:尽管之前没有接触过,但它成功地导航到了全新的璃月地区并推进了其主要故事情节。
    • 对于全新游戏:没有任何微调,Lumine 就被部署在其他游戏中。它在大约 7 小时 100 分钟的时间内完成了《崩坏:星轨》(回合制 RPG)的第一章,以及《呼啸波涛》(一款动作 RPG)的主要故事内容,并根据不熟悉的机制和视觉效果调整了其核心技能。

    出色的“零样本”泛化

    Lumine 是如何建造的?

    创建像 Lumine 这样的代理需要复杂且资源密集的配方。

    可扩展的培训课程: 该团队采用了三阶段的培训过程:

    预训练(1,731 小时的游戏时间): 该模型通过观看大量的人类游戏玩法来学习基本的动作原语,例如如何移动、跳跃和交互,从而使基本技能自然显现。

    遵循指令(200 小时的数据): 该代理学会了用自然语言来执行其动作,使其能够遵循特定的玩家命令,例如“击败前方的敌人并打开宝箱”。

    推理(15小时数据): 最后阶段教会模型生成自己的内部推理,这对于在没有人类指导的情况下规划和完成长期、复杂的任务至关重要。

    大规模计算投资:这项工作并不便宜。报告显示,训练 Lumine 模型需要 64 个 H100 GPU,仅计算成本估计就超过 200 万美元。这一惊人的投资凸显了该项目的规模以及突破人工智能研究界限所需的资源。

    意义

    在惊叹Lumine的游戏性能之后,我们可能会思考一个基本问题:除了让AI为我们玩游戏之外,这项技术的真正实际意义是什么?事实上,它的价值远远超出了表面,我们可以从工业和未来的角度来审视它。

    彻底改变游戏行业

    目前,游戏公司对高真实度AI的需求巨大。从《王者荣耀》到《正义Online》手游的智能NPC,开发商投入巨资,前者的培训成本高达数十亿元,而后者每年在AI云计算上的花费高达数亿。

    在此背景下,Lumine展现出两大颠覆性优势:

    • 卓越的多功能性:与依赖游戏内数据的传统专业人工智能不同,Lumine 通过“视觉推理”与任何游戏进行交互。它不需要游戏开发者提供内部API,不太可能被识别为“机器人”,并且可以通过单一模型适应多个游戏。其低准入门槛、高真实性和隐私保护使其成为极具竞争力的解决方案。
    • 性价比显着:虽然Lumine的培训花费数亿,但与《绝物》等项目的天文投入相比,也算“划算”。更重要的是,游戏开发者未来可能不需要从头开始训练模型;他们可以直接利用成熟的Lumine API,大大降低成本和风险。

    利用这些优势,Lumine可以直接为游戏开发带来两大应用:

    • 自动化游戏测试:可以24/7模拟真实玩家的复杂操作,在广阔的开放世界中高效发现人类难以复制的极端bug,大大提高测试覆盖率和效率。
    • 逆向游戏设计:一旦人工智能能够理解游戏交互逻辑,我们就可以引导它对创作过程进行逆向工程。未来,通过设定目标和规则,AI可以自主推理并辅助生成地图、关卡、任务布局,成为游戏设计的得力助手。

    然而,如果我们放宽视野,Lumine 的意义远远超出了为游戏行业服务。就像当时的 AlphaGo 一样,它的价值不在于“掌握游戏”,而在于验证通往通用人工智能(AGI)的道路。

    复杂的 3D 开放世界是人工智能的完美训练场。在这里,人工智能必须学会感知、推理、计划、决策和保持长期记忆,这些能力与现实世界中的机器人或智能助手所需的能力基本相似。 Lumine的成功证明了创建能够适应和理解复杂环境的通用代理的可能性,为未来能够无缝操作各种软件甚至理解物理世界的人工智能奠定了基础。

    诚然,这项技术也带来了担忧:如果AI可以给你玩游戏,乐趣在哪里?会不会成为破坏游戏平衡的“终极秘籍”?随着技术的发展,这些问题需要持续考虑和监管。

    然而,回顾历史,从深蓝到AlphaGo,每一项突破性的人工智能技术最终都超越了最初的游戏领域,深刻影响着我们的社会。 Lumine-Agent 也不例外。

    未来的影响

    超越炒作

    虽然“人工智能玩视频游戏”是一个令人兴奋的标题,但 Lumine 的含义却更为深刻。

    • 通用人工智能的基准:像原神这样的复杂 3D 开放世界是通用人工智能 (AGI) 的完美测试场。它们需要感知、空间推理、长期规划和技能组合——这些挑战类似于现实世界中的机器人所面临的挑战。
    • 游戏中的实际应用:对于游戏开发人员来说,像 Lumine 这样的技术可以通过自动化游戏测试、有效地发现大规模开放世界中的错误来彻底改变质量保证。它还可以为更智能、更具适应性的 NPC 提供动力,或者协助游戏设计。
    • 迈向通用代理的一步:Lumine 展示了单个模型可以学习可在不同数字环境中工作的可转移技能,例如导航和 GUI 操作。这为未来可以操作任何软件或数字界面的人工智能助手铺平了道路,模糊了数字世界和物理世界之间的界限。

    相关文章

    在 EA Sports FC 26 中快速赚取金币的完整指南

    在 EA Sports FC 26 中快速赚取金币的完整指南

    17 11 月, 2025
    ZZZ 2.4 有多少拉力?

    ZZZ 2.4 有多少拉力?

    16 11 月, 2025
    呼啸海浪2.8中谁值得拉?

    呼啸海浪2.8中谁值得拉?

    16 11 月, 2025

    Comments are closed.

    • 饼干政策
    • 关于我们
    • 关联披露
    • 免责声明
    • 使用条款
    • 数字千年版权法政策
    • 隐私政策
    © 2025 游戏会

    Type above and press Enter to search. Press Esc to cancel.