腾讯研发全新框架：用AI打，让DeepSeek学会战略性思考

来源：24直播网发布时间：2025-10-05 15:04:21

电竞资讯10月05日称据 decoder 今天报道，腾讯研究人员最近用《王者荣耀》游戏作为训练平台，探索如何让 AI 在游戏中学会“战略性思考”，研究全新 TiG（Think in Games）框架，相关成果已发表于 Hugging Face 网站和 arXiv 平台。

undefined

研究团队指出，目前的 AI 模型存在明显的功能鸿沟，以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策，而语言模型虽然可以推理策略，但很难真正执行操作，为此他们研发了全新 TiG 框架，让模型在游戏中同步思考、行动。

团队选择以《王者荣耀》游戏作为训练范本，先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动，胜负回数均衡，AI 模型们必须要在每个定义好的场景下选择最佳策略，并解释其战略缘由。

具体来说，训练分为两个阶段，首先是在监督中学习，弄清楚这些策略的基本机制；随后通过奖励机制进行强化学习，如果行动正确能得 1 分，错误行动则得 0 分。

随后团队测试了多种语言模型，涵盖 Qwen2.5（7B、14B、32B）、Qwen3-14B 模型，并使用 DeepSeek-R1 大模型作为对照组；先从 DeepSeek-R1 提炼高质量训练数据，然后使用群体相对策略优化（GRPO）技术，比较不同策略之间的优劣。

最终经过 TiG 框架训练的模型不仅能制定行动计划，还能解释原因，例如 AI 会指出某个防御塔防守薄弱，是理想的进攻目标，但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。

TAG学会战略思考

相关阅读

媒体人：刷到京东给外卖骑手提供的宿舍感觉比BLG选手住的还好点

媒体人：刷到京东给外卖骑手提供的宿舍感觉比BLG选手住的还好点

媒体人：刷到京东给外卖骑手提供的宿舍感觉比BLG选手住的还好点

2025-12-17

余霜分享运动健身照：运动的快乐又回来了！还有蓝调时刻下的

余霜分享运动健身照：运动的快乐又回来了！还有蓝调时刻下的

余霜分享运动健身照：运动的快乐又回来了！还有蓝调时刻下的

2025-12-17

赛后采访1xn：希望后面越打越好，还有很多地方需要进步

赛后采访1xn：希望后面越打越好，还有很多地方需要进步

赛后采访1xn：希望后面越打越好，还有很多地方需要进步

2025-12-17

Baolan看Ning王被单杀嘴角比AK还难压：虎牙无大将Ning哥作先锋

Baolan看Ning王被单杀嘴角比AK还难压：虎牙无大将Ning哥作先锋

Baolan看Ning王被单杀嘴角比AK还难压：虎牙无大将Ning哥作先锋

2025-12-17

德杯第二日赛果：LGD横扫TT两支主播队一胜难求

德杯第二日赛果：LGD横扫TT两支主播队一胜难求

德杯第二日赛果：LGD横扫TT两支主播队一胜难求

2025-12-17

传闻Deft很渴望重返赛场！理性讨论，Deft如果复出在LPL还是LCK更有竞争力

传闻Deft很渴望重返赛场！理性讨论，Deft如果复出在LPL还是LCK更有竞争力

传闻Deft很渴望重返赛场！理性讨论，Deft如果复出在LPL还是LCK更有竞争力

2025-12-17

集结完毕！吧友们觉得BLG双人组Viper+ON新赛季在LPL属于什么层级

集结完毕！吧友们觉得BLG双人组Viper+ON新赛季在LPL属于什么层级

集结完毕！吧友们觉得BLG双人组Viper+ON新赛季在LPL属于什么层级

2025-12-17

Letme：宁王他们打不过正常让他们训练一两个月BO3有机会赢一把

Letme：宁王他们打不过正常让他们训练一两个月BO3有机会赢一把

Letme：宁王他们打不过正常让他们训练一两个月BO3有机会赢一把

2025-12-17

网友考古BLG视频发现Bin亲自发弹幕夸自己：Bin的肩膀真的宽

网友考古BLG视频发现Bin亲自发弹幕夸自己：Bin的肩膀真的宽

网友考古BLG视频发现Bin亲自发弹幕夸自己：Bin的肩膀真的宽

2025-12-17

Pyosik：昨天和22DRX见面了，感觉等Deft退伍之后应该还会打职业

Pyosik：昨天和22DRX见面了，感觉等Deft退伍之后应该还会打职业

Pyosik：昨天和22DRX见面了，感觉等Deft退伍之后应该还会打职业

2025-12-17

最新录像

12月16日NBA常规赛灰熊快船全场录像 12-16 12月16日英超第16轮曼联vs伯恩茅斯全场录像 12-16 12月16日西甲第16轮巴列卡诺vs皇家贝蒂斯全场录像 12-16 12月16日意甲第15轮罗马vs科莫全场录像 12-16 12月15日CBA常规赛青岛四川全场录像 12-15 12月15日CBA常规赛北京新疆全场录像 12-15 12月15日CBA常规赛辽宁广厦全场录像 12-15 12月15日NBA常规赛鹈鹕公牛全场录像 12-15 12月15日西甲第16轮阿拉维斯vs皇家马德里全场录像 12-15 12月15日法甲第16轮马赛vs摩纳哥全场录像 12-15

最新集锦

深圳击败吉林王浩然21分史密斯30+7姜伟泽14分 12-16 快船18分负灰熊近10战9负！JJJ31分奇兵斯潘塞27+6三分10中7 12-16 掘金险胜火箭约基奇三双&6犯KD25+7+5帽申京三双&失绝平 12-16 爵士加时胜独行侠乔治37+6马卡33+16弗拉格生涯新高42+7 12-16 猛龙末节逆转热火英格拉姆28+5阿德巴约20+10鲍威尔20分 12-16 活塞复仇绿军取4连胜康宁汉姆32+10布朗34+8+7怀特28+6 12-16 混音116110斯托克顿国王杨瀚森11中8砍18+10+4库克36分 12-16 北京大胜新疆陈盈骏29+8周琦15+9齐麟16分 12-15 青岛6人上双32分大胜送四川连败韦瑟斯庞16分段睿骐20+6+5 12-15 辽宁16分胜广厦威尔斯30+7+5&17中12胡金秋24分布朗18中5 12-15

热词推荐

1

瑞典强奸案直播 12-17

2

女足亚洲杯直播中国对日本最新比分 12-17

3

葡萄牙vs波兰直播在线观看免费 12-17

4

皇马尤文直播视频 12-17

5

2021库里vs雷霆 12-17

6

小学生男女足球比赛视频直播 12-17

7

足球赛vs黄晓天 12-17

8

2008欧洲杯分组 12-17

9

nba历届总冠军及mvp 12-17

10

西班牙人马德里竞技直播吧 12-17

热门TAG

维尔斯特曼

德布雷辛尼

福建浔兴股份

姆巴佩禁赛

勒沃库森VS云达不莱梅直播

cctv1中央一频道直播

中央广播电视总台直播在线观看

CCTV-1今日节目表

浙江卫视官网

中央电视台13台在线直播

巴伦西亚VS马德里竞技直播

jrs免费篮球直播高清观看

nba直播免费观看泡泡

热刺对战利物浦直播

羽毛球直播赛事直播app免费

西汉姆联vs曼城直播在线观看

利物浦对阵曼联直播在线观看

绿茵足球直播免费观看

皇家马德里马洛卡直播

阿森纳vs埃弗顿比赛直播

nba泡泡体育免费视频直播

热刺vs切尔西直播频道

阿森纳vs曼联免费直播在线观看

曼城vs莱顿东方视频直播

乐球直播免费直播球趣