生成式人工智能(Generative AI)在創(chuàng )意領(lǐng)域的受歡迎度不斷上升,其有潛力通過(guò)支持人類(lèi)的創(chuàng )意創(chuàng )意-新想法的產(chǎn)生來(lái)改造創(chuàng )意產(chǎn)業(yè)。然而,模型能力的限制提出了將這些技術(shù)更充分地集成到創(chuàng )造性實(shí)踐中的關(guān)鍵挑戰。迭代調整和發(fā)散性思維是利用技術(shù)實(shí)現創(chuàng )造力支持的關(guān)鍵,但這些實(shí)踐沒(méi)有得到最先進(jìn)的生成式人工智能模型的充分支持。
電子游戲在娛樂(lè )產(chǎn)業(yè)中占據了最大份額,全球有數十億人玩和購買(mǎi)電子游戲。而生成式人工智能在電子游戲開(kāi)發(fā)中的作用一直有待明確。
2025年2月19日,微軟研究院的研究人員在國際頂尖學(xué)術(shù)期刊 Nature 上發(fā)表了題為:World and Human Action Models towards gameplay ideation 的研究論文。
該研究以電子游戲開(kāi)發(fā)為切入點(diǎn),揭示了如何通過(guò)精準把握用戶(hù)需求來(lái)驅動(dòng)生成式人工智能模型的開(kāi)發(fā)與評估,使其與創(chuàng )意工作流深度契合。研究團隊研究開(kāi)發(fā)了一個(gè)可協(xié)助電子游戲設計師迭代設計游戲的生成式人工智能模型——“世界與人類(lèi)行動(dòng)模型”(World and Human Action Model,WHAM),其生成的穩健三維世界能遵循設計用于電子游戲的機制。
這項突破為構建真正智能化的創(chuàng )意增強系統奠定了技術(shù)基礎,預示著(zhù)人機協(xié)同創(chuàng )作新時(shí)代的到來(lái)。
生式人工智能正通過(guò)賦能人類(lèi)創(chuàng )意構思(新想法的生成過(guò)程)來(lái)重塑創(chuàng )意產(chǎn)業(yè)格局。然而,現有模型的能力局限為其深度融入創(chuàng )意實(shí)踐帶來(lái)了關(guān)鍵挑戰。
為了理解電子游戲開(kāi)發(fā)者的需求,研究團隊采訪(fǎng)了創(chuàng )意團隊的 27 名電子游戲設計師。這些設計師認為當前用于打造電子游戲的 AI 方案缺乏生成許多不同創(chuàng )意(發(fā)散性思維)的能力。他們還強調了通過(guò)設計過(guò)程來(lái)持續微調游戲各方面(迭代實(shí)踐)的重要性。
也就是說(shuō),當前即使最先進(jìn)的生成式人工智能模型(例如GPT-4、Stable Diffusion)在生成創(chuàng )意方面也存在著(zhù)幾點(diǎn)挑戰——
迭代優(yōu)化支持不足:缺乏對"設計-測試-修正"循環(huán)工作流的系統性支持;
發(fā)散思維受限:在跨模態(tài)概念聯(lián)想(例如將敘事元素轉化為關(guān)卡機制)方面的表現顯著(zhù)低于人類(lèi)設計師水平;
修改持久化缺失:用戶(hù)對生成內容的調整無(wú)法有效反饋至模型知識庫,導致重復勞動(dòng)率高達 62%。
隨后,研究團隊開(kāi)發(fā)了名為“世界與人類(lèi)行動(dòng)模型”(World and Human Action Model,WHAM)的生成式人工智能模型模型,該模型使用了 3D 多玩家戰斗模擬器《嗜血邊緣》(Bleeding Edge)中七年的人類(lèi)玩家體驗進(jìn)行訓練。
WHAM概述
研究團隊發(fā)現,WHAM 或能設計出符合《嗜血邊緣》預存在機制的復雜 3D 電子游戲序列,其關(guān)卡設計具有明顯的多樣性,且創(chuàng )意人員可對輸出進(jìn)行迭代調整。研究團隊還開(kāi)發(fā)了 WHAM 示范器,作為供用戶(hù)操作和自定義 WHAM 輸出的一個(gè)可視化界面。
考慮到由于 WHAM 僅通過(guò)玩游戲的訓練就能學(xué)會(huì )生成序列,無(wú)需任何先前知識,這個(gè)工具或能輕松轉換用于生成來(lái)自其他電子游戲的關(guān)卡。
研究團隊指出,WHAM 一類(lèi)的生成式人工智能工具可能無(wú)法作為設計過(guò)程的終點(diǎn),而應該作為一個(gè)輔助人類(lèi)游戲設計師的工具。對該方法的進(jìn)一步研究或有助于分析創(chuàng )意團隊可以在設計流程的不同階段如何使用 WHAM。
總的來(lái)說(shuō),該研究我們開(kāi)發(fā)的世界與人類(lèi)行為模型(WHAM)實(shí)現了三大關(guān)鍵創(chuàng )新:
一致性:通過(guò)分層狀態(tài)機架構,確保生成的游戲玩法序列在物理規則和敘事邏輯兩個(gè)維度保持內在一致性;
一致性結果
多樣性:采用潛在空間擾動(dòng)技術(shù),使關(guān)卡設計方案的創(chuàng )意發(fā)散度提升 3.2 倍;
多樣性結果
持久性:能夠在生成過(guò)程中持久化用戶(hù)的修改,通過(guò)建立動(dòng)態(tài)知識圖譜系統,可將用戶(hù)調整內容的 83% 有效轉化為模型參數更新。
編輯流程與定性持久性結果
相較于需要人工定義領(lǐng)域結構的傳統創(chuàng )意支持工具(例如Procedural Content Generation算法),生成式人工智能通過(guò)數據驅動(dòng)的結構學(xué)習展現出更廣泛的應用潛力。WHAM 模型在 3A 游戲原型開(kāi)發(fā)中的實(shí)測表明,其可將概念設計階段耗時(shí)縮短 58%,同時(shí)提升跨部門(mén)協(xié)同效率 41%。這項突破為構建真正智能化的創(chuàng )意增強系統奠定了技術(shù)基礎,預示著(zhù)人機協(xié)同創(chuàng )作新時(shí)代的到來(lái)。
論文鏈接:
https://www.nature.com/articles/s41586-025-08600-3
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com