当前位置:首页 > 上海厂房招商 > 正文内容

上海交大推出世界叙事模型沪上影视工业锚定技术话语权

  在AI视频生成技术快速渗透影视制作行业的当下,专业创作者普遍陷入一种被称为“抽卡”的低效循环:输入一段描述镜头语言的文本指令,等待数十秒后获得一段视频,检查画面、发现问题、修改指令、重新生成,再检查,再发现新的问题。

  上海交大团队在前期调研中统计了一组数据:专业创作者使用主流视频生成模型时,为获得一个符合基本要求的镜头,平均需生成20至50次;在追求高精度控制的精品制作中,成功率不足50%。行业将这种低效循环称为“抽卡”——像极了手机游戏里玩家为了一张稀有卡牌反复氪金的行为。

  7月3日,上海交大张文军院士团队的倪冰冰教授发布“世界叙事模型”(World Narrative Model, WNM)。这个被团队称为“为视频基模装上专业方向盘”的模型,试图终结的正是这种“概率赌博”式的创作困境。

  倪冰冰在接受头部财经专访时指出:市面上大多数文生视频AI本质是“神经渲染器”——输入文字或图片,直接生成动态画面,靠数据自学光影、镜头和运动规律。这种端到端模型的工作原理,相当于一个“黑盒概率采样器”:输入稀疏文本指令,输出高维稠密像素矩阵。中间发生了什么?没人知道,也没人能干预。“导演想要一个镜头,模型给出一堆像素。中间缺少对物理世界的显式建模——场景的几何结构是什么?物体的运动轨迹怎么走?灯光从哪个角度打?这些在端到端模型里全是隐式的、不可控的。”倪冰冰对记者表示。

  WNM的思路是把这个黑盒拆开,拆成两半:一半是控制器,即世界叙事模型本身;另一半是绘图器,由现有的视频生成大模型(如Kling、Seedance、Wan等)担任。

  控制器承担的是理解物理世界、规划叙事结构的职能。它将导演的创作意图——包括剧本、分镜、参考图——自动转化为包含场景几何、人物骨骼、道具摆放、动作动线、运镜轨迹、灯光参数等维度的结构化物理参数序列。这些参数构建出一个完整的、可编辑的4D(三维空间+时间)数字世界表征。

  绘图器则简单得多:拿到控制器输出的结构化参数,在确定性的物理骨架基础上完成像素级渲染。

  倪冰冰对记者解释,这一架构的实质是将理解物理世界与渲染视觉像素两大任务彻底解耦。他称,现有视频基模只负责它蕞擅长的事情——画像素。至于画什么、怎么动、光从哪来,则全部由控制器精确指定。

  如此拆分后,物理参数变为可调、可控、实时生效的。导演可以直接调整场景几何、修改人物动作细节、改变运镜轨迹、调节灯光位置与色温,不再需要反复“抽卡”,等待模型随机吐出一个接近预期的结果。

  用户数据显示,采用WNM后,单镜头编辑轮次从20至50次降至3次以内,专业创作者

  视频模型热潮下WNM的定位

  以目前行业头部世界模型GoogleGenie 3为对比案例,倪冰冰向记者明确区分了两者的核心差异:前者追求的是可玩性,用户可以在模型生成的游戏化环境中实时操控,但只能在模型封闭的生成世界中做有限探索。后者追求的是可控性,用户可以对场景、角色等所有物理参数进行独立操控。再与Kling、Veo等视频模型对比,倪冰冰表示,这类端到端视频模型输入稀疏指令、输出像素,中间无法干预,必然导致“抽卡式”低效生产。WNM“控制器+绘图器”架构可以先规划场景、设计走位、调度运镜、布置灯光,再交由绘图器来执行。

  该技术路径仍面临不小的挑战。倪冰冰表示,蕞大的瓶颈在数据层面——训练一个能精确理解物理世界的模型,需要带有精确几何和物理标注的三维数据,这种数据比训练渲染器用的互联网视频稀缺好几个数量级。

  此外,如何让AI生成的几何体在物理引擎中计算准确也是一个难题。团队通过构建自动化标注流水线和数据飞轮来解决数据瓶颈,采用多智能体协同和主动学习降低人工标注量。

  另一大瓶颈是长时序一致性——如何保证长达5分钟的生成过程中,场景布局、角色身份、物体位姿不发生漂移。上海交大团队的解决方案是通过世界叙事模型维护跨帧的物理状态连续性,模型不是逐帧“猜”下一帧长什么样,而是基于明确的物理参数状态演化来驱动每一帧的生成。

  从“抽卡二十次拍一个镜头”到“确定性地构建一个镜头”,WNM试图跨越的正是这道从“能生成”到“能控制”的分水岭。张文军院士认为:视频生成的下一个分水岭是可控性,可控性的基石是物理孪生式的世界叙事模型。

  当模型能够精确理解场景的三维结构、物体的物理属性和运动规律时,真正可控的视频生成才有可能。

  传统影视制作中,导演在实拍前需要通过分镜图、概念设计、3D预演等手段来规划镜头。这是一个耗时、昂贵且高度依赖人工经验的环节。WNM将其自动化并提升到物理参数级别,导演可以在可编辑的4D物理世界层面完成全部创意规划,将专业判断精准注入每一个控制环节。当前市面上已出现大量AI视频创作平台——包括帧赞、LibTV、TapNow、360纳米等,其核心逻辑是将现有视频基模通过API串联,加上剧本生成、分镜管理、素材库等功能模块,形成一条生产线。倪冰冰认为这些平台本质上是流程集成工具,底层仍然依赖黑盒基模,用户依然在“抽卡”,且无法精确控制画面中的每一个元素。

  而WNM不是集成,而是尝试从底层架构上推翻端到端像素采样的生成范式。这一区别决定了WNM在产业链中不是现有生产线的补充插件,而是对生成范式的底层重构。

  2026年5月25日,上海市文旅局发布全国首个省级AI微短剧专项政策《AI微短剧沪8条》。政策明确在徐汇、杨浦、闵行建设三大AI微短剧产业集聚区,布局市级“AI+微短剧”中试基地,对自主研发且市场认可的AI微短剧智能体项目,按不超过实际研发投入的20%给予蕞高1000万元资金支持。

  据记者了解,中试基地项目技术牵头方由上海交大团队担任,算力由九章云极提供。倪冰冰对记者表示,团队将依托中试基地,将WNM嵌入精品短剧和影视内容生产流程中,大幅缩短制作周期,预期WNM的落地将推动上海从微短剧的流量消费地升级为技术输出地和标准制定地。

  从更宏观的视角看,这一判断的底层逻辑是行业正在发生的结构性变化。倪冰冰对记者分析,目前视频模型产品同质化严重——大家都在拼单次生成的画质。但真正决定谁能跑出来的核心是可控性和工作流适配:谁能被创作者真正嵌入日常生产流程,谁就能胜出。

  目前张文军院士团队已将论文公开发布,基于WNM的视频创制平台同步上线公测。倪冰冰对记者透露,商业化方面考虑多种模式并行:面向中小团队的SaaS订阅制、面向大型影视公司的私有化部署,以及面向开发者的API按调用收费。目前已在上海与多家影视制作机构开展合作验证。

  倪冰冰认为,当前视频模型领域正处在一个十字路口。一端是继续堆算力、拼画质的端到端路线;另一端是回到先理解物理世界、再生成视觉像素路线。他判断,大语言模型走通的路,视频生成大概率也要走一遍,后者的“Transformer时刻”不会发生在像素生成层面,而会发生在世界理解层面——当模型能够精确理解场景的三维结构、物体的物理属性和运动规律时,真正可控的视频生成才有可能。

  在AI视频生成从实验室走向产业化的关键节点,谁能在可控性上率先突破,谁就有可能定义下一代影视工业的技术标准。上海交大团队选择用“控制器+绘图器”的架构回答这个问题。至于这套答案能否真正跑通,接下来要看它在中试基地与一线制作机构的碰撞中交出怎样的答卷。

  (文章来源:头部财经)

  即可将网页分享至朋友圈

葛毅明微信号
产业招商/厂房土地租售:400 0123 021
或微信/手机:135246785151356468684613524678515 
请说明您的需求、用途、税收、公司、联系人、手机号,以便快速帮您对接资源。 
长按/扫一扫加葛毅明的微信号

扫一扫关注公众号

扫描二维码推送至手机访问。

版权声明:本文由中国产业园区招商网发布,如需转载请注明出处。部份内容收集于网络,如有不妥之处请联系我们删除 13524678515 仅微信

本文链接:http://www.280380.com/index.php/post/17002.html

标签: 上海工业
分享给朋友:

相关文章

中国2023年主要城市工业总产值排名出炉

中国2023年主要城市工业总产值排名出炉

  : 根据各地统计局和刘晓博说财经的数据,2023年中国主要城市工业总产值排名已经揭晓。深圳以4.85万亿元排名头部,保持了中国工业强市的地位。紧随其后的苏州以4.43万亿排名第二,而上海则下滑至第三位,工业总产值达到3.94万亿元。   深圳作为中国的经济特区之一,一直在中国工业发展中发挥着领导作用。这座城市强大的制造业基础和创新实力为其工业发展提供了强大支持。苏...

中国10大工业城市排名:上海、深圳、苏州等南方城市崛起

中国10大工业城市排名:上海、深圳、苏州等南方城市崛起

  由内容质量、互动评论、分享传播等多维度分值决定,勋章级别越高(),代表其在平台内的综合表现越好。   中国10大工业城市排名:上海、深圳、苏州等南方城市崛起   工业是人类社会文明进步的重要标志,是国民经济的重要支柱产业,对于城市的发展起到了决定性作用。中国工业发展至今,和整体经济格局一样,发生了翻天覆地的变化,这不仅表现在从一个农业打过变成了全...

上海市一月份规模以上工业总产值达2200亿元左右

上海市一月份规模以上工业总产值达2200亿元左右

  上海工业首月实现“开门红”。记者17日从上海市经信委获悉,1月份全市规模以上工业总产值2200亿元左右,可比增长40%以上;工业产销率保持在99%以上。   从主要行业看,汽车行业继续保持去年以来的快速增长势头,产销量继续大幅增长,上汽集团轿车产量达12万辆,同比增长86.3%;石化、钢铁行业生产情况良好,主要设备满负荷运行;电子行业在出口的带动下,恢复势头明显,...

5月28日公司动态精选(公告+互动+调研)

5月28日公司动态精选(公告+互动+调研)

  $百龙创园(sh605016)$ 年产3万吨可溶性膳食纤维项目和年产1.5万吨结晶糖项目已正式全面投产。   $翰宇药业(sz300199)$ 与三生蔓迪签署司美格鲁肽注射液合作协议。   〇$中控技术(sh688777)$ 表示,公司将于今年6月5日至6日在新加坡召开新品发布会,发布全球首款通用控制系统UCS以及流程工业首款AI时序大模型TPT...

格力电器等在上海成立汽车科技公司涉多项工业机器人业务

格力电器等在上海成立汽车科技公司涉多项工业机器人业务

  【TechWeb】10月12日消息,天眼查信息显示,昨日,上海格力汽车科技有限公司成立,法定代表人为钟成堡,注册资本2000万人民币,经营范围含汽车零部件研发、汽车零部件及配件制造、工业机器人制造、工业机器人销售、智能机器人研发等。   根据股权全景穿透图显示,该公司由格力电器旗下珠海格力智能装备有限公司、上海捷英途新材料科技有限公司共同持股,分别持股51%、49...

上海加快推进“工业上楼”多处“摩天工厂”拔地而起

上海加快推进“工业上楼”多处“摩天工厂”拔地而起

  新华社上海9月30日电 上海浦东新区康新公路紫萍路交叉口,施工现场机器轰鸣,明年7月份,这栋地上建筑8层的大楼预计将完成结构封顶。未来,蓝帆医疗心脏瓣膜、微创外科手术器材等产品的研发与生产都将搬进来,实现“工业上楼”。根据近期发布的措施,上海力争三年推出智造空间3000万平方米,目前已开工近700万平方米。   蓝帆医疗上海创新医疗基地项目总经理卢凌威告诉记者,与...

2024汉诺威上海工业联展从展台到未来:见证智能制造的创新力量

2024汉诺威上海工业联展从展台到未来:见证智能制造的创新力量

  秋风送爽、万物丰盈,产业一线汉诺威上海工业联展在上海新国际博览中心盛大启幕,代表制造业各个领域尖端实力的3,100多家企业齐聚申城,在近22万平方米的展示面积上带来世界前沿的首发技术、开创性产品及行业领先的解决方案,为观众呈现了一副智能制造的宏伟蓝图。   从“世界工厂”到“全球制造业中心”,中国制造业蕴含着无限的发展机遇。德国汉诺威展览公司董事局主席柯克勒博士强...

上海沪工上涨501%报2265元股

上海沪工上涨501%报2265元股

  资料显示,上海沪工焊接集团股份有限公司位于上海市青浦区外青松路7177号,公司是一家专业从事数字化智能焊机、大型激光数控切割设备、智能机器人成套设备、IOT智能切割管理服务系统四大领域的研发、生产和投资的工业设备企业集团。公司产品远销全球110余个国家和地区。   截至9月30日,上海沪工股东户数3.93万,人均流通股8093股。   2024年...