华科大开发多模态AI工具 直击视频“穿帮”痛点

蔡新元介绍电影版《新江汉揽胜图》的穿帮迭代过程。
“10分钟,华科数千年,大开这就是发多武汉!”5月中旬,模态华中科技大学视频号发布《新江汉揽胜图》电影版,工具这则10分钟的直击长视频浓缩江城千年史诗,壮阔恢宏。视频制作它需要投入多少人力?痛点花费多少工时?回答可能令人惊讶——初剪版由华中科技大学设计学院6人学生团队在48小时内完成。
这一“效率奇迹”源于一款企业级多模态AI创意生产平台——“爱乌”。穿帮日前,华科华中科技大学光影交互服务技术文旅部重点实验室主任蔡新元向湖北日报全媒记者们展示了“爱乌”的大开神奇魔力。凭借这款自主研发的发多AI平台,设计师不出办公室,模态即可将脑海中的工具创意变成画面清楚、观感舒服的视频作品。
针对视频生成模型痛点研发控制系统
AI视频并不是一件新鲜事。DataEye数据显示,今年1月,国内AI漫剧上线数量创下新高,平均每天有470多部新剧上线;截至2月末,在播AI剧/漫剧总数已达12.78万部,是2025年的两倍。
行业一边迎来爆发式增长,一边在制作痛点上反复磋磨——“文生图”要“抽卡”,后台算力产出数百张图片,满足使用要求的仅为个位数;“图生视频”缺乏一致性,稍微长一些的视频,人物、布景全走样,“穿帮”频现;高峰时段算力争抢,生成时间长,设计师“披星戴月”,只为“错峰打工”,节约等候时间。
痛点因何而生?“视频生成模型好比一台充满能量的发动机,当我想把它变成一辆好车,让它在我所希望的路线上奔跑,就需要有好的减震轮胎、导航系统等,得给它一些‘控制’。”蔡新元比方道,缺乏有效控制,视频生成模型“自由发挥”,用户就会遭遇使用困境。
光影交互服务技术文旅部重点实验室拥有跨学科优势,针对行业痛点,团队着手“爱乌”的研发,把人工智能、机器学习等领域的新技术应用到研发设计上,赋予其“控制系统”。如在业内普遍面临的“抽卡”难题上,团队通过结构化提示词框架,将自然语言的提示词转化为计算机能理解的结构性语言,避免提示词污染与理解偏差,进而控制生成的边界;引入全链路控制系统应对“穿帮”,保障长视频角色、场景、调性的一致性,促进镜头的自然衔接;“小样本自主学习模型”技术则是通过上传少量样本,引导“爱乌”自主联网搜寻,构建知识库,有效避免海量样本“投喂”,大幅降低算力花费与样本依赖。
蔡新元介绍,“爱乌”的研发目标是辅助设计师生成15分钟到120分钟的电影级长视频。AI的应用也加速了研发进程,“爱乌”的代码有三分之一由AI编写完成,研发仅历时半年。
“爱乌”让创意创作更高效、更普惠
当前,人工智能已迈入规模化、普惠化、产业化的全新阶段。AI不再是科技巨头与专业实验室的专属工具,而是深度融入创意、设计、影视、教育、制造等各行各业,成为重构生产方式、提升创作效率、释放创新活力的底层动力。
对于AI,创意设计师常常一边使用一边畏惧,得益于AI技术带来的便利,也惧怕AI最终成为取代自己的工具与对手,让多年积累的专业能力失去价值。
“2030年短视频行业市场规模将有望达万亿元。AI不仅能够解决创意生成的质量和内容问题,更重要的是,在下一阶段,它会真正成为吸纳就业的主力军。”蔡新元表示,作为高校研发团队,必须正视技术引发的创作理念和创作实践的变革,不仅要“用AI”,也要“造AI”,要引入更好的技术,开发更好用的AI平台。
今年春节期间,蔡新元在“爱乌”上花费3小时制作了一段1分钟的小视频,视频中,一匹AI小红马勇闯华中科技大学设计学院,它漫步、奔驰、跳跃,和人亲昵,虽年幼却充满活力、雄心勃勃,在视频的最后,蔡新元动情地解说:“设计学院就像这匹小马,承载着很多人的期望,也承载着我们对未来设计的理解和想象。新年愉悦!”
今年3月,设计学院团队依托该平台,仅历经不到200小时的连续攻关,制作出AI视频《新江汉揽胜图》,让“武汉魅力”以超燃姿态“出圈”,发布后被中国外交部发言人官方账号在X、Facebook等海外平台转发,引发全球网友围观点赞。
目前,“爱乌”已对10余家北京、武汉的设计公司开放试用。经测算,和实拍相比,经由“爱乌”制作可减少95%以上的成本。“‘爱乌’的英文名是‘ARTIOO’,把AI和ART(艺术)融合,最后三个字母形似‘100’,我们想在数字创意产业做到满分。”蔡新元说。
湖北日报全媒记者 张歆 通讯员 左盈
(责任编辑:{typename type="name"/})
-
在《007:初露锋芒》发售之际,不少玩家猜测IO Interactive的下一款重点作品会是007续作或回归《杀手》系列。然而,据外媒Eurogamer报道,工作室真正的下一款重磅项目,很可能是一款
...[详细]
-
6月15日美市更新支撑阻力:18品种支撑阻力(金银铂钯原油天然气铜及十大货币对)
汇通财经APP讯——6月15日美市美市更新的黄金、白银、铂金、钯金、原油、天然气、铜商品)以及:美元指数、欧元、英镑、日元、瑞郎、澳元、加元、纽元(热门货币对)的支撑阻力位一览。
...[详细]
-
据TheGamer报道,即将于5月23日发售的《乐高蝙蝠侠:昏暗骑士之遗》意外发生解锁漏洞,已有玩家在Xbox平台上提前解锁并游玩完整游戏。此次意外源于一位玩家在沃尔玛官网购买数字密钥后,在Xbox兑
...[详细]
-
5月29日是第24个“联合国维持和平人员国际日”。自2002年联合国设立这一纪念日以来,全球维和人员用生命与汗水守护着战乱地区的和平希望。而中国作为安理会常任理事国,始终是联合国维和行动的关键力量。中
...[详细]
-
下栅子村委会旁边,铺满水泥块、砖头,村民正在寻找失踪的村民。本文图片均由南方周末记者李在磊摄2025年7月30日清晨8时多,45岁的马凤娟向暴雨后的重灾区进发,沿途一片触目惊心:房屋倒塌、瓦砾遍地,电
...[详细]
-
近日,知名爆料人Stiviwonder透露,《生化危机》系列下一部正统续作《生化危机10》已进入早期准备阶段,预计将作为PS6及下一代Xbox的护航作品于2029年或2030年发售。据称,本作将不再引
...[详细]
-
“人生中值得一去的地方!”圣马力诺塞拉瓦莱市市长热情“安利”黄山
“2026世界市长对话・黄山”活动期间,多国市长走进世界非遗精粹集,沉浸式触摸徽州文脉,与非遗传承人面对面交流,亲手体验传统工艺。千年匠心在指尖流转,中外文明在此深情相拥。 黄山以非遗为桥,向世界展现
...[详细]
-
在西班牙卡斯蒂利亚-拉曼恰地区的一座宁静修道院中,一群修女正默默进行着一项非凡的事业——救援濒临灭绝的巨型花明兔。这种被誉为“平和巨人”的家兔品种,成年
...[详细]
-
Visual Art's发布公告,证实因非法入侵,公司内部资料与个人信息存在外泄风险;此次泄密事件曝光的导火索,是游戏《anemoi》相关主数据遭私自违规上传。事件的导火索是4月24日发售的新
...[详细]
-
坐火车去远方慢享时光品清茶“我的铁路风景”主题宣传“文化季”活动正在火热进行中让我们一起沿着延伸的钢轨拥抱旅途中的自在闲暇图片类作品央视新闻网友@央视网友e1w3zm《月季满城,南阳见》月季的红,是南
...[详细]

从产品到生态:欧莱雅如何为消费者带来绿色科学之美|2025年度CSR观察案例⑧
超100家企业参与共建 中央企业科技成果产业化联合体成立
这一年,她修复江南唯一一部《四库全书》
吓哭了!T1青训选手神似Faker引热议:启动克隆计划?
《最终幻想7》第三部即将官宣?外媒预热海报引发猜测
