中国首个音视频多媒体垂类大模型万兴“天幕”发布全链路赋能全球创作者

2024年01月31日11:25 | 来源：人民网－湖南频道

小字号

万兴天幕音视频大模型研发中心正式落户马栏山。受访单位供图

人民网长沙1月31日电（记者林洛頫） 1月30日，湖南首个通过算法备案、中国首个音视频多媒体创作垂类大模型——万兴“天幕”面向全球市场发布，它打造基于大模型架构的AIGC应用基础底座，全链路赋能全球创作者，推进大模型进入2.0时代。

多媒体大模型创新应用高峰论坛上，AIGC软件A股上市公司万兴科技宣布其大模型研发中心正式落户马栏山，深入赋能音视频文创生态；万兴科技还与马投算力及华为云达成三方算力合作，并与中广天择达成大模型算料战略合作，推动高质量算料在大模型时代活起来、动起来、跑起来、用起来。

万兴“天幕”由视频大模型、音频大模型、图片大模型、语言大模型组成，涵盖当前市面上语言、音频、图像的大模型能力，包括视觉、音频、语言多模态AI生成及优化，具备一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等核心能力，并在视觉、听觉等多模态关键能力上持续迭代。

“大模型正从图文时代1.0，加速进入到以音视频多媒体为载体的2.0时代。”万兴科技董事长吴太兵表示：“2.0时代垂直大模型增长趋势明显，可更快速、更灵活解决细分领域专业性问题，其生成模式更多是多媒体融合的方式，可从模型到应用场景对用户一条龙赋能。

据了解，万兴“天幕”具有多媒体、垂直解决方案、算力数据及应用本土化鲜明特色，聚焦数字创意垂类创作场景，基于15亿用户行为及100亿本土化高质量音视频数据沉淀，以音视频生成式AI技术为基础，支持全球不同语言，训练在国内算力和服务器基础上进行，引领音视频创作闭环解决方案，相关能力已在海外规模化商用。

数据显示，过去一年行业大模型呈现井喷式增长，并在文本、图像领域实现生产力商用，但以音视频为主的多媒体大模型稀缺；具有“专精特快”优势的万兴“天幕”，可专业提升视频创作效率、精细化提升垂类质量、特色化补齐创作闭环、快速赋能应用智能化升级。

当前，万兴“天幕”多媒体大模型已迭代近百项音视频原子能力。万兴科技副总裁朱伟演示了包括文生主题视频、文生3D视频、AI歌手、视频AI配乐、数字人播报等在内的“天幕”多媒体能力。经测算，多指标数据表现远超行业平均水平。

其中，“文生主题视频”支持高质量视频一键生成、“文生3D视频”支持极高自由度的3D场景生成、“AI歌手”提供超逼真的AI歌手翻唱定制服务、“视频AI配乐”支持根据视频内容AI生成匹配的音乐、“数字人播报”仅需普通手机即可操作，人像真实度、口型准确度等均优势明显，且支持全球主流语种。

目前，万兴“天幕”众多能力已在万兴科技旗下创意软件产品，尤其是海外产品中规模化商用。其中，万兴科技旗下视频创意产品Wondershare Filmora 13已全新集成大模型能力，全新版本的AI Copilot智能剪辑助手、AI文字快剪、AIGC音乐生成等功能备受海外用户好评；一站式出海视频营销神器万兴播爆已实现大模型中数字人能力的应用，使AIGC更好地服务于出海视频创作者，并提供领先的AI视频翻译能力。

据介绍，万兴“天幕”的优越表现基于万兴科技在算力、数据等基础设施及技术人才等层面的积累沉淀。万兴“天幕”持续加码NPU+GPU强力算力底座，已构建千卡集群、自研推理框架、进行全球多活架构布局，并拥有一站式数据生产管理平台，单日可完成百万级数据处理加工；技术人才层面，万兴“天幕”组建百人国际化算法团队，并有乌镇智库理事长、中国人工智能最高奖吴文俊奖获得者张晓东等人工智能专家团坐阵，全力赋能研发工作开展。

吴太兵表示，未来万兴“天幕”将持续在算力、数据、应用三大层面夯实自身实力。算力层面，将积极拥抱国产算力、构建万卡计算集群；数据层面，将通过合作、采购、生成保量，并通过去长尾分布提质，夯实“天幕”基础；应用层面，将以“天幕”为基础底座，加速推进现有产品的智能化升级及全新AIGC产品的推出，持续拓展泛知识、泛营销、泛娱乐等垂类领域场景，从内向外构建“天幕”多媒体开放生态。

论坛上，中国科学院院士王怀民、加拿大皇家科学院院士李明等进行主题演讲，共同论道大模型2.0时代下音视频等领域的新机遇、新趋势、新未来；万兴科技还呼吁行业内外的合作伙伴参与多媒体生态建设，利用马栏山的算力资源和数据资源，共同推动大模型技术的发展，将马栏山打造成更具影响力的V谷。

【1】【2】【3】