-
友情链接:
Powered by 开云(中国)Kaiyun·官方网站登录入口 @2013-2022 RSS地图 HTML地图
刚刚,腾讯混元大模子公布最新进展:庄重上线视频生成才气,这是继文生文、文生图、3D生成之后的又一新里程碑。与此同期,腾讯开源该视频生成大模子,参数目130亿,是现时最大的视频开源模子。
“用户只需要输入一段样子,即可生成视频,”腾讯混元相关负责东说念主披露,当今的生成视频撑捏中英文双语输入、多种视频尺寸以及多种视频明晰度。当今该模子已上线腾讯元宝APP,用户可在AI期骗中的“AI视频”板块央求试用。企业客户通过提供作事接入,当今API同步绽放内测央求。
通过腾讯元宝APP-AI期骗-AI视频即可使用该功能(前期需央求)
在与国表里多个顶尖模子的评测对比炫耀,混元视频生成模子在文本视频一致性、通顺质料和画面质料多个维度恶果最初,在东说念主物、东说念主造样式等场景下进展尤为出色。
腾讯混元视频生成大模子制作出的视频画质很传神,本色也与教唆词高度一致,确保画面的流通性,减少形变,以至在教唆词是 emoji 神志的情况下,也不错踏实输出。
举例,在惩办冲浪、跳舞等包含大幅度手脚的场景时,该模子简略生成流通且合理的手脚镜头,物体形变自得得到有用适度;在惩办光影反射时,它简略基本顺从物理规则,如在镜面或照镜子的场景中,简略收场镜表里手脚的一致性。此外,该模子还能在保捏画面主角不变的情况下自动切换镜头,这是很多其他模子所不具备的高档功能。
视频由腾讯混元视频生成,教唆词:200mm长焦镜头,瞄准一只停在雕栏上的海鸥。羽毛的纹理明晰可辨,远景的木雕栏温情虚化。远方的落日和海平面溶化成金红色的光影
视频由腾讯混元视频生成,教唆词:狂风雪中,一列蒸汽火车在侘傺山间穿行,黑烟从车头直冲云端,车厢在清白白雪中留住机要轨迹,镜头以侧面跟踪,捕捉机械巨兽破开风雪的磅礴阵容,白雾与蒸汽交汇成壮丽画卷,电影氛围,远景
视频由腾讯混元视频生成,教唆词:一个袒护的瀑布流入澄莹的水池,周围是肥大的树木和绿色植物。阳光穿过树叶,鄙人面的岩石和水面上酿成雀斑。传神,焕发丛林中的宁静瀑布,宁静、阳光明媚的日子,中景
视频由腾讯混元视频生成,教唆词:一位戴着维捏飞行护目镜的机械师,半跪在蒸汽一又克作风的责任室里。她棕色鬈发挽成发髻,荒芜的银色发丝闪着金属光芒。深棕色皮质工装背带裤上沾满机油污渍,袖口卷起败露布满齿轮纹身的手臂。特写她正用黄铜器具调试一只机械鸟,齿轮间冒出缕缕蒸汽,责任台上洒落着铜管、发条和旧式图纸。
它取舍了与Sora通常的DiT架构,并在此基础上进行了多项优化。混元的视频生成模子通过引入新一代的文本编码器,显赫增强了对语义的融会和蔼从才气,这使得它在惩办多主体场景时简略愈加精准地实施指示并呈现细节;此外,该模子还取舍了和谐的全珍贵力机制,这不仅让视频帧之间的过渡愈加当然,还收场了在保捏主体一致性的前提下进行多视角切换;临了,混元通过取舍先进的图像视频羼杂VAE技巧(3D变分编码器),在细节捕捉上得回了显赫卓绝,相当是在惩办小尺寸东说念主脸和快速通顺镜头等复杂场景时进展尤为凸起。
当今,腾讯晓示开源该视频生成大模子已在 Hugging Face 平台及 Github 上发布,包含模子权重、推理代码、模子算法等齐备模子,可供企业与个东说念主成就者免费使用和成就生态插件。基于腾讯混元的开源模子,成就者及企业无需从新考研,即可径直用于推理,并可基于腾讯混元系列打造专属期骗及作事,简略肤浅无数东说念主力及算力,加速行业革命样式。
据雷峰网了解,从年头以来,腾讯混元系列模子的开源速率束缚加速。此前,腾讯混元也曾开源了旗下文生文、文生图和3D生成大模子。至此,腾讯混元系列大模子已收场全面开源。
Powered by 开云(中国)Kaiyun·官方网站登录入口 @2013-2022 RSS地图 HTML地图