腾讯混元发布全新视频生成模型:14G消费级显卡流畅运行 生成5-10秒高清视频
|
快科技11月21日消息,今日,腾讯混元大模型团队宣布开源最新视频生成模型HunyuanVideo 1.5,这是一款基于Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。 该模型已经抢先在元宝”上线,普通用户可以直接体验,可通过两种方式:一是输入文字描述(Prompt),直接实现文生视频”;二是上传图片配合Prompt,轻松将静态图片转化为动态视频。 据介绍,HunyuanVideo 1.5模型能力全面,支持中英文输入的文生视频与图生视频。 其中,图生视频能力展现出图像与视频的高度一致性,生成的视频在色调、光影、场景、主体和细节等方面都能与原图较好匹配。 模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、真实的物理规律遵循、写实人物和人物情绪表情等多种指令。 在元宝中可以通过文字和图片生成视频 同时,HunyuanVideo 1.5支持写实、动画、积木等多种风格,并可在视频中生成中英文文字,满足多样化内容创作需求。 在画质方面,模型可原生生成480p和720p高清视频,并可通过超分模型提升至1080p电影级画质。 此前,视频生成领域的开源SOTA旗舰模型至少有20B,需要超过50GB显卡方可部署。 HunyuanVideo 1.5定位为开源小钢炮”,显著降低了使用门槛可在14G显存的消费级显卡上流畅运行,真正让每一位开发者和创作者都能玩起来”。 HunyuanVideo1.5通过多层次的技术创新,实现了生成效果、性能与尺寸上的平衡。 HunyuanVideo 1.5创新的SSTA稀疏注意力机制(全称Selective and Sliding Tile Attention,选择性滑动分块注意力)在保证高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达到商用水平。 |
在线投稿
-
相关阅读
-
杨元庆重磅宣布:联想将全面转型AI原生公司!
-
小米汽车回应碳纤维方向盘是否影响脱手检测:存在误报打扰情况
-
20块的老古董有线耳机火了:不用充电 还可以搭配穿搭
-
一年净利润近10亿,有了AI,美图的日子也是好起来了
-
从降价60%到涨价400%,云厂商疯抢AI蛋糕
-
张雪身价上亿还在用两千多块钱坏手机:没给自己买过一个豪华的东西
-
OPPO K15 Pro系列首发磁吸镜头模组:支持3D打印DIY
-
Colorwalk怎么火了?年轻人用色彩漫步治愈生活
-
精彩图片
-
严重污染!印度首都河面漂浮大量有毒泡沫
-
金饰价格突破800元/克大关
-
绝美!北京朝霞遇到平流雾
-
美国给以色列派先遣队,援助的“萨德”也将启用?
-
以总理住宅遭无人机袭击 以方反应强烈
-
美政府紧急调查以色列报复伊朗计划外泄事件
-
以军袭击加沙地带北部拜特拉希亚地区已致73人死亡
-
加沙民众:每时每刻都有屠杀发生 我们已是活死人
-
新帖速递
-
杨元庆重磅宣布:联想将全面转型AI原生公司!
-
小米汽车回应碳纤维方向盘是否影响脱手检测:存在误报打扰情况
-
20块的老古董有线耳机火了:不用充电 还可以搭配穿搭
-
一年净利润近10亿,有了AI,美图的日子也是好起来了
-
从降价60%到涨价400%,云厂商疯抢AI蛋糕
-
张雪身价上亿还在用两千多块钱坏手机:没给自己买过一个豪华的东西
-
OPPO K15 Pro系列首发磁吸镜头模组:支持3D打印DIY
-
Colorwalk怎么火了?年轻人用色彩漫步治愈生活

精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论