lpm模型介绍

2026-04-28 17:40:59 反馈

lpm模型是什么,在AI视频生成与数字人技术飞速迭代的当下,米哈游于2026年4月推出的LPM1.0,跳出了传统“生成画面”的赛道,聚焦让虚拟角色“活起来”的表演生成,是专为游戏、虚拟直播打造的170亿参数视听交互大模型,核心解决数字人实时互动、身份一致与情感自然的行业痛点,被视为米哈游下一代游戏NPC与虚拟生态的核心技术底座。

游侠网1

lpm模型是什么

一、核心定义与定位

LPM(Large Performance Model),即大型表演模型,是米哈游 Anuttacon 团队研发的170 亿参数扩散 Transformer(DiT)架构视频生成大模型,主打角色表演生成 + 实时双向交互,区别于 Sora 等通用视频模型,专注 “单人全双工视听对话”,核心是生成有意图、有情感、有个性的连贯表演,而非单纯画面合成。

二、核心技术与架构

基础架构:17B(170 亿)参数扩散 Transformer(DiT),统一建模空间、时间与多模态条件(音频 / 文本 / 图像),强化全局时序一致性与表情细节把控。

双模型设计:

BaseLPM:大参数量底座,负责高质量、高一致性表演生成,保障长时视频身份稳定。

OnlineLPM:蒸馏轻量化版本,适配低延迟实时流式推理,支持无限时长交互,满足游戏 / 直播实时性需求。

全双工交互机制:拆分 “说话” 与 “倾听” 双音频输入,建模双向行为配对,角色可实时反馈(微表情、视线、停顿),实现自然对话流。

身份一致性保障:多视角 / 多姿态参考信息输入,长时会话中持续校准角色特征,避免 “脸崩” 或形象漂移。

游侠网2

三、核心能力(四大突破)

1. 语音驱动表演(说)

输入音频 / 文本 + 角色参考图,生成精准口型 + 自然表情 + 肢体动作,适配多语言、多语气,告别机械对口型。

2. 实时倾听反馈(听)

行业首创 “倾听建模”,用户说话时角色实时生成微表情、视线变化、点头 / 停顿等下意识反馈,模拟人类真实对话状态,增强 “人味儿”。

3. 长时身份一致(稳)

支持无限时长视频生成,角色面部、发型、服饰等特征全程稳定,无明显畸变或风格漂移,解决传统视频模型 “越画越崩” 难题。

4. 低延迟实时交互(快)

OnlineLPM 实现秒级流式生成,端到端延迟低,适配游戏 NPC 对话、虚拟直播实时互动等强实时场景。

以上就是lpm模型介绍,希望能帮到各位,获取更多相关攻略请继续关注游侠手游。

米哈游账号管理中心网页版
米哈游账号管理中心网页版

便于用户掌握一手游戏动态

详情
游侠网APP

CopyRight © 1999-2025 ALi213.Net All Right Reserved |
苏ICP备2023007791号

游侠网 版权所有

所有内容都来自于网络上传,如有侵权请联系删除!

您为什么要举报
举报理由(选填)
取消提交