lpm模型介绍
2026-04-28 17:40:59 反馈
lpm模型是什么,在AI视频生成与数字人技术飞速迭代的当下,米哈游于2026年4月推出的LPM1.0,跳出了传统“生成画面”的赛道,聚焦让虚拟角色“活起来”的表演生成,是专为游戏、虚拟直播打造的170亿参数视听交互大模型,核心解决数字人实时互动、身份一致与情感自然的行业痛点,被视为米哈游下一代游戏NPC与虚拟生态的核心技术底座。

lpm模型是什么
一、核心定义与定位
LPM(Large Performance Model),即大型表演模型,是米哈游 Anuttacon 团队研发的170 亿参数扩散 Transformer(DiT)架构视频生成大模型,主打角色表演生成 + 实时双向交互,区别于 Sora 等通用视频模型,专注 “单人全双工视听对话”,核心是生成有意图、有情感、有个性的连贯表演,而非单纯画面合成。
二、核心技术与架构
基础架构:17B(170 亿)参数扩散 Transformer(DiT),统一建模空间、时间与多模态条件(音频 / 文本 / 图像),强化全局时序一致性与表情细节把控。
双模型设计:
BaseLPM:大参数量底座,负责高质量、高一致性表演生成,保障长时视频身份稳定。
OnlineLPM:蒸馏轻量化版本,适配低延迟实时流式推理,支持无限时长交互,满足游戏 / 直播实时性需求。
全双工交互机制:拆分 “说话” 与 “倾听” 双音频输入,建模双向行为配对,角色可实时反馈(微表情、视线、停顿),实现自然对话流。
身份一致性保障:多视角 / 多姿态参考信息输入,长时会话中持续校准角色特征,避免 “脸崩” 或形象漂移。

三、核心能力(四大突破)
1. 语音驱动表演(说)
输入音频 / 文本 + 角色参考图,生成精准口型 + 自然表情 + 肢体动作,适配多语言、多语气,告别机械对口型。
2. 实时倾听反馈(听)
行业首创 “倾听建模”,用户说话时角色实时生成微表情、视线变化、点头 / 停顿等下意识反馈,模拟人类真实对话状态,增强 “人味儿”。
3. 长时身份一致(稳)
支持无限时长视频生成,角色面部、发型、服饰等特征全程稳定,无明显畸变或风格漂移,解决传统视频模型 “越画越崩” 难题。
4. 低延迟实时交互(快)
OnlineLPM 实现秒级流式生成,端到端延迟低,适配游戏 NPC 对话、虚拟直播实时互动等强实时场景。
以上就是lpm模型介绍,希望能帮到各位,获取更多相关攻略请继续关注游侠手游。
- 【攻略】 lpm模型介绍
- 【攻略】 米哈游三件套隐藏兑换码大全
- 【攻略】 米哈游系列歌曲播放量排行总榜
- 【攻略】 米哈游官网入口
- 【攻略】 米哈游游戏大全
- 【攻略】 米哈游账号管理中心怎么改绑手机号







