lpm模型是什么-lpm模型介绍-游侠手游

当前位置：手游首页 > 攻略 > lpm模型介绍

lpm模型是什么，在AI视频生成与数字人技术飞速迭代的当下，米哈游于2026年4月推出的LPM1.0，跳出了传统“生成画面”的赛道，聚焦让虚拟角色“活起来”的表演生成，是专为游戏、虚拟直播打造的170亿参数视听交互大模型，核心解决数字人实时互动、身份一致与情感自然的行业痛点，被视为米哈游下一代游戏NPC与虚拟生态的核心技术底座。

游侠网1

lpm模型是什么

一、核心定义与定位

LPM（Large Performance Model），即大型表演模型，是米哈游 Anuttacon 团队研发的170 亿参数扩散 Transformer（DiT）架构视频生成大模型，主打角色表演生成 + 实时双向交互，区别于 Sora 等通用视频模型，专注 “单人全双工视听对话”，核心是生成有意图、有情感、有个性的连贯表演，而非单纯画面合成。

二、核心技术与架构

基础架构：17B（170 亿）参数扩散 Transformer（DiT），统一建模空间、时间与多模态条件（音频 / 文本 / 图像），强化全局时序一致性与表情细节把控。

双模型设计：

BaseLPM：大参数量底座，负责高质量、高一致性表演生成，保障长时视频身份稳定。

OnlineLPM：蒸馏轻量化版本，适配低延迟实时流式推理，支持无限时长交互，满足游戏 / 直播实时性需求。

全双工交互机制：拆分 “说话” 与 “倾听” 双音频输入，建模双向行为配对，角色可实时反馈（微表情、视线、停顿），实现自然对话流。

身份一致性保障：多视角 / 多姿态参考信息输入，长时会话中持续校准角色特征，避免 “脸崩” 或形象漂移。

游侠网2

三、核心能力（四大突破）

1. 语音驱动表演（说）

输入音频 / 文本 + 角色参考图，生成精准口型 + 自然表情 + 肢体动作，适配多语言、多语气，告别机械对口型。

2. 实时倾听反馈（听）

行业首创 “倾听建模”，用户说话时角色实时生成微表情、视线变化、点头 / 停顿等下意识反馈，模拟人类真实对话状态，增强 “人味儿”。

3. 长时身份一致（稳）

支持无限时长视频生成，角色面部、发型、服饰等特征全程稳定，无明显畸变或风格漂移，解决传统视频模型 “越画越崩” 难题。

4. 低延迟实时交互（快）

OnlineLPM 实现秒级流式生成，端到端延迟低，适配游戏 NPC 对话、虚拟直播实时互动等强实时场景。

以上就是lpm模型介绍，希望能帮到各位，获取更多相关攻略请继续关注游侠手游。

米哈游账号管理中心网页版

便于用户掌握一手游戏动态

详情