更多精彩 >

交互式3D数字人框架SentiAvatar开源:SentiPulse携手人大高瓴,让数字人和人类自然交互

2026-04-08 18:03:10   来源:搜狐网  作者: 

摘要:3D数字人行业已陷入发展怪圈:全行业的竞争维度,始终困在“视觉上够不够像人”的颜值内卷里。但行业集体忽略的是,再精致的建模、再逼真的渲染,都无法成为用户长期深度交互的核心理由。

3D数字人行业已陷入发展怪圈:全行业的竞争维度,始终困在“视觉上够不够像人”的颜值内卷里。但行业集体忽略的是,再精致的建模、再逼真的渲染,都无法成为用户长期深度交互的核心理由。

真正卡住数字人产业发展天花板的,从来不是视觉层面的“不像人”,而是其始终未能构建起与人类相似自然的表达能力和更流畅的动作。很多时候,数字人看似嘴在动、手在挥,肢体动作却与对话语义完全脱钩,面部表情和台词情绪彻底割裂,这种深入骨髓的机械感与违和感,直接斩断了人与数字人之间建立情感联结、实现深度交互的所有可能。

人类真实沟通中,超70%的信息与情绪都藏在非语言信号里,耸肩的无奈、挑眉的质疑,这些细节才是对话的灵魂。但这背后是行业面临的三个瓶颈:一是中文对话场景高质量数据荒,覆盖全身动作的高质量数据集近乎空白;二是复合语义下动作漂移,面对融合情绪的复杂表达,模型语义理解能力急剧退化;三是音画节奏错位,动作机械生硬,与语音重音、停顿完全脱节。

这三道枷锁,把数字人困在“预设脚本播放机器”的定位里,始终迈不开从“能说话”、“能动”到“懂交流”的关键一步。而SentiPulse(思维光谱)联合中国人民大学高瓴人工智能学院推出的SentiAvatar交互式3D数字人框架,正是为打破这些瓶颈而来。面向全球开源的3D动作生成完整解决方案,让数字人跳出预设动作桎梏,实现贴合语境与情绪的自然实时交互,真正告别“提线木偶”式交互。

国内首个交互式3D数字人框架,让3D数字人动作有“灵魂”

针对行业底层痛点,SentiAvatar打造了3D动作生成新范式。

5--.png

在数据底座层,SuSuInterActs数据集围绕单一角色SUSU(22岁,温柔活泼,情感丰富)构建。包含2.1万段片段、37小时的多模态对话语料,涵盖同步语音、行为标注文本、全身动作与面部表情,填补中文高质量数据的空白。

为打破场景限制,让数字人交互摆脱“脚本化”,团队在预训练阶段引入了自研的Motion Foundation Model动作基础模型,在200K+条异质动作序列(约676小时)上训练通用运动先验,让数字人的能力远超对话场景本身。

此外,SentiAvatar创新提出plan-then-infill双通道并行架构,在动作生成时,将身体动作与面部表情分开处理,先规划“做什么动作”,再插入“如何逐帧执行”,让整体动作生成效果更流畅。

具体而言,第一阶段,LLM语义规划器接收行为标签文本和稀疏音频Token,输出稀疏关键帧动作Token序列。为支持多轮流式连续生成,模型以前一句话的最后两个关键帧音频-动作Token对作为上下文前缀,从下一个关键帧位置续写,实现无缝跨句过渡;第二阶段,Body Infill Transformer在相邻关键帧之间填入中间3帧,以逐帧 HuBERT连续特征(768维,20FPS)作为条件信号。模型采用5帧滑动窗口,首尾帧已知,预测中间3帧(12个动作Token)。推理时使用迭代置信度解码策略(默认6步),逐步接受高置信度预测,避免一次性预测的质量退化。

权威实验结果显示,SentiAvatar在SuSuInterActs和行业通用BEATv2两个数据集上,多项核心指标均达到当前国际最优水平(SOTA),性能全面领跑行业主流模型。

6-.png

在自建的SuSuInterActs测试集上,SentiAvatar的文本-动作检索召回率R@1达到43.64%,几乎是行业次优基线的2倍;在跨数据集、跨语言的BEATv2评测集上,SentiAvatar以FGD 4.941、BC 8.078的成绩,同时刷新两项指标的SOTA纪录,超越此前行业最优方案,充分验证了模型的跨场景、跨语言泛化能力。

基于自研高质量数据集、动作基础模型与核心架构,SentiAvatar实现了在0.3秒内生成6秒动作序列,支持无限轮次的流式交互。这意味着数字人可以在实时对话中持续生成连贯的动作与表情,无需等待整句结束再批量处理,能直接解决数字人“交互卡顿”的问题。

构建认知-表达闭环,夯实数字人“交互底座”

SentiAvatar已正式上线GitHub开源平台,面向全球科研机构与开发者全面开放,相关技术报告也已同步发布于arXiv。开发者可基于这套开源框架,低成本打造专属的3D数字人,也可拓展其在游戏交互、影视制作、机器人等领域的应用。

当数字人不再是冰冷机械的交互工具,它能读懂你面部表情的隐喻并反馈同样稀缺的情绪价值,变成能感知语境、理解情绪、主动表达的交互主体,下一代“数字生命”即将诞生。


猜你喜欢

破解具身智能“大脑”进化新路径,“机器人幼儿园”探索自主学习新范式

智能+“机器人幼儿园”

具身智能浪潮奔涌至今,机器人“躯体”的硬件能力日益精进,但“大脑”如何真正理解物理世界、实现自主决策...

1小时前

灵童机器人发布新一代桌面人形机器人,启动1000台全球共创计划

智能+灵童机器人

近日,上海灵童机器人(Figurobot)正式启动“你好·未来造物者”社区共创活动,宣布面向全球专业...

1小时前

史河机器人率先落地具身智能特种机器人,高危作业场景打开产业化空

智能+史河机器人

2026年,"十五五"规划正式开局,"具身智能"被纳入未来产业方向。

2小时前

天梁科技启动新一轮融资:脑机接口与AI内窥镜双驱并进,构建稀缺技术护城河

智能+天梁科技

人工智能与医疗器械的深度融合,正将两个千亿级赛道推向爆发前夜。

1天前

乐动机器人登陆港股 “空间感知机器人第一股”诞生

智能+乐动机器人

在加州一处私人庭院里,一台银灰色的智能割草机器人正在工作。

3天前

2026五大合规安全的贵金属交易平台排名

金融科技贵金属交易平台

贵金属作为一种贵金属交易品种,因其具有高杠杆比例、高流动性等特点而备受投资者关注。

2026-04-24

GEO优化哪家综合实力更强?2026年度国内头部服务商深度实力盘点

大消费GEO优化

中国生成式引擎优化行业已进入规范化发展新阶段。

2026-04-24

时代天使2025年报董事会主席冯岱和CEO胡杰章致辞

上市公司时代天使

4月23日,时代天使发布2025年年度报告。

2026-04-24

从爆品标准到品牌共生:中粮福掌柜如何重新定义供应链与餐饮终端的新关系

大消费中粮福掌柜

2026年4月16日,“中国守味人—掌门驾道·守味争锋”厨师大赛首站在长沙落幕。

2026-04-24

引领健康照明产业升级,欧普照明以科技之力“把阳光带回家”

大消费欧普照明

当“健康中国”上升为国家战略,光,不再仅仅是驱散黑暗的工具,而是关乎亿万国民视力、睡眠与情绪的“隐形...

2026-04-24

金融街证券召开2026ETF生态圈研讨会暨“金如E”ETF投研平台发布会

金融科技ETF生态圈研讨会

4月22日, 2026ETF生态圈研讨会暨“金如E”ETF投研平台发布会在北京金融街中心成功举办。

2026-04-24

歌尔股份2025年报&2026一季报发布:盈利稳步增长,核心业务韧性凸显

上市公司歌尔股份

在消费电子行业普遍面临业绩承压的背景下,歌尔股份凭借扎实的经营功底与精准的战略布局,交出一份抗风险、...

2026-04-24

2026年头部GEO公司十强权威榜单:技术能力与实战成效全评

大消费GEO公司

截至 2026 年 4 月,生成式引擎优化(GEO)已从企业数字营销的"可选动作"升级为"必选战略"...

2026-04-24

2026年度geo公司十强巡礼及选型解读

大消费geo公司

截至 2026 年 4 月,生成式引擎优化(GEO)已从企业数字营销的"可选动作"升级为"必选战略"...

2026-04-24

AI万相重构经营!阿里妈妈618新策见面会,全面释放大促增长新势能

大消费阿里妈妈

阿里妈妈以AI万相为核心,推动经营从流量竞争迈向意图驱动,释放618全域增长新红利。

2026-04-24

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。