更多精彩 >

AI让远程交流“更清晰”:GAN消除视频通话中的抖动

2020-10-22 09:15:03    来源:  作者: 

摘要:NVIDIAMaxine是一款云AI视频流平台,将使用GAN来提高带宽性能

NVIDIA Maxine是一款云AI视频流平台,将使用GAN来提高带宽性能

image.png

Ming-Yu Liu 和Arun Mallya 正在进行视频通话,其中一个人的画面开始出现卡顿,直至画面定格。

这是一种常见且令人反感的情况。但与大多数人不同的是,Liu和Mallya可以做出一些改变。

他们是NVIDIA的AI研究人员,专攻计算机视觉。在与Ting-Chun Wang共事中,他们意识到可以使用神经网络来替代被称为视频编解码器的软件,这种软件通常用于视频在网络传输过程中的压缩和解压缩。

迄今为止,他们的工作成果将用户在视频通话时所需的网络带宽压缩至原来的十分之一,还有望将带宽消耗降低数个数量级。

Mallya表示:“我们希望通过AI提供更好的视频沟通体验,即使在带宽极低的情况下,也可以从语音升级到视频通话。”

GAN让连接质量更佳

即使用户的面部有遮挡(比如戴着帽子、眼镜、耳机或口罩),这项技术同样适用。为了增加趣味性,他们在演示中使用了一些装饰物,这样用户可以在线上更改其发型或衣服或者创建头像。

更重要的是,如上图所示,借助神经网络定位,无需再盯着显示器上方摄像头才能与对方对视,这增强了面对面对话的感觉。

Wang表示:“借助计算机视觉技术,我们可以从多个角度来定位头部。我们认为这将帮助人们更自然地进行对话。”

迎接最前沿的AI技术,让虚拟生活更真实。

AI赋能视频通话的原理

AI辅助视频通话的工作机制十分简单。

与目前使用压缩的视频流的系统类似,参考图像发送后,仅用户眼睛、鼻子和嘴巴周围几个关键点的位置数据被发送,而非发送大量压缩过像素的图像。

接收端的生成式对抗网络通过初始图像和面部关键点,在本地GPU上重构后续图像。因此,通过网络传输的数据要比之前少得多。

Liu在GAN领域的工作成果GauGAN曾引发关注。GauGAN是一种可以将涂鸦转化为写实艺术作品的AI工具,目前已经创建了超过一百万张图像。该工具可在AI Playground中获取。

Liu表示:“疫情期间频繁的视频会议启发了我们,因此我们开始探索突破带宽瓶颈的方式,让供应商可以同时为更多人提供服务。”

GPU突破带宽瓶颈

这一方法顺应当前行业趋势,将网络瓶颈转化为计算任务,从而借助本地或云端资源更轻松地解决此类问题。

NVIDIA媒体集团高级产品总监Andrew Page表示:“如今,许多公司希望将带宽问题转化为计算问题,这是因为带宽一般很难增加,而增强算力则相对容易。”

image.png

NVIDIA Maxine搭配了一套视频会议和流媒体服务工具

AI 工具优化视频服务

GAN视频压缩是NVIDIA Maxine即将推出的几个功能之一,这是一个云AI视频流平台,用于增强视频会议和电话质量。它将音频、视频和对话式AI功能整合在一个工具包中,并支持多种设备。

在上周的GTC大会上,NVIDIA宣布推出了Maxine平台。基于该平台,服务提供商能够在提供超高分辨率的视频的同时,实现实时翻译、噪声消除和情景感知的闭路字幕。用户可以享受到人脸校正、虚拟助手和化身逼真的动画角色等功能。

Page表示:“视频会议正在经历一场复兴。疫情期间,它的缺点给所有人带来了不愉快的使用体验,但回归视觉动物的属性,视频终将成为人们今后生活中的一部分。”

通过利用基于Tensor Core核心的NVIDIA GPU,Maxine可运行如NVIDIA Jarvis的软件。NVIDIA Jarvis是用于对话式AI的SDK,提供了一套语音和文本功能。 它们共同提供了当今有用的AI功能,并成为未来视频产品和服务的基石。

想要了解更多有关AI计算的最新技术,解锁GPU前沿应用,可点击链接:https://www.nvidia.cn/gtc/keynote/,观看GTC 2020秋季站主题演讲上的精彩内容。

image.png

 


猜你喜欢

AI的下一站:为具身智能注入对现实商业世界的“原始认知”

AI智能+

当前,人形机器人及各类具身智能终端正加速步入现实应用场景。

2026-04-10

AI诞生超级并购案

AI

AI诞生超级并购案

2026-03-11

原创

雷军甩出“AI王炸”,小米再次爆火!

华为AI

95后“AI天才”罗福莉首秀炸场,小米再次爆火

2025-12-19

AI应用爆发前夜,谁将获得黄金机遇

AI

2025年,科技领域迎来了一场前所未有的突破浪潮。

2025-08-25

2026英本“最难申请季”呼啸而至,新东方留学跃领计划如何筑起名校“护城河”?

新东方大消费

2026年3月,新东方《中国学生出国留学发展报告》在北京发布。

2026-05-09

投资必备!十大投资软件排名大盘点:2025-2026年五款特色APP全方位测评

金融科技投资软件

在 2026 年科技与金融深度融合的今天,一款好用的投资 APP 已成为投资者在股市中不可或缺的辅助...

2026-05-09

2026年生成式引擎优化(GEO)竞争力白皮书:谁在为你的品牌修建AI世界的认知护城河?

大消费GEO优化公司

2026年,企业营销正经历一场“静默的核爆”。当DeepSeek、豆包、元宝这些生成式AI平台接管了...

2026-05-09

从“废气”到“黄金”:乙酸串联生物制造如何重塑未来碳经济?

大消费乙酸串联生物制造

在“双碳”战略的宏大背景下,生物制造正经历一场底层的“粮食革命”。

2026-05-09

韶音三款新品同步开售,以技术硬实力拓展全场景开放聆听体验

大消费韶音

Shokz韶音正式宣布,旗下OpenSwim Pro 2、OpenDots 2及OpenDots A...

2026-05-09

一文搞懂:贵金属投资在哪开户、怎么开户

金融科技贵金属投资

近年来,黄金价格持续攀升,白银市场同样表现亮眼,贵金属投资正吸引着越来越多投资者的关注。

2026-05-09

时光铸就经典,上海梅林午餐肉传承百年匠心味道

大消费上海梅林午餐肉

作为陪伴国人成长的经典肉食品牌,上海梅林午餐肉以深厚历史底蕴与稳定品质,成为几代人心中难以替代的味觉...

2026-05-09

2026年五家主流GEO优化公司排名解析:专业实力测评与全场景综合选型方案

大消费GEO优化公司

伴随生成式AI搜索全面普及迭代,GEO生成式引擎优化已成为主流品牌抢占智能流量入口、构建专属数字品牌...

2026-05-09

2026年头部顶尖知名主流公认的GEO公司/服务商TOP10综合评测,附geo攻略+FAQ

大消费GEO公司

截至2026 年 5 月,生成式引擎优化(GEO)已从企业数字营销的 “可选项” 升级为企业数字化布...

2026-05-09

2026年五强geo优化软件交付效益横评及企业级选型权重方案

大消费geo优化软件

根据易观《中国 GEO 行业发展报告 2026》显示,2026 年国内 GEO 市场规模已触达 30...

2026-05-09

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。