更多精彩 >

AI让远程交流“更清晰”:GAN消除视频通话中的抖动

2020-10-22 09:15:03   来源:  作者: 

摘要:NVIDIAMaxine是一款云AI视频流平台,将使用GAN来提高带宽性能

NVIDIA Maxine是一款云AI视频流平台,将使用GAN来提高带宽性能

image.png

Ming-Yu Liu 和Arun Mallya 正在进行视频通话,其中一个人的画面开始出现卡顿,直至画面定格。

这是一种常见且令人反感的情况。但与大多数人不同的是,Liu和Mallya可以做出一些改变。

他们是NVIDIA的AI研究人员,专攻计算机视觉。在与Ting-Chun Wang共事中,他们意识到可以使用神经网络来替代被称为视频编解码器的软件,这种软件通常用于视频在网络传输过程中的压缩和解压缩。

迄今为止,他们的工作成果将用户在视频通话时所需的网络带宽压缩至原来的十分之一,还有望将带宽消耗降低数个数量级。

Mallya表示:“我们希望通过AI提供更好的视频沟通体验,即使在带宽极低的情况下,也可以从语音升级到视频通话。”

GAN让连接质量更佳

即使用户的面部有遮挡(比如戴着帽子、眼镜、耳机或口罩),这项技术同样适用。为了增加趣味性,他们在演示中使用了一些装饰物,这样用户可以在线上更改其发型或衣服或者创建头像。

更重要的是,如上图所示,借助神经网络定位,无需再盯着显示器上方摄像头才能与对方对视,这增强了面对面对话的感觉。

Wang表示:“借助计算机视觉技术,我们可以从多个角度来定位头部。我们认为这将帮助人们更自然地进行对话。”

迎接最前沿的AI技术,让虚拟生活更真实。

AI赋能视频通话的原理

AI辅助视频通话的工作机制十分简单。

与目前使用压缩的视频流的系统类似,参考图像发送后,仅用户眼睛、鼻子和嘴巴周围几个关键点的位置数据被发送,而非发送大量压缩过像素的图像。

接收端的生成式对抗网络通过初始图像和面部关键点,在本地GPU上重构后续图像。因此,通过网络传输的数据要比之前少得多。

Liu在GAN领域的工作成果GauGAN曾引发关注。GauGAN是一种可以将涂鸦转化为写实艺术作品的AI工具,目前已经创建了超过一百万张图像。该工具可在AI Playground中获取。

Liu表示:“疫情期间频繁的视频会议启发了我们,因此我们开始探索突破带宽瓶颈的方式,让供应商可以同时为更多人提供服务。”

GPU突破带宽瓶颈

这一方法顺应当前行业趋势,将网络瓶颈转化为计算任务,从而借助本地或云端资源更轻松地解决此类问题。

NVIDIA媒体集团高级产品总监Andrew Page表示:“如今,许多公司希望将带宽问题转化为计算问题,这是因为带宽一般很难增加,而增强算力则相对容易。”

image.png

NVIDIA Maxine搭配了一套视频会议和流媒体服务工具

AI 工具优化视频服务

GAN视频压缩是NVIDIA Maxine即将推出的几个功能之一,这是一个云AI视频流平台,用于增强视频会议和电话质量。它将音频、视频和对话式AI功能整合在一个工具包中,并支持多种设备。

在上周的GTC大会上,NVIDIA宣布推出了Maxine平台。基于该平台,服务提供商能够在提供超高分辨率的视频的同时,实现实时翻译、噪声消除和情景感知的闭路字幕。用户可以享受到人脸校正、虚拟助手和化身逼真的动画角色等功能。

Page表示:“视频会议正在经历一场复兴。疫情期间,它的缺点给所有人带来了不愉快的使用体验,但回归视觉动物的属性,视频终将成为人们今后生活中的一部分。”

通过利用基于Tensor Core核心的NVIDIA GPU,Maxine可运行如NVIDIA Jarvis的软件。NVIDIA Jarvis是用于对话式AI的SDK,提供了一套语音和文本功能。 它们共同提供了当今有用的AI功能,并成为未来视频产品和服务的基石。

想要了解更多有关AI计算的最新技术,解锁GPU前沿应用,可点击链接:https://www.nvidia.cn/gtc/keynote/,观看GTC 2020秋季站主题演讲上的精彩内容。

image.png

 


猜你喜欢

屁味封装器、自动洗头机、灾难逃生器……这届年轻人的「抽象」用AI实现了

AI创新创业

先是上个月前的潍坊风筝节,网上流传的各种现场照片,让人连连感叹潍坊已经变成了年轻人的“抽象大舞台”。

2025-05-15

原创

突发爆雷!255亿家居龙头实控人被留置

AI家居

255亿家居龙头突发爆雷,居然之家实控人被留置

2025-04-18

半导体制造AI大脑:从CIM1.0到CIM 3.0的中国式跃迁

AI创新创业

从 ChatGPT到DeepSeek,大模型的崛起标志着 AI 从通用智能迈向行业深耕的分水岭。

2025-04-17

AI伪造泛滥下 亲笔签以动态生物特征破解电子签名安全困局

AI创新创业

今年以来,什么最热门?AI(人工智能)等智能技术可能是最好的答案。

2025-03-24

原创

中国手机,在海外“杀疯”了

手机AI5G

5G-A、卫星直连......国产手机“惊艳”欧洲!

2025-03-06

暴涨之后,蜜雪冰城会暴跌吗?

投资者需警惕高杠杆资金退潮和行业竞争带来的波动风险。

2025-03-07

中兴众投总经理闫足博士连续两年荣登“投资家网38位最佳女性投资人榜单”

创新创业闫足

中兴众投总经理闫足博士凭借其出色的投资业绩和行业影响力,连续两年荣登“投资家网38位最佳女性投资人榜...

2025-03-07

海尔消费金融:数智化金融服务,助力青年追梦前行

金融科技海尔消费金融

海尔消费金融依托先进的数智化风控审批和客户服务体系,实现了秒级审批和秒级放款,极大地缩短了年轻人的等...

2025-03-07

浙江代表团举行全体会议并向中外媒体开放 徐冠巨接受集中采访

创新创业徐冠巨

面对人民日报记者关于民营企业如何抓住发展新机遇的提问,徐冠巨说,民营企业高质量发展,是促进民营经济活...

2025-03-07

2025春季深圳礼品展 礼品消费升级中的文创新势力

创新创业第33届深圳礼品家居展

2025年,中国消费市场迎来新一轮升级浪潮,文创礼品以其独特的文化属性与创新设计,成为连接传统与现代...

2025-03-07

原创

“投资家网2025·38位最佳女性投资人榜单”重磅发布

女性投资人

VC/PE行业,女性投资人已撑起“半边天”。

2025-03-07

名人百科 中联国兴书画院长华国中的家国情怀

创新创业华国中

华国中,著名爱国人士,社会活动家,外交家,国际战略和国家安全研究专家。

2025-03-07

创维光伏亮相2025济南太阳能展!航天品质+智慧运维点亮绿色泉城

创新创业创维光伏

2025年3月5日—7日,为期三天的第二十届中国(济南)国际太阳能利用大会隆重启幕。

2025-03-07

京东调研:00后、80后、60后女性对话 2025年强身健体、内核稳定是自我突破关键词

京东大消费

3月,京东消费及产业发展研究院联合京洞察通过问卷形式与1200位女性消费者一起对话生活状态、内核稳定...

2025-03-07

光峰科技发布重磅公告:斩获某国际头部核心车企定点

上市公司光峰科技

 3月6日晚间,科创板首批上市企业光峰科技(688007.SH)发布重磅公告,于近日收到某国际头部核...

2025-03-07

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

博进生物C+轮融资落地,药物分离纯化技术国产替代加速

博进生物C+轮融资落地,药物分离纯化技术国产替代加速

众钠能源A轮收官募资近3亿,全球钠电赛道融资新高

众钠能源A轮收官募资近3亿,全球钠电赛道融资新高

坐标系再揽2亿融资,EMB赛道创累计4亿纪录

坐标系再揽2亿融资,EMB赛道创累计4亿纪录

国奥科技获深创投数千万元A轮投资,加码高精度直线电机研发

国奥科技获深创投数千万元A轮投资,加码高精度直线电机研发

本末科技斩获数亿融资,直驱关节年交付冲刺千万台

本末科技斩获数亿融资,直驱关节年交付冲刺千万台

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

在时代的浩渺长河中,“分化”宛如一条隐匿的脉络,贯穿于万物的生长、发展与变迁。从生命的进化到文明的演...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...