更多精彩 >

AI让远程交流“更清晰”:GAN消除视频通话中的抖动

2020-10-22 09:15:03   来源:  作者: 

摘要:NVIDIAMaxine是一款云AI视频流平台,将使用GAN来提高带宽性能

NVIDIA Maxine是一款云AI视频流平台,将使用GAN来提高带宽性能

image.png

Ming-Yu Liu 和Arun Mallya 正在进行视频通话,其中一个人的画面开始出现卡顿,直至画面定格。

这是一种常见且令人反感的情况。但与大多数人不同的是,Liu和Mallya可以做出一些改变。

他们是NVIDIA的AI研究人员,专攻计算机视觉。在与Ting-Chun Wang共事中,他们意识到可以使用神经网络来替代被称为视频编解码器的软件,这种软件通常用于视频在网络传输过程中的压缩和解压缩。

迄今为止,他们的工作成果将用户在视频通话时所需的网络带宽压缩至原来的十分之一,还有望将带宽消耗降低数个数量级。

Mallya表示:“我们希望通过AI提供更好的视频沟通体验,即使在带宽极低的情况下,也可以从语音升级到视频通话。”

GAN让连接质量更佳

即使用户的面部有遮挡(比如戴着帽子、眼镜、耳机或口罩),这项技术同样适用。为了增加趣味性,他们在演示中使用了一些装饰物,这样用户可以在线上更改其发型或衣服或者创建头像。

更重要的是,如上图所示,借助神经网络定位,无需再盯着显示器上方摄像头才能与对方对视,这增强了面对面对话的感觉。

Wang表示:“借助计算机视觉技术,我们可以从多个角度来定位头部。我们认为这将帮助人们更自然地进行对话。”

迎接最前沿的AI技术,让虚拟生活更真实。

AI赋能视频通话的原理

AI辅助视频通话的工作机制十分简单。

与目前使用压缩的视频流的系统类似,参考图像发送后,仅用户眼睛、鼻子和嘴巴周围几个关键点的位置数据被发送,而非发送大量压缩过像素的图像。

接收端的生成式对抗网络通过初始图像和面部关键点,在本地GPU上重构后续图像。因此,通过网络传输的数据要比之前少得多。

Liu在GAN领域的工作成果GauGAN曾引发关注。GauGAN是一种可以将涂鸦转化为写实艺术作品的AI工具,目前已经创建了超过一百万张图像。该工具可在AI Playground中获取。

Liu表示:“疫情期间频繁的视频会议启发了我们,因此我们开始探索突破带宽瓶颈的方式,让供应商可以同时为更多人提供服务。”

GPU突破带宽瓶颈

这一方法顺应当前行业趋势,将网络瓶颈转化为计算任务,从而借助本地或云端资源更轻松地解决此类问题。

NVIDIA媒体集团高级产品总监Andrew Page表示:“如今,许多公司希望将带宽问题转化为计算问题,这是因为带宽一般很难增加,而增强算力则相对容易。”

image.png

NVIDIA Maxine搭配了一套视频会议和流媒体服务工具

AI 工具优化视频服务

GAN视频压缩是NVIDIA Maxine即将推出的几个功能之一,这是一个云AI视频流平台,用于增强视频会议和电话质量。它将音频、视频和对话式AI功能整合在一个工具包中,并支持多种设备。

在上周的GTC大会上,NVIDIA宣布推出了Maxine平台。基于该平台,服务提供商能够在提供超高分辨率的视频的同时,实现实时翻译、噪声消除和情景感知的闭路字幕。用户可以享受到人脸校正、虚拟助手和化身逼真的动画角色等功能。

Page表示:“视频会议正在经历一场复兴。疫情期间,它的缺点给所有人带来了不愉快的使用体验,但回归视觉动物的属性,视频终将成为人们今后生活中的一部分。”

通过利用基于Tensor Core核心的NVIDIA GPU,Maxine可运行如NVIDIA Jarvis的软件。NVIDIA Jarvis是用于对话式AI的SDK,提供了一套语音和文本功能。 它们共同提供了当今有用的AI功能,并成为未来视频产品和服务的基石。

想要了解更多有关AI计算的最新技术,解锁GPU前沿应用,可点击链接:https://www.nvidia.cn/gtc/keynote/,观看GTC 2020秋季站主题演讲上的精彩内容。

image.png

 


猜你喜欢
原创

刚刚!万亿英伟达发布“AI核弹”

AI芯片英伟达

推理性能提升30倍!英伟达黄仁勋再次甩出“王炸”

2024-03-19

原创

宁德时代突曝大消息!

AI宁德时代动力电池

日赚1.2 亿,分红超220亿!宁德时代“爆了”

2024-03-18

原创

180亿!Sora刷屏带火了国内这家AI初创公司

AI月之暗面sora

180亿!清华学霸10个月干出一个AI独角兽

2024-02-22

AI时代下社交与交易的变革

AI

9月26日,EDGE AI&Web3投资峰会在香港隆重召开,FireChat CEO Leo在会上进...

2023-09-27

《生成式人工智能服务管理暂行办法》落地,AI助力网络安全技术创新

AI

7月13日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局七部门联合...

2023-07-17

致力成为百姓健康“医靠”,叮当健康荣获2023中国互联网医疗企业TOP10

叮当健康

12月15日-16日,亿欧大健康【京西健谈】CHS 2023第八届中国大健康产业升级峰会在北京顺利举...

2023-12-20

【旭友会人物志】雷志平:天生的创业者

雷志平

旭友会自创立以来,一直备受外界瞩目。

2023-12-20

中科创星领投航空复材供应商「九由航空」

中科创星九由航空

近日,中科创星领投江西九由航空装备有限公司(以下简称“九由航空”)逾亿元人民币A轮融资,江西国控、...

2023-12-20

微众银行获颁2022—2023深圳银行业“科技金融优秀案例”奖

微众银行

日前,中央金融工作会议明确提出“做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章”。

2023-12-20

海威科技完成新一轮融资

海威科技

国投创业日前宣布投资咸宁海威复合材料制品有限公司(以下简称“海威科技”),加快国产高性能复合材料投资...

2023-12-20

实在智能完成近2亿元C轮融资

实在智能

近日,实在智能完成近2亿元C轮融资。本轮由金泰富资本和安吉智慧谷共同领投、安吉两山国创跟投。

2023-12-20

潮流音频新旗手——BOYA博雅Omic纽扣麦克风再掀麦克风革命!

BOYA博雅

Omic纽扣麦克风是BOYA博雅品牌最新推出的无线麦克风单品。

2023-12-20

凯盛融英向甘肃地震灾区捐款200万元: 火速驰援,共渡难关

凯盛融英

12月18日23时59分,甘肃临夏州积石山县发生6.2级地震,甘肃和青海部分地区受灾严重。面对突发灾...

2023-12-20

「血霁生物」完成A1轮首关

血霁生物

苏州血霁生物有限公司(以下简称“血霁生物”)宣布完成A1轮融资首关,二关同时启动,预计三个月后结束。

2023-12-20

原创

顺丰11月速运物流量收快速增长,国际业务深入布局多地开花

顺丰

12月19日晚间,顺丰控股(002352.SZ)发布《2023年11月快递物流业务经营简报》,公告显...

2023-12-20

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

国内首次!可重复使用技术验证火箭复用飞行成功!

星际荣耀双曲线二号可重复使用验证火箭第二次飞行试验圆满成功

坚守17年,AI“老兵”要上市了

科创板即将迎来一名新成员。

金山云旗下公司增资至4亿美元

金山云旗下公司增资至4亿美元

2024汽车科技创新与成果转化大会在常州成功召开

2024汽车科技创新与成果转化大会在常州成功召开

4月12日,2024汽车科技创新与成果转化大会在常州经开区成功召开。

不响不辍 | 第18届中国投资年会·年度峰会即将启幕

不响不辍 | 第18届中国投资年会·年度峰会即将启幕

2024年5月8-10日,由投中信息、投中网主办,以“不响不辍”为主题的第18届中国投资年会·年度峰...

投资家网协办:首届深圳湾资本市场年会隆重举行

投资家网协办:首届深圳湾资本市场年会隆重举行

12月20日,由南山区资本市场协会主办,投资家网、桐鹏汇财金高管俱乐部协办的资本巿场年会随即举行。

“投资家网·2023中国价值企业榜”重磅发布

“投资家网·2023中国价值企业榜”重磅发布

身处百年未有之大变局,中国经济这艘万吨巨轮,早已屹立于世界舞台中央。

朱民对话瑞•达利欧:2024全球政治风险大于经济与金融风险|和讯财经2023年会

朱民对话瑞•达利欧:2024全球政治风险大于经济与金融风险|和讯财经2023年会

在全球经济经历了激进加息、经济增速放缓、地缘冲突、石油减产等种种事件之后,全球经济增长的态势继续放缓...