更多精彩 >

对话未来|图灵派林云燕对话AI科学家张本宇:商业需求如何反哺技术

2018-10-17 22:16:17   来源:投资家网  作者:陈光 

摘要:他深耕人工智能近20年,他手握151项人工智能专利,他先后就职于微软亚洲研究院、Google、Facebook等世界顶尖企业,他是少有的集学术、工程、商业于一身的人工智能科学家。

他深耕人工智能近20年,他手握151项人工智能专利,他先后就职于微软亚洲研究院、Google、Facebook等世界顶尖企业,他是少有的集学术、工程、商业于一身的人工智能科学家。他就是张本宇,云脑科技的创始人兼CEO。曾被创新工场AI工程院副院长王咏刚评为“人工智能华人科学家中排名前10位大牛之一”。


本周,图灵派、财链社CEO林云燕依约采访了张本宇,双方进行了一场人工智能技术与商业落地之间的对话。


术与商业落地.bmp


张本宇,云脑科技创始人兼CEO,北京大学计算机系95级本科/人工智能硕士,先后工作于微软亚洲研究院,Google,Facebook,19年来专注于人工智能的研究及开发。他曾发起/领导Microsoft adCenter Lab,Microsoft SILK,Google AdWords Quality,Google Now,Facebook Search,Facebook Search Ads,Facebook Feed Ads等多项核心技术及系统。张本宇申请及授予了151项美国专利,于国际一流期刊及会议上发表的45篇论文,目前已有8000+引用。


关于技术与商业落地之间的差距


林云燕:当前前沿科技落地时普遍存在一个问题,就是懂技术的人不懂业务,懂业务的人不懂技术,这导致很多传统行业的企业对新技术往往采取观望的态度,而新兴技术企业又不能提供很好的落地解决方案。您对技术与商业落地之间的差距是怎么看的?


张本宇:我认为这是一个普遍现象,但也不全都是这样。在不同的传统行业,尤其一些大型的标杆客户那里,他们一般对新技术的这种开放程度相对来说会比中间规模的客户要好一些,比如说银行、保险、或制造行业。例如富士康对人工智能的开放程度就很高,他们甚至还建立起自己的基金来投资人工智能的创业项目。这说明大公司、大企业对人工智能对行业可能带来的变革有一定程度的认识。


相应地,我们也制定了自己的策略。首先我们自己的人工智能团队在对接方向上主要会先寻找头部的客户,因为他们对新技术的开放程度比较高。其次,他们的市场规模比较大,可以迅速地帮助消费者和客户理解技术的典型应用是什么,典型场景是什么。


林云燕:也就是说大企业更愿意去尝试新生技术,可以理解为是因为他们的体量比较大,新技术对他们在降本增效上能带来更大的作用,而对于小企业产生的影响反而比较小?


张本宇:是的,一个技术的应用都有一定的前提投入。当企业的体量很大的时候,后期的盈利很快就可以把前期的投入赚回来,但一个中小型企业的试错成本和试错风险就比较大。因此,可能一项技术还在研发早期不够成熟,大企业反而可以承担试错的成本,他们是能够承受得起的。


关于商业需求对技术的反哺


林云燕:在为客户服务的过程中,是否客户的需求对现有的人工智能技术的发展和迭代产生了正反馈?因为在一开始有很多时候我们往往习惯从自身技术能力出发思考问题,云脑在这方面有什么印象比较深刻的案例?


张本宇:其实是有的,就像比如说金融行业对很多模型是有很强的需求,其实很多时候在互联网行业里不一定能看到,像AI模型的可解释性。举个例子来说,贷款,上个月的模型对这个用户是拒绝贷款,那么新的技术应用于相关领域,不能说马上就把这个客户定位成一个可贷款的用户,这个有一定的稳定性的要求。这就会聚焦在一些个体的行为上,不是说看一些客户群体的指标。比如说原来在谷歌或Facebook的广告推荐,很多时候针对的是用户群体,但是在教育行业、金融行业很多时候需要细致到一个个体,针对某一个用户为什么做出了某一个决策,为什么拒绝,为什么这个学生现在需要做这样的问题,都需要有一定的可以解释的机制。


林云燕:也就是以往AI可能会从大样本的角度去做宏观的模型设计,但在某些场景是要具体到某一个个体的。


张本宇:是的,在某些领域模型对于个体要给出决策的可解释性,但决策是不稳定的,模型经常要训练。但是决策本身是否稳定,人可能无法接受今天是这样,明天又是那样,这样对一个客户来说整个商业逻辑上是不成立的。行业给我们的反馈就是让我们怎样把技术做得更好。


林云燕:可以理解为每个行业都有自己的特征,我们的技术如果不跟具体的应用场景相结合的话是很难有好的反馈回来的。没有这种反馈,技术团队对于行业的真正需求就很难感知到。


张本宇:对,在实验室里,我们接触到的都是公开的数据集,不同的数据集涉及的都比较宽泛,不会十分细致,也就无法具体了解到客户关心的是什么。另外一方面我们拿到需求之后,要把它抽象成一个AI的问题,而不是用特别工程化的方式来解决问题,用人为的方式做调整。我们会对应问题考虑,某些问题对应的是AI的模型可解释性,某些需求对应的是AI的稳定性,这样一个问题解决之后就可以很快应用到别的场景上。


林云燕:也就是通过反馈回来的一个个例,抽象成普遍性的问题来解决?


张本宇:是的,反馈个例抽象成普遍问题,而不是仅仅做成一个“特例”。


林云燕:云脑在客户落地,产业结合的时候,经历过哪些比较困难或痛苦的时刻吗?


张本宇:痛苦的时候肯定会有,有的时候项目推进会顺利一些,有的时候会比较慢一些,这些都在我们的预估和可承受范围之内,没有特别出乎意料的事情。大面上的心理预期都有,在团队的扩张的速度和节奏上有很多有意思的事情,比如现在不一定能找到足够多的小伙伴。


关于2B市场的开拓困境


林云燕:头部客户往往有着强大的议价能力,您怎么看待科技公司与头部客户之间的这种选择与被选择的关系的?


张本宇:实际上这是一种双方面的渗透,有些人可能不是这个行业的专家,但是他们本身也会对新技术很感兴趣,包括一些物联网和大数据的技术,客户也希望应用新的技术。虽然比例上可能没那么高,但是中国的企业基数很大,所以相当一部分产品侧的客户不懂技术,但是对于新技术还是很有热情的。另外就是很多技术专家也会相对专注着眼于某一个特定的行业,他也会去理解这个行业。专家也需要有一定的行业经验,一定的积淀才能更好地为行业提供技术支持。


林云燕:我们知道大型客户订单金额大,但需求偏向定制化,整个产品的研发周期也比较长,小客户虽然额度小,但可以通过标准化的产品来解决,并且客户数量基数比较大,云脑现目前在2B业务的开拓上你们是怎么做权衡和定位的?


张本宇:大B小B这两方面我们是都会兼顾的,因为这本身反应的是一个议价能力的强弱。大的客户议价能力会比较强一些,但他们议价能力强是有原因的,因为他们能更好地帮助我们理解这个行业的需求。虽然产品服务的实现是一个偏定制化的实现,但他们的需求有很强的行业代表性,这也有助于我们研发标准化的产品、为中小型客户提供技术产品。


如何看待AI开放平台和技术赋能产业?


林云燕:科技巨头都在把自己的AI能力开放出来,赋能产业,也就可以降低了企业应用AI的门槛,以及创业企业的技术门槛,这对于包括云脑在内的众多AI领域的服务商来说有什么影响或冲击吗?


张本宇:对行业来讲这是一件好事,包括我们。我们现在也会使用谷歌开源的人工智能学习系统TensorFlow,我们会基于开源技术做一些个性化的优化,这也帮我们节省了很多的工作量。开源的工具都是基础性的工具,提供什么样的数据、如何定义优化的目标是什么,这就需要我们这样的团队把开源工具变成可使用的产品。这个差距就是我们所说的“打造行业与人工智能之间的桥梁”,这桥梁的意义是始终存在的,这样也有助于客户把需求定向到统一框架上。


林云燕:也就是说开源工具提供的是基本框架,不足以解决行业的问题,而要解决相关问题就还需要我们企业根据需求定制开发。


张本宇:是的,开源数据只是提供了一个工具,但对于满足产品需求,落实到场景需求,还有很大的差距。


林云燕:之前国内某知名人工智能团队遇到一个比较有意思的事情,百度提供的AI开放平台做出来的效果比他们基于百度平台做出的效果还要好,但他们还不敢完全把相关数据放到百度的平台上,他们担心数据会泄露,这个您怎么看呢?


张本宇:开放平台是两方面的,一方面是代码的开放,另一方面是云计算平台的开放。公有云的环境确实有很多用户尤其是大客户是不太愿意接受的,他们都会尽量做出一个私有云或混合云来进行存储。也是为了数据安全,头部客户都有自己的数据仓库,他们自己的数据处理都是比较规范的,他们自己也不是特别愿意把数据迁移到公有云上去。


林云燕:我们知道最近这几年AI之所以能得到高速发展,是因为有了大数据等条件的具备。如果以现有的发展情况来看,是否还会因为某一方面的条件具备而给人工智能技术带来重大的飞跃?


张本宇:现在大数据相对于问题的规模和复杂度,可能始终是一个短板。之前我们只需要把图片分清楚里面是什么物体就可以了,但现在进化到要从图片中分析出被遮挡的物体,有很多物体还要划分前后祯。从视觉来说,人每天要不间断地看十几个小时,分辨率是远高于现在模型的分辨率的,所以很难说AI和人眼哪个接触的数据更多。AI现在一天的图片学习量也就是几千上万张图片,而人接