博客首页|TW首页| 同事录|业界社区
2017-07-06

一首叫作《阿里巴巴》的儿歌这样唱道:阿里巴巴是个快乐的青年,芝麻开门芝麻开门。2017年7月5日,阿里人工智能实验室在北京时间博物馆发布了首个产品:一款名为“天猫精灵”的智能语音音箱。这一天,与1687年7月5日时隔330年,那一天牛顿正式发表了万有引力定律,人类历史从此改变。

一个智能语音音箱显然不能与万有引力定律相提并论,但它对于阿里的意义来说却可大可小。2003年5月淘宝成立,当年10月推出支付宝。此后迄今14年,淘宝一路超越ebay易趣、雅虎等成为亚洲第一大网络零售商。2008年推出淘宝商城,2012年1月更名为天猫,2017年7月“天猫精灵”公测。如今,淘宝加天猫已经晋身为全球最大的网络零售商之一。

阿里公众与客户沟通部张启说:“感觉现在的天猫精灵有点像2003年淘宝刚开始发展的时候,一切都刚开始。”从当年淘宝第一版非常丑陋的网页入口到今天精工细作的智能语音音箱入口,“天猫精灵”会不会成为阿里的下一个进化奇点?人工智能时代,阿里的进化之路又将如何演进?

语音交互是思维方式的变革

自从亚马逊推出Echo智能语音音箱以来,全世界都把目光投向了下一代人机交互方式:智能语音。今年恰逢iPhone十周年,10年前iPhone用手写人机交互方式彻底颠覆了之前的键盘式人机交互,当年很多IT和手机企业都死守键盘交互而最终被甩出历史的舞台。

iPhone的手写人机交互是苹果公司的首创么?当然不是,之前已经有包括微软在内的多家科技公司研发出了手写触屏人机交互技术,但在PC键盘思维统治之下,没有一家公司愿意相信一个没有键盘的手机会成功。苹果推出第一代iPhone,不仅仅是一个技术和产品路线的选择,而是思维方式和观念的彻底变革。

没有键盘的手机,到底如何成功?十年后的今天,同样的问题又出现了。没有手写触屏的智能终端,到底如何成功?如果仅仅把智能语音人机交互看成是一种技术和产品路线,显然无法成功。就像当年的iPhone一样,智能语音人机交互本质上是一种思维方式的变革。

怎么理解智能语音人机交互是一种思维方式的变革呢?很简单,如果一个智能终端只剩下一个麦克和音箱来完成人机交互的话,就将失去手写和键盘输入的丰富而明确的选项与空间,而只剩上下句对话之间的极为有限的选项和空间,这种极简、有限而又模糊的方式,势必倒逼整个互联网产品与生态的重新思考与再设计。

一款智能语音音箱,仅仅是这个重新思维与再设计过程的起点。只有通过学习和积累实际使用智能语音音箱产品的用户行为大数据,才有可能完成这个重新思维与再设计。经过这个过程的洗礼,下一个阿里的形态,才有可能浮出水面。

阿里的“航天飞船”

2016年,阿里人工智能实验室(A.I. Labs)成立,负责阿里巴巴集团旗下消费级AI产品的研发。A.I. Labs的使命是探索人机交互新大陆,带领人们体验探索未知世界的乐趣。在2017年3月,阿里宣布“NASA计划”,聚焦于核心领域的研究,解决未来10年到20年后的困难。而“天猫精灵”作为阿里自研的硬件产品,实际上承担了类似“航天飞船”的硬件功能。

阿里人工智能实验室负责人陈丽娟(花名:浅雪)在“天猫精灵”发布会上介绍,天猫精灵X1机身126mm X 83mm X 83mm、重量400g,比亚马逊Echo和苹果的Homepod都小巧,这样的设计是为了进入家庭时没有侵入感。当然,“天猫精灵”的小巧外形很有可能是针对中国家庭的面积而设计。

为了实现小巧的外形设计,天猫精灵X1采用了首颗专门为智能语音行业开发的芯片,芯片面积减少25%、功耗降低32%、效率提高25%,在解码、降噪、声音处理、多声道的协同等方面做了专门的优化处理。针对需要进行大量音频处理、声音合成的工作环境,定制芯片加入了独立的NEON处理单元,可加速音频和语音处理、电话和声音合成等,带来更优秀的语音识别及音频处理效果。

在收音方案上,天猫精灵X1采用了业界公认的优秀方案——六麦克风收音阵列技术,即顶部的六颗高灵敏麦克风有助于收集到来自不同方向的声音,从而更容易在周围的噪音中识别出有用的信息,来达到更好的远场交互效果。天猫精灵X1还使用了回声对消和远近场拾音等技术,即使在播放音乐的同时也能正常接收语音指令。

由于家庭中有各种各样的噪音,天猫精灵X1开发人员在厨房、客厅、卧室、书房等环境里面,对玻璃、木材、混凝土、金属、石材等各种材质和环境进行了上千次实验,其中对中国家庭环境大量使用的石材和木头材质进行了针对性的测定,让天猫精灵X1能够适应在家庭环境噪音下被唤醒。天猫精灵X1还具备一定的学习功能,可以根据环境噪音进行学习和进化,经过7天左右优化就会更加适应所在家庭环境。

天猫精灵X1内置中文人机交流系统AliGenie,AliGenie实际上与阿里人工智能大脑ET共享技术成果。依靠阿里云强大的机器学习技术和计算能力,AliGenie作为人工智能系统就已经很成熟。因此,天猫精灵X1的难点并不在语音识别、智能语音交互等人工智能功能,反而在于硬件的设计、制造、供应链管理等阿里之前没有涉及到的业务领域。

陈丽娟表示,阿里之所以没有选择外包的方式来完成天猫精灵X1的硬件设计、生产和制造等工作,是因为智能语音音箱涉及到了非常复杂的软硬件集成与硬件工程,目前在市场上还找不到一家能够满足所有上下游零部件集成研发、生产与制造的厂商,因此阿里只好自己来承担这个硬件产业集成的角色。

从这个角度来讲,天猫精灵X1就是阿里NASA的“航天飞船”,它让阿里开始获得硬件产业的知识与实践,也只有很好的软硬件集成,才能最终实现499元的超低市场定价。而与“航天飞船”的“上天”目标相反,天猫精灵X1的目标是“入地”,通过499元的硬件产品把阿里的互联网产品固定到上亿家庭中。

全面激活阿里技术生态体系

天猫精灵X1和AliGenie应用了阿里积累多年的语音识别、自然语言处理、人机交互等技术。

在美国国家标准署2016年的全球说话人识别竞赛(NIST SRE2016),阿里采用了基于深度学习网络的特征提取,借助距离测度学习来提高数据的泛化能力,开创性提出利用对称性支持向量机器来提高系统性能。在近两百多支参赛队伍中,阿里的系统性能在大中华区声纹识别性能排第一、美国赛区第二。这一声纹识别技术也被运用到了X1上,基于声纹识别技术,X1还推出了声纹购功能,这也是是第一个商用的声纹购物系统。

阿里人工智能实验室正在对声纹识别、声纹购、NLP中文对话引擎等核心技术申请专利。阿里人工智能实验室在自然语言理解的基础上,加入了“决策引擎”机制,能够理解语音的上下文语境,并判断当前应该响应的是哪一个模块,从而进行决策。这一套人机交互和自然语言处理系统也在国际顶级学术论坛KDD 2017上发表了重要的论文,也正在申请技术专利。

考虑到中文语言对话过程中的各种实际案例,阿里人工智能实验室还对北方语言的儿化音、干净利素的问法、小朋友经常叠字叠词、南方人与普通话混淆的中文表达方法进行了深度处理。针对中国人语言发音的特色,对吞字、咬字、缺字、北京话习惯、河南话习惯进行了特别优化、补偿和修正。 这套语义理解系统还带有记忆功能和总结归纳能力,加入了模拟的“长期记忆”和“短期记忆”功能,能够针对不同的场景和时间度,让语义理解系统更加贴近用户。除此之外,阿里人工智能实验室还已经着手其他多个语种的研究。

现在,这些阿里技术生态体系,也随着AliGenie开发者平台对外开放,包括了语音技术、服务入口以及硬件方案,并整合阿里生态体系中丰富的互联网服务和商业链接能力,共同为消费者提供智能体验。

AliGenie开发者平台主要面向四种类型的开发者:内容开发者、应用开发者、智能家居开发商和硬件生产商,开放的核心技术包括深度学习、自然语言处理、搜索/推荐算法 、知识表示及推理问答系统等,将免费开放给开发者和硬件厂商,无需从头搭建AI语音系统。AliGenie目前支持100多个智能家电品牌,包括接入阿里智能联盟、涂鸦科技、broadlink等智能家居方案的产品,更多智能家电正在接入中。

据了解,X1目前已经具备音乐音频内容的播放、听故事、讲笑话、查运势、玩游戏、查天气、找手机、问百科、设闹钟/定时器、查食物热量、充话费、查快递、查价格、天猫魔盒控制、天猫超市购物、智能家电操控等功能。随着开发者的入驻,天猫精灵X1能够实现的功能还将快速增加。而随着X1的大规模商用,阿里技术生态体系也将得以全面激活和检验。

至于为什么叫X1,阿里表示在数学中“X”代表未知数和变量,天猫精灵X1作为阿里消费级AI产品的开端,也充满着未知和变量,阿里人工智能实验室推出的第一款产品因此命名为X1。 天猫精灵X1将于7月5日开始限量公测,用户和开发者可以在天猫精灵官网(bot.tmall.com)申请公测并下载天猫精灵APP,8月8日将面向天猫会员用户进行首批正式发售。

2017年7月5日,阿里的未来或将再次“芝麻开门”,而这次是用说的方式。(文/宁川)

2017-07-05

(上图为SAP中国研究院与沈阳自动化所合作的智能制造示范生产线)

人工智能对未来商业有何影响?SAP中国研究院院长李瑞成认为,除了人工智能将影响一大批人的就业外,最主要的影响就是未来的商业组织将彻底成为哑铃型组织:高层决策层与基层执行层直接连接,原来中间庞大的负责上传下达的科级层将消失。李瑞成强调,高层决策层并不仅仅是管理层,还将包括算法师等思考和创造性的高级岗位。

以前的商业组织,中间有庞大的科层级,他们既发挥了上传下达的功能,但又往往阻碍了信息在商业组织中的无损传播,甚至很多时候出现令行不达或基层意见无法向企业高层如实或及时转达的情况。“SAP正在面向人工智能打造新技术体系,将逐步取代中间层,未来的组织将是哑铃型,两边‘重’,中间少。” 李瑞成说。

过去,SAP作为ERP软件的典型代表,一直在生产和制造System of Record即交易记录型系统,也就是通过ERP软件来完成整个交易的信息与数据的记录、流转与管理等。李瑞成说,这个模式已经存在很多年了,属于企业组织形态模式1,即以数据为基础的系统。但数据存储在系统里,实际上产生不了更多价值。

“怎么能够使数据产生更大的价值?我们提出要从模式1转到模式2。模式2的世界是更加智能的世界,可以利用人工智能、大数据、超级计算能力这三大要素,完成从模式1到模式2的转变。模式2系统具有大量人工智能角色体系特征,企业高层都不需要更多思考,系统将自动根据现有的运营状况,计算出如何调整经营方向、如何使企业运营的更好。”

2016年9月底时,SAP 决定未来五年内将投资20亿欧元,帮助企业和政府机构利用不断增加的传感器、智能设备和大数据,实现基于物联网的数字化转型。SAP  Leonardo物联网产品组合曾是“SAP IoT”产品线品牌,但在2017年5月的SAP全球SAPPHIRE Now大会上,进一步把 Leonardo拓展成为基于机器学习的数字化创新平台。

李瑞成强调,物联网固然重要,但数字化转型远远超出物联网,而是在一个更大的范围内发生的深刻变化。扩展的SAP Leonardo产品线,基于SAP HANA平台,打造一个以HANA、人工智能、物联网和区块链等所有数字化技术融合的新平台,同时融入了SAP丰富的经验、积累多年的企业流程和行业知识,以及先进的设计思维方法论(Design Thinking)。

“原来的ERP模式1是记录系统,而现在是创新系统,这是两个不同的世界、不同的概念,但这两个不互相排斥、也不互相替代,没有交易记录系统,就产生不了更多的数据,也是满足不了运营需求,更谈不上人工智能。企业级人工智能一定是建立在庞大的交易体系下,我们叫企业智能,这是SAP Leonardo的主要逻辑和思想。”

在今年5月,SAP推出了SAP Leonardo机器学习系列产品,主要是把机器学习应用到相关的SAP企业业务应用软件里,比如可以利用机器学习来提高整个客服工单的流转匹配以及知识问答效率,还可以利用机器学习来分析历史客户数据中不为人所注意的微小变化从而提高客户留存率等等。值得一提的是SAP CoPilot利用自然语言交互,为所有SAP应用和Slack等其它软件提供统一的人机接口,而SAP也在为人力资源、采购、服务与支持等应用软件开发聊天机器人技术,以实现基于复杂场景对话的企业应用。

李瑞成介绍说,SAP中国研究院有一个CAMPS计划(CA指Cloud Application云应用、M指Machine Learning人工智能、P指Platform平台、S指Security安全)。为了这个CAMPS计划,SAP中国研究院做了非常多的规划,聚焦于把云、人工智能、平台、安全等四位一体融合到一起。“通过CAMPS计划,我们与客户联合创新,去打造符合中国特点的人工智能解决方案。”

人工智能的一大应用领域为智能制造。在两年半前,SAP中国研究院与沈阳自动化研究所一起打造了一套以工业4.0为基础的示范智能生产线,当时为第一代产品,去年在上海工博会展出了第二代产品。在此基础上,SAP中国研究院又衍生出了新的产品和技术,包括工业云、制造云、设备云、3D打印、C2B定制等。随着智能制造在中国的发展,SAP有更多机会与中国企业一起创造新的制造业务形态。

2005年出版的《世界是平的》一书,其思想曾经震惊了整个世界。然而,那时候的人工智能远没有今天这样火爆。随着SAP等世界级企业应用软件公司加入到人工智能和机器学习的大军中,基于人工智能和机器学习的企业应用软件将彻底扁平化全球的商业组织,而今天正处于这一组织变革的前夜。(文/宁川)

2017-07-04


(上图为网易杭州研究院执行院长汪源)

云计算的核心与本质是什么?网易杭州研究院云计算平台产品部总监、网易云基础服务(网易蜂巢)容器云研发负责人陈谔讲了一个故事:网易云基础服务(网易蜂巢)最初的版本,从申请资源开始监测到虚拟机、容器全部启动,大概需要两分半钟,陈谔认为这个速度太慢,希望20秒内启动容器。

“大家觉得这个事情太困难,几乎不可能完成。于是,接下来分解阶段性目标,先优化到1分钟、再到40秒、再到20秒,让大家看自己的环节还有哪些潜力可以挖掘。最后,实现了20秒左右完成一个容器的建立(除去镜像传输的时间)。在云计算这个复杂系统里面,做到这一点其实是很不容易。”

网易云能够最终实现20秒上线一个容器的故事,道出了云计算技术的核心与本质:即不断和长期的优化。2017年7月13日,网易云即将举办首个云创大会,大会“商业匠心、技术创新”的主题点出了网易技术这20年来走过的坑儿的心得:在商业技术创新面前,只有耐得住寂寞的匠心精神,才能“磨”出精品。

云计算不是神话

十年前,在邮箱、门户、游戏等传统互联网业务之外,开始出现很多创新的互联网业务形态,包括博客、在线相册等。当时,丁磊认为网易需要在原有的业务板块之外,建立一个面向创新业务孵化、探索的独立组织,所以成立了网易杭州研究院。十年后,从网易杭州研究院孵化出了网易云。从网易技术发展历程可以看出,云计算并不是神话,而是互联网技术演变的必然结果。

现任网易杭州研究院执行院长汪源说,网易杭州研究院的第一个业务就是博客,博客代表Web 2.0时代的诞生。在新互联网业务的探索中,发现Web 2.0业务形态对技术的要求相比Web 1.0有了质的飞越,需要如海量数据管理等基础软件的支撑,而网民带来的数据量相比之前门户网站至少有两个数量级以上的提升。

陈谔刚进入网易的时候,正值Web 2.0概念爆发,他的第一个项目就是网易博客。陈谔不仅要从事技术研发,同时还做博客的技术运维,包括版本控制等等。“整个技术挑战、技术方向突然和以前完全不一样,关注点变成水平扩展、高并发、大吞吐量等。”陈谔回忆,之前整个互联网技术体系的发展都相对平缓,就那个时间点突然跳跃了一下,需要不同的运维手段。“做互联网的似乎变成了做运维的,所以我的印象是比较深刻。”

如果说Web2.0是互联网技术的一次跳跃,云计算就是互联网技术的又一次跳跃。“云计算平台对整个网易公司的互联网业务带来很明显的推动作用,因为当时我们对服务器的管理、业务的增长都已经到了一个瓶颈,必须有这样一朵云,才能实现新的突破。”作为第一批网易杭州研究院员工,陈谔回忆道。

“云计算是分布式系统,我认为最核心是要懂得取舍。因为分布式系统架构和实现的技术,近二十年没有太大的突破,该有的理论很早就存在,后面的CAP原理(一致性、可用性、分区容错性)也只是归纳性总结。所以,最重要的还是要知道取舍,比如系统复杂性与可运维性的取舍,功能很强大但是运维很麻烦也不行。”

如今的网易云,就来源于网易技术在运营网易UGC产品的云安全能力、来自网易全线互联网产品的云计算基础服务能力、来自网易电商的云客服、来自于网易多产品的大数据处理能力,以及来自于易信泡泡的通信与视频技术等等。正因为有了网易互联网产品大规模的开发与运维经验,网易云才在正式推出的短短一年时间里,获得了大量客户和开发者。

经历了网易产品的长期优化

在谈到网易过去十年走过的技术路程时,汪源表示技术体系是永远需要不断完善,因为业务发展会不断提出新的需求,而且一个庞大的技术体系中也存在很多可以优化的地方。

到目前为止,网易云是一个成功的技术体系,这是因为这套技术体系成为了一个统一、标准化平台,承载了网易各个互联网产品和业务。自2012年起,网易杭州研究院支撑网易集团互联网产品全面上云之后,网易云至今已经支撑了网易内部95%以上的互联网产品。

特别是教育、音乐、易信、电商、金融、手游等网易业务,在最近三四年间呈现爆发性增长态势,但无论是互联网业务范围还是业务规模,网易云技术体系都很好地完成了使命。“在业务爆发式增长的时候,能够及时地提供有力的支撑,没有出现技术拖后腿的情况”,汪源强调。

以网络为例,从第一个版本上线开始,网易杭研院三年之内对于整个网络的架构和优化了投入大量精力与资源。网易云的网络性能从最开始只能跑千兆网络一直到接近万兆,经历了一个很长的优化过程。而只有网络问题解决之后,上面的业务才能更好的集成,因为云计算虚拟化相对比较成熟,但各家云服务商对底层网络的优化差异程度其实很大,有的云解决方案连千兆都做不到,尤其是在部署了SDN之后。

网易云从2012年的私有云到后来的公有云,中间趟过了很多杭儿,其中一个很坑儿就是自研与跟随开源技术社区的路线选择。2006年到2007年,网易开始做海量数据管理平台,包括的五个核心系统在当时国内是比较超前和领先的。但到后来,部分平台被更加成熟的开源平台代替,比如自研的并行计算系统到2010年被替换成当时已经成熟的Hadoop,当然2007年杭研开始自研时Hadoop并不成熟。

“看开源社区,如果只看到现状,就比较容易掉到坑里去。当时觉得开源项目有很多问题,自研就很容易做一个更好的项目,但是过了三五年可能就被开源社区超过了。成熟的开源项目和开源社区的研发力量确实是很大,不是一家公司的投入所能比的,除非是公司的战略性项目。”汪源回忆过去十年间网易云有很多产品都有类似的经历,最后发现随着开源技术社区的不断成熟,跟随开源社区的技术创新、做好场景化的整体技术优化是一条更好的产品路线。

如果再回到十年前重新考虑的话,“应该会有两个调整,一个是更加积极地参与到开源社区的项目,和开源社区共同成长,另一个就是更早考虑把杭研技术进行商业化,做更好的产品对外提供服务。”

为什么要更早的商业化?“如果只是支持网易的业务,在技术的投入、应用的全面性方面,或多或少会有不足的地方;如果做到全世界的人都在用,这个技术才能说是非常成熟、非常可靠的。所以,网易自身的应用只是一个起点。”

接受内外部的考验

网易从2015年陆续对外推出通信与视频(网易云信和视频云)、全智能云客服(网易七鱼)、云计算基础服务(网易蜂巢)、云安全(网易易盾)等一系列场景化云服务,以及一站式大数据管理与应用开发平台(网易猛犸)和企业级大数据可视化分析平台(网易有数)等大数据平台。

网易云信是网易公司集17年IM经验打造的即时通讯云PaaS服务。除了基本功能外,网易云信还提供了高级通讯功能,包括实时音视频、互动直播、教学白板、专线电话、短信、专属云等以及更多服务。截止至2017年5月,已经有35万+开发者接入网易IM云服务,覆盖用户7亿+,在教育、医疗、O2O、游戏、社交等行业都有众多用户。

好未来双师课堂是一种全新的教学模式,从一个老师教学升级为两个老师负责学生的学习:一位是主讲老师,以直播的形式授课;一位是辅导老师,负责课堂管理和课后针对性学习辅导。好未来双师课堂就接入了网易云IM基础功能、互动白板、实时音视频和短信功能,不仅降低了技术运维成本,还让好未来双师课堂更专注自身的核心课程研发和运营业务。

网易积20年之力专注研发的全智能云客服系统(网易七鱼),可无缝融合多渠道在线客服、呼叫中心、客服机器人、工单系统,由表及里全面打造高效的客户服务体系。小牛在线是国内领先的互联网理财平台,在线累计交易额突破100亿。小牛在线接入全智能云客服(网易七鱼),实现了Web 及微信公众号的整合沟通、跨部门工单以及丰富的绩效管理等功能。

小牛在线的服务总监彭特表示:“全智能云客服(网易七鱼)提供的智能客服机器人智能化程度很高,网易多年的技术积累和经验值得信赖。接入全智能云客服(网易七鱼),使小牛的产品体验也有很大提升。另外很重要的一点是,全智能云客服(网易七鱼)在安全性方面是市场上绝对优秀的,这一点对于小牛、甚至是整个互联网金融行业来说都至关重要。”

网易云音乐是搭建在网易云基础服务之上,面对海量的数据请求,网易云基础服务提供了稳定、可伸缩的容器集群环境,敏捷的开发模式以及良好的运维支持。“作为网易多年经验自研的产品,云基础服务为我们项目整体高效运作夯实了基础,也为企业级应用提供了更加高效、可靠的解决方案。”网易云音乐CEO朱一闻表示。

自从2015年1月上线后,网易考拉的业务开始进入了高速发展期,第一版电商系统的瓶颈逐渐凸显,就是迭代速度缓慢,而仅仅提供基础的资源弹性无法解决问题。具体而言,随着用户数量的不断增加、市场需求的变化、运营体系的完善,网易考拉对功能模块变更的需求越来越频繁,不仅仅基础资源管理越来越复杂,脚本化的应用层的部署和管理也已经远远跟不上需求。

网易云基础服务(网易蜂巢)容器云平台的自动化能力就解决了网易考拉的挑战。网易云基础服务(网易蜂巢)采用了Docker容器作为整个软件部署和调度的基本单元,并结合Kubernetes作为容器管理和编排服务框架。

网易云基础服务(网易蜂巢)还在原生Kubernetes的基础上,对于调度进行了优化,并且利用多年运行IaaS层的调优经验,对于容器之间的网络互通和持久化存储做了优化。结果是,网易云基础服务(网易蜂巢)让网易考拉每天的更新频次上限由最开始的每天2次升级到每天112次再上升到每天723次,并发访问支持由网易考拉第二版的每秒2,600次提升到了每秒16,000次。

在大数据方面,数据科学随着近几年大数据和统计机器学习的进展受到了普遍的重视,网易杭州研究院也成立了数据科学中心,打造大数据、商业智能、机器学习平台产品,于今年推出了网易猛犸大数据平台和网易有数敏捷BI平台。此外,网易杭州研究院数据科学中心还在整合网易各大产品数据,梳理网易数据,使网易的数据发挥更大价值,已经成功挖掘网易用户画像,并应用在广告、金融风控等领域,取得显著效果。

除了经受到内外部用户的严格业务考验外,汪源强调网易云的一大优势在于整体架构设计的一致性,也就是上层PaaS服务可以完全基于IaaS层能力构建。“有些友商的云计算架构比较分散,上层的数据库等服务并没有架设在云主机上,而是独立的一套系统,但网易云计算所有的PaaS服务都统一由底层IaaS支撑、调度和提供高可靠的能力,相互之间的协调性比较好,这和设计得比较好的AWS(EC2+ECS)是同等水平。”当然,这样的一个架构设计,也是网易技术近十年来不断磨炼出来的精品结果。(文/宁川)

2017-07-03

(上图为Linux基金会副总裁、CNCF原生云计算基金会首席运营官Chris Aniszczyk)

“开源软件和人工智能正在吞噬世界。”这是Linux基金会副总裁、CNCF原生云计算基金会首席运营官Chris Aniszczyk在2017软博会的中国开源产业峰会上所做的判断。在Chris看来,开源软件与人工智能是互相促进、互相推动,“未来每家公司都将成为软件公司”。

今年初刚刚宣布完成5000万美元C轮融资的国内开源云公司EasyStack,在本次开源峰会上发布了全球首个支持GPU/FPGA的人工智能开源云平台ESCould AI、国内首个企业级容器Linux操作系统、开源PaaS平台ESCloud+、开源行业云平台ESCaaS以及适用于中小企业的开源云易捷版ESCloud Express,这一系列企业级开源产品与平台有望促进人工智能在国内企业的普及。

EasyStack CEO陈喜伦表示,国内企业对于人工智能应用有着强烈需求,但缺乏通用的企业级IT基础设施平台来实现人工智能数据、应用和场景的闭环,开源软件和开源云在这个领域大有可为。

人工智能促进开源软件大繁荣

2011年8月,硅谷著名投资人Marc Andreessen在华尔街日报上发表著名的《软件正在吞噬整个世界》文章,文章指出“每个行业的公司都必须做好迎接软件革命到来的准备”。那时,全球云计算与大数据变革才刚刚开始了5年,OpenStack才刚刚一周年,OpenStack中国社区也是由EasyStack创始人在2013年创立,更不用说Docker也是2013年才出现。

6年后,在2017中国开源产业峰会上Chris Aniszczyk说,随着每一家公司为了适应未来的生存与发展而在演变为软件企业,以及越来越像谷歌、Facebook这样的互联网规模,在未来数年内AI人工智能和自动化将深刻影响每一个行业,与此同时基于人工智能等的开源软件将迫使公司加快竞争速度,大公司正在积极用开源软件建立行业标准与设立行业方向。

在前不久的2017腾讯云+未来峰会上,腾讯云的高性能机器学习计算平台Angel和腾讯优图实验室前向卷积神经网络实现NCNN都即将开源。2016年9月,百度宣布将开源“百度大脑”底层的并行分布式深度学习平台Paddle,今年4月百度再次宣布开源自动驾驶平台。而阿里云的机器学习平台PAI 2.0全面兼容当前主流开源机器学习算法,并支持CPU、GPU、FPGA等底层硬件资源。

在国际上,谷歌Alphabet、Facebook、Amazon、谷歌、IBM和微软五家联合在2016年9月结成人工智能伙伴关系。谷歌开源的TensorFlow、Facebook开源的Torch、微软开源的CNTK、IBM开源的SystemML、Amazon力推的开源MXnet,正在成为开源人工智能算法中的标准框架。再加上本来就有的开源人工智能软件DL4J、H2O、Caffe、MLlib、OpenNN、Oryx 2等,背后更是英特尔、NVIDIA等硬件大厂和斯坦福、加州伯克利等国际学术组织。

尽管Marc Andreessen所提出的“软件正在吞噬整个世界”还没有到来,但开源人工智能软件在公有云的支撑下,正加速这一进程。

企业级人工智能应用的最后一公里

(上图为EasyStack CEO陈喜伦)

随着人口红利的快速消失,中国急需寻找新的增长引擎。2017年3月麦肯锡全球研究院在一份《中国人工智能的未来之路》报告中指出,根据应用速度的不同,基于人工智能自动化提升的生产力每年可为中国贡献0.8至1.4个百分点的经济增长。但麦肯锡也指出,只有当人工智能技术充分应用于传统行业,而不仅仅属于科技巨头时,其经济潜力才会充分彰显。

陈喜伦表示,“云+人工智能”从今年开始已经成为主流计算行业的标配,为人工智能提供更好的计算能力、支撑不同的场景,正成为业界发展的一个趋势。本次EasyStack发布的一系列企业云产品与服务,就是为了解决人工智能的普适化以及在大中小型企业中的普及化,“在人工智能这个方向,我们的核心与愿景就是要解决利用开源的技术,去解决人工智能最后一公里问题”。

那么,对于传统企业来说,什么是人工智能的最后一公里呢?现在已经有越来越多的创业公司基于开源人工智能平台和公有云,开发了面向不同行业和场景的人工智能应用,然而当这些人工智能应用被部署到企业时,却需要解决与企业私有云以及行业私有云的对接问题:这就需要基于OpenStack的私有云、在私有云中支持GPU/FPGA等人工智能专项硬件以及优化的人工智能开源算法、支持大规模人工智能应用的容器技术以及面向人工智能应用的应用管理平台。

首先,基于OpenStack私有云平台是企业内部承载互联网规模人工智能应用的基础。在这方面,已经成立三年多、拥有了超过200个企业级用户的EasyStack再次推出了用于行业通用私有云建设的开源行业云平台ESCaaS,以及适用于中小企业的开源云易捷版ESCloud Express,快速满足从金融、制造等行业云到大型集团企业以及中小企业私有云的普及型建设。

其次,在OpenStack行业和企业私有云的基础上,EasyStack又针对GPU、FPGA等专项用于人工智能应用的硬件进行了优化,实现了面向人工智能的增强版IaaS。所谓全球首个支持GPU/FPGA的人工智能开源云平台,即首个针对GPU/FPGA进行系统优化和集成的OpenStack企业级基础IaaS云。

EasyStack CTO刘国辉表示,深度学习和机器学习软件需要底层GPU/FPGA硬件板卡的支持,而企业往往缺乏这样既精通硬件又精通云软件和高级机器学习、深度学习算法的全面型人才,这就是ESCould AI的意义所在。ESCould AI还预集成了Caffe、TensorFlow、MXnet等开源人工智能算法框架,直接向上支持商用人工智能软件。

再次,为了更好的大规模运行人工智能软件,在系统软件层和应用资源管理层还需要容器技术。为此,EasyStack在2017年3月正式发布了基于Kubernetes的容器集群技术,并在2016年加入了全球两大容器开放标准组织——CNCF云原生计算基金会和OCI开放容器项目联盟。到了2017年6月,EasyStack进一步发布了专门面向容器技术而优化的Linux操作系统,从而更好的掌握容器技术。

最后,就是AppCenter应用管理平台。就如同苹果手机应用商店一样,一个好的AppCenter不仅为合作伙伴的人工智能应用提供了一个应用分发与管理平台,更重要的是可以完成应用版本的发布、升级、运行调优等功能,特别是在企业中面向关键型生产运行环境的运行时管理,这是开源PaaS平台ESCloud+。

国内企业用上开源人工智能技术

(上图为兴业数金云计算事业部主任辛颖)

随着像EasyStack这样的国内开源云计算和软件公司进入人工智能领域,一个人工智能普及化的浪潮正在到来。在这个新一轮的浪潮中,开源软件和人工智能应用正在加速软件吞噬世界的进程,“未来每家公司都将成为软件公司”。

兴业数字成立于2015年底,于今年3月发布了数金云,是兴业数金面向金融行业用户提供的安全可靠全方位金融行业云。兴业数金云计算事业部主任辛颖在2017中国开源产业峰会上介绍说,兴业数金到今年已经签约300多家银行,包括城市银行、民营银行、村镇银行等,例如国家批准的首批民营银行17家中有七家是兴业数金的客户、村镇银行也有100多家实际上线的客户。

数金云包括了IaaS、PaaS、SaaS和BaaS四层架构。其中,IaaS提供了OpenStack、计算虚拟化(KVM、VMWare等)、软件定义存储(Ceph)、软件定义网络(OpenFlow)等。在PaaS层提供了金融应用组件平台和技术组件平台,其中金融应用组件平台就有区块链平台、深度学习平台等组件。在SaaS层,数金云根据银行业务的理解分为了八大类,包括银行核心、渠道类、客户关系、管理信息、网关类、支持类、产品服务和风险管理等。

而所谓BaaS(Business as a Service)业务即服务,就是数金云不仅仅为银行建行SaaS应用及之下的承载云技术体系,而是把整个金融业务信息系统以BaaS的方式做整体交付,这样金融机构得到的就是可以直接上线使用的业务系统。目前数金云面向银行、财务公司、证券、基金和互联网金融五大业务场景,提供了BaaS整体交付服务。

随着人工智能热潮的兴起,兴业数金正在研究如何以场景化方式快速为中小金融机构落地人工智能应用,希望就像BaaS那样降低中小银行的技术门槛,通过开源技术获得原本属于大型银行的技术优势。

(上图为国电通副总工程师刘椿枫)

另一家隶属于国家电网的国电通公司成立于2000年,从事电力行业的信息通讯研究。国电通副总工程师刘椿枫在2017中国开源产业峰会上表示,国网公司基于OpenStack的一体化“国网云”平台已于今年4月上线。“国网云”包括企业管理云、公共服务云和生产控制云三部分,由一体化“国网云”平台及其支撑的各类业务应用组成。企业管理云覆盖管理大区的资源及服务,支撑企业管理、分析决策、综合管理类业务;公共服务云覆盖外网区域的资源及服务,支撑电力营销、客户服务、电子商务等业务;生产控制云覆盖生产大区的资源及服务,支撑调控运行及其管理业务。

刘椿枫介绍说国网云计算技术体系主要采用了OpenStack构建软件定义数据中心架构,采用了Docker、Kubernetes和MESOS构建编排容器,采用了Ceph构建软件定义存储,在此基础上形成了“智擎”云操作。智擎云操作基于Linux、OpenStack、Docker等开源技术优化增强开源项目29个,自主研发组件13个,在计算、网络、存储等方面的性能优化和功能增强都有自主知识产权。

智擎云操作已经在国网云得到了大规模的应用,实现了设施、数据、服务、应用等IT资源的一体化管理,进一步提升信息存储、传输、集成、共享等服务水平,有力促进业务集成融合、缩短应用上线周期、快速响应业务变化、显著提升用户体验、增强了系统运行可靠性。

(上图为中国邮政储蓄银行科技部副总经理胡军锋)

中国邮政储蓄银行科技部副总经理胡军锋也在2017中国开源产业峰会上介绍中国邮政储蓄银行的新一代个人核心业务系统也是采用开放式平台,以小型机集群代替大型机,构建超大规模银行交易核心业务系统的成功实践。该系统建设历时三年,目前系统峰值已经到了日交1.39亿元,系统运行稳定,充分印证了小型机集群的可行性和架构性。

邮储银行还积极开展云计算和新技术的应用体系研究,2014年开始基于开放的技术路线,引入企业级OpenStack云计算技术以及国内的OpenStack云计算厂商深入合作,建成资源调配弹性更灵活、应用开发更快捷和敏捷的邮储云化智能信息化体系,可缩短应用上线周期、快速响应业务的变化、提升用户的体验和增强系统运行可靠性,支撑互联网金融、大数据和开发测试云等不同的应用。

目前,邮储银行云平台已经部署八百多个节点,成功运行了手机银行、互联网网贷、自助银行、基于区块链业务等一系列应用,支撑行内日均三千多万笔的交易。胡军锋介绍说,下一步邮储银行将开展多中心云统一管理运维、人工智能云、渠道应用云等PaaS乃至SaaS最核心的基础研究和应用,开展人工智能和机器人、物联网等方面的金融科技前沿创新,从而加速邮储银行向体验+智能的智慧银行全面转型。

从兴业数金、国电通和中国邮储银行等企业以及EasyStack为代表的国内开源厂商的实践来看,中国正走在开源和人工智能等技术的实践前沿,为这些技术的落地提供了很好的业务场景和数据。这也意味着,将有越来越多的中国公司成为全球开源和人工智能等技术与应用的主要参与者,从而带动更多的中国企业成为软件驱动的科技型公司。(文/宁川)

2017-06-29

(上图为斯坦福大学李国鼎工程讲座教授、杉数科技首席科学顾问叶荫宇)

过去两年出现了人工智能的热潮,特别是以深度学习算法为代表人工智能在中国市场出现了井喷现象。根据麦肯锡统计,2016年全球科技巨头在人工智能上投入了 200亿到300亿美元,VC/PE投融资达60亿到90亿美元。在中国,根据钛媒体TMTbase全球创投数据库的数据统计,目前共收录中国人工智能企业398家、共发生571起投资事件,投资总额高达571亿人民币。

就在AlphaGo先后挑战世界和中国围棋高手后,关于人工智能的热炒更有甚嚣尘上的趋势,也有行业专家发出人工智能泡沫的警告。然而,人工智能泡沫现象却有一个意想不到的效果。2017年6月24日,在由钛媒体与大数据运筹优化公司杉数科技联合举办的“钛媒体AI大师圆桌会”中,来自美国与中国的顶级优化算法专家均表示,人工智能热带动了优化算法的繁荣。

斯坦福大学李国鼎工程讲座教授、华人运筹学领袖、杉数科技首席科学顾问叶荫宇表示,机器学习算法强化了单体机器的智能,但在机器人群体协同工作时则需要“通盘考虑、统筹优化”的优化算法。正因为云计算、大数据与人工智能的井喷,才出现了超大规模的大数据,而这正是优化算法繁荣的基础,优化算法的发展也将反过来推动人工智能进入新阶段。

算法战争与战争算法

2017年4月26日,美国防部在一份备忘录中对“战争算法”进行了描述,提出了“算法战”概念,更为重要的是组建了“算法战跨功能团队”,该团队将通过编写人工智能、机器学习等代码来改变作战方式,比如利用人工智能对无人机采集的海量视频数据进行分析以获得丰富的战争情报。

而早在二战的时候,还没有大数据甚至也没有计算机,在获取数据的途径、数量和速度都很有限的前提下,发源了对后来全球社会经济有广泛影响的“战争算法”:运筹学。叶荫宇介绍说,运筹学是一种研究优化的学问,就是对于所有的实际生活中出现的问题,不是简单是找一个可行的方案,而且是一定要找到最优的方案。用现代的话说,就是要把事情做到极致。

生活在1707年到1783年的著名瑞典数学家莱昂哈德·欧拉就曾说过:这个世界上的任何事情或事物都有最大值或最小值。在二战中,盟军使用数学模型解决各种作战的最优化问题,包括雷达部署问题、运输船队的护航问题、反潜深水炸弹投掷问题、太平洋岛屿军事物资存储问题、项目管理问题等等,这些问题的解决保障了最后的胜利。

二战结束后,人们将运筹学广泛应用到企业和政府之中,包括生产、服务、金融等行业。由于运筹学源于解决现实世界中的决策问题,因而后来涌现了大量运筹学算法,运筹学各重要分支得到快速发展,包括线性规划、非线性规划、整数规划、组合规划、图论、网络流、决策分析、排队论、可靠性数学理论、库存论、博弈论、搜索论等。

现代运筹学利用统计学、数学模型和算法等方法,为复杂问题寻找在满足约束的条件下能够最大化/最小化某一目标的最优决策,典型的应用就是解决复杂巨系统的优化决策问题。复杂巨系统指的是规模巨大、构成要素复杂、包含众多子系统的系统,如电力系统、城市交通网、数字通信网、柔性制造系统、水资源系统、社会经济系统等。

复杂巨系统性能的优化将产生巨大的经济效益或社会效益,而其中运筹学的应用就能起到重要作用。比如工厂生产、货物库存、销售中心和消费区域等管理等,不能对各个环节孤立地进行研究和管理,必须把这些环节连接起来,以获得全局优化的运行管理。

能够解决复杂巨系统的优化问题,才是以运筹学为代表的最优化算法的最大价值,甚至对于一个国家来说具有着战略意义。从商业价值这个角度来说,大数据是从0到1、人工智能是从1到2、统计和运筹优化算法是从2到N。掌握了以运筹学为代表的优化算法,才能真正赢得未来的算法战争。

大数据时代下的商业决策

叶荫宇曾获得美国运筹与管理学会冯诺依曼理论奖(运筹管理学界最高奖),也是迄今为止华人唯一获奖者,2014年美国应用数学学会优化大奖(每三年评一人)、2012年国际数学规划大会Tseng Lectureship奖(每三年评一人),曾主持和参与美国波音、FICO、运通、美国卫生部、美国科学基金、美国能源部以及美国空军科研部门等多个科研项目。

1982年叶荫宇赴美深造,当时人工智能经历了一****高潮后,由于没有大数据等现代技术的支撑,理论研究与商业应用都处于停滞状态,但运筹学则在各行各业方兴未艾,从市场营销、生产计划、库存管理、物流运输、财政会计到人事管理、设备维修、工程最优化、计算机与通信系统以及城市管理等都有广泛的应用。

随着计算机技术高速发展,要解决的问题规模不断增大,运筹学的应用范围也取得革命性的突破。大量算法、软件产生,大数据时代给运筹学进一步带来了生机——如何将大数据转化为最优决策成为运筹学重点的课题。美国纽约大学助理教授、博士后师从机器学习之父Michael I Jordan(蚂蚁金服智囊团主席)的陈溪也认为,大数据的出现推动了机器学习、大规模统计推断与运筹学算法三大领域齐头并进,由此形成了大数据驱动下的商业决策。

叶荫宇介绍了大数据驱动下的商业决策的三个阶段:基于数据收集与管理的描述型(Descriptive)决策,数据成为大数据时代商业决策的基础和公司发展的“原燃料”,通常由计算机和信息科学技术完成;基于规律性分析的预测型(Predictive)决策,从大数据中提取信息,获得事物背后的规律,通常由统计和机器学习技术完成;但仅仅对数据的管理与规律性分析并不能释放数据的巨大价值,必须真正提升决策质量、从海量数据中发掘出规律,才能让大数据产生实质性价值,这就是基于决策建模与求解的处方型(Prescriptive)决策。

运筹学将实际中决策问题转化为数学模型,用高效的优化算法求解,运用系统科学和优化算法获得最佳决策及战略,并实现决策的自动化、流程化、规范化。在美国和欧洲,已经实现了运筹学算法的软件化与工具化。例如,在投资组合优化及相关决策领域,就有Barra、Axioma、ITG、Mosek等知名软件,其中Mosek大规模数据优化软件是欧洲第一大优化软件,叶荫宇为该公司科技顾问委员会主席、创始人也是在叶荫宇的指导下对优化算法有了深入了解,并创立了该公司,目前华尔街进行风险控制的软件求解器有很多都使用Mosek软件。

叶荫宇认为高频交易的竞赛就是算法速度的竞赛,如果一家软件的模型求解速度需要10秒钟,而其它家软件的速度为0.04秒,那么谁掌握了0.04秒求解软件的源代码谁就有核心竞争力,而从10秒到0.04秒就是算法的力量。

前不久的美联航事件,是典型的不确定环境中库存管理决策问题。航空公司机票超售是因为总有5%到10%的乘客因为各种原因不登机,而航空公司在不确定的条件下到底要超售多少张机票以弥补损失,当出现超售后有人不愿意下机的情况下,该如何鼓励乘客改乘下一班飞机,这都是运筹优化算法的范围。在不确定和测不准的随机或复杂环境下的困难决策,也是人工智能和机器学习算法的薄弱之处。

数据驱动商业场景中的决策优化

Mosek公司成立于1997年,迄今已经有20年的历史。而国内近年来在人工智能的产业化和商业化方面取得了一些进展,但优化算法是整个人工智能推进中不可缺失的一环,在国内却处于相对弱势情况。此外,即便是机器学习和深度学习的底层算法开源求解器,在国内也尚未见到。

2016年中,几位来自斯坦福运筹学领域的教授和博士,从斯坦福校徽的“杉”和大数据的“数”取名,创立了杉数科技,开始致力于在中国推广运筹学的商业应用以及开发机器学习和深度学习的底层求解算法。杉数科技目前已经有了京东等大企业客户,2016年7月获得了来自真格基金和北极光创投的210万美元天使轮融资。

美国明尼苏达大学助理教授、杉数科技CTO王子卓,曾获美国运筹管理学会收益管理分会2015年最佳实际应用奖提名,参与过美国运通、华为、IBM、希捷等项目,其中为IBM定制的定价策略系统获美国两项专利,为IBM创造过巨额的利润。

王子卓介绍了互联网时代由大数据驱动的定价策略,他认为好的定价策略是企业的“生命线”,特别是互联网商业模式下的实时定价更决定了酒店、零售、航空、租车等行业和企业的生死存亡以及能否获得更大的发展。

那么电商等实时企业如何更好的获得“生命线”,如何制定自己的定价策略?首先这就需要了解消费者的构成、偏好以及消费行为等大数据,其次在获得了消费者或消费者群体大数据的前提下,做出价格、时间、地点等销售决策。所以数据驱动的定价策略就是在正确的时间和正确的地点,以正确的价格为正确的客户提供正确的产品与服务。

现在,杉数科技智能决策提供一套基于数据的完整定价解决方案,包括目标场景、底层模型、优化策略、高效算法、信息回收、模型迭代等环节。其中,在构造和选择底层模型的时候,由于消费者在面临多个选择、不同价格、不同质量等信息时会改变购买行为,虽然有时候会出现不理性行为但依然可以从大数据分析中得出规律,随后通过非线性、离散、高维与动态算法等建立定价决策模型,再设计独特高效算法得到精确最优解/高质量近似解,采用并行计算架构就可以同时对大规模多SKU 问题有效求解,最终实现在线获得最优解、满足实时性要求。当然,价格计算不是一劳永逸,市场在变化、环境在变化、价格也在变化,动态调价已经成为很多行业的趋势,也就是在线学习消费者购买行为后不断更新算法模型。

杉数科技创始团队自2016年以来,利用自己在定价方面的独特积累和技术,已经为国内多个行业的龙头企业,包括电商、物流、出行等,提供了收益管理方向的精确量化软件开发和咨询服务,合同额达到了近2000万。

陈溪进一步介绍了在线学习与在线决策的联动影响与决策算法。在线学习与在线决策联动,有两个基本的选择:一是通过最少的尝试以获得对象的最大化信息(Exploration,勘探);二是在已获得信息的基础上做出最佳决策以最大化收益(Exploitation,收获)。一个经典的例子就是多臂****问题(Multi-Armed Bandit Problem,MAB):不同****的收益都是随机的,有的随机收益低、有的随机收益高、有的能出现高额随机收益,那么如何通过最少次数的尝试尽量多地获得每台****的收益水平,从而优化拉****的策略?2014年,王子卓、叶荫宇等人的一篇学术论文讨论了用于单一产品收益最大化管理的MAB算法。

多臂****MAB算法有着广泛的商业用途,比如电商可以把该算法用于某个产品消费群体的认知和开发。陈溪在2016年参与的一篇“电商个性化收益管理的统计学习算法”中就探讨了杉数科技为唯品会开发的算法。当时在美国,某电商每个月甚至每两个礼拜,就定期给女性顾客寄一个内有5件衣服的盒子,顾客可以选择一件付款再把剩下的退回,如果5件衣服都不喜欢就会象征性收取邮费。以此来探知女性消费者的消费行为数据,并用于相关算法的开发。

陈溪强调,由于现实中的商业环境极为复杂,因此需要机器学习、统计分析和运筹优化的共同作用,才能做出最优化的商业决策。

清华大学交叉信息研究院助理教授、杉数科学家李建介绍了基于时空大数据的机器学习算法,所谓时空大数据中是生产生活中带有时间轴的地理大数据。李建表示,随着社会发展、企业运营、工业生产朝着精细化运作的方向发展,对于生产中一些关键性时空属性的预测和控制就显得越发重要。

时空大数据有着广泛的应用,例如:对于交通路况的预测,可以帮助交通部门调整和优化交通指挥和布局;对于给定路径的出行时间预测,可以帮助人们更好的规划行程;对于在线租车来说,准确预测未来一段时间内的订单量和区域分布,可以帮助公司更好的进行车辆调度,从而提高车辆共享效率; 对于物流公司而言,对各网点收发货量的良好预测,可以帮助公司提前进行运力、人力等资源的调度,从而提高物流效率,增加收益;无人驾驶对周围障碍物运动位置的预判,可以帮助驾驶系统提前规划调整路径,从而提高安全驾驶系数。

时空数据在各行各业中海量产生,对于这些数据的合理挖掘与利用可以帮助生产者乃至整个社会提高生产效率。

人工智能新浪潮:结合优化算法的快速智能决策

机器学习和人工智能是大数据时代科技发展的产物,近几年有了突破性的发展,代表性成果包括图像识别、语音识别、自然语言处理等,应用场景包括自动驾驶、智能诊断、无人机等。然而,机器学习和人工智能所基于的主流深度神经网络学习算法,还需要与优化算法结合,才能适应现实商业世界中超大规模、快速实时响应等需求。

来自佐治亚理工学院的终身教授蓝光辉,其主要研究领域为随机优化和非线性规划的理论、算法和应用,包括随机梯度下降和加速随机梯度下降等于用于解决随机凸和非凸优化问题。蓝光辉也是国际上机器学习和深度学习算法方向顶级专家,华人年轻一代优化算法的领军人物之一。

所谓凸优化/非凸优化是国际上一套已经研究很完备的优化算法理论体系和求解算法,如果把某个优化问题转化为凸优化/非凸优化问题,就能快速给出最优解。简单理解,凸优化就是指某个问题可以找到局部最大值或最小值,而非凸优化就是指某个问题虽然没有局部最大值或最小值,但依然有几个局部优化点。换句话说,非凸优化就是可以找个几个局部优化的解决方案以供决策,可用于投资组合交易、航线管控、生产排班、资源调配、信号传输等领域。

例如在2017年6月21日到24日的北京汛期最强暴雨天气中,根据航旅纵横统计,从21日0:00-23日12:00,全国延误航班架次11805架,取消航班架次3052架。在这种情况下,航空公司和铁路公司能否实时的根据受影响航班、天气、人流等数据,及时优化调整航班与铁路车次,就成为了影响整个社会经济运行的重要因素。这不仅仅是智能学习和预测,还需要超大规模、快速实时响应,才能够解决实际的问题。

蓝光辉介绍,自2015年以来,大规模凸优化及非凸优化算法取得了很大的进展,已经能够处理超过一百万甚至达上亿变量的超大规模数据集。把凸优化及非凸优化算法用于机器学习算法的优化,就能大幅加速机器学习算法的速度。杉数科技的科学家们也一直在开发自己的机器学习与深度学习算法求解器。同时也帮助上海财经大学协同开发国产的最优化求解器的开源软件,推进我国开源社区在优化算法方面的进展。

H2O与TensorFlow是两大界顶级机器学习求解器,其中H2O是发布最早、影响力最大的机器学习开源软件之一,已经服务于三百多家金融、互联网企业,被全世界70000多名数据科学家和8000多家单位所使用。而TensorFlow是谷歌开发并力推的深度学习计算引擎,也可作为通用的机器学习求解器,是Github排名第一的世界顶级开源项目,在语音识别、图像识别、机器翻译等各人工智能领域有着广泛的应用。

蓝光辉介绍说,杉数科技的优化求解器软件在9个公开数据集上与TensorFlow和H2O两种求解器进行了对比测试。其中,在针对分类模型的数据集上,杉数科技求解器的求解速度在所有数据集上均大幅高于TensorFlow,提升速度为10倍~70倍不等;而在计算速度大幅领先的情况下,杉数科技求解器预测效果仍略好于TensorFlow。针对回归模型的数据集上,在3个公开数据集上的对比测试来看,在不影响求解精确度的情况下,通过选择合适的超参数使得杉数科技求解器软件的求解速度仍快于TensorFlow数倍,而预测效果则大致相当。

与H2O比较来看,针对分类模型数据集,在预测精度大致相同的情况下,杉数科技在几乎所有数据集上求解速度都大幅度领先于领先于H2O;而在回归模型数据集上对比,通过选择合适的超参数,杉数科技的求解器求解速度略慢于H2O,但预测精度能远高于H2O。

也就是说,在新一波人工智能浪潮中,中国的科学家们已经掌握了并不落后,甚至领先国外的核心算法及软件工具,把优化算法代码与中国企业的商业流程无缝结合起来,真正掌握从单体智能到群体协同智慧的“软实力”。

“核心算法是一个国家的软实力。只要互联网不死、数据与信息不死,算法就永远存在。掌握了核心算法,一个国家才能在未来一波又一波人工智能浪潮中掌握主动权。”叶荫宇强调说。(文/宁川)

2017-06-27

软件定义的时代,基本的目标就是万物皆可互联,一切均可编程。这个时代还有多远?在2017年6月举办的第9届中国云计算大会上,中国科学院院士梅宏就这个话题提出了他的观点。在随后不久,首次来到中国的L3大会(LinuxCon + ContainerCon + CloudOpen)上,Linux发明人Linus Torvalds也就这个话题谈了他的见解。

“我们正在进入一个新的时代,这个时代一个重要的特征就是无处不在的软件技术和软件应用,正在定义这个时代的一切。”梅宏表示。“当前很多的场景、应用、产业,都会实现软件技术的深度应用。”

梅宏认为,当前正在进入以数据的深度挖掘和融合应用为特征的信息化3.0时代。一方面摩尔定理驱动着设备的增长,另一方面移动宽带互联形成了人机物的广泛互联,技术的低成本化让信息技术无处不在并实现了万物的数字化,加上云模式驱动数据汇聚和集中,所以出现了大数据现象,从而激发了人们从中间寻找规律、萃取知识,再用于指导社会实践和工作实践——一个新时代正在开启。

随着人机物融合的环境,软件技术面临着一系列的挑战,其中一个挑战就是从传统静态环境中的传统软件走向开放动态环境下的复杂软件,这就需要凝练系统的共性以保证高效可靠的运行,凝练管理的共性以保证可靠高服务质量的运行。过去几十年软件技术发展的主要驱动力就是系统的平台化,以操作系统为代表的系统软件的发展,反映了基于共性凝练和沉淀的平台化过程

系统软件平台化一直是软件发展的重要驱动力,在人机物互联环境下的系统软件平台是什么样?在互联网上的网络应用,因需求多样、形态也多样,其下的硬件资源有个人计算机、大型计算机、手机终端以及众多的物联网计算设备,这么海量异构的硬件资源,如何构建一个系统级平台、如何凝练应用软件的共性,把下面支撑的硬件资源整合起来,从而通过一个系统软件平台完成工作?

此外,很多应用软件都是在线运行,7*24小时不能停机,一直要为企业提供服务,其应用场景也是动态多变,因此就进而提出一个要求,系统级软件平台能不能实行按需、灵活、深度的定制,而这种定制怎么解决?所谓软件定义就提供了这么一个按需、灵活、深度、定制化系统级平台的方式。

早期的计算机就是硬件计算机,操作系统的出现使得计算系统能够成为通用的设备。现在,每个用户看到的计算机是一台由操作系统定义的计算机,操作系统是向下管理硬件资源、控制程序运行,向上实现人机交互界面、为应用程序提供系统软件层支撑,通过API完成系统资源的调用。

操作系统的目标本质上就是要追求更为高效的硬件资源管理,透过软件技术实现灵活高效可信统一的虚拟硬件资源管理,这是操作系统发展的重要驱动力。在某种意义上也正是因为以操作系统为代表的系统软件平台的不断发展,带来了应用软件市场的快速繁荣。

如果应用软件是构建在纷繁复杂的硬件设备基础之上、构建在不同的网络提供商所提供的网络之上,可以想像开发工作量和开发复杂度将非常大,而系统级软件平台就可以屏蔽掉底层的异构系统,这就是操作系统的目标。

梅宏表示,信息化3.0时代需要管理的是海量异构硬件资源所构成的信息基础设施。云、管、端、多网融合的复杂环境,各种各样的计算设备,还有人与物,这么多的资源怎么能够实现有效管理?相应的基础设施就需要新的资源管理机制,多样化、领域化、个性化的管理资源需求就出现了,比如规模化的资源整合、基于巨型虚拟机的巨型资源设备,包括GPU、摄像头、手机上的传感器等等微型化设备,都要都需要通过软件构建API的方式实现虚拟化的统一管理。

(上图为Linux创始人Linus Torvalds)

作为PC时代的操作系统泰斗、Linux创始人Linus Torvalds表示他开发Linux时,把Linux当成一个PC操作系统。后来,美国一家服务器公司说要把Linux用到服务器上,用以支持4000个CPU,随后做了专门化的编写,该代码对Linux内核做了有益的补充。在另一方面,移动端关注的是低功耗,而不是多少个CPU,当然现在每个手机里都有4-8个CPU。现在很多开发商都把Linux用于手机操作系统的开发,他们的开发工作对于服务端的Linux系统来说,也有着价值。

Linus因此认为,Linux不是某一个版本的操作系统,而是服务器端、手机端、PC端等多种方向的Linux版本的平衡版。“未来很难预测,没有办法开发出理想的操作系统,但是可以通过Linux达到一个平衡的状态。能否达到理想状态已经不重要了,只要能把项目推进。Linux是针对不同场景的操作系统,而不同场景的代码改进可以让开发者和Linux内核都有改善和提高。”

在谈到通过开源方式开发操作系统等软件时,Linus认为参与开源项目的人有不同背影,有着不同的诉求。有的人认为开源的理想比项目本身更重要,但也有人参与开源项目是为了商业利益。目的不一样,利益点也不同,但Linus认为开源是开发技术的方式,也是很务实的方式。“我创建开源Linux,是与别人一起打交道和沟通的很好的方式。Linux Foundation更看重技术方案,通过协商达成一致。而我推动Linux项目的目的是关注技术,以技术为中心,这是我追求的目标。”

Linux基金会HyperLedger项目负责人Brain Behlendorf表示,开源让开发者、企业、用户等共建一个“家”,这样的话失败成本就很低,因为能找到共同点。20年前提出了开源的概念,基于许可协议所带来的收益,让各参与方找到共同的技术诉求和利益公约数,以共同同意的方法推动开源项目。华为开源软件和社区战略首席专家侯培新则表示,成功的开源项目,尽管各方出于自己的考量各有利益诉求,但还是会形成公共技术,就像Linux有内核但有不同的发行版,但有一个共同的基础。

接下来,软件定义操作系统的时代什么时候会到来?人工智能AI能否驱动软件定义操作系统?美国国防部高级研究计划局(DARPA)在2015年开始启动一项资源自适应软件系统(BRASS)的研究,其核心思想是开发一个能经受未来100年技术变革而能自适应的软件技术体系,该软件技术体系能自行对所在硬件资源生态系统的变化做出安全、动态式的响应。在很大程度上,这就需要一个能被软件或代码自行定义的“操作系统”。(文/宁川)

2017-06-26

1997年,亚马逊发表了著名的“Day 1”致股东信,贝索斯在信中说“ this is Day 1 for the Internet and, if we execute well, for Amazon.com”。

在过去的20年间,亚马逊一直保持在Day 1状态。20年后,贝索斯再次在股东信里强调,“Day 2公司将停滞不前,接着将变得无关紧要,然后将经历痛苦的衰退,直至最终死亡。这就是为何我们总是要做Day 1公司的原因。”

尽管贝索斯所在的办公大楼叫作“Day 1”,但贝索斯很清楚的知道,Day 2终会到来。1997年的时候,亚马逊销售额为1.478亿美金,同比增长838%;而亚马逊在2016年的净销售额达到了1360亿美元,同比增长27%。接下来如何防止走进Day 2?如果不可避免进入Day 2,又如何尽量延长Day 2阶段?贝索斯在2017年度致股东信中大力强调了机器学习与人工智能。

“如果你不能快速拥抱趋势,外部世界就会把你推入Day 2。抵抗趋势,就是抵抗未来……大的趋势不难被发现,但大公司往往难以拥抱它们,机器学习和人工智能就是这样一个明显的趋势。”贝索斯说。

AWS的人工智能全局

201611月底举办的AWS re:invent大会上,AWS正式推出了自己的AI产品线。以此为标志,AWS正式展开了人工智能的全线布局。

亚马逊AWS首席云计算企业顾问张侠介绍了AWSAI方面的产品框架和四大产品线:AI服务、AI平台、AI框架和AI基础设施。其中AI服务处于最顶层,主要包括了用于图像和人脸分析的 Amazon Rekognition、用于文本转语音的 Amazon Polly 以及用于创建带自动语音识别和自然语音理解(NLU)功能的对话式聊天机器服务 Amazon LexAWS提供的这三大系列AI服务,通过已经过预训练而且是高度可扩展的托管AI服务,专门服务于那些想直接使用AI技术与模型的开发人员,并且不需要任何人工智能或深度学习知识就可使用。

AI平台方面,AWS提供了Amazon Machine LeaningAmazon Elastic MapReduceEMR)。其中,Amazon Machine Learning可以让用户使用自己的数据来训练自定义的机器学习模型。Amazon EMR则提供了Hadoop大数据处理能力,以及分布式计算框架Apache Spark和基于Spark的机器学习框架SparkML等。借助这些平台,用户无需担心开发和管理AI训练与模型托管的大数据处理、存储与管理等平台型任务。

AI 框架方面,Amazon支持所有主要 AI 框架,包括Apache MXNetTensorFlowCaffeTheanoTorchKerasCNTK 等,这些开源框架提供了灵活AI编程模型,可以进行大规模的自定义模型训练,适用于那些想要构建复杂智能系统的研究人员和数据科学家等。用户通过预置的AWS Deep Learning AMI机器映像就可以调用这些框架,这些机器映像支持Amazon LinuxUbuntu系统并进行了预配置。

在最底层则是AI基础设施,比如Apache MXNet等深度学习框架使用的是神经网络模型,就需要底层大规模计算能力的支持。Amazon EC2 P2 实例提供功能强大的NVIDIA GPU,极大缩短了完成AI计算所需时间,Amazon EC2 C4计算优化型实例和M4通用型实例则非常适合使用训练后的AI模型来运行推理。借助无服务器计算编程环境AWS Lambda则可实现无服务器环境下的机器学习,开发者无需关心底层到底使用了哪个数据中心的服务器等大量细节。而 AWS Greengrass则可以在 AWS云和本地设备之间,无缝运行AI IoT应用程序。

虽然AWS2016年底才推出全线AI服务,但张侠表示:“整个AWS亚马逊云发展非常快,已经有90多项大类服务,2016年就推出了1017个新功能,其中即有新的服务、也有原有服务的新功能,而截至201751日,我们又推出了322个新服务和功能。因此,对于AWS来说,我们是与自己竞争,通过不断推出新的产品,更好的服务客户需求。”

在全球普及人工智能

对亚马逊AWS来说,推出人工智能的基础设施、框架、平台与服务等全线AI产品与服务,并不是为了与其它公司在人工智能方面一较高下,而是为了在全球范围内普及AI,让AI真正平民化。在这一点上,亚马逊AWSNVIDIA的黄仁勋有类似的看法,黄仁勋曾说AI最大的价值在于平民化和普及化,只有让每一个国家、企业和个人都有获取和使用AI的能力,才能避免AI的垄断和威胁。

首先,亚马逊AWSAI基础设施就是AWS云服务,而目前AWS云服务已经全球16个地理区域内运营着43个可用区,并宣布了将增设3个区域(8个可用区)的计划,从而可支持全球190个国家和地区的几乎所有计算工作任务。在2016财年,AWS全年营收高达122亿美元,运营利润为31亿美元,首次超过了100亿美元大关。已经形成良性循环的AWS云服务,成为了AWS AI服务全球普惠的基础。

其次,AWS的开发环境Lamda是一个无服务器架构(serverless),这就意味着开发者在不需要管理基础设施的情况下,可自动运行代码并管理计算资源,并且不会产生不必要的费用。Greengrass让开发者在IoT物联网设备上运行Lambda函数,除了可以在本地执行Lambda函数并保持与云端同步外,Greengrass还支持各种IoT设备间的本地消息传递以及可访问各种AWS服务,这就让AWS AI程序可以大规模运行在云端和边缘设备上。正因为与AWS编程环境Lamda集成在一起,开发者可以轻松使用AWS AI服务开发各种AI应用,为网络应用、即时通信工具或为手机及物联网设备等添加AI能力。

再次,AWS AI服务支持多种编程语言、多种国家语言以及具有很强的可移植性。例如, AWS选择MXNet作为官方机器学习首选平台,是因为它的可编程性、可移植性以及性能等。MXNet支持包括GoPythonScalaR语言、Java ScriptC++等在内的广泛计算语言,只需要很少量的存储空间即可运行,上千层的神经元网络也只需4G存储空间,可部署在智能手机、物联网设备、无人机等设备上。而文本到语音转换服务Amazon Polly则支持多达24种语言47种声音,覆盖了全球主要国家和地区。

抓住新技术趋势

对于大公司来说,之所有很难拥抱新的技术趋势,是因为新的技术趋势往往与企业现有的业务相冲突。然而,对于亚马逊来说,却不存在这个问题,因为亚马逊天生就是一家新技术公司。

Amazon Rekognition就采用了Amazon Prime Photos所用的技术,可以轻松向应用程序添加图像分析功能,包括对象和场景检测、图像审核、人脸分析、人脸比较、人脸识别、名人识别等。Prime Photos是亚马逊于2012年推出的个人图片存储、备份和分享等功能的图片App,面向Amazon Prime用户提供无限量、为其他用户提供5GB的存储空间。除了存储和分享外,Prime Photos每日分析数十亿张图像,可智能搜索图片,也可为图片做自动分类而无需人为输入任何标签。

借助Rekognition,企业可以定位到图像中的人脸面孔并分析其特征,比如面孔是否在微笑或者眼睛是否睁开着。在分析图像时,Rekognition将返回每个所检测面孔的位置和矩形框架,利用Rekognition的面孔分析功能,就可以跟踪用户的情绪。通过Rekognition分析实时图像,并将情绪特征发送到亚马逊数据仓库Redshift中,就能帮助零售商等定期获得店面的用户趋势等。

而用Rekognition编程也十分简单,因为与Amazon简单存储服务S3 AWS无服务器编程环境Lambda的无缝集成,可以直接通过 AWS Lambda调用Rekognition API,以响应 Amazon S3事件。由于S3Lambda可自动扩展和扩容,就可以构建可扩展、低成本且可靠的图像分析应用程序。例如,门上的摄像头会将来访者的照片上传到S3,以触发使用Rekognition APILambda 函数,从而识别出访客。该服务还支持 AWS Identity and Access Management (IAM)身份管理,可控制对Rekognition API的安全访问和权限管理。

实际上在亚马逊电商网站的日常运营中,就已经应用了大量的人工智能技术,另一个值得一提的就是Echo智能音箱。Echo是一款可以与用户对话的智能音箱,帮助用户完成各种信息查询(诸如天气、行车路线规划等),执行各种日常任务(如闹钟、音乐等),还能帮助用户在亚马逊电商网站搜索和购买商品。Echo本身并不具备复杂的学习分析能力,它的智能部分是通过互联网连接到云端的Alexa服务完成的,Alexa输出为云服务即为 Amazon Lex

全美最大的银行之一Capital One就利用Alexa为客户带来全新的智能语音银行体验。Capital One认为,智能语音银行将开启一个全新的客户互动体验。具体来说,Capital One基于Alexa开发并实现了第一阶段的功能:基于智能语音的信用卡账单支付、信用卡余额查询、储蓄账户余额查询、列出近期消费记录、查询信用卡可用额度、查询信用卡账单到期日、账户信息概况/总览等。Capital One 采用了Conference Driven Development的开发模式,通过内部不同团队间的数次会议讨论,促成了该Alexa项目。

Capital One综合了客户常用的各种表述方式开发了新的Alexa Skills Kit,使智能语音银行助手既能对客户提出的意图明显的问题进行快速回答,又能在一些模糊的和泛泛的话题上与客户互动。比如针对近期信用卡的消费记录,Capital One总结了来自不同客户的150多种询问方式,并将其植入Alexa Skills Kit,使得智能语音银行助手可在不同语境下更好的理解客户问题,还会避免比如对余额偏低的客户用玩笑口吻回复的情况。

贝索斯说,能抓住大的趋势,就能乘风而起。亚马逊自己已经抓住一大趋势,成为了全球最大的科技公司之一,AWS亚马逊云也一直蝉联全球云计算市场龙头老大的地位,亚马逊的人工智能产品与服务正向全世界渗透与蔓延。接下来,就需要更多像Capital One这样的金融、零售、制造等企业,利用AWS亚马逊的人工智能技术、产品、平台与服务,进入下一波科技浪潮。只有这样,才能避免Day 2的到来,或为长期Day 2生存,做好准备。(文/宁川)

2017-06-24

去年秋季的ARM TechCon上,软银集团总裁孙正义谈到全球将会有一万亿互联设备的概念。为了实现这样一个宏大愿景,需要相应支撑的技术基础特别是定制化的SoC系统,而且技术本身必须是高效、被业界证实的支撑架构,同时还要有广泛的生态系统。

2017年6月20日,ARM对外宣布对旗下的DesignStart项目进行升级,加入了ARM Cortex-M3处理器和相关的IP子系统,帮助开发者更简单、更快速、更低风险地实现定制化SoC。

ARM计算产品事业部高级产品营销经理Phil Burr表示:“孙正义提到未来一万亿设备的数字,因为我们已经成为了软银的一部分,所以ARM也非常大胆的迈出了变革的一步,我们希望成为这一万亿互联设备实现中的一部分,能够让芯片开发人员更加便捷、容易、高效的实现芯片的开发。”

低功耗芯片系统设计的快速通道

自2010年开始,ARM就通过DesignStart项目为开发者提供ARM IP的快速通道。两年前,ARM通过DesignStart开放了Cortex-M0系统。外部的芯片、开发、设计人员通过ARM DesignStart门户,能够访问和获得Cortex-M0以及数以百计的IP子系统。

在2015年的时候,ARM让外部的芯片开发员获得三个评估,同时还能够仅付4万美元就可以获得基于Cortex-M0之上快速芯片开发。今天,DesignStart项目又有了升级。

首先,能够让外部的芯片开发员即时获得Cortex-M3这样一个最为主流、使用最为广泛的嵌入式智能芯片技术。同时,无需支付预付的授权费用,外部人员就可以免费率先进行Cortex-M0或者Cortex-M3的开发。同时ARM也为那些以前没有做过这种定制化芯片开发的公司提供了SoC片上系统设计、辅助服务。

通过DesignStart,AMR为开发者提供两个类型的服务,一个是DesignStart Eval评估服务,让开发者即时、免费地获得评估、设计、原型等服务,Cortex-M0和Cortex-M3的子系统可通过DesignStart Eval获得。同时,希望开发自己定制化芯片的公司可以使用DesignStart Pro,也就是到DesignStart门户网站上注册,签订一个简单的合同,就可以访问并获得全套的商用化SoC IP资源了。

有了DesignStart,就可以通过最快的通道来实现芯片设计。首先DesignStart可提供快速、简单和无风险技术获取。ARM提供都是经过业界证实的技术。不管是Cortex-M0还是Cortex-M3,都属于世界上出货量最高的Cortex-M的芯片,有几百家公司获得授权并使用它们,已经被几百种不同的芯片系统所采用,总计出货量达到了200亿片,而其中有一半也就是100亿片是在过去两年内完成出货的。

除了IP之外,通过DesignStart还能获得广大ARM生态系统的支撑。在这个生态系统中能看到世界上最庞大的芯片开发人员队伍,从中能获得很多工具以及软件的支持。

物联网设备的主流芯片

Cortex-M0特点是什么呢?就是它的体积非常之小而且功耗极低。有一些物联网设备可能需要在几年的时间里运转,而且仅仅依靠自身所带的电池,Cortex-M0就非常适合这类产品,比如传感式。而Cortex-M3是Cortex产品家族中最为广泛使用的一款芯片,它本身的体积也非常小,可以广泛应用于各种各样嵌入智能设备,比如智能路灯、智能家居温控器、智能灯泡等等。

现在有数以百计基于Cortex-M0和Cortex-M3的产品设计,很多产品都是基于Cortex-M0和Cortex-M3芯片所设计出来的,从而助推了Cortex-M0和Cortex-M3的出货量,也就是每30分钟的出货量就可以达到25万片。

事实上,ARM所提供的不只是Cortex芯片产品本身,还提供很多子系统以及周边器件。这些子系统都是高度可配置的,如果开发者想修改配置,ARM给他们提供大量系统级别的IP来帮助修改。正因如此,新品开发人员只需要专注于开发自己设计产品的差异性。这为他们节约了大量的时间、金钱和精力。

同时,ARM也提供了丰富的软件支撑,比如提供了内嵌的OS。有了这种嵌入式OS就意味着能够实现很多功能,包括提升产品的安全性、片上不同器件之间的连接性,同时OS还带来很多的工具,更易于整个产品的管理。

“我们免除了预付的授权费,这就意味着这些公司可以以非常低的成本和风险进行开发。这极大地帮助了厂商降低他们的开发以及生产芯片的成本,尤其是对于那些创业公司而言,他们能够实现更好的现金流。我们采用只收取版权费的收费模式,能够为进行芯片开发的产品公司带来低成本。可以看到500万单元开发的成本是低于20万美元的。如果客户数量极高的话,我们这边也有非常灵活的收费模式可以配套。” Phil Burr表示。

通往一万亿互联设备之路

孙正义的愿景是未来会有1万亿互联的设备。其中,有的设备是开发商用现成设备生产的,有的则要用定制化芯片。随着芯片技术不断的成熟,未来的定制化芯片将比现在成本更加低廉。对于定制化的片上系统来说,由于是定制化的,所以能够减少板上器件数量,同时也能够降低整个PCB尺寸等。对于最终的客户而言,可降低复杂度、成本、尺寸等。定制化的SoC能够为厂商实现新功能,从而实现产品的差异性。

ARM的一个合作伙伴叫做S3集团。S3集团为自己的客户设计了一款针对阀门控制器定制化芯片。这个产品听上去并不炫酷,但是非常常见的嵌入式智能工业环境工业控制系统典型的案例。其中,耗电方面降低了70%。因为是定制化的芯片,整个PCB的尺寸降低75%,在物料节约方面超过了80%。

也正是因为有了定制化的芯片,使得终端厂商能够去开发新的服务,打造新的收入来源。对于厂商和开发者而言,其成功并不只是因为有这样的一片芯片,更多还有ARM所提供的周边支持技术和软件。

ARM和ARM的生态系统是如何提供这样周边的技术服务,来帮助开发人员进行基于ARM架构的产品开发?

首先,ARM和ARM的生态系统在整个开发过程当中都会提供培训,以及其他类型的支持。开发者可以找到几百种免费或者是收费的ARM的培训课程。可以用DesignStart获得在线论坛的支持,同时ARM还有全球一对一的专门辅导。同时,ARM还提供设计方面的服务,称之为DesignService。ARM可以帮开发者做审校工作,也可以帮助进行子系统设计方面的建议。还有OEM厂家想自己做设计,ARM可以帮他们找到合适的的芯片设计公司。在ARM的生态系统当中,有数以百计对ARM方面技术驾轻就熟的设计公司。

ARM专门有这样一个ARM Approved Design House的项目,经过ARM认证的设计公司都在这里面。同时还有一些设计公司,可以提供已经测试的封装芯片产品,这样就能够加速整个芯片开发的过程。ARM和生态系统提供的软件工具非常丰富,即有免费工具软件,也有收费的专业版工具和软件。

ARM还提供了很多技术文件,其中有论文类型的技术文件,也有指南性质的用以帮助进行手动实际操作。,“如果简单的用一句话来去总结的话,就是ARM提供最为简单、最为快速、已经经过业界验证、成熟的IP。我们为了实现软银孙正义先生所提到的未来一万亿设备,免除了Cortex-M0、Cortex-M3版权的预付费,不管你是一家初创型公司,还是成熟企业,都可以借由ARM的帮助,从零开始进行芯片的开发。同时,ARM也携手合作伙伴提供相应的支撑和培训服务,帮助加入DesignStart的公司进行芯片开发。我们还打造了包含诸多数量的合作伙伴的生态系统,共同帮助实现通往芯片设计成功之路。” Phil Burr说。

“要实现一万亿的数量,就要帮助新公司更方便的获得AMR的IP,要扫除他们做芯片开发道路上的障碍。因此ARM DesignStart项目强调,让芯片系统开发人员通过网络去访问这些技术,只需要点击一下就能够5分钟之内获得这些IP,在几天内实现商业化。所以,DesignStart以非常简单的方式,让开发员获得ARM全套IP,我们认为只有这样才能够把规模做大,实现一万亿互联设备。”ARM计算产业事业部高级营销总监Ian Smythe补充说。(文/宁川)

2017-06-22

(上图为人工智能领域的世界级泰斗、美国伯克利大学教授Michael I. Jordan)

在2017年5月的贵州数博会上,马云、李彦宏、马化腾隔空对话人工智能的方向。马云坚持认为数据为王,而李彦宏则提出数据固然重要但技术创新才是王道。对此,马化腾点评认为李彦宏谈的是从 0 到1,这个过程需要由创新技术驱动,而马云讲的是从 1 到N,这个过程需要持续不断的数据驱动。马化腾则强调应用场景,有了场景自然就会有市场、数据、技术和人才。

在随后6月21日的2017腾讯云+未来峰会上,腾讯云发布了完整的25项人工智能即服务,涵盖基础设施升级、AI框架服务、AI平台服务和AI应用服务。其中的AI应用服务包括人机对话、智能客服、智慧法院、天眼系统、客服质检、智能搜索、舆情服务、智能推荐、智慧会场、直播审核、人脸核身、OCR/MR(混合现实)等12大类场景。

在腾讯高级执行副总裁、社交网络事业群总裁汤道生的演讲中,他强调人工智能的三个关键因素:场景、数据、技术,其中技术涵盖了计算、算法等。他认为智能未来不仅仅是一个设想,而且结合真实的场景,让数据通过AI技术发挥价值。现在,越来越多的客户除了向腾讯云提出了基础设施的需求外,也需要大数据和通过数据所带来的智能服务。

汤道生强调腾讯云是大数据能力的领先者,拥有行业最大规模的计算集群,日采集量达到3万亿条,日实时计算次数超过35000亿次,更在大数据排序的竞赛中打破了世界纪录。腾讯云率先向行业开放了高性能的数据训练,结合腾讯的数据,提供一套完整的智能服务。

腾讯云本身就是从海量计算走向智能化。马化腾说,QQ最早就是一朵云,7年前QQ同时在线突破了1个亿,腾讯云也从此起步。也正是同一年,腾讯启动了具有里程碑意义的开放战略。在这个开放平台打造过程中,合作伙伴向腾讯云提出了海量计算的需求。腾讯云要在短时间内有能力上架几千台服务器给合作伙伴,帮助合作伙伴扛住突发业务压力,为此腾讯搭建了一套可计费的完整的服务体系,从支持数亿QQ用户同时在线的技术架构出发,开启了云计算之路。

在当天的腾讯云+未来大会上,马化腾力邀了几位海内外人工智能界的大拿,其中一位人工智能领域的世界级泰斗、美国伯克利大学教授Michael I. Jordan,在2017年6月蚂蚁金服刚对外宣布正式聘请Michael I. Jordan加盟,任蚂蚁金服科学智囊团主席一职,而前不久刚刚从百度离职的人工智能科学家吴恩达也是Jordan的得意门生。

Michael I. Jordan可谓跨了BAT三家,成为了三家的座上宾。虽然目前他本人没有与百度的直接联系,但如果李彦宏出面邀请的话,相信Michael I. Jordan也不会拒绝。毕竟对于学术界来说,与产业界的沟通与交流也是必须的,如能得到BAT三大家的倾力支持,这颇有点当年合纵连横的意思。

Michael I. Jordan在腾讯云+未来峰会上强调,在当代这代人的时间内,将很难看到人工智能实现人类智慧所具有的灵活性与创造性。人工智能系统只能实现有限的语义理解、有限的应对复杂语言(比如、讽刺等)的能力,以及有限地抽象学习、在现实中寻找新抽象概念的能力,在复杂环境中的应对和根据变化修改计划的能力也很有限。

近期机器学习有哪些挑战呢?Michael I. Jordan指出如下挑战:能够对不确定性做出有意义和可校正定义的机器学习系统;能够做出解释决策的机器学习系统;执行随机推理,以及找出原因;能够追求长期目标的机器学习系统,并在追求长期目标的过程中,主动搜集数据以支持这些目标;可实现实时的执行目标;在不确定环境中的鲁棒性(可靠性);在恶劣环境中的鲁棒性(可靠性);在个人与组织之间共享和分享数据;保护隐私与数据主权。

未来的人工智能将会是什么样子?Michael I. Jordan认为人工智能将像孩子那样,能知道很多令人惊讶的事实、与众不同的洞察力,但却难以真正理解这些事实与观察的结果。“当然,我们肯定不会看到类似超人那样的人工智能,我们这一代人肯定不会看到超越人类智力的人工智能。” Michael I. Jordan强调。(文/宁川)

2017-06-20

201761日到618日,京东商城累计下单金额达1199亿元,累计卖出商品超过7亿件,这在京东历史上,是一个从未达到的新高度,也是一个新的起点。京东集团副总裁、京东商城居家生活事业部总裁辛利军在618日的媒体沟通会上说,“在这个电商行业里面,有的人站在现在的风口上,京东则站在下一轮的风口上,我相信我们会赢得那个位置。”

“能在网上卖家具吗?”

对于电商来说,家居家装品类是一个特殊的品类。网上购买家居家装品类,特别是买家具的最大担心点就是最后一公里配送和安装。2012年刘强东和辛利军聊,刘强东问:“老辛你觉得网上能卖家具吗?”辛利军说能卖,刘强东觉得不太现实。辛利军于是讲,QQ教育了一代用户群,80后的用户已经开始成家立业、成家生子了,他们的购物需求是在网上完成的。

到今天为止,京东的家居家装品类与2012年比,超过接近60倍。“我们只做了两件事情,就是送和装。”今年4月,京东推出送装一体服务,争取到今年年底覆盖更多的城市,买家具可以享受免费送装服务,京东为此做了很长时间准备,4月份已经开始华南实现该服务了,今年618期间也进入了北京。

辛利军表示,“先把送做好,我们是这个行业第一个把大件家具入仓的,今天京东上买一个床垫大概0.7方、接近40公斤,京东选自营床垫可实现上午下单下午送到,这种体验是无与伦比的、任何平台做不到。接下来还有沙发和橱柜,入京东大件仓享受京东211服务,联合我们的配送和社会的力量做到送、装一体化,送完之后打电话预约安装,不用用户动手。”

这样做的结果,就是品类和品牌的升级。2017年,京东新签了意大利品牌SAVIOKartell,他们都选择了京东作为国内首家也是目前唯一的线上销售平台,其中Kartell是现任米兰国际家具展主席的品牌,与京东签约正是因为京东家居家装品类不论从品类管理还是服务方面都做的很好。意大利品牌飘洋过海来中国,国际上非常有名瑞士卢森地板、西班牙乐家卫浴、意大利道格拉斯瓷砖等等,都与京东有非常紧密的合作。

京东还在不断地升级服务。在京东上买机油、轮胎等汽车用品,可以让消费者选择5公里以内的安装服务门店,目前跟京东合作店铺已经超过1万个,在京东买轮胎、机油的同时就可以预约服务。

“直营的独特优势”

京东集团副总裁、京东商城时尚事业部总裁丁霞总结了京东时尚产品销售规律:平均客单价在大促期间不仅没有降,反而上升了30%,这说明京东销售了更多更有价值、更有品质的产品,以阿迪达斯的运动鞋为例,一千块钱以上的鞋子在京东卖的很好。在过去的六个月当中,奢侈品牌纷纷入驻京东,包括手表当中的泰格豪雅、箱包中的RIMOWA等等。

“为什么这么多大品牌,都愿意和京东时尚合作?”丁霞表示,“我们的经营模式在国内乃至于世界上,也是唯一一个存在两种经营模式的:一种直营,另外一种就是平台。大多数友商都是用一个平台POP和品牌合作的,直营是京东的DNA。放到时尚产品这个长尾品类中不是容易的事情,风险性非常高,这就是为什么其他的品牌不选择直营时尚产品。”

“我们认为直营和平台相结合,可以给品牌商更高的灵活度,选择如何在京东上卖时尚产品。有一些大的时尚品牌的中国团队很小,没有办法经营线上的业务,而专门做品牌出身的品牌商,销售不是其长项,京东就帮助经营品牌店。当然也有很多品牌,像阿迪达斯在中国深耕很长时间,在中国有非常强大的团队,愿意自己在线上经营官方旗舰店也是可以的。也有很多的品牌,即跟京东做直营,又跟京东做平台,直营做经典货、平台做产品的丰富性,两者的结合给到消费者都是最好的客户体验。”

通过这些方式,京东开发了各种各样的店铺,比如说线下现在非常流行的买手店。这是一个什么概念?就是通过买手帮消费者选择适合其风格和穿衣服场景的产品,一进去就能很快很高效地买到喜欢的产品。这在线下都不容易实现,线上实现就更不容易。因为线上给用户推海量产品、海量品牌,在手机和电脑面前,看着这么多产品的时候往往不知道怎么选、哪个比较好。“正因为有直营的模式,资深的买手可以帮你组合搭配和推荐,有各种各样风格的、各种各样场景的买手店,帮用户挑出一定会爱上、一定会适合要穿的场景的衣服。所以最近我们推出的线上买手店备受欢迎,转化率远远高于其它的店铺。”

而正因为有了京东的自营模式,就能让京东的时尚产品嫁接到京东强大的物流系统上,能够利用京东强大的物流系统把服装更快、更好地送到用户身边,包括两三万的奢侈产品,一定需要有更好的服务,包括送货员应该是衣冠整洁、服务非常周到,为此京东推出过京尊达,也就是配送员会身穿西装、戴领带和白手套,把几万元的奢侈品按照用户需求送到办公室或者家里。

此外,消费者在网上买时尚产品还是有一点不放心。看起来好,摸起来是不是很好?穿在身上是不是很漂亮?所以时尚品类退换率相对比较高,用户往往因为退货不方便而在买的时候非常犹豫。为了打消大家的顾虑,提高转化率,京东推出了无优退货。“把京东物流方面的优势,在时尚品类发挥得淋漓尽致。一个电话打给我们的物流,就会上门取货,买的时候再也不要犹豫尺寸是不是合适,衣服摸起来手感是不是想要的。”

“通过京东优势,围绕京东客群的高端性做时尚品类,这是一个差异性的经营,也符合整个消费升级的一个趋势。”丁霞认为。

生鲜“冷与准”的背后

与家居家装和时尚品类不同,生鲜是另一种“极端”品类。京东生鲜从20161月份成立,到今天已经有超过10万个SKU,经营的品类涵盖了海鲜、水产、水果、蔬菜等,包括冻品、肉类、禽类、蛋类等等,几乎和百姓餐桌息息相关的产品都能在京东买到。

京东集团副总裁、京东商城生鲜事业部总裁王笑松说,为了支持生鲜业务的发展,京东成立自营的冷链物流团队,涵盖从零下30度到常温的全温层配送,已经在270个以上的城市冷链物流都能够覆盖到了。“从20161月份成立到今天,应该说整个部门,无论产品的丰富度还是从物流冷链的覆盖范围,都有非常大的增长。”

“我们的一个目标,是希望做到中国最大、最安全的生鲜销售平台。为了实现这个目标,我们现在已经在做的就是推出全程的冷链。在京东购买生鲜产品,供应商的库房到京东库房一定是冷链配送,我们收货会测温,京东的冷链库房里面有24小时温度监控,京东的库房到配送站也是全程冷链,从配送站到顾客的家里这一段是自己采购的保温箱,保温箱里面有冷板,确保用户收到生鲜产品的时候不会脱冷。”

此外,京东还推出了京准达服务。消费者购买生鲜的时候,有时候配送时间不太好把握,比如家里没有人,但生鲜产品送到家门口,配送员很难放到家门口就可以离开,所以京东做到可以根据消费者选择的时间进行配送。在生鲜冷链上,不仅配送速度快,更重要是时间上的准确,生鲜也推出专属客服。

在品质溯源方面,京东生鲜也做很多的工作。在618之前的那一周,京东云平台和Y事业部一起宣布帮助合作伙伴,把种植和养殖环节所有的数据送入云端,消费者在购买京东产品之后扫描二维码就能知道源头在哪里、什么时候种植、什么品种、有没有用化肥、有没有打农药等等,每一个环节非常清晰可见。为了确保京东生鲜每件产品安全放心,京东冷链库房还专门设立了实验室,对每一批供应商的货进行抽检,现场检验有没有超标,如果超标就全部拒收,还有无理由赔付,都与专属客服密切关联在一起。

与京东时尚类似,在京东购买的生鲜产品,收到之后如果发现对产品不满意或者有问题,提交售后申请之后,就会有专人联系,不需要把生鲜产品寄回给京东,京东就把钱退给消费者。这是独家推出的京东生鲜客服升级项目,目前已经上线三个多月了,效果非常好。王笑松说他经常收到朋友发来的微信和短信,提到使用这个服务之后带来的超出期望的体验。

如何赢得下一个风口?

“品牌和品质都跟着京东大平台一起走,我们当然能赢。”辛利军如是说。

京东数据研究院院长刘晖在618媒体沟通会上介绍,为了把从61号一直到618日媒体沟通会时,用户所购买的商品配送到用户手中,京东的快递员一共要走超过3亿三千万公里。同时京东无人客服,帮助用户了解整个的订购流程和解答问题,替代很多人工的劳动,也为用户节省了很多的时间。

京东还在开发更多的自动化和智能化技术,提升京东整体的运营效率。京东X事业部总裁肖军介绍了今年618和去年双11618的京东无人机进展。

随着无人机逐渐落地,今年618也落地了京东第一个无人机运营中心,未来这个运营中心将负责京东全国所有无人机的调度、管控,目前无人机运营中心落户在江苏宿迁。京东现有三类无人机,分别是旋翼类电动无人机、旋翼类四轴无人机、垂直起降固定翼无人机,适配不同载重、不同里程的服务。

2017618日上午,京东在人大开始实验性用机器人送货。随着配送机器人的实验和落地,未来京东的配送机器人会承担校园配送,也会承担办公楼、封闭式园区等场景配送。

说到了无人机、无人车,还有一个服务机器人用户看不到,这就是在背后默默付出的仓储类机器人,随着去年京东几款机器人研发的成功,现已经有小批量的量产,并在京东的北京、上海、武汉、济南等地仓储开始落地性运营。未来一段时间,京东将增大产能,以服务于更多的仓储,甚至还会把京东机器人的服务能力开放给社会。

随着这些机器人不断的落地和参与到京东的仓库与生产,未来京东的仓储运作效率将大幅提升,穿梭类的机器人单位存储容量是现有单位存储容量的十倍,更多搬运机器人会减少很多操作人员在大型仓储里面每天的跑动和走动,也会大幅降低劳动强度,提升整体运营效率。“现在有些机器人的效率是人类的十倍,甚至二十倍。”

随着技术的攻克,很多京东技术也应用到其他的行业。京东5月份建立了中国第一个植保无人机的联盟,吸引了很多无人机的企业服务于整个植保行业。无人机的植保效率是人工植保效率的3050倍的,而且能大幅降低运作成本。随着老龄化的加重,未来更多的黑科技高新科技将参与农业,京东无人机以及未来研发的其它农业产品,也会服务于农业。

无人车技术加上图象识别技术,以及热成像技术和AI技术,能够配合人工去完成更多工作,比如巡查不到的房顶,京东也有空地一体化的巡检机器人。618之后,空地一体化巡检类机器人会逐渐落地京东园区,也会给相应的合作伙伴提供安防消防解决方案。“随着黑科技融入到生产生活当中,未来也会服务于整个京东和整个物流行业。”

当然,随着京东的强势崛起,京东集团3C事业部总裁胡胜利也强调刘强东送给3C事业部的九个字:永谦卑、不作恶、求共赢。“对于品牌供应商,不论京东占比有多高,必须是永谦卑、不作恶、求共赢。”

今年京东618整体反映了品类都在围绕着品牌、品质和服务的升级。“后面的市场更大,机会也更大,也有更多消费者在等着京东的服务。相信我们会做的更好,会满足京东用户的需求。”辛利军的声音,代表了所有京东人。(文/宁川)