国家发展和改革委员会主管   国家信息中心主办

财经界

您的位置:首页 > 财经界杂志 > 2017年第七期 > 封面文章 > 正文

最大突破:基于大数据的AI

摘要:大数据为社会带来的变化已经远超过我们的想象,谁也不知道明天还会有什么惊喜发生

在人和物加速互联的全球信息化背景下,以及我国转型升级关键时期,数字经济对我们经济发展具有的重要意义不言而喻。

《“十三五”国家战略性新兴产业发展规划》,首次把数字创意产业纳入战略性新兴产业范畴,计划到2020 年数字创意产业相关行业产值规模达到8 万亿元,这就意味着,未来平均每年需要增长70%,远远高于其它行业。

国家信息中心研究员、中经网副主任朱幼平已经专注信息化研究三十余年,他在接受本刊记者专访时指出,要达到8 万亿元的产业规模虽然有一定难度,但放眼全国各地,发展大数据积极性都较高,行业应用也得到快速推广,市场规模增速明显,国家和政府应乘势而为,以宽容的态度进一步引导行业的未来发展。

未来已来

几年前,大数据还是专业领域里的抽象概念;如今,它已在切切实实地改变着人们的生活,改变着经济、社会发展的轨迹。

就拿生活中最简便的应用来说,无论是出门用手机地图导航,还是扫码骑共享单车的智能出行,多数都与大数据相关。而基于大数据的个性化医疗服务和具有弹性学制、个性化等特点的教育,以及无人驾驶等,三五年前还被认为是“天方夜谭”,现在都在日益成为可以触摸到的现实。

正如中国工程院院士、中科院计算所研究员倪光南在2017 中国国际大数据产业博览会上描述的那样:“大数据为社会带来的变化已经远超过我们的想象,谁也不知道明天还会有什么惊喜发生。”

的确,大数据的价值已经毋庸置疑。《“十三五”国家战略性新兴产业发展规划》首次把数字创意产业纳入战略性新兴产业范畴,计划到2020 年数字创意产业相关行业产值规模达到8 万亿元。

“大数据从权属角度看,就是数字资产。”朱幼平说,互联网飞速发展,产生了大量的信息,人、物加速互联,整个世界已经高度信息化,进入大数据时代。

另外,资产数字化也在飞速发展。比如,比特币、以太币等数字货币是最为人们熟悉的一类数字资产。目前各色各样的数字货币大概有300 多种,市值约120 亿美元。未来央行会发行法定的数字货币也是一种数字资产,智能股票、智能债券也是数字资产。朱幼平认为,除数字货币、数字股票、数字债券外,数字资产的范围比这要大得多,包括所有数字化了的资产,比如数据、专利、版权、创意、信用等知识文化资产。更广义的还包括实物产品以数字权证形式存在的形态,比如商场购物卡、房产证等。

破解人工智能困境

聚焦现在这个时间点,大数据取得了怎样的发展成果?朱幼平认为,目前看来,最大的突破是基于大数据的人工智能(AI)。或者说,以深度学习为代表的人工智能技术之所以能取得突飞猛进的进展,正是得益于良好的大数据基础。

AI 诞生于1956 年达特茅斯学院(Dartmouth)的探索问题解决和符号化方法等科研项目课题,但人类在推进AI 的研究一度遇到了巨大的障碍,最后几乎绝望。

以机器翻译来说,语言专家必须不辞劳苦地编撰大型词典和与语法、句法、语义学有关的规则,数十万词汇构成词库,语法规则高达数万条,考虑各种情景、各种语境,模拟人类翻译,计算机专家再构建复杂的程序。最后发现人类语言实在是太复杂了,穷举式的做法根本达不到最基本的翻译质量。这条道路最后的结果是,1960 年代后人工智能的技

术研发停滞不前数年后,科学家痛苦地发现以“模拟人脑”、“重建人脑”的方式来定义人工智能走入一条死胡同,这导致后来几乎所有的人工智能项目都进入了冷宫。

这种困境一直持续到计算机“深蓝”出现。1997 5 11 日,国际象棋大师卡斯帕罗夫在和IBM 公司开发的计算机“深蓝”进行对弈时宣布失败,计算机“深蓝”因此赢得了这场意义深远的“人机对抗”。

朱幼平指出,“深蓝”不是靠逻辑或所谓的人工智能取胜的,而是靠超强的计算能力取胜。去年Alpha Go 大胜李世石的人机围棋对战更进一步印证了大数据的巨大威力。

移动互联网、物联网等技术的发展让我们拥有了以往难以想象的海量数据,尤其是在某一细分领域更深度的、逻辑化的数据,而这些都是训练某一领域智能的前提。从软件时代到互联网,再到如今的大数据时代,数据的量和复杂性都经历了从量到质的改变。

人机对战只是其中一种,它属于已有实质性突破的计算型的AI。朱幼平说,还有一类是感知型的AI,人脸识别、语音识别都属于此类。“有了足够大的信息量,别管是导航、理解话语、翻译语言,还是识别人脸,或者模拟人类对话,都可以让机器来做。未来基于大数据和机器学习基础上的人工智能达到比较流畅地模拟人类对话,就是人类可以和机器进行比较自如的对话。”

而随着人工智能技术进展,数据采集、清洗、建模、分析、可视化等都有了突破性进展。朱幼平认为,两者的融合发展,将释放出更多的市场潜力。

麦肯锡预计,至2025 年人工智能应用市场总值将达到1270 亿美元。在未来10 年甚至更久的时间里,人工智能将是众多智能产业技术和应用发展的突破点。随着人工智能被写入“十三五”规划纲要,有预测说我国人工智能市场规模2018 年将突破380 亿元。

大数据典型应用

朱幼平认为,我国大数据产业虽仍处于起步发展阶段,但各地发展大数据积极性较高,行业应用得到快速推广,市场规模增速明显。有研究称,2015 年我国大数据市场规模为115.9 亿元,增速达53.10%

从行业应用情况来看,已经涵盖投资机构采用的量化投资、银行贷前和贷后风控、出行线路优化、精准营销、健康管理、犯罪预测等内容。而从更加具象的角度看,朱幼平还列举了全球大数据应用的几个典型案例:

自动驾驶汽车。一辆自动驾驶汽车每秒会产生100G 的数据。特斯拉用机器学习AI 技术,从它的自动驾驶汽车那里收集的数据越多,就越能改进自动驾驶技术。特斯拉第一季度只卖出了2.5 万辆车,但目前市值比卖出230 万辆车的通用汽车还高。UBER、滴滴打车等目前我国流行的共享单车,未来有可能由无人驾驶代替出行等,都是大数据典型应用。

PRADA 试衣间。PRADA 在纽约的旗舰店中每件衣服上都有RFID 码。每当一个顾客拿起一件衣服进试衣间,RFID 会被自动识别。同时,数据会传至PRADA 总部。每一件衣服在哪个城市哪个旗舰店、什么时间被拿进试衣间、停留多长时间,数据都被存储起来加以分析。如果有一件衣服销量很低,以往的作法是直接下架。但如果RFID 传回的数据显示这件衣服虽然销量低,但进试衣间的次数多,也许在某个细节进行微小改变就会重新创造出一件非常流行的产品。

遥感卫星。采用遥感卫星,通过图像识别,把所有的耕地标识计算出来,然后把耕地网格化,对每个网格的耕地抽样进行跟踪、调查和统计,然后按照统计学的原理,计算(或者说估算)出整体粮食数据。这种做法是典型采用大数据建模的方法,打破传统流程和组织,直接获得最终的结果。炒股票。2011 年好莱坞电影《永无止境》中,落魄的作家库珀服用了一种可以迅速提升智力的神奇蓝色药物,然后他将这种高智商用于炒股。库珀能在短时间掌握无数公司资料和背景,也就是将世界上已经存在的海量数据(包括公司财报、电视、几十年前的报纸、互联网、小道消息等)挖掘出来,串联起来,甚至将FacebookTwitter 的海量社交数据挖掘得到普通大众对某种股票的感情倾向,通过海量信息的挖掘、分析,使一切内幕都不是内幕,使一切趋势都在眼前,结果在10 天内他就赢得了200 万美元,神奇的表现让身边的职业投资者目瞪口呆。这部电影简直是展现大数据魔力的教材性电影。

找对象。如果碰上一位心爱的姑娘,大数据系统就像算命系统一样,根据双方海量数据的挖掘,告诉你和姑娘匹配指数是多少,告诉你全球类似情况的夫妻日后离婚概率是多少,低于某个匹配指数,大数据系统会慎重建议你认真考虑不要这个姑娘继续交往下去。门当户对有了数字化解决方案。

宽容式引导

霍金曾指出未来100 年中,人类将面临比人类更聪明的人工智能的挑战。人工智能机器人如果产生了意识,那么人类最终会被机器人吞并掉,一如最近上映的《异形:契约》给人类带来的恐慌。朱幼平并不担心霍金所说的AI 将毁灭人类,“还很遥远。现在不是担心谁控制人工智能的时候,而应该担心人工智能是否能被完全控制住。”

因此,谈到如何引导和规范大数据+ 人工智能的发展问题,朱幼平主张更加宽容的方式。“不要有任何条条框框,有点泡沫也不怕,大方向肯定是对的,新的行业必须大胆试错。”

“一些企业如果死掉了,也是有价值的牺牲。”朱幼平说,但在如何处理好数据开放和保护隐私的问题上,这是政府要发挥作用的地方。他同时提出了几点具体建议:

首先可以设立国家级的AI 实验室,以举国体制搞研发,我国不能在这个人类未来发展方向领域落伍。

其次,建立政府引导基金,作为母基金,通过PPP 等,设置杠杆机制和风险保障机制,把我国堆积在房地产、金融领域的资金引流到这个领域。

第三,编制行业标准和技术标准。

第四,制定国家数据安全和个人隐私安全法律法规。

第五,加大公共基础设施建设,比如数字版权公共服务平台、北斗卫星建设与升级、5G,以及公民和法人数据库、空间地理信息系统、信用信息系统等。

《“十三五”国家战略性新兴产业发展规划》提出,计划到2020 年数字创意产业相关行业产值规模达到8 万亿元,未来平均每年需要增长70% 才能实现,难度不小。

朱幼平因此还从产权方面提出了一些可行性措施,比如要加快区块链技术的研发和可信网建设,打击侵权盗版,保护知识产权,积极推进从信息互联网向价值互联网的变革。同时,加快DCI(数字版权唯一标识符,Digital Copyright Identifier)公共服务体系建设,把版权登记、审核、发证、保管、交易、存证、维权、监测、评估、咨询等政务服务搬到网上,推进版权线上公共服务。