和谐

您现在的位置是:网站首页 >和谐

大数据时代的政府行政管理创新(上)

浏览次数:384      日期:2017-11-10

大数据时代的政府行政管理创新(上)

孟庆国

清华大学公管学院党委书记、教授

各位学员大家下午好,今天我们交流的话题是“大数据时代下的政府行政管理创新”。这个话题,其实在目前很热,不管是大家对政府改革的关注该是对大数据的管注,这两个热点问题通过咱们这个题目就交织在一起了。

今天我们来讲,先看一个小例子。在去年的1231号,上海外滩发生了一个非常严重的踩踏事件,这个事件对政府的管理和在应急措施,大家进行了非常系统的反思。其实对这个在他事件的发生来说,从我们现在很多的技术手段来看,我们完全是可以事先预测和掌握的,如果我们有大数据思维、有大数据的一些理论方法的话。

这个表,大家能看出来,是对公众出行行为的分析,就是利用手机基站的切换数据,就是你在一个地方打电话,这个基站会捕捉到手机的信号,基于这个,我们就可以把每一个人的位置进行分析。如果我们从早上的五点十分到上午的八点十分进行采样的话,你会发现一个城市、一个区域会他出现一个聚集化的过程。早上上班的时候,可能大家都是从周边聚集到这个城市的中间来,所以会形成我们说的这个出行行为的分析图。就像我们在PPT上所看到的一样。

基于这个方法,我们可以反述1231号晚上踩踏事件前后的数据反映出来的一些情况。这张PPT上大家可以看出,一个是我们说的在1231号前后每天的数据量的变化,基于手机基站所记录的公共出行情况,从地图的表上能够看出,1231号这个时候,当天晚上,人是越来越多的,数量变化的非常快,那我们可以用不同的颜色来区分。比如说红色已经达到了一个预警的状态,如果我们事先有这么一套分析手段的话,那我们采取一些应急的措施或者是采取一些防控手段是完全可以的。但是很遗憾,我们没有充分的利用这些数据,最后导致了非常严重的一个踩踏事故的发生。

从这种踩踏事故上来讲的话,我们就可以和今天咱们要讨论的话题联系一起。经过这次踩踏事件之后,大家反思政府管理,我们要不要依靠一些技术类的手段,依靠一些大数据的手段,来分析我们所面对的一些管理问题。基于这么一种方式,我们来看看我们所处的一个技术环境,包括我们所面对的管理的一些数据信息是不是足以让我们能够形成一些好的管理方式,形成一些应急管理措施。

那从我们的互联网发展到今天来看,由于互联网的广泛深入使用,数据在疯狂的产生。不管是基于电子政务这种组织形态的数据,还是基于网络层面的,比如说基于微信、微博的大家进行社交、交流的数据,还是在城市里面运用信息化的采集设备,包括摄像头等所产生的这些机器数据,还包括大家在日常的各种行为里如刷信用卡、网上购物等交易性数据。你会发现,这四类数据越来越成为咱们今天面临我们这种网络普遍使用而一些数据资源。如果我们对这些数据资源加以很好的分析和使用的话,我们运用大数据的思维、大数据的理念、大数据的手段、大数据的方法,那对于促进我们政府的行政管理会带来非常大的一种便利,或者来讲的话,会改变我们原有的一些管理手段和方法。

所以今天主要是跟大家来交流三部分内容。第一部分,我们先来看大数据是怎么产生的。第二部分是大数据具备什么特征,尤其它会引发什么样的管理变革。第三部分是跟大家探讨一下大数据时代如何来推动政府管理的创新。

一、大数据是信息技术发展的必然结果

我们先来看看第一部分,大数据是怎么产生的。我们之所以要避免像上海外滩踩踏事件的发生,我们能不能利用日益快速增长日益疯狂产生的这些数据?大数据是怎么里的?通常,我们可以从三个方面来理解。信息技术发展到今天,我们在使用的信息技术的产品,我们所处在的网络环境,以及我们在运用这些网络数据处理的方式、获得计算的方式,来认识我们当今所处的技术和数据环境的变化。基于这么一个变化,我们可以看出来,信息技术产品不断的在演化,从原来我们的行政管理中利用计算机到今天,你会发现我们这种形态完全发生了变化。

我们可以依托城市里道路口的图像采集设备来分析交通的情况,来引导交通的情况,我们可以利用手机来了解网络上人员的情况,了解大家的一些出行行为等。这些东西都是由于信息技术的不断发展,给我们带来了非常丰富的一些信息技术产品,这些产品,不管是从政府的管理角度来说,还是我们日常的生活角度来说,给我们提供了非常大的便利。

这里边有几张图,可穿戴式设备,就像谷歌的眼镜、苹果的手机一样,将来可能就像我们现在用的这种电脑和手机一样,越来越普及。那这种可穿戴式设备给我们带来的便利跟以前是完全不一样的。

包括我们日益面对的网络环境的变化,从原来计算机的网络逐渐的和通信网络相融合,而且通信网络越来越和这种感知设备相结合,所以就形成了移动互联网、形成了物联网。那不管是移动互联网也好,还是物联网也好,和传统的计算机这种网络所带来的使用形式完全不一样,那带来的一些管理和服务的模式也越来越不一样。比如说移动互联网是由于手机的普遍使用、是由于这种智能终端的普遍使用,这种网络形态更具泛在化,更具随意性,不受时间、地点、空间的限制,给大家带来非常大的便利。

另外,像物联网是在原有的互联网基础上,进一步的扩展了感知的功能,我们可以利用摄像头来采集道路上的车辆情况,来感知一个社区里面的街面情况,我可以对这些情况就可以做出判断和分析,特别是在一些紧急事件发生的时候,我可以去捕捉一些信息,进而为我们的引导、管理带来非常好的支撑手段。这是物联网所带来的一种便利。

随着网络形态的不断演进,移动互联网、物联网自身的网络形态也在不断的相融合,所以将来我们面临的是一个越来越泛在的时代,越来越有感知的时代。这种东西使得我们的网络不断的在演进,特别是我们由于社交媒体、由于手机的使用,我们进入了一个web  2.0的时代,现在我们进入到了物联网时代,很多人又说我们进入到了一个web 3.0的时代。web3.0是什么?我们叫大互联的时代。它是人和人之间可以通过手机、智能终端、计算机进行信息的交互。不仅如此,人和物质世界之间、物质和物质之间可以全面的互联,可以进行精确的感知,甚至可以进行准确的表达,可以进行自动化的解读。所以我们说人类在推进互联网技术应用发展到今天这一步,我们已经从web1.0迈向web2.0,进而迈向web3.0的时代,这是我们所处的网络环境的变化。

那如果我们把网络环境比作我们的道路运输体系的话,那在道路上行驶的车辆就是我们的数据,就是我们的信息,交通的基础设施不断的发生变化,相应的我们在道路上所进行的交通的管理,进行的车辆的调度这方面要花费的非常大等,这方面要发生非常大的变化。也就是信息的处理方式要不断的演进和发展。就像我们说不管是人和人和之间互联、人和物之间互联还是物和物之间互联,如果还是用原来的一种数据处理的方式的话,显然不能够真正的体现网络到今天所产生的一种价值。所以网络发展到今天,相应的计算模式也进行了变化、进行了发展,所谓的云计算的概念就被推出来了。

所谓的云计算是什么?通俗地来讲,它是分布式的,是一种网络化的,不再是基于我们传统的一台电脑就来处理你自己的信息一样,你单位的信息化,你建你的数据库,你来处理你的业务系统、处理你的数据一样,它一定源源不是这么一回事儿了。既然各个单位、我们每一个社会的群体都联到网上来了,那大家彼此之间应该是一个共享的、分布式的,那我们一切的软件、一切的服务甚至一切的数据和信息可能都是分布式存在的。

举一个例子来讲,就像我们用的水一样,原来我们用的水是每一家里挖一口水井或者家里边有一口水缸,那构成了我们生活用水的一种方式。随着城市化的进程,水缸或者每一家打一口水井的模式已经不能够适应城市生活的需要了,我们开始怎么办,我们能不能建构一个自来水的网络?我在家地面,只要把水龙头一开,水就来了,那对我用户来讲,我可能不关注这个水是怎么产生的、水是从哪个地方来的,我只关注我在用的时候,有这么一个水龙头,一打开,水就来了,能够满足我这种需求就OK了。

也比如说咱们家里面的这种煤气一样,原来我们都是一个煤气罐,现在来讲的话,通过一个煤气固用的网络,我家里面的阀门一打开,我就可以做饭了,是一样的。就像电也一样,我们也没必要自家建一个发电厂,也没有必要自家建一个发电机,那这个时候,我只需要插头一插,或者是开关一开,我的电就有了。那这种供电、供水、供气的方式就是分布式的方式,或者就是网络化的方式。我们也可以形象的理解云计算就是这么一种模式,所以我们说云计算在数据、信息,甚至你的服务、软件上都是分布式的存在的。我们不求对这些分布信息的所有,我们但求所用,用的时候我能够获得到就OK了。

就像我们现在每个人大家有什么样的需求,或者是领导交给你一个任务,我们往往第一选择就是在网上打开百度,用搜索引擎来搜索一下。关键是这一搜,想要的东西就来了。和以前不一样,我记得以前我们上学的时候,看到好东西都往自己硬盘里存,都去拷贝,现在来讲的话,我们都是在网上搜索那搜索引擎其实就是计算方式的一种非常重要的方式。云计算的到来,可能在这些方面给我们带来一个非常不一样的方式,这种方式也影响着我们的一些服务模式的提供,影响着我们管理模式的提供。因为我们来讲说信息资源这种方式来讲的话,将来用在我们的政府管理中,你会发现我们这些数据、信息资源,会按照社会或者是按照用户的需求进行分配,就像供电、供水一样。

那简单的小结一下,那我们说大数据是怎么来的?其实大数据是新一代信息技术发展到今天的一个集中的体现。这里边,信息技术产品不断的演化,所谓便携式、智能化、交互性、随性化、移动性的产品越来越丰富,和大家的生活、工作,和咱们的组织运营等越来越密切相关。第二方面,就是网络环境不断的往前演进,不断的在融合,所谓的移动互联网已经成为一个普遍存在的形态。那物联网也慢慢的走进了我们的生活,成为我们政府管理非常重要的一项网络设施。你会发现,这时候的网络越来越融合,越来越泛在。所谓的泛在,什么意思?无所不在。不管任何时间、任何地点、我干任何事情,大家看,我都可以通过网络这个平台来搜集信息、处理信息、交流信息,甚至分享信息和使用信息。计算方式,就像电和水一样,我们任何时间、任何地点,我们只要想用,我们随时都可以来获得到,不管是通过网络搜索引擎还是通过大数据的一些平台。我们说信息技术发展到今天,这种信息技术产品、网络环境、计算方式的变化,它深刻的影响了互联网的一种应用形态和模式。那也是基于这种广泛深入的使用,大数据的概念,我们也给大家提出来了。所以来讲,大数据是怎么产生的,大数据是这么来的。所以大家要理解大数据这么一个技术性的概念的话,可以从这个方面来把握一下,以便认识大数据的一些基本特征。

二、大数据的特征及引发的管理变革

第二个方面我们来看看大数据有什么特征,以及大数据能给我们带来什么,它引发什么样的管理改革。这是我们要思考的,或者我们今天交流的比较核心性的内容。从三个方面来讲,一个是我们先看看大数据的特征,第二个是基于大数据的管理创新是什么,第三个方面是基于大数据的管理创新,这种创新的模式和以前有什么不一样。这样的话,对于我们思考政府的变化问题上就来的非常有帮助。

(一)大数据的特征

所谓大数据的特征,一般意义上来讲是四个方面的特征。第一,体量大。大数据是不是很大?这个“大”是体量很大。大数据的规模很大,所以又叫海量数据。举例来讲,就像我们城市管理中,满大街的图像采集设备,包括交通管理中的图像采集设备,它是一天24小时、一年365天都在记录信息。一般的城市,摄像头的数量都在几十万以上,像大一些的城市都在上百万,甚至两三百万。大家可以想象,一个城市如果有两百万个摄像头每年24小时记录着我们运行的状态,一年365天都在记录,汇总起来这个数据量有多大?这就是大数据的含义。

大家也可以想一想,我们每天用微信交流和沟通,每天我们跟一个人交流的量有多大,我们会发多少、转播多少、评论多少,我们有6亿的手机用户,那这6亿里边,我们说2亿用户用微信,大家可以看看这个量有多大。所以说来讲之所以称为大数据,是由于这种技术产品、由于我们的网络形态、由于计算方式和以前远远的不一样,使得我们数据的产生也和以前远远的不一样,所以我前面用的是叫“疯狂的产生”,这就意味着数据产生的速度是非常非常快、量是非常非常大的。

第二个来讲的话,大数据多样性的特征。所谓多样性,我们现在面对的数据不像以前了,比如说档案管理可能都是一些文本资料,我们统计上都是一些数字的资料,但现在你会发现,我们现在网络日益泛在、使用日益广泛的情况下,那数据的类型就多样化了。比如说我们传统办公自动化流转的信息都是一些文本的信息,我们的交通管理里面通过摄像头所采集的信息都是图像的信息,甚至是一些视图信息。统计上用的数据我们说是结构化的,这些图像信息是非结构化的,我们利用统计手段分析一些数据信息可能来得很容易,但是我们用一些传统的统计手段分析一些图像的信息、视频的信息,来得就比较麻烦。就像我们在街上跑的一辆车,我们把车牌给它抓拍下来,我们能对车牌进行识别,把它转化成我们机器可读的东西,这里边需要专门性的技术才能做到,我们说这些数据是非结构化的。结构越来越复杂,就面临着处理这些信息就和以前完全不一样。

第三来讲,什么那,价值密度。你会发现我们的量很大,但是这些量里面,真正的对你管理、对你的服务有用的东西和有价值的东西,你会发现它的密度可能很低。这里边我举个例子,比如2012年的“周克华”事件,这是一个非常恶性的事件,他连续杀了很多人。公安部门想从有限的信息里面获得一些重要的信息,以便能够对周克华事件进行非常好的处理。大家都知道,当时重庆市公安局得到了他的手机信息,知道他在某一个区域历出现过。那为了把他的活动轨迹给掌握清楚,我们靠什么?因为他手机用得少,短信的数量也很少。我们大街上的摄像头是一个非常重要的信息源。基于他出现的地方,我们公安部就开始画全,一公里、两公里、五公里范围内所有的摄像头采集的图像信息,我们都要进行分析。当然了,我们那时候分析手段比较落后,没有好的办法,靠什么?就靠人工。那方圆一公里的摄像头,我们要重点看,三公里的摄像头,我们稍微粗一点的看。但是这个量很大。就像摄像头拍一个小时,你人工正常看的时候,你至少得看一个小时你才能看完。所以这个量是很大的,我们没有很好的处理方式,只能靠人。据说重庆市公安部门调集了两三千名民警到一个宾馆,关起门来,大家来看这个视频。当然,我们可以通过快进快倒的方式来捕捉里面的信息。好不容易看了几天,发现了这个信息。就一个路口,周克华这个身影一出现,也就两三秒钟的信息。大家看,这么多的视频信息,我们最后想要的就是这两三秒的信息,想一下这个价值密度,就是对拘捕周克华这个事件来讲,这么大的事情量,就为了两三秒的信息,价值密度非常非常低,但是又非常非常重要,没有这个东西,我们公安部门的干警就很难事先做一些埋伏,很难最后他出现的时候就把他给击毙了。

第四个特点就是,速度。就像一个摄像头一样,一个摄像头一天24小时的在拍,速度很快。如果从一个城市来讲,大家看我一个车辆在道路上行驶,我第一时间要拍下来,我要对车号进行分析,分析出可识别的信息后,我要到库里去比对,比对的结果要反馈到指挥中心,指挥中心来讲还要把结果送到我们最近的民警的手持设备上。大家看,这个速度一定要很快。否则的话,等你人再过去,车辆已经跑远了。所以是本身这个产生的数据很快,让我们分析、处理应对的时候也要很快,所以这就是大数据给我们带来的一些特征。

(二)基于大数据的管理创新

那基于这些分析,我们来看看大数据从管理变革上能给我们带来什么。其实从概念上很好理解,我们说大数据的数据量很大,它的数据类型又非常复杂,本身速度产生的又非常快,在这种情况下,我们怎么样发现数据的价值,或者是发现数据仅有的那些价值,是我们大数据的一个非常重要的手段,或者来讲大数据真正的意义和价值就体现在这个地方。那我们来看看基于大数据的管理创新有哪些。怎么样通过大数据的这些价值使我们的管理服务得到一个提升?

第三个方面来跟大家做一些论述。一方面是数据驱动创新应用。原来没有数据,现在有数据了,我靠分析数据就能够捕捉到新的东西、有一些新的发现,对我们的决策也好,对我服务对象的需求也好,来得更加便利。第二个方面,我们说用户行为驱动着创新。第三,实时分析与智能处理。

我们先看第一个,数据驱动创新是一个什么样的含义。举一个例子,比如说在谈到大数据应用的时候,有这么一个比较经典的案例,就是大家讲的谷歌利用它的大数据技术,对使用谷歌的搜索行为进行分析,分析之后它就能够发现在全球哪些地方会发生流感及流感的传播情况。据说,它通过它的搜索引擎对客户搜索行为的分析,能够准确的预测流感这种传染病发病情况以及传播情况。据说,它这种预测比美国CDC(美国疾病控制中心)要来得更加准确,而且更加及时。谷歌他预测出来这种疾病发病的情况,往往比美国CDC所做出的专业分析要早两周的时间,所以它可以发现得很及时、很早,另外,它的判断很准确。那我们可以思考一个问题了,谷歌是一个IT公司、一个网络公司,它不是专业的疾病控制机构,美国CDC是一个专业性的疾病分析、预测控制机构,那为什么在这个大的技术环境下,CDC这种专业机构变得很落后了,而IT公司反而变得很及时、很有判断力,这到底说明了什么?

我们可以简单的来分析一下,我们可以说谷歌有了它的大数据平台,它可以对用户的网上行为技术分析。比如说我的身体不舒服了,我的第一选择可能不是到医院去,我首先在网上搜索一下,我看看我这个症状是一个什么样的原因所导致的。那我这种身体不舒服,我要用什么样的治疗手段或者是我吃什么药能够缓解?往往大家都是先在网络上搜索一下。如果说自己对自己的症状了解得比较清楚的话,那他可以通过网上购物或者是网上购买药品、网上咨询的方式来获得一些治疗手段,往往是等人的症状非常严重、坚持不下去了,可能才会到医院去。谷歌基于这些网络关键词的分析,就可以判断一个地区在某一个时刻,是不是大家共同关注某一方面的特征,共同关注一种传播情况。基于这些情况的分析,它就知道这个地方是不是有传染病爆发、传染病爆发是不是已经开始传播了。

那美国CDC为什么会落后两周?因为美国CDC就像咱们国家的疾病控制一样,它对传染病的预测分析基于什么?基于门诊。是基于患者到医院去就诊,基于这些就诊的记录,汇总起来、统计起来做分析,看看这个地方是不是传染爆发了、传播的趋势怎么样。那从这个意义上来说,我们说这个之间有一个时间差,那谷歌来讲利用它的网络平台,可以第一时间做出快速准确的分析,而咱们的疾病控制中心要通过门诊数据的汇总,到最后结果出来,差不多正好是两周的时间。这是什么?就是说我们有了数据,就可以有新的发现。就像谷歌一样,它不是一个疾病专业机构,但是它有了用户搜索行为的数据,它就对这些用户行为进行分析,分析完了之后,然后就知道了传染病的传播情况。这叫数据驱动创新。

就像我们说的在我们国家的一些地方,我们利用政府的数据,利用一些网络的数据,可以分析艾滋病分布的情况一样,我们传统上对艾滋病的掌握情况是基于咱们的医疗统计部门。实际上我们说有相当一些艾滋病人,他可能不愿意到门诊去,不愿意把自己的这种情况告诉别人,因为这里面有隐私问题,有一个恐慌的问题,甚至有一些艾滋病本身的携带者,他自己也不知道自己是不是感染了。所以单凭我们政府医疗统计部门掌握的信息,可能我们还不足以统计和分析艾滋病的分布情况。如果我们把网络数据加进来的话,比如说大家在网上的搜索行为,在购物网站上的购物行为,如果我们一些网站分析起来的话,可能个人隐私这个行为会在网上表现出来,通过在网上搜索这种关键词的分析,网上购物行为的分析,我们就知道这个人是不是有类似于患上艾滋病的相关症状和身体特征的数据进行分析。把这两类数据汇总起来,对于我们相关的部门来了解艾滋病的发病情况来讲,就有非常大的意义。

也包括来讲我们有了数据,我们就能很好的把握这个社会行为,我记得在2013年的年底,百度通过手机基站地理位置的信息,来分析春运期间人口迁徙或者流动的情况,大家可以看,这是一个大数据的分析结果,这个看起来是非常也意思的。春节那几天,从哪些城市流出的人口、从哪些地方流入的人口,基于这些数据分析,变得非常的清晰。那这对于我们春运的相关安排或者对于我们相关部门应对春运来讲,能够提供非常好的一些信息作为我们决策的基础。

另外,我们说大数据还可以产生你想不到的地方。比如说这也是百度大数据观察做的,它说上时间,大家利用手机、利用网络平台的时间做一个分析,蓝色是工作时间,黄色是生活时间,下边那个横轴上是你在网上上网时候都在关注什么或者都在做什么。这里边有一个叫金融理财的,蓝色的条非常高,黄色的条相对比较低。大家一看,金融理财都是在什么时候做的?都是在工作时间做的。这个背后的含义是什么?说明工作的时间中,可能大家不好好干工作,都利用网络、利用手机去炒股了。那这个东西的话,是非常有意思的一个判断。我基于每个人的网络新闻,我就可以分析这个人在一定的时间都在做什么,这样的话,对于改进我的管理、提高大家的工作效率是非常有帮助的。

另外也包括其他地方的一些城市部门利用大数据来分析现状,对未来进行预测。这里边来讲的话,我们说英国有一家是对罪犯一些情况进行了分析。这个警察局把往年的一些地方发生的犯罪记录进行了一些汇总,而且这些犯罪的信息和其他信息相关联,包括和城市的位置信息、地理信息相结合,它就能够非常好的来分析一些犯罪发生的情况。而且一些地方的长久破不了的案件,经过这个数据的关联分析,就会发现一些新线索。尤其是一些地方来讲的话,它可以去预测某一个事件,或者是某一个类似的案件在某一时刻会发生,我们说这些东西都是基于这些海量的数据作为基础的。那我们说的数据驱动创新来讲,其实就是指的这些方面。不管是政府在建设政府平台还是建各种信息系统,你会发现这些信息系统给人们提供便利性、效率的同时,也在记录着大量的工作数据和大量的工作痕迹,那我们能不能把这些数据拿出来好好的分析和使用?

另外,不单单是我们内部的系统,你会发现我们所服务的对象、我们的一切管理行为,可能在网上、在某一个平台上也会有反映,我们能不能将这些数据也进行整合、也拿过来,对它进行关联、对它进行分析,按大数据的思维方式来做,就像我们利用大数据来构建一个非法集资的平台一样。大家看,非法集资的平台,我们说可以利用什么?我们可以对网络的数据、对互联网的数据进行全市搜索,我们也可以和咱们公安部门或者是咱们社会层面的各种数据相融合,我对这些数据进行分析、挖掘。那你就会发现这里边是否有某种潜在的新闻,或者是某种群体性的特征。基于这些特征,我们能够分析是不是在非法的集资,或者来讲,大家聚在一起去干一些不符合规律的事情,我们就可以做一些这方面的分析。这是我讲的第一点,我们叫数据驱动的分析。有了数据了,就像我们做饭一样,有了米和菜,我就可以去做饭了。如果数据不全、没有数据、数据的质量不高,那我们很难有一些创新的应用。那有了数据,我们没有非常好的方法,没有办法对它进行识别和处理,可能我们很难获得一些有价值的东西,所以我们说因为有了网络、有了这种新的互联网的应用,我们的数据获取成为一种可能。所以大数据之所以被提出来,也是基于这方面引起了大家的关注。

 

第二方面,用户行为驱动创新。什么意思?这里边也有一个小故事,跟大家交流一下,可能这个故事,大家都听过,因为讲大数据的时候,这几个经典的案例是必讲的。

说在美国有一家超市,这个超市是经营日用品的一个超市,就像咱们的7-11超市。有一天,这个超市迎来了一位父亲,这位父亲一到超市来就大发雷霆,对超市的经理发火。他说你的超市对我17岁的女儿来讲,我的女儿还是个中学生,你们就去推销一些母婴的产品,就会给她发一些怀孕的广告等这些商业行为,这是对我们家庭的一个非常大的不好的行为。这个超市的经理一下子也没反应过来,赶紧跟他道歉,是我们搞错了什么问题。过了两周之后,这个父亲又来了,这时候不是超市的经理跟他道歉,而是这位父亲给超市的经理道歉了。为什么?这位父亲发现他的女儿真怀孕了。这个就非常有意思了。这个女儿怀不怀孕,超市居然知道,而作为父亲,居然不知道女儿怀孕。这里边问题到底出在哪里?这是纽约时报2012年报告的一个小故事。基于这个故事来讲,说这一个超市,因为它有了一套系统,什么系统?是基于用户的这些购买行为,也包括用户的网络行为这么一个数据分析的平台。那这个小姑娘,可能经常在网上搜集一些信息,经常到超市的网站上去浏览一些商品信息,那超市,就捕捉到这些信息,对女孩子的一些网络行为进行了分析,完了之后得到一个结果,说这个小姑娘可能怀孕了。那进一步来讲,超市就跟她推销和怀孕有关的母婴用品的广告,怀孕了之后身体需要哪些商品给她推送这些信息。那我们说这就是大大数据时代叫精准销售,商业上大家关注的比较多。

在大数据时代来讲的话,商家利用这些网络数据,对某一个人的行为、偏好就可以做出分析和判断,之所以有这么一个结果,就是因为大数据有这么一种可能,使得这些商家也好,或者是将来我们的政府部门也好,我们能不能利用我们所积累的一些数据、利用网络数据来分析你的服务对象的一些行为,他们有什么偏好,他们更需要什么样的服务。如果我们能够做到的话,其实我们说这是非常好的一种手段,让我们去把握用户的行为,让我们去了解服务对象的需求,进而改进我们的管理,提升我们的服务水平。这就是我们说的用户行为驱动创新。

再举一个例子,这也是2013-2014年比较火的一个电视剧,就是美国的一个片子,反映美国政治斗争的一个电视剧,《纸牌屋》。大家在网上搜索一下可以看到,它在美国已经拍摄了很多个版本了,就像我们的《水浒传》、《红楼梦》一样,很多公司已经拍了好多版本了,以前的版本都是评价很一般的,那为什么这次的《纸牌屋》让美国这么关注?不仅美国人关注,全球的人都喜欢看。拍摄《纸牌屋》的这家公司,它不是一个电视制片商,它是一个视频点播公司。大家看这个公司来讲,它是怎么样捧火了《纸牌屋》?

这家公司基于它的网络平台,来搜集在它平台上下载、浏览、观看电视剧、电影的一些客户信息,比如说大家下载了个片子,那你在线看的是什么时候暂停了、什么时候快进了、什么时候快倒了、看完这个片子用了多长时间、你是花了好几天时间每天看一点还是连续的看还是怎么样,来分析你对这个片子是否偏爱、是否有偏好。就像咱们一样,如果你喜欢看一个片子,可能很短的时间内,  你会一直很关注的来看这个片子,如果你不太喜欢这个片子,你可能需要花很长的时间来看它,或者看一半就不看了,看个开头就不看了。甚至包括影片里边的演员类型、主題曲、包括色调、大家的评论等,对这些信息进行了分析。分析完了之后,它又充分的分析了客户的需求或者客户的偏好。这家公司不是一个电视制片商,它就是一个视频点播公司。它有了这些数据之后,它就开始做什么了?和一些拍电视剧的公司进行合作,去招募什么演员、用什么样的色调、电影海报的颜色等,甚至我制片团队也好、演员也好,我都是基于客户的偏好来进行分析的,分析完了之后我去招聘演员,甚至这个导演、制片,我都是基于客户的偏好来进行选择的。大家看,把这些工作做完,最后再拍这个电视片,那一下子就火了。所以这个电视片,它不是基于导演某一方面他的的能力、专业性和判断力去拍摄的电视剧,它完全是基于用户的偏好,通过网络数据来分析,分析完了之后来进行电视剧的拍摄和加工。所以它得到了全球用户的一个高度评价。那这一切的东西,我们说它都是基于用户行为所导致的一个电视剧的产生。实际上在我们的政府管理里边,这个对我们的启发是非常大的。

比如说我们现在各个地方得建构了一些服务的呼叫中心、一些热线平台,大家在上面会反映一些问题,会投诉一些问题和咨询一些问题,那我们能不能基于这些用户平台的数据分析,来改进我们的服务?就像我们把投诉的人,把通过电话、网络进行咨询或者是反馈的人的行为进行分析,因为网上都有痕迹,那我们就知道客户的偏好和需求是什么。反过来,我们对他提供更人性化、更基于他需求的一些服务,那这种服务来讲,是有利于提升我们的服务水平的。

有些地方,还搞基于市民心声的分析,基于很多的网络数据,像咱们的微信、微博和很多的社交平台,比如说我们的公共服务、政务公开或者是某一方面的情况,我们都可以进行分析。那基于网络上这些属性数据分析,我们就能知道居民的需求在哪些地方,居民普遍反映的问题是什么,然后再来做出我们不管服务上或者是管理上的改进,这样就能显著的提高我们政府的服务和管理。这是用户行动驱动创新。因为我们以前没有手段、没有渠道让我们更好的去了解服务对象,居民也好、来办事的这些人也好,到底他是有什么样的需求、有什么样的偏好,我们不知道,现在我们有了这些办事平台、在线受理平台和一些网站或者是各种论坛、微信、微博的平台,我们就能非常好的来把握用户的需求和偏好,进而做出管理上的改进和调整。

第三个来讲是,实时分析和智能处理。这个大数据是动态的、快速在产生的。大家看这张图,很熟悉,我们在城市里边,尤其是我们的交通管理,这个工作中,我们越来越依赖街上的这种图像采集设备,来对街面上的一些违规行为进行一些分析和处置。比如说今天我们限号,你上街了,那系统就自动抓拍。抓拍完了之后,分析比对之后,如果你是一个今天不该上路的车你上路,那这里边技术会自动对你做出一个处罚。这里边对于技术的要求是什么?我必须第一时间抓拍,抓拍完了之后我还能分析比对,比对完了之后能够做出一个处罚。它不是说把这个车牌的信息抓拍完了之后靠人工去分析,或者是我抓拍到了之后先放到一边,然后再去分析,不是的,一定是一些实时的分析。尤其是对一些肇事车辆、有问题的车辆,甚至是一些实施犯罪的行为,我必须是第一时间抓拍完了之后,我能知道他的位置哪个地方。那这一切的东西,我们必须靠机器或者是靠网络能够自动了去进行判断。

这里边我举个例子,可能大家就明白了。大家到新加坡去,新加坡的街上有这么一个设备,这个设备叫ERP。这个ERP是干什么的?其实就像我们高速公路上的ETC一样,是一个自动收费系统。但这个自动收费系统跟咱们的不一样,它是一个车辆动态管理的系统。就是它会基于主要道路上或者城区里边交通的状况,这个系统是不是启动开始收费、该收多少,是取决于市区里车流的情况。比如说这个车已经到40迈以下了,这个系统就开始启动,就开始收钱了。如果到了30迈以下,比如说是收三块钱,如果是20迈以下,我可能收得更多。大家看,这时候如果你的车辆再开进去的话,你要交钱,里边又堵,那大家可能就想,换条道路吧,不走这条道路了。所以它是起到一个动态的交通调整系统的作用。大家看,这种系统必须要有非常强的实时处理的能力。什么概念?就相当于城里边交通道路的情况,我必须能够第一时间实时的做出分析,分析完了之后,我又能够反映到系统里边来,决定这个系统是否收费、按什么标准来收,起到一个动态调节的作用。所以到新加坡去,它的交通秩序非常的好。当然了,这个非常好有很多原因,一方法是社会发育程度很高,大家的文明素质很高,另外是政府管理的很严格,再加上它有这么一套比较先进的管理系统。这套管理系统我们说,它发挥的效率很高,有一次我们去了之后还了解到,它不单单和车辆用度的情况相关联,而且还和每一套道路的红绿灯长短的设置情况匹配在一起。所以通过这种实时的智能化的系统,让新加坡的整个交通变得更加的有效率。这一切东西来讲,和咱们的信息技术有关,和基于交通网络、交通探头所采集的数据并且对这些数据实时的分析有关,然后能起到一些动态调节的作用。大家有机会可以去新加坡看一看,非常有意思。当然,我刚才讲了,一方面是新加坡的手段很先进、很发达,另外一方面是政府的管理也是很到位的。

我记得有一次在新加坡吃饭的时候,大家在聊天,说新加坡的管理到什么程度?说有一位先生,晚上和喝酒了,喝酒肯定是不能驾车的,各个国家都一样。这个先生说那就不驾嘛,也没地方去,就回到自己的车里边,他的车是在一个停车场。他说到车里边去睡觉吧,休息一下,等自己酒醒得差不多,再开车回家。因为新加坡天气很热,在车里边呆着肯定不舒服,他就到驾驶位上,把钥匙打主要,把车给打着,就这种行为,周围的居民就投诉、举报了他。就这种行为,后来法院和检查部门就按酒驾进行了处理。什么意思?你的车在停车场停着,你喝酒了,这时候你坐在驾驶位上把车给打着,这种行为和酒驾是一样的。可见,它的法律也是非常严格的。所以有非常好的技术管理手段,再加上非常规范、严格的一种管理,这才是我们政府所追求的,不管是服务的水平也好,还是管理的提升也好,都是非常重要的一些方面。