交通拥堵和空气污染似乎是如今大城市,特别是中国大城市发展的不可解难题。
无数的指责,无数的找原因,无数的推诿,对于中国城市的交通拥堵和空气污染,一点作用也没有,反倒更显得人云亦云的纷乱。一边是政府部门的种种一刀切政策,一边是行业人士的各种找原因,但是,似乎两者永远都隔着一层透明的隔膜,互不触及,但又明显双方都在努力,各种措施也一天天不停地出。
可是,汽车工业却不能不发展,也就是说,汽车只会越来越多,道路永远也跟不上汽车的发展;人民需要更好的生活,工业要发展,空气和环境的负荷只能越来越大。难道我们就进入了一个越缠越紧的漩涡没有办法跳出?
是不是我们的思维方式出了问题?
我们习惯于因果关系,习惯于抽样精确的数据调查与测试。但是在如今信息大爆炸时代,我们是否可以试试“样本=全部”的大数据方法,试着不要找出因果关系(为何拥堵),而只是找出相关关系(比如时间、天气、气候、时尚甚至只是根本想不到的因素,比如萧敬腾要来开演唱会)?
我不是乱说。实事上,由于计算机的普及,由于GPS、由于手机的普遍运用,甚至由于微博微信的时时刻刻的发送,数据已经成了我们无时无刻不在运用的东西。而正是因为这全方位的数据,使得大数据成为如今这个时代的特征。而这些特征,是过去任何一个年代都不可能有、也不可想念的东西。大数据的运用一个最基本的特点就是,全部的数据处理,只找出相关关系,而不必找出因果关系。因为因果关系太费劲,而且耗时巨大成效甚微;而相关关系却不必费太大功夫,就可以找出办法。比如说,防疫中心过去要想划定流感的范围,需要动用很大的人力物力,而最后的数据汇总通常要迟上两三个星期,一般来说,这个结果来得太晚了;谷歌公司通过搜索关键词条,很容易就能发现流感的时间和范围,这个结果要比防疫中心早上一两个月,而且更趋于准确还有,2008年9月里,已经有相关大数据公司指出美国通缩,结果,11月里雷曼兄弟倒下,有关部门才发布通缩的调查结果……。
也许,我们已经陷于因果关系的思维方式误区太久了,比如交通拥堵,我们只会想到汽车太多,道路不够用,开车的人不守规矩……也许这一切都是原因,但是却并不是必然和充分的原因;再比如空气污染,为什么就要想到一定是汽车的原因,虽然汽车也是其原因之一,但肯定比不上遍地的大烟囱、到处飞扬的尘土,但也许,这些也都不是必然的原因。既然现实已然如此,为什么不试试换一种思维方式和处理方式?
嗯,也许找出的相关关系让你大吃一惊,比如说,美国一个二手车中心试图找出哪种二手车最保值,结果,却是“橙色的车最保值”;但是,结果就是如此,先解决问题是急需,至于因果关系,可以说橙色比较醒目,也可以说喜欢橙色的人性格比较内敛,较少出事故等等,如果需要找出因果,且再去找吧。要买卖二手车的人,只需要知道橙色车较保值就好。
其实我们有过相关的大数据案例:微软亚洲研究院的谢幸及其同事,通过记录和分析北京市出租车两年的GPS数据,可以向司机提供不同时段的最佳出行线路;如果能把全市公交车以及私车的GPS数据全部拿来,那么,向所有人提供不同时段最佳出行路线也不是难事。
可是,这“全部数据”就是问题,比如,我国某城市公交车因为价格不依赖于起点和终点,所以能够反映重要通勤信息的数据,就被工作人员给扔掉了。
所谓的大数据,就是全部数据,可以是微博微信上的片言碎语组成的大海,也可以是一些公司运营时有意做成的表格,只要全面就好,不求精确,因为大数据自身能包容和修正这些不精确。
事实上,虽然我们都知道世界已经进入了信息化时代 ,可是我们却不知道收集和保存信息,没有数据化的意识。其实,大数据的范围很广,我们只需换个思维方式,也许工信部本身拥有的数据,就可以找出解决拥堵和空气污染的办法。
是不是的些匪夷所思?我宁愿相信,交通拥堵和空气污染是可以通过大数据解决的,因为无论东京,纽约还是香港,无论人口密度还是车辆保有量,都不比北京以及中国的大中城市小。