开放数据:如何从无处不在的免费数据中发掘创意和商机

本书是针对开放数据及其在商业中的应用的经济科普性读物。开放数据从定义来说相当简单:那些已经被政府或者其他组织发布,任何人都能获得并能用于任何商业或者个人目的的数据。开放数据在过去的几年中在英美等政府的推动下得到了长足的发展。本书的主要内容就是对开放数据做了一些普及性的介绍,并对其在当前商业环境下的应用给出了建议。

书的内容不多,大体分为两大部分:开放数据的力量与开放数据的发展趋势。开放数据力量部分,又包括:开放数据中蕴含的商机,利用开放数据构建的决策引擎,帮助政府管理数据的数据管理公司、以及以数据为基础的投资分析决策、数据市场营销、基于开放数据的群体创新。总的来说,第一部分是对开放数据在商业中应用的成功模式进行了介绍,并且给出了一些潜在商业可能性的建议。从书本的这部分描述来看,开放数据的前景十分美好。第二部分开放数据的发展趋势,主要是对目前开放数据运动所面临的问题,以及开放数据带来的好处与机遇,开放数据的未来。

书中的描述给人的印象是开放数据的美好明天即将到来。但就目前来看,还存在着许多问题。在开放数据的运动中,开放数据的主导是政府,在目前较为成功的美国和英国都是由政府主导的开放数据,并且也是有选择性的开放。无论商业公司如何庞大,但在数据方面的占有量是远远比不过政府的,政府数据的重要性,不言而喻,数据为决策提供强有力的支撑,说到这里,就讲个历史故事来论证,在进入咸阳后,萧何分文不取,却独独占领了丞相御史府,将秦朝的户籍典籍、地形、法令等文档搜刮一空。这些数据在日后的楚汉争霸中为不少决策提供了支撑。但是开放数据对于政府来说究竟有没有好处?在目前来看,还有待检验,英美等国开放数据的目的是商业公司提供支撑,促进经济的繁荣。从书中的例子是可以看到,许多初创公司是由于开放数据计划而诞生,并且许多公司也因此获利,但这并不能论证开放数据对政府有益。开放数据给带来的压力在民主国家与非民主国家中会迥然不同,在特色社会主义民主环境下带来的压力更是不可同日而语。所以,目前的现状是,中国的开放数据还停留在萌芽层面,并且毫无发展动力。

另外,本书考虑的数据开放大都是站在国家的角度上,但是作为市场主体的商业公司并没有开放数据的需要,企业间的数据共享更多的是通过企业间的战略合作来进行,如腾讯入股搜狗等这些。开放数据的不甚会给企业带来灾难,通过分析上市公司三大报表发现企业虚假账目信息导致企业破产的例子不在少数,三大报表仅仅是为了监督证券市场强制要求开放的数据就会为企业发展带来诸多限制,更遑说其他更多的数据。数据在某种程度上说是政府与企业的命脉,并在未来的某天也将成为个人的命脉。所以,也许开放的数据的未来,并不能靠政府来推动,更加需要的是公众的力量。在国内,数据开放可能会率先在公共服务领域内得到发展:诸如天气预报、部分医疗数据、公共服务方面的相关数据等,至于其他方面的数据,只能拭目以待了。下图是源于[开放数据指数]网站的一个数据开放指数图:
Open Index

其实,如果仅仅将开放数据限制在由政府和企业主动公开的数据上定义可能为颇显狭隘。在我看来,开放数据更多的应该着眼与在信息化浪潮中,企业与政府被动的公开的可以利用的数据。这些数据可能会存在各式各样的缺陷,比方说:数据不完善、数据无规则,数据陈旧。但这一部分数据的规模也是十分巨大的,本部分数据所蕴含的价值可能不会低于政府主动开放的数据。最后,再给出几个与开放数据有关的网站,对此有兴趣的朋友可以进一步了解。

Open Data Now