我院优秀院友。法学博士、理论经济学博士后,现为上海政法学院政府管理学院教授、上海政法学院软实力研究中心主任、中国-上合组织基地教授、博士生导师,曾长期担任《社会科学》杂志社社长、总编;兼任上海市俄罗斯东欧中亚研究会副会长、上海市社会科学普及研究会副会长、上海欧洲学会理事、上海市委党校(上海行政学院)客座教授、上海社会科学院软实力暨思想文化研究中心学术主任、上海社会科学院上合组织研究中心副主任、新疆师范大学文化润疆研究院学术院长、特聘教授。
大数据与公共管理变革
——在华南农业大学公共管理学院的演讲
说明:2016年4月20日,应时任华南农大公共管理学院院长张玉教授的邀请,为学院学生讲授这个专题。尽管此前本人做了一些有关互联网与国家安全的研究,也写了几篇有关大数据的评论性文章,但从学理上来进行分析并做讲座,这确实是一个大胆的冒险。不过,讲完这堂课之后,我尽快地进行学理化整理,形成了一篇同名论文,刊发于《行政论坛》,后来拙文被《新华文摘》、人大复印资料请问转载,被《中国社会科学文摘》提要转载。也正因为这次讲座,促使我对这类问题不停思考和亚久,并撰写了一系列的相关论文,在此特别感谢以上所有朋友和平台!
首先感谢张玉院长的邀请,感谢唐斌教授的主持!今天我斗胆在这里讲一个我最不熟悉的话题,可能也是学术界的一个全新的领域。因为大数据进入学术界的时间毕竟还很短,国内学术界尚未有非常系统和深刻的研究,所以我借贵院的平台尝试我的一个新的且十分不成熟的研究,期望我今天的分享能引起大家的兴趣。
什么是大数据?
并非数据繁多就是大数据,也不是数据量大就是大数据,在舍恩伯格的著作中有一个非常明确的定义,即大数据是指无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。大数据的特点用“4V”来表达:一是数据体量巨大(Volume)。人类生产的所有印刷材料的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量大约是5EB(1TB=1012;1PB=1015;1ZB=1021)美国国会图书馆相当于235TB,所有美国学术研究图书馆只有2PB,每天由Google处理的数据相当于24PB。到2020年将全球数据量达到44ZB。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。二是数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。三是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。另外,Value还有一层意思是指大数据所蕴含的巨大价值。大数据虽然因信息超大规模而导致关注度降低,进而使数据的价值密度降低,但是,大数据之大在于数据具有“再生性”,数据的价值具有巨大的增值效应。四是速度快(Velocity)。大数据框架内的速度包括两个方面:一是指如何加快数据的导入;二是如何加快分析和利用新导入的数据。前者的一个重要原因是大数据时代数据产生迅速,而大数据本身要求的是全数据,如果没有快速导入数据的技术,那么就很难做到全数据,不是全数据就不能成为大数据。后者则是由大数据的目标所决定的。大数据的目标是利用大数据进行科学分析和科学预测,新数据不断产生,那就意味着新问题、新情况也迅速产生。没有快速分析和利用新数据的能力,那么,所有的预测都是滞后的。
除了上述四个特征之外,大数据更重要的还是提供了一种独特的思维,即大数据思维。大数据思维一是开放性思维。由于大数据的来源是多源性、多路径的,也就是说,数据本身是开放性的。因此,在分析数据和基于大数据进行预测的时候也需要一种开放性的思维来进行分析和预测。二是非线性思维。这种思维要求我们在分析问题的时候不能仅仅凭几个要素来进行决策,而是要把所有相关性因素都要纳入分析框架。尤其是不能用简单的因果关系来进行决策,要充分考虑问题的复杂性。三是价值思维,不能把数据仅仅看作是数据,数据背后的是巨大价值。传统的数据思维是数理统计思维,认为数据的本质在于统计,统计的目的是揭示历史过往中的基本特征和基本规律,根本没有通过数据来获得价值的思维。大数据思维就是通过数据的导入、分析,挖掘出巨大的价值。
服务公共管理变革的大数据来自何处?
大数据全面嵌入公共管理,那么,公共管理所依赖的大数据又是来自何处呢?服务公共管理的大数据主要来自以下几个方面:
一是来自互联网的大数据:包括数据库如Oracle、DB2、SQL Server等;Excel、电子邮件服务器等数据源上也积累了不少数据源;Hadoop(分布式处理平台)系统如ApcheCloudea、Hortonworks、MapR,以及NoSQL数据库如Cassandra、HBase、MongoDB等也储存了大量的数据。此外,云应用如Salesforce.com和社交网站如新浪微博、腾讯微博、搜狐微博等上也产生了大量的数据。
二是来自公权力运行(政府)过程中的大数据。政治系统的输入和输出,最重要的就是由话语、文件、口号、音频、视频等数据构成的信息输入和输出。这些数据是权力输入和输出的实际表现,因而也就是公共管理所以来的大数据。目前,中国有用信息的80%由政府所掌握,但长期以来,这些信息一方面大多处于不对外公开状态,严重地制约了经济发展;另一方面,部门之间、上下级之间的政府信息相互割裂、数据之间无法有效共享,形成一个个信息孤岛,难以发挥应有的作用。
三是来自企业的大数据:企业是大数据最重要的来源,它几乎每时每刻都在产生数据,而企业管理层是绝对不允许数据丢失的,另外从行业机密来考虑,企业也不允许随意公开和丢失经营数据,因而企业的数据积累是最为全面的。更为重要的是,为了防范风险,企业往往会建立自己的容灾系统来备份自己的数据。
四是来自个人的大数据:个人的基本数据如涉及个人隐私的所有数据如健康状况、电话号码、银行账号等都是公共管理的依据,也是公共管理的对象。个人在日常生活中的活动行程的数据包括上网、电子邮件、短信,以及博客、微博、微信等自媒体数据。例如,汽车传感数据用于评价司机行为会推动汽车保险业的深刻变革。此外,还有个人在职业活动中行程的各种数据如写作、科研、发明等。
大数据为什么能够促进公共管理变革?
舍恩伯格和库克耶所著的《大数据时代》提出了大数据时代的管理变革,但他们主要是从风险管理的角度来分析的。他们认为,在大数据时代,“我们时刻都暴露在‘第三只眼睛’之下。但是,我在这里则是从管理的效率、效能来分析大数据是为什么能够促进公共管理变革的。大数据能够促进公共管理的变革,是因为大数据有其特殊的功能:
其一,大数据有强大的数据收集功能:大数据就发挥了提供多样化、多源性信息的功能。因此,大数据和云计算实现了彻底的大多数决策的范式。
其二,大数据强大的管理功能。大数据的管理功能既包括对大数据的管理,也包括使用大数据结果的管理。从公共管理来看,对大数据本身的管理体现在政府能够拥有对云硬件进行虚拟化的虚拟技术、对各种数据进行编程的编程技术和提供大数据使用服务的云服务平台技术;对大数据使用结果的管理功能则体现在适应大数据时代大数据使用的国家立法能力,也就是通过有效立法来加强对大数据使用结果的管理。
其三,大数据具有强大的分析功能。数据没有经过分析就是一组没有生命力的数据,而经过技术分析的数据才能够“发声”,才能够用于预测和进行公共决策。没有大数据思维就难以获得大数据的分析功能。大数据的分析功能不仅是分析已经“发声”的大数据,还要有能力重组各种已经存在且被挖掘出来的数据。
其四,大数据具有数据挖掘和数据重组的功能。在公共管理过程中,我们往往重视重要数据和可以用二维表结构来逻辑表达实现的结构性数据并依据这些数据来进行公共决策,从而忽视了众多所谓的不重要的、非结构性数据,但这些数据客观上对公共决策是有重要影响的。不过,“孤立的数据是没有价值的”。
其五,大数据具有强大的预测功能。大数据的核心是预测,而预测自古以来就存在,那么大数据时代的预测与以往的预测有何不同呢?其最大的区别在于“一”与“多”的关系不同。传统的预测是从“一”来预测“多”的,而大数据时代的预测则是相反,从“多”来预测“一”的。
大数据将在哪些方面促进公共管理变革?
大数据推动公共管理的变革并非因为大数据提供了数据服务,而是因为大数据带来了管理思维的变革,管理结构的变革,管理边界的进一步明晰,以及公共管理对象的变化和管理效能的重大变化。自从有了大数据这种技术和相应的大数据服务,公共管理就彻底革新了。
第一,大数据促使公共管理从封闭性的管理结构转向开放性的管理结构。传统的公共管理受制于公权力,而公权力的运行客观上存在着封闭性的特点,如所谓的保密性、国家安全等,社会组织的参与、市场组织的参与度比较低。这种封闭性决定了公权力在进行公共资源配置的过程中存在着权力寻租的现象,即便没有权力寻租问题,但由于其封闭性也会导致社会的不信任,使公权力本身陷入“塔西佗陷阱”之中。相反,大数据完全不一样,大数据是在互联网和云平台上运行的,大数据时代的公共管理存在着天然的开放性。市场组织与社会组织,甚至民众个体都可以在公共管理的框架中游走。
第二,大数据使公共管理由官僚科层制转向扁平化结构。官僚科层制管理是一种金字塔形的治理结构,其结果导致资源配置形成与之相反的倒金字塔结构,离金字塔尖越近的部门获得的公共资源越多。这样的公共管理结果最终是难以持续的。社会的不满情绪也大多源于此。
第三,大数据公共管理与政治管理的边界进一步得到明晰。传统的公共管理更多的是基于政治意识形态的安全而实施的过程,把一切涉及经济利益诉求的集体行动和个人维权行为都被纳入到与政府对抗甚至视之为颠覆政府的政治诉求行动,所以刚性维稳成为公共管理的常态,是人对人的监控。大数据采取的是技术监控和技术分析,包括对人的监控和对人的行为的监控。技术只会告诉你数据,不会做出主观判断,技术用数据说话。大数据的公共管理就是要去政治化的管理而转变为社会化的管理。
第四,大数据促使公共管理强化对人的管理转变为对数据的管理;从管理人转变为服务人。传统的公共管理是为社会秩序服务的,所以专注于对人的行为进行规范化,使之合秩序化人是公共管理的目标,而不是管理服务的对象。大数据的公共管理首先是数据管理,因为数据是最为关键的管理对象,数据在云平台上安全运行是大数据条件下公共管理的前提条件,因此,对数据的管理是第一位的,只有对数据有效管理才能实现有效的公共管理。
第五,大数据促使公共管理从被动应对式管理到主动预测式管理。传统的公共管理:被动应对;先前付出的代价来购买新的公共决策。大数据公共管理:廉价技术条件下和基于大数据的预测式决策;在“全样本”的数据支撑下,预测性地优化决策。
大数据条件下公共管理面临哪些挑战?
变革也就意味着风险,其中包括不确定性的风险和不可靠性的风险。不确定性的风险大家都知道是什么了,不可靠的风险是指大数据作为安全数据的可靠性问题,以及大数据到来的包括个人隐私保护等方面的问题,都会给公共管理提出全新的挑战。
第一,对全数据的依赖会导致公共管理为收集数据而收集数据。公共管理的目标是提高服务质量,但数据的大爆炸会导致公共管理者更多的是在应对数据爆炸带来的困惑,为如何收集瞬间即逝的非结构性数据而费尽周折。而公共管理的服务内容很有可能被数据收集过程而冲淡,甚至是被忽视。
第二,个人隐私保护成为大数据时代公共管理最大的困惑。保护个人隐私虽然不是公共管理的目标,但它是公共管理的内容之一。传统的公共管理也包括对隐私权保护的内容,即任何个人隐私都必须得到公共管理行为的保护,公共管理过程不得侵犯个人隐私。否则,公共管理就会被认为是违背法律的。然而,大数据所收集的所有数据都存放在互联网之中,个人隐私如何保护就成为一个问题。
第三,在立法管理上就要进行变革,即国家立法要从个人许可转变为让数据使用者承担责任。大数据的价值并非是直接体现出来的价值,而是通过挖掘之后而发现数据的价值进行二级使用。因此,个人许可的立法原则就难以获得全数据,但获得全数据之后,数据使用者必须要为使用数据负有法律责任。因此,立法的原则就是要求数据使用者负责。公共管理就是要促使数据使用者要评估数据使用的风险、规避或减少潜在伤害。
第四,大数据公共管理的最大挑战在于个人隐私的保护。大数据把个人隐私几乎完全暴露在互联网之中,对个人数据和隐私的保护,既缺乏相关的立法,也缺乏实践的操作。事实上,在公共管理实践上,公共管理的安全究竟是指环境的安全,还是人自身的安全?这个问题实际上是很难兼顾的。大量的实践案例表明,不同的公共管理者对安全的理解大相径庭,尤其整体主义的管理逻辑往往会对个人隐私的严重忽视。
以上是我对大数据与公共管理之间关系以及由此产生的问题的粗浅认识。请大家批评指正。谢谢!
演讲:2016年4月20日
整理:2023年2月7日(根据演讲PPT整理,案例和数据略)
来源|2月8日软实力研究微信公众号
(ID:CFSPS001)
编辑|卢昱舟