【数据科学】唐世平:决策计算:仅有“大数据”是不够的

【数据科学】唐世平:决策计算:仅有“大数据”是不够的


简  介

【作者】唐世平,系复旦大学特聘教授、陈树渠讲席教授、教育部长江学者特聘教授

来源澎湃研究所


【数据科学】唐世平:决策计算:仅有“大数据”是不够的

正 文


本文将提出一个新的范式,即基于全数据totaldata)的决策计算,并且给出这一范式的基本发展方向。

在绝大部分人的理解中,未来是一个大数据bigdata)的时代。事实上,拉泽尔等人在2009年在《科学》杂志的计算社会科学时代的到来一文中,几乎把大数据等同于计算社会科学

而我从一开始就对这样的理解持有保留和怀疑态度。经过8年的探索,我们有理由相信,我们找到了更为有用和有效的方向,至少我们的探索为未来数据技术的用途提供了另一种可能的方向——“全数据的决策计算。

计算社会科学真正具有革命性的冲击力的领域是决策科学,它将给决策科学带来巨大且根本意义上的革命。更具体地说,计算社会科学完全有可能让人类的许多重大决策能够更加基于客观的大数据和计算机模拟,从而让传统的绝大部分依赖于专家的主观意见的决策变得更加科学,尽管专家意见仍将有其一席之地。

但决策计算不应仅仅基于所谓大数据,我们认为基于计算社会科学的决策计算的核心范式或者方向应该是基于全数据的决策计算。这一范式有以下几个核心的认知论和方法论水平的要求:

就认知论水平而言,我们必须用社会科学的思维,特别是社会科学的问题意识,来规制计算社会科学。换句话说,我们必须首先问:计算社会科学到底能够帮助我们解决那些决策者经常要面临的问题?

笔者认为,计算社会科学在以下几类决策问题将大有用武之地:1)对一个国家来说,对其它国家的基本政治走向(包括其权力结构、国内政治稳定等方面)的预测;2)对一个企业,特别大型跨国企业,来说,对所在投资国的基本政治走向的预测、如何确定竞争战略、如何选址等等;3)对于个人来说,旅游,买房、定居(特别是退休以后)等等的决策。所有这些决策都不仅仅需要数据的支持,还需要社会科学的思维以及理论和实证积累。

从方法论水平来看,决策计算首先需要的是全数据思维,而不是大数据思维。全数据思维包含了大数据,大数据是全数据的一部分,而不是全部。

【数据科学】唐世平:决策计算:仅有“大数据”是不够的

全数据思维又是什么呢?全数据思维首先考虑——当我们试图通过计算和模拟来解决一个决策问题的时候,我们需要什么样的数据?它强调的是数据对一个决策问题的必要性和充分性,而不是一味强调数据的多少。

在多数情况下,要解决一个决策问题,我们需要很多的数据,也就是大数据。而多数情况下,一般意义上的大数据(比如,社交媒体、网购交易、通话数据等等)是不够的,还需要和其它基础数据集合起来,才能够为计算决策提供支撑。

另外,值得一提的是,我们对运用大数据辅助重要决策,需要特别谨慎,因为大数据很容易被假数据和假信息污染,正如特朗普当选英国脱欧两个事件告诉我们的那样。

所以,要解决具体的决策问题,我们需要将通常意义上的大数据(比如,社交媒体、网购交易、通话数据等等)和其它基础数据集合起来运算。光有大数据,可能只能解决一些小的决策问题,比如,给特定的用户推送他或她喜欢的衣服款式。

基于这样的全数据计算社会科学思维,我和我的团队开发了针对不同决策问题的计算平台。这里不妨介绍一下:

世界上几乎每年都有重要的选举。因此,预测选举的结果并基于这些预测调整选举策略,就成了每一个政党和候选人需要面对的最重要的决策问题。而因为选举必定产生大量的数据,基于社会科学家对选举的理解,计算社会科学就有可能基于这些大数据构建能够模拟选举结果(包括不同选举策略下的结果)的计算机模拟平台。

基于这一理念,复旦大学复杂决策分析中心构建了一个选举模拟平台。传统的选举预测通常依赖民意调查,而民意调查通常都有相当的误差和不确定性,尤其在对议会选举结果的预测上,传统模式的准确率不高。我们的选举模拟平台启动以来,对我国台湾地区的两次选举(2016,2018)以及美国两个州的参议员选举,进行推演和预测,结果还是比较准确的。为此,平台还获得了台湾地区授予的发明专利,对我们基于全数据思维的决策计算研究也是一种肯定吧。

基于同样思路,我们还搭建了一款接地气的计算平台。具体而言,是一款能够通过智能计算,为用户量身定制旅游行程的旅游移动端应用(微信小程序),叫做掌中星球。一开始,朋友们都很诧异:你一个学者,怎么会去做旅游?我的回答是:旅行其实是一个非常复杂的决策问题,而决策正是我的研究重心所在。

对于旅游,大家肯定都深有体会——为了一个()自由行,你必须花费大量的时间和精力去到处找攻略、看景点、搜酒店,使用多个平台才能制定出一个你自己也不知道是否科学的行程。既有旅行网站及应用推出的所谓行程定制,都基于人工的服务,比如定制师的推荐和策划。掌中星球试图提供一种基于客观数据、完全智能算法和机器驱动的一站式行程定制服务,省却用户大量的时间和精力。

我们相信,计算机社会科学能够给决策科学的许多问题带来一些崭新的解决办法,从而为传统上主要依赖专家意见的决策科学带来巨大的变革。我们的社会科学家和计算机科学家一起,应该和政府、企业等行为体携起手来,为中国决策的进一步科学化而努力。如此,中国的社会科学,特别是作为应用社会科学的决策科学,才有可能实现追赶发达国家的目标。


更多阅读

【重磅速递】约瑟夫·奈:美国霸权的兴衰:从威尔逊到特朗普 | 国政学人

【重磅推荐】巴里·布赞:英国学派视角下的中国崛起 | 国政学人

【重磅速递】米尔斯海默:注定失败:自由主义国际秩序的兴衰 | 国政学人

【百年国关】专题导言:巴黎和会后的百年国关 | 国政学人

【百年国关】复兴中国与凡尔赛遗产 | 国政学人

【百年国关】劳伦斯·弗里德曼:大国战争的兴衰 | 国政学人

【百年国关】一战后不同帝国的发展轨迹 | 国政学人

【百年国关】邝云峰:权力——世界政治中的威望 | 国政学人

【百年国关】历史在国际社会中的应用:从巴黎和会到现在 | 国政学人

【国际组织】IO杂志:联合国维和行动的武力运用问题研究 | 国政学人

【国际秩序】为什么自由主义国际秩序理念将美国外交政策引入歧途?| 国政学人

【关系理论】“关系”:世界政治关系理论的中国话语 | 国政学人

【冲突研究】IO杂志:革命、独裁和国际冲突 | 国政学人

【丝路研究】新丝绸之路:来自欧洲的观点与视角 | 国政学人

【英国学派】张勇进:中国与全球国际社会中的自由主义等级制:实力与对规范变迁的协商 | 国政学人

【地区秩序】论经济实力的可转化性:中国经济崛起与东亚安全秩序 | 国政学人

【IPE研究】封闭的圈子:墨西哥离岸金融的政治 

【中俄关系】不得已的伙伴:系统-单元动态与中俄关系 | 国政学人

【IPE研究】美国对外贸易政策的“1934年体制”是如何形成的?| 国政学人

【现实主义】斯蒂芬·沃尔特:傲慢的终结与美国克制的新时代 | 国政学人

【理论批判】系统、层次与结构理论:沃尔兹的理论并非系统理论 | 国政学人

【外交政策】单极体系下的不和平状态与美国外交政策 | 国政学人

【欧洲研究】资本主义多样性与合规:加入欧盟后中东欧的经济改革 | 国政学人

【移民外交】国际政治中的移民外交 | 国政学人

【历史分析】国际关系中的历史偶然事件及其影响 | 国政学人

【理论研究】吴建树:权力、道德、均势、联盟与摩根索——汉斯·摩根索的经典现实主义思想再解读

【外交政策】建设更好的民族主义 | 国政学人

【全球治理】全球治理:一场关于普世价值的斗争 | 国政学人

【友谊国关】将友谊重新引入国际关系:从中国到西方的关系本体论

【移民研究】组织化伪善的移民救援 | 国政学人

【定量研究】政党实力和经济增长(Party Strength and Economic Growth)| 国政学人

【台湾学者】向骏:美国从“霸权稳定”到“霸凌不稳定” | 国政学人

【古代中国】张锋:古代中国的儒家对外政策传统 | 国政学人

【理论研究】霸权研究3.0版:霸权秩序理论

【理论研究】巴里·布赞等:重思日本:主流国际关系理论的偏见 | 国政学人

【收入问题】全球性收入不平等:历史与现实 | 国政学人

【国际组织】国家缘何退出国际组织?| 国政学人

【南亚研究】南亚对冲:中印竞争中经济和安全利益的平衡 | 国政学人

【外交政策】美国霸权的自我毁灭:华盛顿浪费了单极时代 | 国政学人

【外交事务】民族主义为何有效?| 国政学人

【定量研究】谁在欧洲议会中领导委员会? ——基于2014年欧洲议会选举的研究 | 国政学人

【定量研究】暴露于难民危机之中会让当地人更有敌意吗?| 国政学人

【恐怖主义】恐怖主义组织扩展数据(EDTG)的介绍——从1970年到2016年 | 国政学人


【数据科学】唐世平:决策计算:仅有“大数据”是不够的


原文始发于微信公众号(国政学人):【数据科学】唐世平:决策计算:仅有“大数据”是不够的

发表评论

邮箱地址不会被公开。 必填项已用*标注