雅虎虚拟政坛编辑本段回目录
美国爱荷华(Iowa)州党内竞选前夕,投票选举预测卫冕冠军来自《纽约时报》的内特∙希尔(Nate Silver)跟同事用一份牛排打赌里奇∙桑托姆(Rick Santorum)会在爱荷华州获胜。这次他输给了一位沃顿商学院(Wharton business school)的副教授贾斯汀∙沃尔夫斯(Justin Wolfers),他打赌是基于政治预测的又一热点事件——像Intrade这样基于网络的预测市场,许多人都在那里为选举结果打赌。
现在雅虎的数据科学家们正在使用同样的预测市场,利用投票问卷、Twitter上的情感分析以及搜索查询动态趋势来创建所有政治预测引擎的母本。
这一项目背后的研究人员大卫∙洛希尔(David Rothschild,雅虎研究院经济学家,曾与沃尔夫斯联合著书)和戴夫∙彭诺克(Dave Pennock,雅虎研究院计算机科学家)将其称为Signal。他们计划建立能向大众传达事件最大可能性的可视化数据,并发表基于该项目有关机器学习和基础经济模型的著作。
他们将让人们轻松愉快地参与到所有这些政治和数学方面的枯燥工作中来。鉴于雅虎虚拟体育联赛的成功(因为这家公司是全球最大的网络社区),洛希尔和彭诺克已经建立了“虚拟政坛”(Fantasy Politics),用户可以就诸多事件的结果打赌。
“我们打算让人们‘为简单的预测打赌’,如‘民主党将在加州获胜,’”彭诺克说道。“但如果他们想要提高难度,他们可以为这样的预测打赌——‘民主党将在俄亥俄和佛罗里达胜出’或‘共和党将赢得佛罗里达却最终竞选失利。’”
雅虎的政治预测市场将于今年春天推出,这样的打赌将使其复杂性和预测能力达到一个空前的水平,彭诺克说道。
Signal将利用这些市场以及其他实时数据资料。Signal所运营的预测市场不断进行投票,因为这将成为雅虎搜索查询和推特的分析结果。
情感分析,或者说是基于对某事的交流情况对其感受的自动判断,“还处于婴儿阶段,”洛希尔说道,但它能洞悉的内容是投票无法比拟的。
多数投票的一个局限就在于它们的二元性——这些投票会查问一次选举的走向是这个方向还是其他的方向。另一方面,情感数据则可以让政治观察家们精确地得知候选人的民调数字上升或下降的原因。洛希尔引用了里奇∙桑托姆上下波动的民调数字作为实例。通过跟踪推特的情感和搜索数据,洛希尔和彭诺克发现有证据表明这反应了一个关注焦点的变化:公众最初对候选人在同性恋和种族问题上的立场感兴趣。之后,选民们则更有可能搜索有关其经济政策方面的信息。
“这可以在几小时或几天内发生,这种时间跨度让你无法在投票中有所察觉,”洛希尔说。情感分析甚至有可能得知某位候选人或某事件是后劲十足还是昙花一现。考虑到长期趋势的变化,预测市场似乎已经比投票略胜一筹了——虽然凯恩(Cain)、佩里(Perry)和特姆普(Trump)均在投票中轮流领跑,但Intrade以及其他Signal所监测的预测市场却都认为罗姆尼(Romney)会脱颖而出。
Signal身后的智囊们会预测谁会在南加州初选中获胜呢?
“竞争几乎已经结束了,”洛希尔说道。“目前,罗姆尼获得提名并赢得南加州初选的可能性超过90%。”
那么大选结果如何呢?
“在过去2个月里,随着共和党初选声势逐渐增强,‘奥巴马获胜的概率’一直在缓慢增长,”洛希尔说道。为团队提供数字信息的彭诺克表示,他们最新的数据显示奥巴马获胜的概率为52.9%。