写于 2017-02-06 05:13:22| 澳门永利线上| 体育

对于第二次世界大战后出生的大多数美国人来说,弗吉尼亚州的阿灵顿不太可能具有任何特殊的意义

但对于那些知道战争结果主要取决于模仿游戏风格的破译的人来说,阿灵顿具有神秘感,美国军事密码分析中心1942年,美国陆军信号情报局悄悄地在阿灵顿音乐学院女子少年学院(一所私立学校指导年轻女士学习艺术,音乐,礼仪,正装和家政)并使用它作为其对日本密码系统进行袭击的总部国家安全局成立于1952年,最初设在阿灵顿厅

十年后国防部长罗伯特麦克纳马拉在五角大楼组建的国防情报局也在那里占据了两座建筑物,阿灵顿保持其破码的根源,但现在它正在破解其他类型的代码 - 并已进入量子计算领域,成为成为政府资助的研究计划的温床,由主要服务于华盛顿的公共和私人机构带头参观这些幻灯片中所有本周最佳照片弗吉尼亚理工大学(VT)的其中一个展示了多少“大数据“已经通过扩大美国情报界的预测能力,以惊人的准确性,改变了游戏规则,通过淘汰Twitter,YouTube,维基百科,Tumblr,Tor,Facebook和更多VT在全球范围内的人类行为正在使用算法和各种先进的工具,通过密集和复杂的信息为混乱模式中的模式排序,这些模式通常指向事件发生前的事件,例如民事起义,疾病爆发,人道主义危机,大规模移民,抗议,骚乱,政治溃败,甚至暴力“任何时候你在Facebook上发布或发布信息,你正在成为大数据经济的一部分,“VT的计算机科学教授Naren Ramakrishnan说

大学的发现分析中心正如他所描述的那样,“研究整个数据科学领域”去年,该中心将其运营基地从弗吉尼亚州弗吉尼亚州布莱克斯堡的校园搬到了阿灵顿 - 也是五角大楼的所在地 - 之后,得分更多EMBr项目Ramamarishnan的这项计划迄今为止领先于军备竞赛,将大数据转化为美国政策制定者和情报机构可以使用的预测

“许多分析师可以给你提供预测来年,但是当我们做预测时,我们正在谈论具体的日期,“罗摩克里希南说,自2012年4月成立以来,平均80%至90%的预测结果是准确的 - 并且他们到达了预测事件EMBERS(使用代理项目的基于早期模型的事件识别的简称)的平均值提前7天从数据极客们称之为“开源指标”社交媒体,卫星图像和200,000多个公开可用的博客它每秒钟发送高达2,000条消息并购买开源数据,例如Twitter的“firehose”,该数据流每天流传数以亿计的实时推文虽然很多是由政府的秘密监视行动(特别是那些监视美国人的行动)构成的,EMBERS项目专注于追踪海外人类行为并发布其调查结果,即使是负面的“我们没有看任何分类的东西,我们也没有预测到恐怖主义,因为我们无法访问这些返回频道,“Ramakrishnan说:”我们正在查看任何人都可以获得的数据“这是一个全自动系统,每天24小时,每天七天,产生45到50条警报一周它吐出预测事件的日期,位置和坐标,谁或涉及哪些组,动摇的原因以及预测的置信水平goa L·预测可能会让美国在海外保护美国人以及其盟友的任何事情该项目首先开始审查拉丁美洲的开源数据流:它准确预测了2012年巴拉圭总统的弹predicted, 2013年在巴西举行的世界杯抗议活动以及2014年在委内瑞拉举行的暴力学生抗议活动如今,该计划监测拉丁美洲的20个国家,并开始进入中东和北非,覆盖伊拉克,叙利亚,埃及,巴林,约旦,沙特阿拉伯和利比亚 EMBERS是由Jason Matheny组织的2012年竞赛的产物,该组织由政府预测惊喜办公室(是的,这是一个真实办公室的名称)的副主任,以及办公室的Intelligence Advanced Research Activity Activity计划的项目经理组成

国家情报局局长弗吉尼亚理工大学的三个团队 - 马萨诸塞州剑桥的量子计算公司Raytheon BBN Technologies和加利福尼亚州马里布的HRL(前休斯研究实验室) - 被要求建立基于开源指标的最佳预测模型其中最成功的是EMBERS,它最终将其他团队的几个成员整合到了自己的团队中,其中包括Raytheon BBN,该团队现在构建了EMBERS的一些社交媒体模型,比如试图通过阅读Twitter Feed预测内乱的人

该研究的指导原则,Raytheon BBN的演讲和语言高级技术总监Scott Miller说“我们寻找喋喋不休,具体表明抗议的词,”米勒说,“我们发现不安条件的总体频率之间存在相关性 - 例如,西班牙词protesta - 和国内动乱的数量我们发现在这些地区发生了事情“科威特公民Raken Subaiya在他的电话上检查他的推特信息,正如Yousef al Anazi在科威特城司法宫前在2012年10月19日静坐抗议期间看起来一样Stephanie McGehee / Reuters在其他地区但情况可能会更加复杂因为信息可以是图片,文字或图表的形式 - 更不用说跨越许多不同的语言和方言 - EMBERS在合作中使用先进的数据提取和翻译方法与另一家剑桥公司Basis Technology合作,丰富了数据并提供了文本分析工具,而不是将外语翻译成英文,从而直接从本地语言方言例如,它可以解释阿拉伯文印刷的英文音标(在Twitter上流行)图形数据是从Tumblr上读取的,而航空卫星照片是通过自动工具处理图像的

尽管技术复杂,但预测模型的算法仍然必须经历大量的试验和错误80个专家和13个分包商(包括每个国家的社会科学家,计算机科学家,流行病学家,政治学家,统计学家和区域专家)组成的团队 - 致力于设计和更新最佳模型Ramakrishnan比较培训计算机以识别模式来教导电子邮件应用程序以识别垃圾邮件随着时间的推移,有一种“超级模型”,“学习哪种模型是最好的,但是它不断学习,因为这些国家的情况随着时间而改变”,Ramakrishnan说超级名模每月收到一份关于其预测准确性的报告卡告诉它哪些模型在哪些组合中起作用 - 哪些不是那么然后他们相应地进行调整独立承包商阅读和分级EMBERS预测的准确性是位于弗吉尼亚州麦克莱恩附近的一家非营利性研究机构,名为MITER,一个政府集合资助的研究中心MITRE国土安全系统工程与开发研究所的信息系​​统工程师Terry Reed负责监督一组十几个人,他们将EMBERS警报与新闻报道进行匹配,以确定其预测是否成真EMBERS现在在预测中几乎完美无缺Matheny Ramakrishnan表示,他相信EMBERS有潜力预测世界各地的人口水平事件

“可以想象,像这样的技术将会是有用的未来,并可能成为主流,“他说,”试图预测这并非新事物在社交媒体上让我们更好地做到这一点“迄今为止,政府机构并未就EMBERS项目的预测采取一致行动,但政府计划如何处理这些迅速发展的能力Matheny拒绝透露哪些政府机构热衷于此采用EMBERS的预测技术,但他向新闻周刊证实,情报,公共卫生,人道主义事务以及全球和国家安全机构正密切关注它 他说:“我们不断向政府合作伙伴通报研究结果,”他说:“十多家机构定期更新了这项研究的进展情况

”Ramakrishnan说,使用EMBERS警报的其中一个机构是疾病控制中心和预防除了向政府机构提供信息之外,VT还可以向商业实体出售其社交媒体技术,尽管目前还没有立即制定计划,但Ramakrishnan说:“这样做有很多正当的理由, “Ramakrishnan说,”这可以让我们在热点地区增加安全性,或提供更准确的旅行建议,保护美国人免受暴力侵害,并增加我们在大使馆的安全

“MITRE与国家的防务,安全和情报有着深厚的关系仪器事实上,根据MITRE的说法,里德代表国土安全部的信息安全主管,负责国内的一个委员会安全系统工作组专注于与机密信息系统相关的政策问题虽然MITRE确认了Reed与EMBERS的合作,但她拒绝接受Newsweek的采访EMBERS也可能不是唯一针对社交媒体进行预测的政府项目2月份,当一个声称与ISIS有关的团体短暂接管了Newsweek的Twitter feed,它发布了一份看起来是陆军文件的详细说明“Gist Mill试点项目”,该文件提到了开源指标的“操作概念”和“社交媒体分析“据五角大楼发言人称,该项目于2013年停止,但陆军正在将社交媒体与其传统的情报,监视和侦察行动融合在一起,并不断引入新的能力

尽管采用开放式战略,来源数据,福特汉姆大学国家安全中心主任卡伦格林伯格警告说,通过社交媒体和其他手段密切跟踪大众听起来少了很多模仿游戏,还有更多少数报告“我们确实需要在所有的初始阶段决定一些准则和法律和道德参数这些项目“,她说:”我们已经看到,当这种情况没有发生时,我们稍后会从我们的政府那里听到'我们依赖这个计划,我们现在不能拆除'这些计划的后果是非同寻常的作为一个国家,我们是否同意我们如此不安全以至于我们需要这些计划以牺牲我们的隐私为代价将我们的风险降低到零“

情报官员经常指出,”大规模监视“这个词是一种用词不当,认为政府监督的目标是针对特定的个人或群体,而不是群众但EMBERS只进行大规模监视“我们没有跟踪我们项目中的个人,”Ramakrishnan说,“我们正在追随人群和群体”他指出该计划确实遵循了公众人物的推特和其他主要领导人,因为他们对群众的影响力超过了事实,但格林伯格补充说,虽然这些工具无疑是有用的,但有迹象表明政府可能正在过度依靠技术来提醒它安全威胁“不知何故,我们错过了阿拉伯之春,我们错过了ISIS的崛起,”她说,“这些是有价值的技术工具,但没有任何替代品可以在当地实现

超过两次点击“雷神BBN的米勒同意,如果有疑问,没有什么可以说明事实:”现在,我们的中东预测还没有出现

找出问题的最好方法是只问某人“