Nalsi的读书笔记:《大机器:计算机模型、气候数据以及关于全球变暖的政治》

在这个学期STS理论课(参见本人之前的一则读书笔记)即将完成的时候,我读了Paul N. Edwards写的《大机器:计算机模型、气候数据以及关于全球变暖的政治》(A Vast Machine: Computer Models, Climate Data, and the Politics of Global Warming)一书 (Edwards, 2010)。Edwards教授在密歇根大学信息学院和历史学院任教,他的研究领域包括计算机、信息基础设施、以及全球气候科学的历史、政治和文化研究,这本书是他最有名的作品之一,也完全涵盖了他上述所有的研究领域。

这本书很符合STS领域一以贯之的研究路线:对于技术物(technical artifact)的社会构建属性的分析。这本书里面最主要的分析对象就是气候数据——一种我们一般所谓的研究数据。作者从两个角度讨论了数据的社会构建属性:从数据到科学知识之间的过程并不是客观的或者自然的,对于数据的分析涉及很多人为的、主观的因素;甚至于数据本身也并不是客观的或者自然的,数据并不是对于自然现象的客观记录,我们所谓“收集数据”的过程也涉及到了许多人为的、主观的。

本书中的第一个角度也是上一篇读书笔记中Fleck的论点之一,他强调的是知识共同体对于知识产生的决定性的作用。在本书中,作者特别强调了计算机模型(作为一种并不那么客观的技术物)对于从数据中提取知识的重要性。从全球、使用各种方式和设备收集来的数据,只有被“规训”(使用福柯的术语)在某个框架下才能被理解、才能被转变为知识。而这个规训的过程,实则充满了各种社会的和政治的因素。作者在书中说:

Virtually everything we call ‘global data’ is not simply collected; it is checked, filtered, interpreted, and integrated by computer models. (page 188)

在上面提到的第二个角度上,作者提到知识的收集过程也并不如传统的科学主义叙事那样客观的,这尤其体现在不同设备(尤其是不同时代的设备)获取数据的翻译问题、以及现在越来越流行的使用模拟方法来收集数据——而模拟的方法则需要在软件中提供一系列的参数来代表世界的运行。

不过作者也提到,数据和模型的关系并不能简单的用单一的决定论来概括,二者互相依赖、互相影响,因而其实并不存在单纯的数据或者单纯的模型。而作者把这种数据和模型相互依赖的状态称之为“模型-数据共生” (model-data symbiosis)。

Thus, in global climate science, neither pure data nor pure models, exist. Not only are data ‘theory-laden’; models are ‘data-laden’. (page 284)

本书中提到的另外一个重要的概念是“科学摩擦力” (science friction) 的概念——作者在本书中也提到了这个概念在其他方向上的扩展,比如数据摩擦力、计算摩擦力、和元数据摩擦力——它们归根结底指得都是这些技术物在跨越社区和个人边界传播的过程中,会造成额外的时间和工作上的负担,比如一个科学家拿到了另外一个科学家分享的研究数据,但是他需要花费时间来理解数据和处理数据。而在作者和其他人合作的另一篇文章中 (Edwards et al., 2011) 指出,作为终端产品的元数据标准很容易产生这样的摩擦力,因为元数据标准的使用和制定往往是停留在本地的、而成为文档的元数据(虽然其用意在于促进数据的传播),也并不容易被读者所理解,甚或产生误解。

“摩擦力”的概念显然受到了行动者网络理论 (Actor-Network Theory, ANT) 的影响,这是STS领域里面影响力最大的一个理论。它关注人类和非人类的actor(为了照顾非人类的对象,actor往往被称作actant)如何组成社会关系的网络而发挥作用。比如使用本书中的例子,国际气象组织 (World Meteorological Organization) 在制定数据和元数据的国际标准的时候,需要参考现在使用的标准、以及标准应用的信息对象。这些曾经的标准和信息对象都是这个行动网络中的actants,而在这个过程中这些actors或者actants往往需要被重新定义才能嵌入到网络中,而当它们进入网络中的时候,它们也就失去了自己的权利,而把网络的行动主体作为代言人——从而网络的行动主体获得了更大的话语权力。ANT关注权力在微观层面的运作,它假定更为常见的权力模式只是微观的权力模式得到了扩展和复制——而这些模式扩展的政治机理也是ANT研究关注的对象之一。本书的理论脉络受到了ANT的强烈影响——“摩擦力”的概念只是表现之一,它可以看作是对于科学数据在社会网络中被运作的一个很好的个案研究。

参考资料

Edwards, P. N. (2010). A vast machine: Computer models, climate data, and the politics of global warming. Mit Press.

Edwards, P., Mayernik, M. S., Batcheller, A., Bowker, G., & Borgman, C. (2011). Science friction: Data, metadata, and collaboration. Social Studies of Science,

美国大选之后的一些想法

这是我第一次如此彻底的参与一次美国总统大选(虽然我对4年前的那次大选的记忆已经很浅了),从一开始的初选就在密切的关注,虽然后来因为Sanders的出局我的关注不再很密切,不过因为这次选举太过特殊,所以最后仍然不免有很多深切的参与和体会。

站在我目前的立场上,我依然想说,无论是图书馆事业、学术圈、还是作为一个个体的人,我们是没办法脱离政治的(关于第一点,推荐一下我几年前写的一篇小文)——在这里,政治指的既是大写的Politics(即国家、征服层面的政治)也是小写的politics(即人与人之间非正式的政治)。我并不认为民主制度总是好、无条件的好,但是我认为至少在政治的前一个维度上,有责任的公民是需要积极参与、而且有自己的独立的立场的。因为政治和我们息息相关。

回到这学期一直在读的STS(请参考本人的上一篇日志,虽然我的读书笔记持续跳票中),政治贯穿在科学研究的每个角落。福柯认为政治是权力的中心,而后者贯穿了他的科学技术研究叙事。或许是他在这个领域最重要的概念也是他后期研究的核心概念之一,“生命权力”(biopower)指的就是政治权力如何超越了我们每个人对于我们自己生命和身体的控制。而在另一个研究的方向上,Langdon Winner提出了那个著名的问题:“技术对象(technical artifact,但在STS的领域,artifact值得是任何非人的对象,比如技术系统、或者物品)是否存在政治属性?”(Do objects have politics?)(Winner, 1980) 在STS领域或许最有影响的理论行为者网络理论(Actor-network theory)甚至认为所有的政治都并不超脱于人、物之间的互动,所有的政治就是人和物在不同层面的互动,以及这些互动被扩展之后的效果。

让我想起这件事的原因是今天STS课上对于昨天大选结果的讨论。一点都不意外的,我们班上的同学普遍都是支持民主党的。有两个同学甚至于表达了很强烈的悲伤情绪。关于这件事,国内网络的环境似乎很喜欢“天真的、或者愚蠢的白左”这样的叙事。我当然认为当前美国如此撕裂的民意显然不是一边的错——我也听到很多教育程度很高的人会用愚蠢、愚昧这样的字眼来评价另一边的人,我个人并不认同这样的看法。但是如果说都是另一边的错、都是因为另一边的傲慢或者愚蠢那也显然并不是事实。当然人们选择一个候选人的原因有很多,但是今天我们班上一个一直需要特别的药物的同学(忘了她得的到底是什么病了)谈到她显然没办法接受新任总统会废除奥巴马的保险计划,因为这会极大的提高她的生活成本。另一个年纪比我大很多的大叔也谈到在他更年轻的时候,他会系统的追踪每一个候选人的每一个政策,来决定他到底要支持谁。政策,对于这个国家的很多人,都是很重要的事情。这并不是一句屁股决定脑袋就能盖棺论定的事。

前两天在知乎上读到一个对于这次中国一部分民众对于川普同学的态度和美国一部分民众对于他的态度如此不同的阐释(当然,我这里故意选择了这种叙事方法,好让这件事情被更好地放在情境里,让这个问题本身变得荒谬),大意是对于美国的这部分民众,他们已经生活在了所谓的后现代社会——他们的现状已经不再为发展这件事情担心,而更多的是需要去反思现代性对于人性的破坏。而在中国,官方的意识形态和很多人都依然生活在现代性的巨大影响下——我们在乎第一还是第二、我们在乎GDP、我们在乎物质的利益、我们不那么在乎人性。我并不认为这是故事的全部,我不认为任何现实存在所谓全部的故事,但是这个理论是能够阐释我所看到的一些事情的。

最后的生活昼夜颠倒,夜半醒来,兴之所至写下了这段不求全面但是发于心的东西。仅供各位参考。

Nalsi的读书笔记:《科学事实的产生和发展》

本学期修了我们学校科学技术研究(Science and Technology Studies,简称STS)专业的一门“科学、技术和社会理论”(Science, Technology and Society Theories)的课。这门课的老师很棒,阅读量很大,讨论很哲学,以及作业很多。但是作为本人有史以来上过最理论、最学术的一门课,我真心觉得受益良多。

所以未来3个月,我可能会把这门课上读到的几本书做一下最基本的读书笔记。

第二周我们要求读了Ludwik Fleck在1935年出版的《科学事实的产生和发展》(Genesis and Development of a Scientific Fact)。这本书实则是STS专业非常传奇的一本书。它往往被看作是STS领域的第一本著作、在30多年前就使用了社会建构主义(social constructionism)的视角来分析对于科学的认识论、以及它直接影响了托马斯·库恩在1962年写出了那本更有名的《科学革命的结构》(虽然两本书讨论的主题几乎一样)。

本书的主旨:科学事实是由社会结构和历史共同构建的,因而永远不存在在认识论上客观的事实。科学社区中存在称之为“智力共同体”(intellectual collective)的社会结构,在同一个共同体中,科学家享有同样的“思维风格”(thought style)。而正是这样的“超越个人”的思维风格,而不是科学家本人,决定了一个社区构造概念的方式。另一方面,我们当下的研究也总是收到之前研究的影响,而在这个意义上,也并不存在决然的对和错的结论。

作者Ludwik Fleck是波兰的医学从业者,也曾经在1930年代写过这本书为代表的一些科学认识论的作品。他在二战以及战后有过更为有趣的个人经历,不过各位可以参考此处所附的维基百科的页面。作者在1930年代深受涂尔干(Emile Durkheim)的功能结构主义社会学的影响(虽然后续的研究证明他对于社会学的认识是很初级、而且只是用于证明他的论证),所以本书的主旨中包含着深厚的社会结构超越于个人的味道,而这本书也在1960年代被莫顿(Roland Merton)和库恩重新发现之后,又影响了库恩那一代的STS研究者。

本书讲述了梅毒研究的发展史,以及华氏测验(Wassermann Reaction)的产生历史。和当时(甚至于现在)人们对于科学的看法相反,作者试图论证这两个科学的发展都并不是直线的、进步的。欧洲中世纪以来对于梅毒的经典看法毫无疑问的影响(作为一个中性词)了现代的科学发展;科学的发展也受到了科学家在“智力共同体”中的位置的影响;而且,在前一个时代被看作是错误的结论,随着新技术的发展,也往往被发现其实是有道理的(相反,我们在随着一个思路前进的时候,也会往往放弃掉很多本来可能也是正确的思路)。

如果说只能选这本书里面我最喜欢的一点,那就是作者说,任何单个实验都无法自动的导向结论,因为里面存在无数科学家的判断:某个证据是错的、是噪音、还是需要解释的真实?所以从观察乃至于实验得出的证据导向某些具体的结论,其实是需要研究者本人大量的主观意志的(而这种主观意志,根据作者的看法,又受到了科学共同体的集体意志的强烈影响)。作者反过来说,最开始的实验一定是无法自动说明任何结论的,而一旦任何一个实验能够自动的说明任何结论,那么这个实验也就必然失去了任何证明的意义,而只是为了向人展示罢了。

这本书给我最大的感受就是,和作者所说的“科学家无法超越共同体”,以及“科学界总是只能证明已有的看法,而并不是提出新的看法”的思路颇为不同,一些人(比如Fleck本人)是能够在一些特定的理论框架下提出新的、截然不同的看法的。比如虽然作者的社会学和哲学的框架都是当时存在的,但是一般看法认为作者的认识论框架是非常有独创性的——虽然也必然受到了当时波兰或者欧洲某些特定的影响,但是对于这一部分影响的追溯是并不太明确的。从这本书反过来说,科学的发展,着实是一件既简单又复杂的事情。

Nalsi的R笔记:RMarkdown

本人PhD的第二学期结束了。这学期上了一门统计的入门课,中间的过程颇为曲折,暂且不提。不过期末作业是用学到的统计方法分析一个数据集,并且写出一篇报告。因为本人最近对于数字人文学的兴趣,所以我选择了美国现代艺术博物馆(MoMA)在Github上发布的馆藏元数据,分析了西方绘画在19世纪末到21世纪初之间尺寸的变化。

因为这门课虽然课程安排上写的工具是SPSS,但是两位老师都很认同现在R在数据分析上的地位,所以也很鼓励我们用R完成全部的作业——所以我也就用R上完了这门课。并且经一位同学(他是一位很有经验的数据科学家)的提醒,第一次用RMarkdown这个插件包(package)完成了我的期末报告。

Markdown,根据Wikipedia的介绍,是一种轻量级的文本标记语言。但是它应用最广的领域是学术写作——尤其是定量研究的学术写作。(Latex是另一种这个领域常用的格式。)

R,作为一个目前在数据科学和数据分析领域应用最广的软件,显然应该有支持这种语言的插件包。以及因为接入了R的平台,这个插件包能够完美的在Markdown文本中插入R的代码和/或R产生的可视化图表。(作为比较,这就比苦逼的截图要容易而且优雅太多了。)

Markdown文本中每一段R的代码称之为一个Knitr chunk。在这个插件包本身的层面,你可以对这个chunk做多种功能的选择:比如选择这个chunk在文本中显示的大小、只显示代码的效果(可视化或者分析结果)、只显示代码本身、不显示所有的信息(比如错误信息或者警告信息),等等。如果你用的R编辑器是RStudio(强烈推荐)的话,那么在RStudio里面你也可以单独显示这段代码产生的结果,这让在文本中插入结果的功能变的非常容易,虽然我个人觉得没办法看到结果在文本的语境下的样子——尤其是文本中的尺寸——显然是一个值得改进的地方。

最后,作为一种常用的格式,它可以被很容易的转换成其他格式,比如Word、幻灯片、PDF、Latex、和HTML。(绝大多数格式都只需要你在这个文件的header的部分稍微改动一下就可以了。而且RStudio自带把rmd文件转换成Word、PDF和HTML的按钮。)

要想了解更多RMarkdown的功能,可以参考RMarkdown的官方文档