乌托邦图书馆：为世界知识大同而奋斗不已

zhixun · 发表于 2012-8-3 22:39:49

尼古拉斯·卡尔（Nicholas Carr） 2012-08-02 14:46:30
谷歌野心勃勃的图书扫描计划已经陷入法律困境；而一个由哈佛大学领导的组织目前正在致力于将人类的所有文学作品放到网络上。硅谷做不到的事情，常春藤联盟学校能成功吗？

1938年，在《世界脑》（World Brain）一书中，H·G·威尔斯曾这样设想：在不远的将来，地球上的每个人都可以轻松获得“无所不思，无所不想”的知识储备。

缩微摄影术快速发展的十年是20世纪30年代，威尔斯推测，缩微胶片将会成为一项“促进人类知识体全面普及化”的技术。他这样写道：“很快，在世界任意一个角落，学生们都能将投影机当作学习工具，利用精确的复制品来便利地探讨任何一本书或一份文档。”
威尔斯的乐观看法最终落空了。第二次世界大战让理想主义的商业冒险陷入停滞，恢复和平之后，技术限制令他的计划难以实现。尽管缩微胶片依然是存储和保存文档的重要手段，但它过于笨重、易碎且太过昂贵，因而无法成为承载知识传播宏大体系的基础性技术。不过，威尔斯的理念并没有消失在历史长河中。75年之后的今天，创造一个囊括了所有已出版书籍的公共知识库——普林斯顿大学的哲学家彼得·辛格（Peter Singer）将其称之为“乌托邦图书馆”——的想法似乎已经成功在望了。利用互联网，我们拥有了一个能够高效且廉价存储和传播文本的信息系统，我们可以通过电脑或智能手机将文本按照要求发送给任何人。于是，我们剩下的任务就是要将自古登堡发明活字印刷以来问世的1亿多本书全部数字化，对其内容进行索引，增加一些描述性的元数据，然后利用工具将它们上传到网络上，以供浏览和搜索。
听起来似乎简单明了。如果这只是操纵比特和字节这么简单，那么在线图书馆可能早已成为现实。毕竟，谷歌已经为此奋斗了十年之久。但搜索巨头的图书计划还是遭遇了挫败；它被卷入了法律纠葛的泥沼之中。而另一项试图构建一座普世图书馆的宏大计划目前也正在孕育之中，它的发起者并非来自硅谷，而是来自哈佛大学。这个被称之为美国数字公共图书馆（Digital Public Library of America，简称DPLA）的计划不但名头响亮，志存高远，而且还找到了实力雄厚的捐助者。尽管该计划拥有种种优势，但其能否获得成功还远未成定局。和之前的谷歌一样，DPLA计划的发起者也开始意识到，在当下，构建一座普世图书馆所面临的主要难题并不在技术方面，围绕出版业的种种法律、商业和政治纷争才是最棘手的症结所在。不管是在线还是离线，人类世界似乎还没有为这种乌托邦式图书馆的出现做好准备。
谷歌的扫描大业

拉里·佩奇并无多少文学敏感性，但这并不妨碍他去构思一些宏伟的文学目标。2002年，这位谷歌的共同创始人决定要扫描世界上所有的书籍，然后将其保存在这家年轻公司的数据库中。他担心如果印刷文本不被转化为在线数据，谷歌就无法践行自己要让全世界的信息“随手可得，随处可用”的使命。在自己的办公室里完成了一些图书扫描测试——佩奇操作照相机，当时还是一位产品经理的玛丽莎·梅耶尔（Marissa Mayer）负责调整——之后，他断言谷歌拥有足够的技术和财力来完成这项工作。他组建了一个由工程师和程序员组成的小组进行协同工作。用了几个月的时间，他们就发明了一套精巧的扫描设备，这套设备利用一个立体红外摄影机去修正书本被打开时页面的弯曲部分。这种全新的扫描仪可以在将书籍快速数字化的同时，又不用拆掉书脊或破坏图书。除此之外，研究小组还开发出了能够解读四百多种语言中的特殊字符和其他怪异文体的字符识别软件。
2004年，佩奇及其同事向外界公开了这项后来被他们称之为为谷歌图书搜索（Google Book Search）的计划，这样的命名方式等于是在暗示，至少从一开始，谷歌认为这项服务本质上是其搜索引擎的延伸部分。在世界上规模最大的研究型图书馆中，包括纽约公共图书馆（New York Public Library）以及牛津大学和哈佛大学的图书馆在内的五家图书馆都与谷歌签约成为合作伙伴。他们同意让谷歌对其藏书进行数字化，作为回报，他们可以拥有图片的副本。从此之后，谷歌便开始了自己的扫描大业，将数百万册的书籍化为了数字复制品。这家公司并没有将扫描对象限定于公共领域的图书，它也扫描了一些依然受到版权保护的书籍，于是祸根就此埋下。美国作家协会（Authors Guild）与美国出版商协会（American Association of Publishers）起诉谷歌，控告其复制的所有书籍，乃至在搜索结果中仅仅展示一小段文本的意图，都将构成“极其严重”的版权侵犯。
随后，谷歌做出了一个重大决定。它没有凭借对受版权保护材料的“合理引用”为依据来应对诉讼和为图书搜索计划进行辩护——一些法学家甚至认为谷歌也许会赢下这场官司——相反，它与敌对者展开协商，以求彻底解决问题。2008年，谷歌公司同意向创作者和出版商支付巨额资金，换取图书商业数据库的开发许可。根据双方达成的协议，谷歌可以将数据库的订阅权出售给图书馆和其他机构，同时还可以把这项服务当成出售电子图书和广告展示的一种手段。
这样的处理方式只能使争议进一步激化。图书馆馆长和学者们纷纷站起来反对这一交易；很多作家要求将自己的著作从交易中排除出去；美国司法部忧虑会出现反垄断方面的问题；就连外国出版商也在大声抱怨。去年，在最后一轮的法律磋商结束之后，联邦地方法官陈卓光（Denny Chin）驳回了和解方案，并表示该方案“太过偏激”。陈卓光列出了各种各样的反对意见，他认为这项协定不仅“赋予谷歌在没有获得著作权人许可的前提下开发所有图书的至高权力”，而且还会让它从过去“对版权作品的大规模复制行为”中获得回报。原诉拟于今夏进入审判程序——事到如今，谷歌发现自己几乎又退回到原点。面对来自Facebook和其他社交网络新的竞争风险，谷歌也许不会再将图书搜索列为重中之重。佩奇的大胆计划在着手实施的十年之后陷入了搁置。

罗伯特·达顿曾这样写道，他希望能够开放“人类文化实体库中几乎所有可用的知识”。
再寻启蒙理想

如果你要寻找一个拉里·佩奇的对立面代表，那没有比罗伯特·达顿（Robert Darnton）更合适的人选了。现年72岁的达顿是一位声名卓著的历史学家和获奖作家，前罗氏学者（Rhodes scholar）和麦克阿瑟研究员（MacArthur fellow），还是法国荣誉军团骑士勋章（Légion d’Honneur）和2011年国家人文奖章（National Humanities Medal）的获得者，他与佩奇简直就是两个世界的人，他能言善辩，圆通得体，一直固守文坛。如果说佩奇是一头闯进瓷器店的公牛，那么达顿就是这家瓷器店的老板。
但有一点达顿和佩奇是相通的：他们都热切盼望能看到一座普世图书馆出现在网络上。用达顿的话来说，这样的图书馆可以“让所有公民自由地获取所有知识”。早在20世纪90年代，他就发起了两个开创性的计划，要将博物学和历史类的著作数字化，到了20世纪90年代末期，他撰写了一系列富有哲理的文章来论述电子书和数字学术的发展潜力。2007年，达顿受雇于哈佛大学，并被任命为学校图书馆系统的主任，这一职位安排为他提供了推广自己理念的绝佳契机。虽然哈佛是谷歌扫描计划的最初参与者之一，但达顿很快就成了图书搜索解决方案的最杰出和最具影响力的批判者之一，他通过写文章和发表演讲来反对谷歌提出的交易。他的批判主义不仅富于学术性，而且还具有极强的讽刺性。他坚称，谷歌图书搜索是打着自由和解旗号的“商业投机行为”，它注定要发展成为“一个财力上无可匹敌，技术上无懈可击，法律上无法战胜，足以碾碎所有竞争对手的霸权企业”。它会发展成为“一种完全不同于铁路和钢铁领域的新型垄断，即信息获取的垄断”。
达顿的言论似乎有些过激。密歇根大学的图书馆馆长保罗·柯朗特（Paul Courant）就指责他在散布“反乌托邦的白日梦”。但达顿有理由感到如此不安。这些年来，他亲眼目睹了商业出版公司无情地逐渐抬高了学术期刊的订阅价格。由于很多期刊榨干了研究型图书馆的预算，导致这些图书馆每年的续新费用飙升至数千美元。达顿担心，和解方案将无所不包的商业保护赋予了谷歌，在这些保护下运作的谷歌将会拥有为数据库订阅随意定价的能力。为了能够获得那些他们曾经让谷歌免费扫描的书籍的使用权而付出高昂费用的图书馆也许会就此灭亡。在达顿看来，虽然谷歌的执行官们似乎都充满了理想主义和善意，但谁又能保证他们或他们的继任者在未来不会成为唯利是图的掠夺者呢？他认为，通过允许“图书馆内容的商业化”，上述协议“会把互联网变成知识私有化的工具，而这些知识原本应归入公共领域”。
达顿认为，如果图书馆和大学利用来自慈善基金会的资金一起协作，就能构建一所真正意义上的美国数字公共图书馆。达顿构思DPLA的灵感并非来自当下的技术专家，而是来自于启蒙时代的伟大哲学家。18世纪，在印刷机技术和邮局的推动下，各种思潮在欧洲和大洋彼岸的美国呈现出风起云涌之势，在这股风潮的影响下，伏尔泰、卢梭和托马斯·杰弗逊这些思想家开始将自己视为是文学界（Republic of Letters）和超越国界充满了自由思想的知识界的公民。那是一个知识分子满腔热忱和酝酿才华的伟大时代，但当时的文学界只是“在原则上实现民主”，正如达顿在发表于《纽约书评》（New York Review of Books）上的一篇文章中所指出的那样：“就实践来看，它还是被名和利所把持着。”
随着互联网的出现，我们终于可以纠正这种不公平性。达顿曾表示，通过把图书的数字拷贝放到网络上，我们就可以使将美国大型图书馆中的藏书开放给任何能够接入网络的人，从而创造出一个真正自由、开放和民主的“数字文学界”。DPLA让我们能够“实现美国建国之根基的启蒙理想”。

密歇根大学的图书馆馆长保罗·柯朗特是DPLA指导委员会的成员之一，他预见到了谷歌图书计划中的公共利益。
一切都待定

哈佛大学的伯克曼互联网与社会中心（Berkman Center for Internet and Society）热切地接受了达顿提出的挑战。2010年年底，该机构宣布将投身于DPLA计划的构建中，力争将启蒙之梦想化为信息时代的现实。该计划不但从斯隆基金会（Alfred P. Sloan Foundation）募得了启动资金，而且还吸引了一个囊括多位杰出人士的指导委员会的加盟，这些知名人士包括达顿、柯朗特和斯坦福大学的首席图书馆长迈克尔·凯勒（Michael Keller），以及互联网档案馆（Internet Archive）的创始人布鲁斯特·卡利（Brewster Kahle）。年轻的约翰·帕尔弗雷（John Palfrey）担任了该委员会的名誉主席，他是哈佛大学的法律学教授，曾与他人合著了一系列关于互联网的颇具影响力的著作。（帕尔弗雷计划在今年的7月1日离开哈佛，去安德沃菲利普斯中学（Phillips Academy Andover）这所马萨诸塞预备学校担任校长，但他亦表示，自己依然会掌控DPLA计划。）
为了力争在2013年4月之前让数字图书馆至少在某些基本层面开始运转，伯克曼中心确立了一个野心勃勃的目标。经过一年半时间的努力，他们已经很快完成了若干任务，例如召开公众集会来推广数字图书馆，征求创意，以及招募志愿者；组织了六个工作小组来应对从读者群定位到技术难题解决等各方面的问题。除此之外，为了从许多不同的组织和个人中搜集具有革新意义的运作理念和有用的软件，该中心还发起了一个名为“冲刺公测（beta sprint）”的开放式竞赛。
陈卓光对谷歌协定的否决让达顿获得了一个将DPLA打造成普世图书馆最好寄托的历史性机遇。事实上，这项计划已经获得了广泛的支持。它不但获得了美国国家档案馆馆长戴维·费利洛（David Ferriero）的赞誉，而且还结交了一些重要的盟友，如欧洲数字图书馆（Europeana），这是一个由欧盟委员会赞助且与DPLA概念类似的数字化图书馆。
尽管如此，DPLA把自己打造成“公共图书馆”的意图还是引发了很多争议。在2011年5月召开的一次会议上，一个名为州立图书馆机构主管会（Chief Officers of State Library Agencies）的组织通过了一项决议，要求DPLA指导委员会为这项计划更名。虽然州立图书馆馆长们对DPLA“力图将全部的文化和科学遗产免费提供给国家和世界人民”的意愿表示了支持，但他们担心，通过自我标榜为美国的公共图书馆，DPLA会让一种毫无事实根据的想法变得更加可信，这种想法即是，“在美国，由16000多个团体构成的公共图书馆可以被一座国家数字图书馆所取代”。这样的看法将会导致地方图书馆更难以保住自己原本就不多的预算份额。DPLA推测，一座在线图书馆就能维持学术研究者和公众们各方面的不同需求，但其他批评者正是从这样的预判中察觉到了傲慢的意味。于是，为了强化自己与公共图书馆的联系，去年DPLA在指导委员会中新增了五位公共图书馆馆长，其中包括波士顿公共图书馆的主任艾米·瑞安（Amy Ryan）和旧金山城市图书馆馆长路易斯·赫雷拉（Luis Herrera）。
围绕着命名问题的诸多争议凸显了在线图书馆这种新生事物所面临的更深层次问题：它无法进行自我定义。从很多方面来看，DPLA计划依旧是一团迷雾。没有人知道它究竟要如何运作，甚至连它到底是什么也没人能说得上来。有些含糊之处是蓄意为之。在计划发起之后，伯克曼中心就希望能以一种合作和兼顾的方式来制定主要决议，以避免出现自上而下的指令传达方式，从而疏远了众多要赖以仰仗的资源。不过，依据DPLA现任官员和其他参与者的说法，指导委员会的17位成员也对图书馆的职能和业务范围产生了根本分歧。用帕尔弗雷的话来说，计划中的很多重要方面依然“有待定论”。
举例来说，对究竟是把数字图书的源文件存放在自己的服务器中，还是仅为用户提供其他图书馆和档案室电脑中的数字藏书的索引，委员会成员就无法达成一致。在除了图书之外哪些其他资源也应当被纳入图书馆的问题上，指导委员会亦无法形成明确的决议。照片、电影、音频、物体图像，乃至博客和在线视频皆在考虑范围中。另一个涵义尤为深远的待决问题在于，DPLA是否应该尝试为用户提供对包括流行电子书在内的新近出版著作的任意使用权限。就自己的角度而言，达顿认为数字图书馆应该避开最近5至10年内出版的著作，以免触动出版商和公共图书馆的既得利益。他警告说，DPLA“侵入现有的商业图书市场”将会铸成大错。不过，他同时亦表示说，自己目前还没有听到有任何人提出令人信服的反驳观点来，他也承认自己的观点也许不会被所有人接受。而帕尔弗雷只是表示，DPLA正在研究电子图书出借的议题，至于运作范围是否会延伸至新近出版物，DPLA还未做出决定。
同时悬而未决的关键问题还包括DPLA将以怎样的面目去面对公众。伯克曼中心监督图书馆技术平台开发的研究员戴维·魏因贝格尔（David Weinberger）表示，DPLA还没有决定是否应该提供诸如网站或智能手机应用程序之类的“前端接口”，或是否要将自己的角色限制为其他组织可以随便利用的幕后数据交换中心。DPLA技术团队的首要目标相对较为单纯。首先，他们希望能为目录信息导入和来自参与机构的其他数据（如记录图书被借出的频度）确立一整套灵活的开源协议；其次，技术小组计划将元数据整理到一个统一的数据库中；再者，他们想为数据库提供一个开放式的程序设计接口，希望启发富于创造力的程序员去开发出有用的应用程序来。帕尔弗雷表示说，自己期望DPLA能够运作属于自己的公共网站，但对于网站的功能以及它与传统图书馆网络服务功能的重叠程度，他又谨慎的不敢做出任何预言。帕尔弗雷希望DPLA不止是一个“元数据储存库”，不过，即便它最终只能提供连接功能，他亦会觉得计划获得了成功。
一个成员众多背景各异的指导委员会在复杂且重大的问题上难以达成一致意见，这根本不足为奇。要形成某些具体化的决策必定会让图书馆领域和出版业的某些人士心烦意乱，DPLA计划的领导者对此感到焦虑亦是情有可原。但DPLA展现给公众的夸张自我定位——它的网站宣称自己“会力图将人类的文化和科学遗产免费提供给所有人”——与实际构建过程中的迟疑和含糊之间的对立在不断激化。如果DPLA的身份和运作方式的不确定性得不到解决的话，这项计划最终会被延误甚至被拖垮。

版权高墙

即便指导委员会成员的观点能够日渐统一，DPLA的最终形式依然会模糊不清。威胁此项计划的最大难点在于它无法被执行命令或甚至是系统化的共识达成所决定。谷歌图书搜索和其他试图创建一个昂贵在线图书馆的努力行为都遭遇到了一个相同的问题，即如何摆脱美国麻烦的版权限制？“法律问题让人望而却步，”达顿说。
早在1790年，美国国会就通过了第一部联邦版权法。按照英国的先例，立法者力争在作家谋生需求和让公众免费接触其他思想的社会效益之间取得合理的平衡。这部法律允许“地图、图表和书籍”的“作者和所有者”为自己的著作注册14年的版权，如果版权到期且作者和所有者依然健在，则可以将版权期限再延续14年。通过将版权保护的最长时间限制在28年，立法者确保了没有一本图书会被私人长期控制；而要求版权被正式注册的做法又使得大多数著作能够很快进入公共领域。根据历史学家约翰·特贝尔（John Tebbel）的统计，在这部法律颁布之后的十年间，美国一共出版了13000本图书，其中只有不到600本著作注册了版权。
从20世纪70年代开始，美国国会又制定出了一套完全不同的版权策略。在电影公司和其他媒体及娱乐公司所施加的压力之下，它通过了一系列显著延长版权期限的法案，而且其针对的目标不仅是新书，甚至还包括那些出版时间可追溯到上个世纪的旧书。时至今日，著作版权在作者死亡之后还能延续70年之久。美国国会还删除了作者注册版权的必要条件——同样，这一变化也适用于过去出版的书。现在，版权对于任何著作都适用。即便有时候作者对版权主张毫无兴趣，他们也会拥有版权——他们的著作会几十年如一日的远离公共领域。结果，自1923年以来的大多数著作或文章依然被禁止进行未授权的复制和传播。为了努力建立知识产权贸易的国际标准，其他国家也制定了类似的政策。
政客们总是目光短浅。谷歌和DPLA的经历证明，版权的变化为扫描、存储和提供在线使用近一百年来所出版的图书资源带来了严重的限制。不仅如此，版权注册必需条件的剔除意味着成千上万本所谓的孤儿图书——版权所有者未知或无处寻找的著作——现如今也被排除在网络图书馆的利用范围之外。对于保证作家和艺术家能获得必要的创作资金，版权保护至关重要。但目前这种形势很难不让人感叹一句：版权限制管得太宽了，以致它甚至束缚了原本旨在鼓励的创造力。“在今天，创新经常会因为法律原因而非技术原因受到限制。”戴维·莱文（David K. Levine）说，他是华盛顿大学的经济学家兼《反抗知识垄断》（Against Intellectual Monopoly）一书的合著者，他表示，在很多领域，“人们都无法创作出新产品，因为他们惧怕如噩梦一般的版权诉讼。”
还有一种更深层次的扭曲。躲在版权高墙之后的图书和其他创造性的作品并非总是无法企及。在如何再使用的问题上，图书馆用来分类藏书时生成的大量元数据已经落入了一个灰色地带。这是因为很多图书馆会购买或许可来自商业供应者或联机计算机图书馆中心（OCLC）的元数据，后者是一家大型的图书馆合作组织，管理着大量的目录信息。由于长期以来图书管理员一直使用来自多渠道的元数据去分类藏书，因此要厘清哪些元数据有许可哪些没有或所有者是谁权限怎样等问题就变得异常困难。按照戴维·魏因贝格尔的说法，这种混乱的局面甚至导致DPLA看似普通的元数据收集工作也充满了障碍。他表示DPLA已经在这个问题的解决上取得了进展，不过，等到数字图书馆打开虚拟之门之后，用户们也许只能勉强使用那些少得可怜的内容描述了。

互联网档案馆的创始人布鲁斯特·卡利认为，DPLA应当为一个由众多图书馆组成的网络提供支持，而不是去构建一所集中化的数字图书馆。
梦想和现实

一些学者们相信，版权限制将会挫败任何尝试创造一所普世在线图书馆的企图，除非美国国会修改法律。纽约法律学院的版权专家詹姆斯·格里梅尔曼恩（James Grimmelmann）就觉得，在缺少新法律条款支持的前提下，想把孤儿作品纳入数字化的数据库中是“非常非常困难的”。弗吉尼亚大学媒体研究专业的教授希瓦·维迪亚那桑（Siva Vaidhyanathan）则希望能构建一个国际性的项目去整理网络上的研究材料，他相信版权法的重大修订是创建囊括了近代作品的数字图书馆的关键因素。维迪亚那桑预感，公众们可能要经过多年施压，才能让政客们采取一些必要的补救措施。
虽然对法律问题的讨论有些犹豫不决，但帕尔弗雷还是表达了某些期许之情，他希望不需要国会采取行动就能使计划取得进展。在他看来，DPLA也许能够与出版商以及作者充分协商，达成协议，继而可以提供1923年以后出版的某些孤儿图书和其他类型图书的使用权。按照某些版权专家的看法，在通过谈判达成类似协议和寻求法庭的支持上，DPLA拥一个谷歌图书搜索计划难以企及的优势，即前者是非营利的。
DPLA已经明确了自己会一丝不苟尊重版权的态度。如果找不到一种能够规避现行法律限制的方法，那么不管是谈判也好，立法也罢，它都将不得不将胃口限制在那些已经流通于公共领域的图书范围之内。如果是那样的话，DPLA要想显得与众不同就不那么容易了。毕竟，互联网上已经拥有很多来自公共领域的图书资源。谷歌也一直在提供1923年之前出版的数百万册图书的全文本且可搜索拷贝的相关服务。提供类似服务的还包括HathiTrust和布鲁斯特·卡利的互联网档案馆，前者是一个图书馆财团运营的大型图书数据库。亚马逊的Kindle商城则免费向用户提供数千本经典著作。此外，还有一个受人敬重的古登堡计划（Project Gutenberg），自1971年以来，它就一直在转录各种公共领域的文本，然后将其上传到网络上（1971年，该计划的创始人曾将《独立宣言》输入了伊利诺伊大学的一台大型机中）。尽管DPLA也许能够提供某些有价值的特色服务，例如搜索被研究型图书馆收藏的稀有文本，但这些特色很可能只会吸引一小部分学术人士。
尽管困难重重，但美国数字公共图书馆计划已经招徕了大群充满热忱的志愿者和一些慷慨大方的捐赠者。很可能到明年的这个时候，它就能完成第一个里程碑式的跨越，开始进行某种程度上的元数据交换。但之后将会怎样？数字图书馆可以把收藏范围扩展至上个世纪早期之外的时间段吗？它可以提供激发公众兴趣的服务吗？如果DPLA只不过是个过渡性工程，那它等于辜负了自己那不可一世的名称以及更为宏伟的承诺。H?G?威尔斯的梦想——同样，还有罗伯特·达顿的梦想——都将被再一次延误。

------------------------------
作者简介：尼古拉斯·卡尔（Nicholas Carr）为包括《大西洋月刊》在内的多份刊物撰写技术和文化方面的文章。《浅薄：互联网如何毒化了我们的大脑》（The Shallows: What the Internet Is Doing to Our Brains）是他最近出版的新书。

		自动登录	找回密码
密码			立即注册

乌托邦图书馆：为世界知识大同而奋斗不已

浏览过的版块