缩微摄影术快速发展的十年是20世纪30年代,威尔斯推测,缩微胶片将会成为一项“促进人类知识体全面普及化”的技术。他这样写道:“很快,在世界任意一个角落,学生们都能将投影机当作学习工具,利用精确的复制品来便利地探讨任何一本书或一份文档。”
威尔斯的乐观看法最终落空了。第二次世界大战让理想主义的商业冒险陷入停滞,恢复和平之后,技术限制令他的计划难以实现。尽管缩微胶片依然是存储和保存文档的重要手段,但它过于笨重、易碎且太过昂贵,因而无法成为承载知识传播宏大体系的基础性技术。不过,威尔斯的理念并没有消失在历史长河中。75年之后的今天,创造一个囊括了所有已出版书籍的公共知识库——普林斯顿大学的哲学家彼得·辛格(Peter Singer)将其称之为“乌托邦图书馆”——的想法似乎已经成功在望了。利用互联网,我们拥有了一个能够高效且廉价存储和传播文本的信息系统,我们可以通过电脑或智能手机将文本按照要求发送给任何人。于是,我们剩下的任务就是要将自古登堡发明活字印刷以来问世的1亿多本书全部数字化,对其内容进行索引,增加一些描述性的元数据,然后利用工具将它们上传到网络上,以供浏览和搜索。
听起来似乎简单明了。如果这只是操纵比特和字节这么简单,那么在线图书馆可能早已成为现实。毕竟,谷歌已经为此奋斗了十年之久。但搜索巨头的图书计划还是遭遇了挫败;它被卷入了法律纠葛的泥沼之中。而另一项试图构建一座普世图书馆的宏大计划目前也正在孕育之中,它的发起者并非来自硅谷,而是来自哈佛大学。这个被称之为美国数字公共图书馆(Digital Public Library of America,简称DPLA)的计划不但名头响亮,志存高远,而且还找到了实力雄厚的捐助者。尽管该计划拥有种种优势,但其能否获得成功还远未成定局。和之前的谷歌一样,DPLA计划的发起者也开始意识到,在当下,构建一座普世图书馆所面临的主要难题并不在技术方面,围绕出版业的种种法律、商业和政治纷争才是最棘手的症结所在。不管是在线还是离线,人类世界似乎还没有为这种乌托邦式图书馆的出现做好准备。
谷歌的扫描大业
拉里·佩奇并无多少文学敏感性,但这并不妨碍他去构思一些宏伟的文学目标。2002年,这位谷歌的共同创始人决定要扫描世界上所有的书籍,然后将其保存在这家年轻公司的数据库中。他担心如果印刷文本不被转化为在线数据,谷歌就无法践行自己要让全世界的信息“随手可得,随处可用”的使命。在自己的办公室里完成了一些图书扫描测试——佩奇操作照相机,当时还是一位产品经理的玛丽莎·梅耶尔(Marissa Mayer)负责调整——之后,他断言谷歌拥有足够的技术和财力来完成这项工作。他组建了一个由工程师和程序员组成的小组进行协同工作。用了几个月的时间,他们就发明了一套精巧的扫描设备,这套设备利用一个立体红外摄影机去修正书本被打开时页面的弯曲部分。这种全新的扫描仪可以在将书籍快速数字化的同时,又不用拆掉书脊或破坏图书。除此之外,研究小组还开发出了能够解读四百多种语言中的特殊字符和其他怪异文体的字符识别软件。
2004年,佩奇及其同事向外界公开了这项后来被他们称之为为谷歌图书搜索(Google Book Search)的计划,这样的命名方式等于是在暗示,至少从一开始,谷歌认为这项服务本质上是其搜索引擎的延伸部分。在世界上规模最大的研究型图书馆中,包括纽约公共图书馆(New York Public Library)以及牛津大学和哈佛大学的图书馆在内的五家图书馆都与谷歌签约成为合作伙伴。他们同意让谷歌对其藏书进行数字化,作为回报,他们可以拥有图片的副本。从此之后,谷歌便开始了自己的扫描大业,将数百万册的书籍化为了数字复制品。这家公司并没有将扫描对象限定于公共领域的图书,它也扫描了一些依然受到版权保护的书籍,于是祸根就此埋下。美国作家协会(Authors Guild)与美国出版商协会(American Association of Publishers)起诉谷歌,控告其复制的所有书籍,乃至在搜索结果中仅仅展示一小段文本的意图,都将构成“极其严重”的版权侵犯。
随后,谷歌做出了一个重大决定。它没有凭借对受版权保护材料的“合理引用”为依据来应对诉讼和为图书搜索计划进行辩护——一些法学家甚至认为谷歌也许会赢下这场官司——相反,它与敌对者展开协商,以求彻底解决问题。2008年,谷歌公司同意向创作者和出版商支付巨额资金,换取图书商业数据库的开发许可。根据双方达成的协议,谷歌可以将数据库的订阅权出售给图书馆和其他机构,同时还可以把这项服务当成出售电子图书和广告展示的一种手段。
这样的处理方式只能使争议进一步激化。图书馆馆长和学者们纷纷站起来反对这一交易;很多作家要求将自己的著作从交易中排除出去;美国司法部忧虑会出现反垄断方面的问题;就连外国出版商也在大声抱怨。去年,在最后一轮的法律磋商结束之后,联邦地方法官陈卓光(Denny Chin)驳回了和解方案,并表示该方案“太过偏激”。陈卓光列出了各种各样的反对意见,他认为这项协定不仅“赋予谷歌在没有获得著作权人许可的前提下开发所有图书的至高权力”,而且还会让它从过去“对版权作品的大规模复制行为”中获得回报。原诉拟于今夏进入审判程序——事到如今,谷歌发现自己几乎又退回到原点。面对来自Facebook和其他社交网络新的竞争风险,谷歌也许不会再将图书搜索列为重中之重。佩奇的大胆计划在着手实施的十年之后陷入了搁置。
哈佛大学的伯克曼互联网与社会中心(Berkman Center for Internet and Society)热切地接受了达顿提出的挑战。2010年年底,该机构宣布将投身于DPLA计划的构建中,力争将启蒙之梦想化为信息时代的现实。该计划不但从斯隆基金会(Alfred P. Sloan Foundation)募得了启动资金,而且还吸引了一个囊括多位杰出人士的指导委员会的加盟,这些知名人士包括达顿、柯朗特和斯坦福大学的首席图书馆长迈克尔·凯勒(Michael Keller),以及互联网档案馆(Internet Archive)的创始人布鲁斯特·卡利(Brewster Kahle)。年轻的约翰·帕尔弗雷(John Palfrey)担任了该委员会的名誉主席,他是哈佛大学的法律学教授,曾与他人合著了一系列关于互联网的颇具影响力的著作。(帕尔弗雷计划在今年的7月1日离开哈佛,去安德沃菲利普斯中学(Phillips Academy Andover)这所马萨诸塞预备学校担任校长,但他亦表示,自己依然会掌控DPLA计划。)
为了力争在2013年4月之前让数字图书馆至少在某些基本层面开始运转,伯克曼中心确立了一个野心勃勃的目标。经过一年半时间的努力,他们已经很快完成了若干任务,例如召开公众集会来推广数字图书馆,征求创意,以及招募志愿者;组织了六个工作小组来应对从读者群定位到技术难题解决等各方面的问题。除此之外,为了从许多不同的组织和个人中搜集具有革新意义的运作理念和有用的软件,该中心还发起了一个名为“冲刺公测(beta sprint)”的开放式竞赛。
陈卓光对谷歌协定的否决让达顿获得了一个将DPLA打造成普世图书馆最好寄托的历史性机遇。事实上,这项计划已经获得了广泛的支持。它不但获得了美国国家档案馆馆长戴维·费利洛(David Ferriero)的赞誉,而且还结交了一些重要的盟友,如欧洲数字图书馆(Europeana),这是一个由欧盟委员会赞助且与DPLA概念类似的数字化图书馆。
尽管如此,DPLA把自己打造成“公共图书馆”的意图还是引发了很多争议。在2011年5月召开的一次会议上,一个名为州立图书馆机构主管会(Chief Officers of State Library Agencies)的组织通过了一项决议,要求DPLA指导委员会为这项计划更名。虽然州立图书馆馆长们对DPLA“力图将全部的文化和科学遗产免费提供给国家和世界人民”的意愿表示了支持,但他们担心,通过自我标榜为美国的公共图书馆,DPLA会让一种毫无事实根据的想法变得更加可信,这种想法即是,“在美国,由16000多个团体构成的公共图书馆可以被一座国家数字图书馆所取代”。这样的看法将会导致地方图书馆更难以保住自己原本就不多的预算份额。DPLA推测,一座在线图书馆就能维持学术研究者和公众们各方面的不同需求,但其他批评者正是从这样的预判中察觉到了傲慢的意味。于是,为了强化自己与公共图书馆的联系,去年DPLA在指导委员会中新增了五位公共图书馆馆长,其中包括波士顿公共图书馆的主任艾米·瑞安(Amy Ryan)和旧金山城市图书馆馆长路易斯·赫雷拉(Luis Herrera)。
围绕着命名问题的诸多争议凸显了在线图书馆这种新生事物所面临的更深层次问题:它无法进行自我定义。从很多方面来看,DPLA计划依旧是一团迷雾。没有人知道它究竟要如何运作,甚至连它到底是什么也没人能说得上来。有些含糊之处是蓄意为之。在计划发起之后,伯克曼中心就希望能以一种合作和兼顾的方式来制定主要决议,以避免出现自上而下的指令传达方式,从而疏远了众多要赖以仰仗的资源。不过,依据DPLA现任官员和其他参与者的说法,指导委员会的17位成员也对图书馆的职能和业务范围产生了根本分歧。用帕尔弗雷的话来说,计划中的很多重要方面依然“有待定论”。
举例来说,对究竟是把数字图书的源文件存放在自己的服务器中,还是仅为用户提供其他图书馆和档案室电脑中的数字藏书的索引,委员会成员就无法达成一致。在除了图书之外哪些其他资源也应当被纳入图书馆的问题上,指导委员会亦无法形成明确的决议。照片、电影、音频、物体图像,乃至博客和在线视频皆在考虑范围中。另一个涵义尤为深远的待决问题在于,DPLA是否应该尝试为用户提供对包括流行电子书在内的新近出版著作的任意使用权限。就自己的角度而言,达顿认为数字图书馆应该避开最近5至10年内出版的著作,以免触动出版商和公共图书馆的既得利益。他警告说,DPLA“侵入现有的商业图书市场”将会铸成大错。不过,他同时亦表示说,自己目前还没有听到有任何人提出令人信服的反驳观点来,他也承认自己的观点也许不会被所有人接受。而帕尔弗雷只是表示,DPLA正在研究电子图书出借的议题,至于运作范围是否会延伸至新近出版物,DPLA还未做出决定。
同时悬而未决的关键问题还包括DPLA将以怎样的面目去面对公众。伯克曼中心监督图书馆技术平台开发的研究员戴维·魏因贝格尔(David Weinberger)表示,DPLA还没有决定是否应该提供诸如网站或智能手机应用程序之类的“前端接口”,或是否要将自己的角色限制为其他组织可以随便利用的幕后数据交换中心。DPLA技术团队的首要目标相对较为单纯。首先,他们希望能为目录信息导入和来自参与机构的其他数据(如记录图书被借出的频度)确立一整套灵活的开源协议;其次,技术小组计划将元数据整理到一个统一的数据库中;再者,他们想为数据库提供一个开放式的程序设计接口,希望启发富于创造力的程序员去开发出有用的应用程序来。帕尔弗雷表示说,自己期望DPLA能够运作属于自己的公共网站,但对于网站的功能以及它与传统图书馆网络服务功能的重叠程度,他又谨慎的不敢做出任何预言。帕尔弗雷希望DPLA不止是一个“元数据储存库”,不过,即便它最终只能提供连接功能,他亦会觉得计划获得了成功。
一个成员众多背景各异的指导委员会在复杂且重大的问题上难以达成一致意见,这根本不足为奇。要形成某些具体化的决策必定会让图书馆领域和出版业的某些人士心烦意乱,DPLA计划的领导者对此感到焦虑亦是情有可原。但DPLA展现给公众的夸张自我定位——它的网站宣称自己“会力图将人类的文化和科学遗产免费提供给所有人”——与实际构建过程中的迟疑和含糊之间的对立在不断激化。如果DPLA的身份和运作方式的不确定性得不到解决的话,这项计划最终会被延误甚至被拖垮。
版权高墙
即便指导委员会成员的观点能够日渐统一,DPLA的最终形式依然会模糊不清。威胁此项计划的最大难点在于它无法被执行命令或甚至是系统化的共识达成所决定。谷歌图书搜索和其他试图创建一个昂贵在线图书馆的努力行为都遭遇到了一个相同的问题,即如何摆脱美国麻烦的版权限制?“法律问题让人望而却步,”达顿说。
早在1790年,美国国会就通过了第一部联邦版权法。按照英国的先例,立法者力争在作家谋生需求和让公众免费接触其他思想的社会效益之间取得合理的平衡。这部法律允许“地图、图表和书籍”的“作者和所有者”为自己的著作注册14年的版权,如果版权到期且作者和所有者依然健在,则可以将版权期限再延续14年。通过将版权保护的最长时间限制在28年,立法者确保了没有一本图书会被私人长期控制;而要求版权被正式注册的做法又使得大多数著作能够很快进入公共领域。根据历史学家约翰·特贝尔(John Tebbel)的统计,在这部法律颁布之后的十年间,美国一共出版了13000本图书,其中只有不到600本著作注册了版权。
从20世纪70年代开始,美国国会又制定出了一套完全不同的版权策略。在电影公司和其他媒体及娱乐公司所施加的压力之下,它通过了一系列显著延长版权期限的法案,而且其针对的目标不仅是新书,甚至还包括那些出版时间可追溯到上个世纪的旧书。时至今日,著作版权在作者死亡之后还能延续70年之久。美国国会还删除了作者注册版权的必要条件——同样,这一变化也适用于过去出版的书。现在,版权对于任何著作都适用。即便有时候作者对版权主张毫无兴趣,他们也会拥有版权——他们的著作会几十年如一日的远离公共领域。结果,自1923年以来的大多数著作或文章依然被禁止进行未授权的复制和传播。为了努力建立知识产权贸易的国际标准,其他国家也制定了类似的政策。
政客们总是目光短浅。谷歌和DPLA的经历证明,版权的变化为扫描、存储和提供在线使用近一百年来所出版的图书资源带来了严重的限制。不仅如此,版权注册必需条件的剔除意味着成千上万本所谓的孤儿图书——版权所有者未知或无处寻找的著作——现如今也被排除在网络图书馆的利用范围之外。对于保证作家和艺术家能获得必要的创作资金,版权保护至关重要。但目前这种形势很难不让人感叹一句:版权限制管得太宽了,以致它甚至束缚了原本旨在鼓励的创造力。“在今天,创新经常会因为法律原因而非技术原因受到限制。”戴维·莱文(David K. Levine)说,他是华盛顿大学的经济学家兼《反抗知识垄断》(Against Intellectual Monopoly)一书的合著者,他表示,在很多领域,“人们都无法创作出新产品,因为他们惧怕如噩梦一般的版权诉讼。”
还有一种更深层次的扭曲。躲在版权高墙之后的图书和其他创造性的作品并非总是无法企及。在如何再使用的问题上,图书馆用来分类藏书时生成的大量元数据已经落入了一个灰色地带。这是因为很多图书馆会购买或许可来自商业供应者或联机计算机图书馆中心(OCLC)的元数据,后者是一家大型的图书馆合作组织,管理着大量的目录信息。由于长期以来图书管理员一直使用来自多渠道的元数据去分类藏书,因此要厘清哪些元数据有许可哪些没有或所有者是谁权限怎样等问题就变得异常困难。按照戴维·魏因贝格尔的说法,这种混乱的局面甚至导致DPLA看似普通的元数据收集工作也充满了障碍。他表示DPLA已经在这个问题的解决上取得了进展,不过,等到数字图书馆打开虚拟之门之后,用户们也许只能勉强使用那些少得可怜的内容描述了。
------------------------------
作者简介:尼古拉斯·卡尔(Nicholas Carr)为包括《大西洋月刊》在内的多份刊物撰写技术和文化方面的文章。《浅薄:互联网如何毒化了我们的大脑》(The Shallows: What the Internet Is Doing to Our Brains)是他最近出版的新书。