【转载】国内百科类网站十年小史

国内百科类网站十年小史

信息烟尘里的中文路径

作者:赵大伟 宋小伟

《南方都市报》2012年9月14日   B14-15版

        摘要:作为维基百科中文版的创始人,苑明理在2002年写出了中文维基百科的第一个页面。十年过去,他现在每天仍会浏览维基,却很少再编写词条,当初老一批编者也大都淡出。维基百科中文版进入平缓的发展阶段,但仍“不比百度百科和互动百科差”,苑明理说。他现任果壳网的架构师,这是一个日益引人注目的科普网站。

           作为维基百科中文版的创始人,苑明理在2002年写出了中文维基百科的第一个页面。十年过去,他现在每天仍会浏览维基,却很少再编写词条,当初老一批编者也大都淡出。维基百科中文版进入平缓的发展阶段,但仍“不比百度百科和互动百科差”,苑明理说。他现任果壳网的架构师,这是一个日益引人注目的科普网站。

           2001年,维基百科英文版创立。2004年初,国内主流媒体开始报道维基百科的新模式,称其为自由知识的新革命。两年之后的8月,首届中文维客年会在上海举行,苑明理与会。维客年会由内地最早的类维基网站“网络天书”(cnic.org)主办,它于2003年成立,两年内就吸引了三四百人参与其中;互动百科那时叫“互动维客”,刚成立一年多,拉到了投资,率先走上商业化道路;百度百科在测试中,没有代表参会,两年后网民们会见到她;苑明理印象深刻的还有南京人鲍鸣浩创立的维库(wikilib.com),它基于跟维基百科一样的开放、平等、共享理念。鲍鸣浩当时对维客的发展已不再盲目乐观,他说一是技术,二是“中国缺乏内容开放运动的土壤”。

           如今,你搜索维库,会发现最后更新时间是2010年2月25日,“网络天书”则是2007年10月7日。互联网的浪潮过去,中文维客年会后再没有消息。现在,活跃在内地网民世界里的,似乎只剩中文维基百科、百度百科等几家。新鲜的词汇、知识以最快的方式在网站上发芽,在网民的屏幕上生根。

互动百科、百度百科:

本土百科的成长与桎梏

           苑明理说,他有一段时间没上互动百科了,互动百科之前给他个人的感觉是,“他们不是从知识,自身的积累来做考虑,所以很多决策和维基百科都是不一样的。它的首页上有一些相当吸引眼球的内容,我自己个人的理解是为了网站流量才这样做的”。互动百科定期会公布影响中国的“十大热词”;在一位不愿透露姓名的工程师看来,互动百科CEO潘海东的公开信《三问李彦宏》都是一种噱头“商战,有多少是真咬牙切齿的?”

           今年7月底,互动百科成立了“科学顾问团”,请来方舟子做首席科学顾问,清华大学教授赵南元、资深媒体人“土摩托”袁越、中国科学院理论物理研究所研究员何祚庥等人也都是科学顾问团的成员,赚足了眼球。紧接着,百度百科也成立了“学术专业委员会”,请来姬十三、乐嘉等120多人为网友提供权威意见。

           在“中文网志年会”的主导者、自身互联网观察家毛向辉看来,维基百科从来不尊崇任何权威性,一个大学教授的权威性在大学里可以接受,但是在维基百科中就会变成一个灾难。“因为可能这个词条里面五个学生在编辑,他们分别来自于欧洲、美洲、北美、中国,维基人相信,这五个学生的能力超过了这个教授,这不是假设,已经证明了,叫做collectiveintelligence,它是群体智慧,超过权威性的东西,尤其是群体智慧在求证和考据的多元性方面。”

           百度百科运营总监高雪对南都记者解释说,虽然百度的学术专业委员会中80%都是博士以上学位,但是这些专家并不能把词条改为他自己的想法,“专家只是针对有质疑的点提出专业意见,这个地方可能存在问题,可以参考哪些资料,最后写成词条的还是用户”。

           高雪去年加入了百度百科,之前百度百科对自己产品的定位是满足用户事物了解,而今年开始他们树立了新的使命,着手建立数字博物馆、百科学术委员会等,“让人类更平等地认知世界”。百度百科正式上线于2008年,当时有110万词条,如今已经发展到500多万词条,200多万用户的规模,当你就某一人名、社会事件等词条在百度上搜索的时候,如果百科有收入,它很快就会跳在搜索首页靠前的位置。

           或许对于初级用户来说,编写词条是件相对简单的事情。以周克华女友张贵英为例,在周克华被击毙的第二天,百度百科词条中就有了“张贵英”,但是内容全复制自媒体报道。更多人对百度词条的速度惊叹,这全靠庞大百度用户,他们发出的词条,只要不涉及敏感违禁内容,都可以很快通过机器自动审核后发出来。“我们工作人员肯定做不到这么海量的编词量”,高雪说。

           百度最资深用户群体统称为“蝌蚪团”,目前有一百多人,背后是几千人的核心用户。而互动百科的用户则称为“智愿者”。二者都用积分等级上升和商城换购实物的方式来奖励各自的优秀用户。“维客”这个词也不再流行,背后是类维基网站的分化,“只有中文维基在遵循着维基的编辑原则,其他百科网站都是大面积商业操作的痕迹在里面”,毛向辉对南都记者说。

           或许更重要的是,国内的商业类百科网站都只设定中文用户和读者,在内容的广度上有不足,而且“像中国企业很难走到外面去一样,他们没有一个普世可以接受的价值”,毛向辉说,2004年,维基百科成立基金会,吉米·威尔士和几个顾问就征求了他的意见,“所以维基百科一开始就是国际化,这是它的生命力”。谈及互动百科和百度百科之前关于抄袭的官司,他觉得,如果走国际化的路线,抄袭这种问题很容易就会碰壁,触犯到其他法律边界。

《中国大百科全书》:纸本转电子的尝试

           专注中文用户,国内还有另一种形式的百科类网站。2005年,新浪网与中国大百科全书出版社合作,一起推出了“中国百科项目”,即“百科在线”。

           那时,新浪还是汪延时代,汪延对百科全书很感兴趣,促成了这个项目。“百科在线”的用户只能免费查看词条的前600字,注册成为付费会员后可获得更详细、专业的付费内容。在当时,这似乎是传统出版社转型数字化出版的一个成功案例。

           在百科类网站方兴未艾的2005年,中国大百科全书出版社有着得天独厚的优势。据社长龚莉介绍,自1978年成立以来,《中国大百科全书》第一版(共74卷),单卷本最高销售70万册;《中国大百科全书》(简明本),1998年出版,累计销售十几万套;《中国大百科全书》(第二版)于2009年出版,目前已销售17000套。人民群众需要词条。

           数字化从术语统一开始。早在1992年左右,大百科全书出版社高级工程师田野和同事们,就把不同译者翻译的同一个外国人名收集起来,做成一张卡片,用来进行百科全书的统一工作。在百科全书编完之后,田野和同事们在社里的图书馆里,把好几张大桌子拼在一起,排卡片做内容分析索引。(来源:南方都市报 南都网 大闸蟹来袭全城杀价)

           “分析索引是按汉语拼音排,条头是按笔画排,正文是按照汉语拼音排。”编辑们把索引词条从文中找出来抄到卡片上,再对卡片进行排序,填页码,然后用再将正文和索引按汉语拼音顺序排好,方便读者查找。做一本书的索引词条工作需要团队一两个月的时间。

           上世纪90年代中期,大百科出版社开始把这些卡片整理成数据库,在计算机上保存下来。田野印象深刻的是,当时的出版社第一台计算机的硬盘只有五兆,用数据库给卡片内容排序的时候,需要排一个晚上,晚上下班计算机都是不关的,第二天早上接着做。中国大百科全书数据库就这样慢慢建立起来。

           “当时我们的认识比较局限,新闻出版署的于永湛副署长去加拿大参观,看了人家的双语术语数据库,回来和我们说,你们要站得再高一些。”田野说,于是百科全书的数据库又重新设计了一遍。一步步摸索、丰富,《中国大百科全书》第一版光盘版和后来十几个更新版本进一步推进了百科全书走进了付费领域。2011年,经历过数次丰富的网络版《中国大百科全书》(数据库)进入了众多公共图书馆、高校图书馆和政府机构领域。

           而对于更多的普通网民来说,在自己家的电脑上免费检索网络版的《中国大百科全书》无疑是件困难的事情。“大家很需要这个东西,但是中国这个环境就是没有人愿意为这个付钱,我们只能找一些帮着付钱的机构。”田野一肚子苦水。

           2005年与新浪合作,把大百科全书出版社权威优质的资源在线化一直是他的愿望。合作的产物“百科在线”最终因为利润太低被新浪舍弃。为了利益,出版社曾与书商合作,利用图书捆绑销售在线上网卡。

           现在,第三版的《中国大百科全书》项目正在进行整体设计,预计未来三五年内会推出。面对国内百科类网站日益迅猛的发展,田野觉得,出版社其实应该更多地“为大众公益服务,甚至是免费服务”。在他的设想里,未来第三版《中国大百科全书》的网络化,其实可以“对研究机构、高校收费,提供增值服务;而对普通的网民来说,可以用增加广告版等方式开放给公众,或者是用手机话费的方式来付费,这样更好地为用户服务。”田野希望第三版百科全书能结合中国大百科全书的权威性和商业百科网站的优势,真正做出一部用户欢迎的百科全书。

           田野的设想是否能得到实现还是未知。传统出版社转型数字化出版一直是他们面临的现实问题。

           “我一直想把百科在线做起来,但一直有一种孤军奋战的感受。”田野说。2006年,很多人都觉得网络出版不挣钱,一些出版社数字出版变成了一个创收的部门,工资都要部门自己的员工去挣。“没有一个东西是你什么都不投入,就可以挣到钱的”,田野说。回想起90年代中国大百科全书出版社在全国出版行业领先的地位,田野承认,因为资金的问题,现在大百科全书出版的网络数字化建设,已经远远落后于高等教育出版社和商务印书馆,更不能跟百度这样的大公司比了。

           田野也曾去百度百科交流过,“我们算过他们多少人做这方面的事,这些人的工资比我们要高很多,这样算下来,光一个人工经费就不得了”。更吸引他的,是百度的技术优势,“对内容的处理主要是由软件来做,对知识的挖掘和人工智能方面,都值得我们学习”。在现在大百科全书出版社的“百科在线”的网站上,也有“我编百科”这样的栏目,田野就是想“引入人家好的方式,把读者的积极性调动起来”。(来源:南方都市报 南都网 大闸蟹来袭全城杀价)

           现在,与新浪合作的“百科在线”只孤零零地挂在了大百科全书出版社的网站首页上,最后的一个词条“金字塔”更新的时间是2009年3月26日。

中文维基百科:黄金时期过后的平缓

           苑明理最近一次编写维基中文的词条,已经是一年多之前的事了。经历过2004年到2007年的黄金时期,维基中文已经处于一个趋于平稳的发展阶段。苑明理观察到,2007年之前还觉得维基百科很新鲜、有启发意义,近几年在世界不同地方召开的年会内容板块大致都固定了,“年会上很多问题提了很长时间,比如在中国受到的限制,国际上,老用户也在退出、新用户在减少等问题,都不是短时间能解决的”。

           中文维基百科正式开始于2002年10月24日,包括内地简体、港澳繁体等。2011年1月,维基百科创立十周年。著名的“维基原则”包括 :“我们不供出售”、“只要符合少许条件,每个人都可以使用我们的工作成果”、“我们只是一群资料收集者”,等等。

           苑明理粗略统计过,全球范围内每个月为维基百科的词条贡献五次的大概有一千人;每个月贡献一次的有七千多人。“五次以上就是活跃的,一千多人好好做的话,已经是会有很好的东西出来了。”苑明理说,“中文这边还是在逐步增长的,但增长相对慢一些。按照人口比例的话,这也是反映了中文对知识的积累和贡献,比英文要差很多。”

           维基中文与其他语种之间的差距,似乎是一个难解的问题。“深层的原因是社会氛围,不论社会知识的存量和还是文献的积累,比人家差很多。”苑明理觉得这和微博与T w itter的对比一样,“英文内容更丰富,中文看来看去就那些事”。但维基中文十年,给苑明理等一批维基人和用户带来了更宽广的视野,“知识由从上而下的传播途径变成了由下而来的积累方式,路径发生了明显改变。”

           毛向辉也承认这个问题的存在。他很少在维基百科写词条,基本都是浏览。最近一次是几天前,他在维基中文上增添了“铁质施肥”这个词条。“我关心地球环境方面的话题,铁质施肥的试验在国外已经有三十年的历史,但中 国 没 有这种试验,维基中文是个空白,而英文、德文、日文、都有了,我这种分享的冲动就出来了。”用了五分钟时间,毛向辉把英文的内容编译了一下,添加了“铁质施肥”这个条目“我们需要有人做掮客,做桥梁。”

           在英语世界,维基百科常被拿来跟其他类百科计划做比较。比如已经停止的百科全书计划N upedia、需付费使用的大英百科全书网络版等。但在中文世界,维基百科衍生出了一些独有的魅力。

           明年8月,2013年维基百科媒体国际会议将在香港召开。虽然在浏览来源数据上,内地超过香港,居于第二位,但是在中文编辑来源中,香港超过内地,仅次于台湾地区。每个月,香港的维基人都会定期举行聚会,毛向辉经常会参与其中。“见面主要是可以把线上反复整理的问题进行当面争论,加速问题的争论”。

           毛向辉认为,值得一提的是2007年开始的“时昭罢免案”。香港地区的维基管理员认为时昭对政治性内容的审核过于严苛,前后共进行了七轮针对时昭管理员身份的罢免案。维基百科的阅读栏里,保留着每次罢免时正反双方的辩论理由和当事人的陈述,此事直到2011年才告一段落,最终支持罢免196票,反对205票。“后来大家觉得罢免不是那么重要的事情了,重要的是维护编辑的原则,而不是通过自己的政治观去左右编辑内容,这种民主实践,我觉得它是华人地区史无前例的”。毛向辉说。

           现在,关于“时昭罢免案”的历次讨论、投票内容依然在维基中文公开,“维基从来没有政治密室,这种东西是不存在的,这也是我们喜欢它的地方。”

           【Johnnie注】本文转引自南都网,转载未征求作者意见,仅用于学习分享,在此特别鸣谢。

 

留下评论