设为主页
加入收藏夹
工具书库    学术研究    学习资源    学派名家    学术动态    最新文章    辞书论坛    
当前位置:首页>>辞书应用与研究>>学术研究>>辞书理论与应用
 

 

摘要本文简单回顾了我国数字化辞书的发展历程,简要介绍了数字化辞书的特点,着重对国内数字化辞书目前存在的问题进行了评述,对辞书出版所面临的数字化冲击进行了分析

 

关键词辞书数字化问题冲击

 

当下,全球化、信息化浪潮势不可当。从内容产业来看,以互联网为代表的数字技术正在改变我们生产、生活、消费(包括信息消费)的传统做法。在辞书领域,这一变化也很明显。虽然数字化辞书的基础依然是辞书(或内容)而不是数字化技术,即“内容为体,数字化为用”,但如果我们在辞书内容的提供、加工、更新、传播等一系列的过程中不研究、不运用数字化技术,那么,辞书内容的生产、传播必然就会游离于时代潮流之外,处于一种被动的状态,传统辞书在教育领域、大众市场的作用和份额就会降低、弱化,甚至可能会被替代。在无情的市场经济面前,固守即意味着退缩。因此,在传统出版与数字出版的融合已成为现代出版趋势的背景下,如何避免数字出版的冲击,分享数字出版的成果,应该成为我们关注的焦点之一。

 

一、我国数字化辞书的发展历程及代表性作品

 

在我国,数字化辞书大约出现在20世纪90年代中期,起初多以软件的形式出现,同时,也出现在手持设备(如掌上电子词典、PDA、手机等),并且迄今不衰;90年代中后期光盘版的数字辞书也盛行一时,但由于遭受盗版等原因,现已式微;2000年以来,随着互联网的普及,网络版工具书逐渐兴起,成为大型数字化辞书的主要类型。

 

国内数字化辞书的类型主要有:

 

网络版辞书,这是使用时通过互联网来控制数据传送的数字化辞书。如《汉语大词典》(网络版2.0)、《中国大百科全书》(网络版)、《辞海》(网络版1.0)等。软件版辞书,这是以软件形式发行,使用过程中不通过互联网传送数据的数字化辞书,如《汉语大词典》(光盘版1.0)、《中国大百科全书》(光盘版)、《儿童辞海》(光盘版)、“金山词霸”等。手持设备版辞书,这是各种类型的掌上电子词典,也包括储存在手机等手持设备中的数字化辞书。在上述类型的数字化辞书中,目前最值得关注的是一些大型的网络版工具书。这主要是因为这些数字化辞书均出自名门,来自我国著名的工具书出版社,系二次出版,在内容的权威性、释文的经典性、条目的完备性等方面都具一流的水准。较具代表性的有:《中国大百科全书》(网络版);上海世纪出版集团易文网的“工具书在线”,包括《中华文化通志》(网络版)、《汉语大词典》(网络版)、《辞海》(网络版)、《〈中央日报〉标题索引》等;商务印书馆的“工具书在线”(测试版),包括《新华写字字典》、《新华正音词典》、《新华拼写词典》和《中华人民共和国地名大词典》等。

 

二、数字化辞书的特点

 

与传统的印刷本辞书相比,数字化辞书主要具有下列特点。

 

1.更多的检索、查询手段

 

除了与传统纸质工具书一样的常规检索手段(如分类检索,按拼音、笔画检索),数字化工具书还具备其他一些极为有效的检索、查询功能,如通配符检索,逻辑表达式检索,全文检索,还可根据内容制作特殊的检索方法,如《汉语大词典》中对汉字作“通假”等关联的检索,就是一个很典型的例子。

 

2.支持多媒体

 

数字化工具书具备多媒体处理能力,这也是其颇具吸引力的一个方面。在数字化工具书中,人们除了能够像使用传统的纸质工具书那样,得到以文字、图像为表现形式的信息外,还能得到通过声音、动画、视频等多种媒体元素来表现的信息,而工具书中的许多条目正是需要通过这些媒体元素才能独特地、完整地、更好地为读者提供相关的信息。如重大历史事件条目,音乐作品条目,物理、化学、生物条目中的原理演示等内容,都不是仅靠文字、图片就能够完美表现的。从技术上讲,数字化辞书对音频、视频、动画等均可支持,但目前我们还很难看到像微软公司所出《Encarta百科全书》那样比较理想地支持多媒体表现的大型数字化辞书。究其原因,笔者认为,主要与投入大而产出小有关。目前国内的数字化辞书大都属“二次出版”,只对内容作技术上的加工,而很少再花人力、物力去重新制作或采集多媒体资源,因为这项工作投入巨大,但回报并不理想。

 

3.支持互动,更新快捷方便

 

大多数人认为,互联网是一个大众媒体,面向的是大众,但也有少数专家认为互联网是一个个性化的媒体,是小众媒体,更是唯一的互动媒体。笔者认为,后者抓住了事物的本质特征。与图书、报纸、广播、电视相比,互动性是网络媒体的鲜明特征。如何利用网络媒体的这一特性,让关心辞书的大众贡献出自己的意见,参与内容的提供(实践证明,在个别条目上,读者掌握的信息会比专家更多、更正确),以利辞书的更新、修订,这一问题值得探讨。笔者认为,利用网络媒体的互动性,数字化辞书至少能为将来的在线工具书编纂平台打下基础,如《辞海》网络版增加“评论”功能就是一种尝试。众所周知,印刷本《辞海》的修订周期较长,投入很大,更新的时间跨度大(10)。如能在《辞海》(网络版)中注意吸收新的资料,会对《辞海》的修订大有裨益;同时,读者查阅《辞海》也能了解到更多、更新的信息。如有关冥王星失去行星地位的资料,吸收到网络版中十分方便,但在纸质书中必须等到出下一个版本才能作修订。因此,通过论坛、博客等形式吸引读者提供素材,最后由专家审定(在未审定前则作为资料供读者查阅、参考),对保证工具书的常用常新,实现修订的持续性有很强的实用价值:读者看到的都是最新的修订版,此时,网络版就不再是纸质版的附庸,而成了纸质版的基础。网络版和纸质版各有各的读者市场,两者能共同为形成良好的辞书出版产业结构和产业链作出贡献。

 

另外,即使读者互动的信息不是提供内容,而是提出问题或质疑,也对辞书出版者有很大帮助,因为通过网络这一渠道,把产品和用户(读者)联结了起来。从产品营销的角度看,这对提高产品的质量、扩大产品的影响等会有重要作用。

 

三、数字化辞书目前存在的问题

 

数字化辞书在发展的同时,也存在着一些明显的不足,:产业链的培育与整合(包括产业链之间的利益分配)还未合理形成;与纸质辞书相比,数字化辞书还未形成成功的商业模式,产业的规模依然较小;市场的接受度(读者的阅读习惯)还不高;版权保护还有待于进一步加强;研制、开发过程中缺乏相对统一的标准,在界面、外字字库等方面往往大家各搞一套,等等。这些问题的外在表现之一,就是数字化辞书鱼龙混杂。具体表现为:

 

1.有些作品制作时研发重心更多地偏向软件功能而不是辞书内容

 

表现为注重新技术的运用和收词数量的堆积,忽视内容的正确性、实用性和科学性。请看一个实例。在一本桥牌书中有如下一段文字:

 

Obviously the bidders and doublers believed a pass was not forcing.The two passers were Eric Rodwell and the late Teddy Lightner.Peter Nagy wasn’t sure,nor was moderator,BobbyWolff.

 

上述文字中的“moderator”一词,在“金山词霸”中仅一个义项:

 

moderator(音标略)n.缓和剂

 

这一解释显然与原文不符。如果我们到《新英汉词典》(世纪版)中查这个单词,就会发现该单词有4个义项:

 

moderatorn.1仲裁人;调解人2(集会、会议或讨论会等的)主席;议长;[](基督教长老宗)教政组织的首脑3()(剑桥大学教学荣誉学位考试的)主考人4[]减速剂,慢化剂‖moderatorshipn.仲裁人的职权,主席的职权其中第一个义项符合原文的语境。毫无疑问,“金山词霸”在这个条目上存在着“义项缺失”这一重大缺陷。

 

2.有的数字化辞书提供的知识十分芜杂

 

随着“维基(Wiki)百科全书”编写模式在网络的流行,由网民参与编写百科全书的做法得到了很多互联网经营者的青睐,但在这一模式下编写出的“百科全书”,其所提供知识的正确性很难把握。如在号称“全球最大开放式中文百科全书”的“百度百科”中,“足球”条介绍的知识有足球的起源、汉代蹴鞠石刻、第一个因踢球名垂史册的人、史上第一份首发名单、最早的著名球星、现代足球的诞生,林林总总近万字,但从头至尾,却没有一段文字集中、概要地介绍足球是一项怎样的运动(如“比赛分两队,每队十一人,球员主要用足踢球或用头顶球。比赛90分钟,分上下两半时。以将球射入对方球门多者为胜”等信息)

 

3.版权暧昧不明

 

有些数字化辞书版权暧昧不明,内容甚至有抄袭之嫌。

 

目前,网上流传着一个叫“汉语大辞典”的软件(注意,不是《汉语大词典》),据开发者介绍,该软件包含成语词典一本(可查成语48700)、字典一本(可查汉字20973)、百科词典一本(可查词语377590),另有中华诗词大全、歇后语大全、灯谜大全、同义反义别名词典、名言词典、古文词典等内容。

 

显然,这些内容的编写依靠个人的力量是无法实现的。那么,这些内容在汇集过程中,版权是否会有问题,不免令人生疑。例如,在该软件中,“中国式摔跤”条目前面一大部分文字与《辞海》同名条目内容就十分接近。

 

中国式摔跤 摔跤运动之一。古称角力、抵角、相扑、争跤等。常用方法有背、别、挑、缠、揣(原文如此,当作“踹”———笔者按)、踢、拧、搂、弹、搿、插闪、抱腿、勾脚等,以将对手摔倒为胜,比赛分三局,每局三分钟。此外还有中国民族形式的摔跤,如蒙古族摔跤、朝鲜族摔跤、藏族摔跤、维吾尔族摔跤等。—“汉语大辞典”

 

中国式摔跤 中国民族形式的摔跤运动。比赛按体重分十个级别,10米见方的场地上进行。常用方法有背、别、挑、缠、踹、踢、拧、搂、弹、搿、插闪、抱腿、勾脚等,以把对手摔倒为胜跤,按胜跤质量评定321分。每场赛两局,每局3分钟,以得分多者为胜。若比赛终止时间未到而一方得分已超过对手10,该方为胜。中国各地区各民族也有不同的摔跤,如蒙古族摔跤、藏族摔跤、维吾尔族摔跤等。—《辞海》

 

尽管如此,“汉语大辞典”对《辞海》的摘录也有不全面的地方,如没有介绍“按胜跤质量评分,以得分多者为胜”的情况,而且最后一句话“此外还有中国民族形式的摔跤”则将“中国民族形式的摔跤”排除在“中国式摔跤”之外(正确的表达应该是将蒙古族摔跤、藏族摔跤、维吾尔族摔跤等包含在“中国式摔跤”这一概念里)。再看一个“百度百科”中的例子:

 

道员 职官名。明初布政司、按察司因辖区大而事繁,布政司的左右参政、参议分理各道钱谷,称为分守道;按察司的副使、佥事分理各道刑名,称为分巡道。此为道员称谓之始。至清乾隆间裁去世参政、参议、副使、佥事等职,专设分守道与分巡道,多兼兵备衔,管辖府、州,乃成为省以下府、州以上的高级行政长官。别称“道台”、“观察”。《官场现形记》第三四回:“八点钟一位客到,乃是这里有名的一位道台叫做‘磕头道台’。”又第九回:“王观察信上言明,是奉了东抚之命,前往东洋考察学务。”东抚,指山东巡抚。———“百度百科”

 

道员  明初布政、按察二司以辖区广大,由布政司的佐官左右参政、参议分理各道钱谷,称为分守道;按察司的佐官副使、佥事分理各道刑名,称为分巡道。此为道员称谓之始。清乾隆时裁参政、参议、副使、佥事等名称,专设分守、分巡道,多兼兵备衔,管辖府、州,成为省以下府、州以上的高级行政长官。清代简称“道台”,又设督粮、盐法等道,清末更在各省设置巡警、劝业二道,各司其专职。北洋政府时曾分一省为数道,设置道尹。———《辞海》

 

两者前半部分的文字几乎完全一样(百度百科中“至清乾隆间裁去世参政”衍一“世”字),而“又第九回”以下的文字,已与“道员”无涉,也犯了内容“芜杂”之病。

 

4.内容辗转抄袭

 

由于一些数字化辞书(软件)的开发者(尤其是个人)版权意识比较淡漠,往往将别人的东西随便拿来使用,因此,数字化工具书(软件)内容被辗转抄袭的现象屡见不鲜。下面是网络版成语词典中的一个条目:

 

 

我们在不同的网站可以看到与其相同的内容。现略举数例:

 

金石网www.kingsnet.biz

 

东方法眼www.dffy.com

 

成语词典www.chengyu.org

 

网络中国life.httpcn.com

 

四、要重视辞书出版所面临的数字化冲击

 

尽管互联网上数字化辞书(软件)的问题不少,但不容否认的是,互联网对辞书(包括纸质辞书和由正规出版机构出版的数字化辞书)的冲击很大,应当引起辞书界足够的重视。目前,这种冲击主要表现在两个方面。

 

1.以互联网为典型代表,信息提供的渠道更多

 

借助于搜索平台,目前互联网上的各种网站、网页已经成为很多人(包括不少专业工作者)了解信息、释疑解难的平台。“内事不决问老婆,外事不决问Google(仿《三国演义》孙策临死前对其弟孙权所言:“内事不决问张昭,外事不决问周瑜”)被选为2005年十大网络名言之一,就是这种冲击的形象概括。辞书,特别是百科类辞书、专科类辞书是否有被互联网替代的可能,值得我们关注。

 

2.互联网上的百科全书兴起,对辞书出版(知识供应)形成了冲击

 

作为一种互动媒体,互联网很容易成为一个聚集信息和知识的平台,因此,完全由网民编写、更新并供网民免费浏览的百科全书也逐渐出现,目前在全球范围内最具影响的是维基(Wiki)百科(http:www.wikipedia.org)

 

维基百科发轫于20世纪90年代中期,经过十年的发展,维基百科已被认为是目前世界上最大的百科全书,2005年底,共有82种语言版本,词条总数已经接近200万个,并且正以每月7%的幅度增加,每月的页面点击量达到25亿次。对此,不少人欢欣鼓舞,正如互联网刚兴盛时有人高呼“全民出版”或“个人出版”的时代到来了那样,目前,也有一部分人认为全民编写词典时代已经到来。但是,用专业的眼光来看,那种全民编写辞书的举动实际上是十分危险的。前《不列颠百科全书》副总裁和主编罗伯特·麦克亨利(RobertMcHenry)2004年对“维基百科”有一个尖刻甚至貌似恶毒的评论,他认为,使用维基百科这样全民编写的百科全书如同在上公共厕所:“如果它可能脏得显而易见,你就会处处小心;但或许它看上去相当干净,因此你会被一种错误的安全感所麻痹。显然你无法明确知道,谁在你之前用过了厕所。”

 

有人认为,罗伯特·麦克亨利的这番言辞,是因为维基百科全书与《不列颠百科全书》构成竞争使然,但实情却是:如果没有相当程度的判断力,用户就根本无法判断在类似“维基百科”这样的全民百科全书中获得的知识是真还是假;而如果用户能够作出准确的判断,那还需要去查工具书吗?这真是一个类似于“第二十二条军规”的黑色幽默。

 

知识作为人类文化的精髓,显然不应该被垄断。同时,我们也应该看到,知识的提供历来是一种专业化的技能,从来都是由专业化的队伍来提供(否则,就不应该有教师、医生、律师等职业),才能保证科学性、准确性。因此,如果普通大众获得的知识是真伪难辨的,互联网上良莠不齐的信息让人难以辨别其优劣,而人们还对这种情况一味称赞、夸耀,那么在知识供应上的“劣币驱逐良币”现象,便会发生、扩大。这才是最令人担忧的。

 

目前,经济全球化、全球信息化的浪潮席卷而来,每个人都面临着“全球信息化”或“信息全球化”的挑战。作为辞书工作者“全球信息化”需要我们考虑用信息化技术来发展我们的辞书事业,而“信息全球化”则使我们面临的竞争更为残酷(因为有更多的内容提供商出现)。面对新的环境、新的对手,应该如何应对,这个大问题值得每一个关心辞书事业的人去探索、解决。

 

 

 
【上一篇】
【下一篇】