首页>检索页>当前

编词典:从卡片到语料库

发布时间:2021-09-15 作者:吕海春 来源:中国教育报

《现代汉语词典》首任主编吕叔湘先生说:编词典“要有人,要有物,就是物质条件,还要有计划和组织”。编词典最重要的物就是资料。

作为新中国成立以来第一部主要收录普通话词汇的《现代汉语词典》,在编写时,遇到的难题之一就是没有可借鉴的资料。以往的词典以古汉语词汇为主,因此一切都要白手起家。在资料收集方面,吕先生定下的方针是:书面与实际生活并重。一方面要从当时的报纸杂志、现代文学作品和新中国成立后出版的通俗读物中收集,并规定有些书要一个词不漏地穷尽收集;另一方面, 特别强调要有系统地收集各行各业中流通的词汇。吕叔湘先生曾让语言所词典室的同志到百货大楼去收集商品名称。他解释说:“为什么新词新义,特别是口语里的新词新义没有受到编词典的人重视呢?因为编词典的人是‘读书人’,对书本里的东西感兴趣,对生活中的东西不感兴趣,或者不太感兴趣;对书斋中来的东西比较敏感,对市场上来的、车间里来的、田野里来的就不那么敏感。找词汇只在著名作家、著名作品里找,一般报刊就不大理会,至于什么手册、传单、广告等等就更不在话下了。”正确的资料收集方针保证了《现汉》收词的科学性、系统性、现代性。

同一个词要在不同场合被收集多次,制成若干张卡片,才能证明被社会广泛应用,成为待选。在没有计算机的年代,这项烦琐细碎的工作完全靠编纂人员在日常生活中像蚂蚁搬家似的逐渐积累。为编纂《现汉》,工作人员最终收集了100多万张卡片,这些都成为编纂《现汉》坚实的语料基础,也是重要的历史资料。

如果把自上世纪50年代《现汉》开始编写以来,编辑们收集的卡片装进柜子,卡片柜在百来号人开会的大厅里摆上一圈还放不下。

如今,利用计算机语料库收集资料、统计词频早已成为辞书编纂的必然选择。但机器再灵,在某些方面也不能完全代替人的大脑和眼睛。时至今日,词典室的同志们依旧是把这两种手段结合起来。第6版修订主持人、中国社科院原副院长江蓝生先生介绍说,在第6版修订过程中,编者们利用语料库,持续监控网络时发现,“电脑只能根据词频来进行挑选,但‘语料库’这种软件的内容选取往往不够稳定,不能取得均衡意义上的目标词汇”。因此,还要靠每个成员平时对阅读材料的记录与留心。事实上,从《现汉》第1版问世以来,收集新词的工作从未停止。词典室的同志们养成了职业习惯,仍然坚持用手眼广泛收集报纸、书刊、电视、广播等媒体上的新词新义,制成卡片,以备修订所用。第5版修订主持人之一的晁继周先生说:“我们这些人读书看报都要比一般人慢,一句话要拆成语素看。”每遇到新词,词典编辑室的同志们都会用红笔圈出来,将报纸剪贴或抄写,制成卡片。最早参加《现汉》编写工作的孙德宣先生,直到89岁,还在家坚持收集资料,做资料卡片。编辑们碰到一块,谈论最多的也是最近发现的新词。这正是从吕先生时代就一直坚持的做法,是保证《现汉》在资料上永远有源头活水的好传统。

(作者系商务印书馆汉语编辑中心编审)

《中国教育报》2021年09月15日第9版 

0 0 0 0
分享到:

相关阅读

最新发布
热门标签
点击排行
热点推荐

工信部备案号:京ICP备05071141号

互联网新闻信息服务许可证 10120170024

中国教育新闻网版权所有,未经书面授权禁止下载使用

Copyright@2000-2022 www.jyb.cn All Rights Reserved.

京公网安备 11010802025840号