|
|
教育部介绍2005年中国语言生活状况
|
时间:2006/05/23 出处:新华网 |
2006年5月22日(星期一)14时30分在教育部北楼二层报告厅举行教育部2006年第11次新闻发布会,向新闻界介绍2005年中国语言生活状况并答记者问。
[教育部语言文字信息管理司副司长王铁琨] 媒体的各位朋友,大家下午好。欢迎到教育部来参加新闻发布会。今天是教育部2006年的第11次新闻发布会。 今天主要内容是介绍我们国家2005年语言生活状况,这是教育部第一次向社会发布今年年度语言生活状况,预示着语言文字工作和语言国情调查的一种全新尝试。一提到教育部,自然会想到是主管教育的政府部门,但是自1998年国务院机构改革,国家语言文字工作委员会并入教育部,对外仍然保留国家语委的牌子,教育部成为主管教育事业和语言文字工作的国务院组成部门。从那时起,教育部增加了语言文字的工作内容和工作子能。据我所知,教育部仅今年就有两次发布会涉及到了语言文字工作的内容。一次是向新闻界通报国务院公布汉字简化方案和发出推广普通话的指示50周年纪念活动的筹备情况;一次是组织著名的语言学家与记者见面,并且召开了座谈会。在这里,我代表教育部和国家语委对新闻媒体朋友们一直以来对国家语言文字工作的关心支持、对社会语言生活的热情关注表示衷心感谢。 由于语言文字工作具有面向全社会的工作特点,所以总是需要方方面面的支持。今天除了媒体的代表以外,我们特意请来了中央、国务院有关部门的代表,教育部有关司据和国家语委组成单位司局的代表、国家语委的老领导、老专家,国家语言资源监测与研究中心各分中心共建单位的领导同志,这些部门单位长期以来对语言文字工作给予了大力的支持,让我们在这里对他们的到来表示欢迎。 参加新闻发布会的其他发布人有:北京语言大学教授杨尔弘、中国传媒大学教授侯敏、华中师范大学教授何婷婷、厦门大学教授苏新春、暨南大学教授刘华、社科院民族学与人类学研究所研究员周庆生。
[新华网报道]教育部语言文字信息管理司副司长王铁琨宣读教育部副部长、国家语委主任赵沁平的书面讲话。
[王铁琨]媒体的各位朋友,大家下午好。欢迎到教育部来参加新闻发布会。今天是教育部2006年的第11次新闻发布会。 今天主要内容是介绍我们国家2005年语言生活状况,这是教育部第一次向社会发布今年年度语言生活状况,预示着语言文字工作和语言国情调查的一种全新尝试。一提到教育部,自然会想到是主管教育的政府部门,但是自1998年国务院机构改革,国家语言文字工作委员会并入教育部,对外仍然保留国家语委的牌子,教育部成为主管教育事业和语言文字工作的国务院组成部门。从那时起,教育部增加了语言文字的工作内容和工作职能。
我们过去对语言生活研究的领域有限,而且定量研究少,借助现代化的手段少。在社会快速前进、信息技术飞速发展的今天,需要建立对社会语言生活实时检测和规范引导的长效机制,利用现代化信息技术手段,对重要社会领域的语言文字使用状况进行监测、分析与研究,对语言国情有更及时全面的了解,以提高决策的科学性。教育部、国家语委自2004年6月开始,陆续与相关部委和高等院校共建国家语言资源监测与研究中心及各个分中心,以动态流通语料库为基本监测平台,对平面媒体、有声媒体、网络媒体、教育教材以及海外华语等的语言状况进行分析研究。国家语委还成立了“中国语言生活状况报告”课题组,分领域、分专题报告每年度的中国语言生活的基本状况及热点问题。今天发布的数据,就是“中国语言生活状况报告”课题组和国家语言资源监测与研究中心对2005年语言生活进行监测研究的成果。这些数据不一定能够全面反映2005年中国语言生活的面貌,但都是相当有价值的。这项工作我们会持续做下去,每年公布语言生活状况报告,以引导语言生活向着健康和谐的方向发展,为国家语言文字政策的制定、调整和学术研究提供参考。
另外,国家语委也在积极尝试规范研制发布的新形式,比如以国家语委名义发布“中国语言生活绿皮书”。“中国语言生活绿皮书”的内容分为两大类,一类是软性的规范标准,一类是中国语言生活状况与分析。这些内容同正式的语言文字规范标准相辅相成。《中国语言生活状况报告(2005)》是《中国语言生活绿皮书》的第一部。
目前,语言文字工作面临前所未有的发展机遇。信息时代要求大幅度提升语言文字的规范化、标准化和信息化水平,要求充分关注虚拟世界的语言生活;不同语言间的交流与碰撞,使得社会语言文字生活更为纷繁复杂,使得一些语言面临濒危的命运。在新的历史时期,语言文字生活同和谐社会的构建,同国家的安全与可持续发展,关系更加密切。我们要了解新情况,解决新问题,不断开创语言文字工作的新局面。
多年来,教育、文化、科技、新闻出版、广播影视、工商、交通、旅游等部门,对本领域的语言生活做了很多工作,对我们给予了大力支持。希望各兄弟部委今后一如既往地支持国家语言文字工作,关注本领域和全社会的语言问题,使语言生活更加充满活力,更加健康和谐。 非常感谢参加今天发布会的各位新闻界的朋友。希望你们多关心、多支持语言文字工作,发挥新闻媒体在国家语言生活中的榜样作用。 祝“2005年中国语言生活状况报告新闻发布会”取得圆满成功! 谢谢大家。
赵部长的讲话介绍了教育部、国家语委近年来关于语言规范化、标准化和信息化三项新的举措,这三项举措就是:出版《中国语言生活绿皮书》、与有关部委和高校合作共建国家语言监测与研究中心、定期发布年度语言生活状况报告。 下面有请教育部语言文字信息管理司司长李宇明介绍2005年中国语言生活基本状况。
[教育部语言文字管理司司长李宇明]非常欢迎媒体朋友们的到来。 语言文字是人类用于交际、思维和文化传承的最为重要的符号体系。语言生活就像空气和水一样,平时我们意识不到,实际上它是人类最为重要的生活之一。语言生活的质量,影响甚至决定着个人的生活质量。语言生活的和谐,关乎到社会的和谐,甚至关乎到国家的稳定与发展。特别是现在,互联又给我们构造了一个虚拟空间,虚拟空间的语言生活,也是人类语言生活的重要组成部分。今天我们正在通过网络来直播新闻发布会,就是我们语言生活通过虚拟空间来传播。
语言信息处理已经成为高新技术之一种,已经成为高薪经济制宠儿,已经成为国家信息安全之基础。虚拟空间的语言生活包括阅读、出版、通讯等,正在造就新文化,不断酝酿新技术,陆续形成新产业。 国家语言文字工作委员会从2004年6月开始,陆续与相关部委和高等院校共同建设国家语言资源监测与研究中心以及各个分中心。过去我们把语言看作是问题,是要解决问题,今天我们还把语言看作资源。中华民族的“语言矿藏”非常丰富,是我们宝贵的资源,需要我们珍视它、开发它。 这几个中心主要是以动态语料库为基本手段,对平面媒体、有声媒体、网络媒体、教育教材以及海外华语等状况进行动态采样分析。
2004年9月,国家语委开始筹备成立“中国语言生活状况报告”,当时称为中国语言国情报告课题组,分年度搜集、报告中国语言生活的基本状况及其热点问题。但是没有想到困难这么大,所以2004年没有报告成,所以在我们的报告里也涉及到2005年之前的情况。这个报告得到了许嘉璐副委员长的支持,他担任顾问。赵沁平同志担任顾问。 上编是中国语言生活状况报告课题组对2005年中国语言生活的若干方面所作的调查报告。
下编是国家语言资源监测与研究中心对2005年若干媒体语言使用状况的统计数据。 这种报告在国内是首例,在国外也不太多,可资借鉴的经验自然有限。 我们课题组的同志们非常辛苦,反复研究,数次修改报告框架;反复讨论,逐步明确编写宗旨;并且通过报章杂志、政府公报简报和计算机网络等等,尽可能全面地搜集资料;过去发布都是用政务信息,现在用了网上信息。多次听取专家和有关部门的意见,数易其稿而不敢稍有倦怠。为什么说这样?很多同志度过了很多不眠之夜。 专题篇是就某些专题研究发布了一些报告。
热点篇是现代语言生活当中大家讨论比较多的,特别是汉语热、英语热、方言热等。港澳台篇介绍的是港澳台的语言生活和采取的语言政策。还有背景篇。我们介绍了海外华人华侨的分布。另外还有一个附录。 上编的基本情况我简要介绍一下。比如说在行政领域,国家通用语言文字已经成为公务员行使公务的主要用语用字。在这个群体里,使用普通话的已经达到88.26%,其中88.18%都能熟练使用。公务员在单位谈工作时最长使用普通话的比例已经占到79.27%,正式会议已经占到80.70%。
在教育领域,语言生活状况也有很多特点。比如语文课程标准及其教材实现多样化。英汉双语教学试验越来越多,在中小学已经涉及到很多课程。在一些地方,方言知识开始走进课堂。语文高考有了新的变化,这个新的变化起码表现在两方面:1.作文命题改革稳步推进。话题作文更加成熟,呈现出形式不拘一格,标题作文各有千秋,材料作文设计新颖。作文的题材内容大都立足现实生活,体现时代精神,目标是引导考生关注社会人生、关注自身成长。2.试卷内容体现了语言的工具性与人文性的统一,突出了高中语文新课程的基本理念。
大学英语四、六级考试进行了重要改革。特别是教育部发布了改革方案,基本精神是减轻学生的学习压力,突出四、六级考试为教学服务的功能,降低它的社会权重。 少数民族双语教育得到了空前大发展。对外汉语教学更是突飞猛进,来华留学生年增长率已经达到30%,这是2005年的数据。对外汉语教学正在实现由请进来到走出去的重大变革,召开了世界汉语大会,陆续在海外兴建“孔子学院”,积极研发教材,并且开发了基于多媒体、网络、卫星电视等平台的教学资源。
在新闻出版、广播电视领域也在加强语言的使用管理。新闻出版业2005年有很多重要的举措出台。 广播电视2005年由总局发出了关于进一步重申电视剧使用规范语言的通知等等。 下编是国家语言资源监测与研究中心对2005年若干媒体语言使用状况的统计数据。
我们知道,语料的抽选、校对与建库,学术性强而且工程量大,对语言文字进行科学标记与精密统计,在国内或者说国外都是没有很好解决的科技课题,特别是从海量语料库当中统计的来的很多数据怎么进行分析,我们也缺乏经验。但是课题组迎难而上,孜孜不倦地工作,在用字、用词和标点、符号等方面寻求出了不少有意思的数据。 汉字、标点、符号等的使用情况。调查语料为平面媒体、有声媒体、网络媒体,共计文本文件890多万,总共9亿字次,其中汉字是7亿多。
现在发现媒体用了汉字是8225个,平面媒体、有声媒体和网络媒体共用的汉字是5607个。这就是我们现在语言生活的主要用字状况。 再看一下汉字的覆盖率。581个汉字就可以覆盖语料的80%,也就是你认识前581个字,就可以读懂媒体文字的80%。当覆盖率达到90%的时候只需要934个字。当覆盖率达到99%的时候需要2315个字。 我们和过去《现代汉语常用字表》比较,发现有很多不同。2500高频字当中有357字是一级常用字中所没有的。3500高频子与《现代汉语常用字表》比较,有398字是《现代汉语常用字表》中所没有的。
前7000字与《现代汉语通用字表》比较,有615字是《现代汉语通用字表》里所没有的。另一方面,《现代汉语通用字表》中的通用字有244个,在本次调查中没有发现。 这是不是现代媒体用字情况和当年制表用字发生了一些变化。 再看看汉字的其他情况,这里面有繁体字、异体字、不合现有规范的类推简化字、旧印刷自行、旧记量单位用字、方言字、汉字部件、日本汉字等等。
再看词语使用的调查情况。这次词语调查的材料与文字调查材料一样。我们使用的分词软件是中国科学院自动化研究所研制的分词标注系统,这个系统在2004年度“863中文信息处理与智能人机接口评测”中,取得了较好成绩。我们希望在2006年选择更好的分词软件来做。 这次得到的分词单位总计是4亿多,得到的词次也是4亿多。这是过去用手工完全不可能做到的事情。得到的词是160万,三种媒体功用词是100万多一点儿。这在词语里是一个什么情况呢?160多万词里面,人名大约有61万,地名大约24万,组织机构大约59万,时间词语大约10万,其他都是语文词,经常语文词大约是11万条左右,占整个数据的7%。在11万里,有1万多条常用语文词,在常用语文词当中,包含汉字2463个。
上面两个介绍是不是说明这个问题:掌握一万多条词、900多个汉字,就可以阅读90%左右的出版物。所以有些外国人老说汉语难学,我们应该有一个新的观念,汉语是世界上比较好学的语言。 关于标点、符号的使用情况,这次发现的形式总共是4584种,有效价值是14类93种,出现多少标点和符号,我们也有一个统计。 下面我解说一下2005年BBS用字用词情况。这次我们调查了7所高校BBS网站,有6万多个文本,包括1亿多字符。 上面两个介绍是不是说明这个问题:掌握一万多条词、900多个汉字,就可以阅读90%左右的出版物。所以有些外国人老说汉语难学,我们应该有一个新的观念,汉语是世界上比较好学的语言。 关于标点、符号的使用情况,这次发现的形式总共是4584种,有效价值是14类93种,出现多少标点和符号,我们也有一个统计。 下面我解说一下2005年BBS用字用词情况。这次我们调查了7所高校BBS网站,有6万多个文本,包括1亿多字符。 4.BBS用字种数情况早年增长快,近年增长速度放缓。 5.网络词语具有不稳定性。同一意义常有多种书写形式。比如说哥哥,可以用大写的GG,也可以用小写的gg,感谢可以用39、3X、3Q等形式。再见可以用88、886、3166等。伤心悲切可以用5、55、555、5555、呜、呜呜、呜呜呜呜等。 迅速产生大量近义词,比如水鬼、水母、税收、水桶、水王、水仙等。 因多种表达方式共用,容易造成一词多义或同形词。比如BB可以是宝贝的意思。
除此之外,我们还把2002年以来发布的媒体十大流行语做了一个归总。 今年十大流行语是分门别类进行公布的。 《中国语言生活状况报告(2005)是国家语委首次向社会发布年度语言生活状况报告,也是国家语委《中国语言生活绿皮书》的第一部。《中国语言生活绿皮书》是国家语言文字工作重要举措。为了加强语言文字标准化、规范化和信息化工作,国家语委还成立了6个技术分会,最近与国家汉办正筹办对外汉语教学的标准化技术委员会。我们也完善了规范标准研制、审定机制。《中国语言生活绿皮书》以国家语委名义发布,分两类内容。A类是软性的准规范,语言文字应用具有弹性,规范难度大,往往需要一个试行试用的过程,在试行试用过程中逐步完善。A类就是根据语言文字规范的特点设计的,发布这些软性规范,既让社会有所遵从,起到规范引导作用,又留下了足够的弹性空间。
第二类就是中国语言生活状况与分析。通过发布一些数据来为语言文字研究和社会有关人士提供参考,这本书主要是给各部门提供参考,也是为国家的科学决策服务。 现在已经列入出版程序的有《中国语言文字国情调查报告》、《信息处理用现代汉语分词词表》、《现代汉语通用词表》等。参加《语言生活状况报告(2005)》工作的,绝大多数都是青年学人,他们有强烈的国家意识和创新意识,学风谨严,团结向上,为了编写报告度过了许多不眠之夜。许多专家积极参与了稿件阅读,特别是几位审订,贡献了学术智慧,付出了辛勤劳动,令人钦佩。特别感谢相关部委和教育部相关司局办,或提供重要资料,或深度有关内容,甚至派员纂写,对提高报告质量起了重要作用。 商务印书馆为本报告的研制、编写和出版提供了人力、智力和物力,所扮演的角色绝不仅仅是出版者。
本报告的数据虽然由教育部、国家语委发布,但是希望大家以学术数据来看待,不要仅仅作为政策的研读。因为我们发布的目的,在于引起人们对语言国情的关注,在于引导语言生活向着健康和谐的方向发展,并为政策制定和学术研究提供参考。 万事开头难,本报告会有许多不足,希望听到各方面的意见和建议。 理解就是激励,希望这项工作继续得到各级政府部门和社会各界人士的支持,更希望的到新闻界朋友们的帮助。 谢谢大家。
[王铁琨]李司长讲得绘声绘色,使我们很直接地了解到这次调查的一些数据和基本情况和初步结论。正像李司长刚才所说的,《中国语言生活状况报告(2005)》是第一就当前中国社会语言使用实际状态进行描写、分析、预测的年度分析报告,语言生活的领域十分广泛,语言生活本身错综复杂,并不是所有的现象、问题,包括热点问题都能很快的得出一个结论来,这就需要语言学者和相关学者加强研究,这也就决定了我们完成这一课题的难度。但是我们参加这个课题组的所有同志,直面有关领域和几乎所有的热点问题,并且没有在这里回避什么,这是很需要勇气的,同时也是一种实事求是的态度。李司长在报告当中首先引用了语言资源这个概念,过去我们总说语言是载体、语言是工具,很少有人讲过语言是一种资源。语言学者说到语言现象总是提醒张三这个用得不对,李四那个用得不对,批评的多。所以引用语言资源的概念,我觉得是一种进步。语言随着社会经济、生活的发展变化而变化,所以有必要对平面媒体、有声媒体、网络媒体,国家语言资源实施动态统计分析研究,逐步加强动态管理,并且要进行开发和利用。
我们这次调查主要采用的是计算机语料库的一些现代化手段,在定量和定性相结合的基础上,尽量增加了定量研究的成分,主要是试图用数据和事实说话。通过处理大规模的真实文本,这次调查确实得到了许多非常珍贵的数据,这些数据既有统计学的依据,同时又有语言学的意义。比如我们在80几万个文本文件当中,总的字次是9亿多字,汉字出现的字次是7亿多。在这么大的分量当中,真正的汉字字总数是多少呢?8225个。2005年的媒体用字是8000多字。这个数字就和我们所知道的国际标准扩充级是3万多字,国家标准GB18030标准是27000多字。实际上得到每年度的用字情况和刚才我说的国际标准和国家标准来比,有较大的反差。 再比如用8225个字里的前2500高频字和《现代汉语通用字表》比较,前7000字和《现代汉语通用字表》比,都得出了相关的数据,这也反映了语言生活的变化。特别是我们在调查当中,还发现一些无法显示的字符,总共有693个,2万多个字次。我觉得这些调查都是非常有意义的。
对于适时的调整以往作出的规范标准,对于我们制定规范汉字表都有重要意义。所以这项工作是有意义的基础性的工作。 我们认为这次调查的年度报告,既可以为专家学者研究语言政策、语言规划提供参考,也可以为语言文字工作部门和其他有关部门制定和态度相关的政策提供学术上的支持。调查数据虽然是国家语言文字工作委员会公布的,但是主要成果还是学术性的。数据公布以后,相应的深度研究还需要继续进行,还需要快速的跟上。语言生活重在引导,万事开头难,理解就是激励,我们期待着读者用一种宽容的心态将报告的数据作为学术数据和学术信息来看待。当然,我们更希望听到大家的各种意见和建议,帮助我们不断地提高年度语言生活状况报告的质量。
[记者] 刚才李司长的讲话当中提到“软性的准规范”这样一个术语,软性的准规范的规范内容涵盖哪些方面?这些规范和以往公布的语言文字规范之间是什么关系?
[李宇明] 语言文字规范本来就比较软,比较硬的地方是字体的写法、语音的读法。词、语法更高层次的东西可能本来就比较软。我们说的准规范主要是在词汇、语法,甚至其他层面的一些规范。这些规范同已经发布的规范项目是两个关系:一个是相辅相成。比如我们教外国人学汉语,肯定要给一些语法上的基本东西,肯定要有一些标准。再比如说计算机分词,总得有一些标准,这些标准可能适用于不同的群体和对象。有软规范和硬规范相互辅助,就可以使我们摆脱那种困境,要么是制定规范,要么是不制定规范。第二,软规范经过一定时间的适用,可以做更高层面的社会推荐。总之,语言文字是以人为本、与人为善,是十几亿人在使用的东西,我们希望它能够切合实际,把我们语言文字做好。包括我们发布这些数字,虽然它不是规范,但是有一个引导的作用。比如起名字,你起一个人家都不认识、身份证也打不出来,这不是给自己找麻烦吗。我们说的软规范大概是这样一个意思。 [ 2006-05-22 15:32:18 ]
[香港南华早报记者]大家觉得在香港推广普通话的前景如何?有哪些现实的障碍和困难?我们国家在未来几年会采取什么样的措施在香港推广普通话?
[李宇明]香港是中国的特别行政区,香港事务按照特区基本法来执行。我觉得语言问题与别的问题不一样,语言问题和文化、经济关系很密切。这些年我注意到香港各界对于普通话产生了相当大的兴趣,而且有很多人士积极在那里引导大家学习普通话、推广普通话。就这个发展趋势来看,香港用普通话来和包括大陆在内的华人社区交流,我想是一个好事。当然粤方言也是香港人长期使用的、带有浓厚文化韵味的语言。我非常乐观的看待香港推广普通话。
[新华社经济参考报记者] 怎么看待网络符号在网络语言中的位置?是不是属于网络语言的一种?怎么看待网络符号的作用?
[汪磊]我个人认为,因为网络交际本身是一种通过计算机的输入、电脑屏幕呈现这样一种交语方式。在这个过程当中,与我们日常的人极交往有很大区别。在日常当中使用的非语言表达形式,在网络传播当中缺失。比如说我们的面部表情、笑声,包括服饰这种非语言方式。在网络传播,为了很好地传递这样的人极交往信息,很自然的就会选择一些辅助性的符号,比如说:)(笑脸的意思),包括现在的QQ、MSN,已经提供了一些专门的笑脸符。它就是为了更好地传递人们之间的信息交流、情感交际。我觉得这是网络传播的一种必然,也是网络传播当中语言的辅助形式。能不能把它看作是网络的词汇?我个人保留意见,还有待于进一步研究。但是至少可以看作是网络传播当中的辅助表达形式,也是网络传播当中的必然形式。
[华东师范大学何婷婷教授] 在2005年BBS语料库当中,出现符号占的比例达到55.07%,和一般的平面媒体相比,这个数字是很特别的。说明在BBS用于当中,很多人在使用这样一些符号,表达各种各样的意思。但是各种符号组成的网络用语往往不是很稳定,我们也做了一些统计。由符号组成的网络用语不是很稳定,但是用得很多。
[中国日报记者] 李司长刚才提到现在媒体的用字情况同《现代汉语通用字表》制定的年代已经发生了一些变化,《现代汉语通用字表》是什么时候制定的?和它相比,我们出现一些新的简化字,这些字的出现和历史上普通话发展的时间相比,它出现快还是慢?如果是快,出现的原因是什么?是不是由于网络的使用而加快了?
[王铁琨]《现代汉语通用字表》是1988年国家语言文字工作委员会和国家新闻出版署发布的,《现代汉语通用字表》是7000字。我们这次调查的前7000字和《现代汉语通用字表》比较,出现了一些情况。有165字是现代汉语通用字表》里没有的。1988年制定的《现代汉语通用字表》,现在是2006年。尤其是计算机和媒体的普及,也带动了用字的变化,主要是语言生活发生了变化。按照国家标准委的制定,标准标龄应该5年修订一次。现在字出现的速度肯定是快的,与政治经济各方面发展变化,文化水平的提高、素质水平的提高,各个方面的原因都会促使发生变化。 这些年,国家语言主管部门一直在制定和推行一些标准,在推行标准的过程中,老百姓掌握的规范字更多更好,所以跟过去就会有一些不同的情况。 通过这些年规范化的工作,反而用的字实际数量减少了,不是增加了。比如1988年定《现代汉语通用字表》的通用字是7000多字,现在二级字也就是6000多字。这说明什么呢?繁多繁体不用了,异体不用了,所以是减少了,不是增加了。杨尔弘: 刚才问到这些字的变化是不是因为网络的出现。根据我们这次统计,在通用字表里出现而在前7000字没有出现的165个汉字里面。在8225里没有出现规范汉字244个,平面媒体里出现243个,不是因为网络语言出现了才出现一些语言汉字变化,在平面媒体里还是占主要的。
[记者]刚才提到动态流通语料库,什么是动态流通语料库?和以前的语料库有什么区别?
[北京语言大学杨尔弘教授]动态流通语料库,我认为是指它的内容。一个是语料来源是不断变化的,更重要的是从里面提取的东西也是不断动态变化的过程。第二,流通。我们选择语料的一个原则是在大众媒体上流通的,没有按照原来的语料库,比如说各种方面占什么样的比例来选。一般来说,平面媒体主要是参照世界报业大会公布的一些主流报纸,每年会选择15份左右进行每天的下载,每天的数据都入到语料库里,这也是一个动态的方面。在这样的基础上,我们就可以考察每一年词语的变化是什么样的,每一年字的变化是什么样的,甚至于可以把时间单位缩小到每一个月的变化是什么样的、每一天的变化是什么样的。从这个角度来讲,也是一个动态的。
[新华社瞭望周刊记者]刚才说覆盖率高频字集中的特点,是不是还有这样一个原因,就是由于汉字简化的作用。为什么这么说呢?我们和一些专家探讨的时候说,我们推行的简化字不是繁简完全对应,就是不能完全互换,有一些是互换不了的。现在某些简化字代表着以前若干个繁体字。我们打开现在的汉语词典,包括前几年最新版的汉语词典,一个字或者一个词第一意思、第二意思、第三意思,最后一看,原来这些意思以前都是由若干繁体字所代表的,但是一个简体字等于那几个繁体字了。李宇明: 这次我们按照语言的实际状态公布的数据,我们之所以让大家把这些数据当做学术方面来看待,为什么会形成这样的原因?是需要学者、社会,包括资深记者,怎么解读它。另外,这些数据可以引发研究和思考,我觉得已经非常好了。这个学术问题将来会引起很多学者的兴趣,也期待你的很多解释会带来社会上的关注。
[王铁琨]大家对语言文字的兴趣盎然,这也是语言主管部门和语言学者做好语言文字工作的内在原动力。需要说明的是,我们发布《中国语言生活状况报告(2005)》的目的在于引起人们对于语言国情的重视,在于积极的引导社会语言生活向着健康和和谐的方向发展,但是由于我们主观和客观因素的多种制约和影响,目前我们的报告本身还存在着这样那样的一些缺憾和问题,这些问题和不足将在今后的工作当中不断的克服和完善。 新闻发布会到此结束,谢谢各位。
[新华网报道]本次新闻发布会到此结束,感谢您的关注。 |
|