古典文献论文(收集5篇)

时间:2024-10-05

古典文献论文篇1

关键词:出土文献;思想史;进化主义;实证主义

中图分类号:B21;K09文献标识码:A文章编号:0257-5833(2012)11-0122-06

简帛研究成为一门显学,应该是在20世纪90年代末郭店楚简问世之后。20世纪70年代之后虽然有银雀山汉简、马王堆汉墓帛书、睡虎地秦简等世界性重大发现,但毕竟专注于此的学者少,研究的成果少,对中国学术史造成的影响也小。郭店楚简问世之后,简帛研究已毋庸置疑成为一门国际性的显学,其原因有以下几点:第一,新材料开始层出不穷地涌现出来,为今后的长期研究提供了丰富资料。

和思想史相关者,除郭店楚简外,还有上海博物馆藏战国楚竹书、岳麓书院藏秦简、清华大学藏战国竹简、北京大学藏汉简秦简等极为珍贵的发现。除郭店楚简已全部发表外,其它均尚未全部问世,或尚未正式公布。第二,新材料的时代跨度更大,书写时代从战国时代一直延伸到汉代,和马王堆帛书等过去的材料相配合,新的简帛资料在时间上构成了比较完整的连续性。而这些简帛资料最初创作的时代或其内容所反映的观念应该更早。而且这些材料有些正好处于传世文献的缺环,因此意义格外重大。第三,渉及的领域更广。马王堆汉墓帛书堪称汉初百科全书,最近出土的文献同样具有传世文献所不具备的现实感、生动性和复杂性,但时代更早,难以解释的现象也更多见。第四,引发的讨论更多。借助郭店楚简等最新出土文献,加上马王堆帛书等尚未开发穷尽的出土文献资源,使一系列新的、过去无法想象的论题得以成立,如孔孟荀之间的儒学展开、孟学和荀学的源头,老庄之外的道家轨迹、黄老思想的早期面貌、墨家的异端思想、从《易经》到“易传”的传承和谱系,多种多样的宇宙生成论、重视自然之情的人性论,数术方技和阴阳五行思想与社会政治和民众生活的联系,等等。由此而被激活的或引发出来的研究课题有学派判别、经典确认及其文本演变的问题、天人关系论、儒道关系论、齐鲁文化关系论、传世文献价值的再评价乃至“疑古”和“释古”关系的大讨论,等等。可以说,简帛文献为哲学史思想史拓展了新的线索,为古典学的新发展带来了千载难逢的机遇。

20世纪由西方及日本传入的人文科学的理论和方法,使古典学割裂为文史哲三门学科,学者们的研究虽然日益精细,但也出现划地为牢,甚至老死不相往来的弊端。然而,由于材料的不同、参与者的不同,使用方法的不同,简帛研究的研究方法将不同于以往文史哲任何一门学科的方法。这将刺激我们反思20世纪将文史哲分而治之的不合理性,甚至有可能通过简帛研究使文史哲重新走向合流,使中国古代思想的面貌得以比较真实的还原。因此,就古典学而言,说我们已经进入了一个简帛研究的时代,恐不为过。如何以理智的态度和创造性的智慧把握住这次机遇,如何在各个重要研究领域中实现重要突破,是我们面临的时代课题,由此必然会引发一系列方法论的讨论。郭店楚简发现之后,学界喊出了“出土文献即将改写思想史”的口号,这个口号虽然激动人心,但表达的其实是一种心情和愿望,并不具备多少方法论的意义。同样,出土文献的大量问世,也使王国维提出的“二重证据法”名噪一时,似乎有了“二重证据法”就可以解决一切问题,这样的思维过于简单。笔者曾讨论过出土文献发现的偶然性、研究过程的复杂性、出土文献自身的不确定性、不完整性,及“二重证据法”适用范围的局限性,探讨过传世文献和出土文献的关系、出土文献改写思想史的前提条件[注:参见曹峰《出土文献能够改写思想史吗》,《文史哲》2007年第5期。后经修改扩充,改题为《价值与局限:思想史视野下的出土文献研究》,发表于《中国哲学与文化》第6辑,广西师范大学出版社2009年版。]。上述问题固然值得讨论,但揭露出来的许多依然是表层的现象。随着重大发现后的兴奋之情逐渐转变为研究展开后的冷静之心,面对出土文献的复杂性和问题的多样性,我们需要更多、更深入的思考。出土文献的问世可以改变一些过去的结论,这当然有意义,但如果仅仅满足结论的改变,而不借此探讨过去的经验方法乃至错误发生的原因,就很可能会导致各种失误的继续发生。

就目前的研究现状而言,作为一名利用简帛资料从事思想史研究的学者,我感觉问题主要集中于以下三个方面:第一,如何使用证据和展开推论的问题;第二,如何看待学派的问题;第三,如何把握文字、文献研究和思想史研究之间的关系问题。如果说我们的最终目标在于探索、反思古典学研究的方法和模式,为古典学今后的发展提供可能的思路,那么这些问题就是我们无法回避的。

第一个问题和“疑古”与反“疑古”,“默证”和反“默证”的讨论有关,因此必须放在整个20世纪学术史的大背景下去思考[注:有关讨论可参见文史哲编辑部编《“疑古”与“走出疑古”》,商务印书馆2010年版。]。这个问题也可以归结为出土文献大量问世之后引发的对于古史辨派的学术反思,本文无法对此作出全面的回顾和总结。在此,我涉及的主要是证据和推论的问题,这方面针对古史辨派的批判集中于对古史古书的怀疑是否过猛以及是否使用了“默证”。实验科学的特征是以客观的立场、严苛的目光、精确的测量手段对待学术研究的对象,因此怀疑是正常的科学的态度,并不能因为怀疑导致个别结论的失误而对怀疑本身予以否定。关键在于“过猛”,也就是说,当中国处于“亡国危机”和“现代化焦虑”的背景下时,“疑古”不再是一种理性的态度,而转变为以“疑古”代表进步、以“信古”代表保守的感性的态度[注:这方面的事实可参见王泛森《价值与事实的分离?民国的新史学及其批评者》,载《中国近代思想与学术的系谱》,台北联经出版事业有限公司2003年版。]。因为“疑古”标志着对于封建的制度、价值及其历史构建的否定。这里,对于事实的怀疑悄然让位于对于价值的批判,因此,这种“疑古”其实已不具备科学的精神,在这样的前提下,王国维、傅斯年等人看似偏向“信古”的态度,反而显得更为理性一些。可能因为20世纪的历史洪流就是民族国家的自强与进步,因此,在很长一段时间里由否定传统的“疑古”派来代表学术的正统和方向,也是可以理解的。相反,反“疑古”则无法形成强大的势力。20世纪末,本来属于学术问题的“走出疑古”之所以能够得到响应,蔚然成风,除了出土文献提供的材料有助于推翻“疑古”派的一些结论外,也和中国需要通过构建悠久而可靠的历史,以强化民族自信,提高文明地位的明确目标有关。因此,无论是“疑古”,还是反“疑古”,无论是“疑古过猛”,还是“信古过甚”,其实都不完全是学术的问题,而和时代的脉动相关连。

古典文献论文篇2

[关键词]文献学研究方法价值

[中图分类号]G256[文献标识码]A[文章编号]1009-5349(2014)01-0080-02

文献,作为历史研究、文学研究的重要载体,从古至今都受到了特殊的重视。而文献学作为一种工具之学、门径之学,在中国整个历史发展过程中,特别在历史中的文化、文学发展中发挥着不同的作用。正是由于人们逐渐认识到过去流传下来的或者是传承下来的这种有历史、文化、科学等知识信息记录的载体所散发出的价值和作用,才会促使人们对文献进行研究,直至研究更加深入上升到学问的地位。而且随着经验的积累,对文献的研究方法也逐渐丰富、具体、系统。文献学为近代中国学术领域造就了众多著名大学者,这些学者无一不是在各领域的佼佼者,他们所创造的文献学成就也极大地影响着近现代学术的发展。就如孙钦善在《中国古文献学史简编》中所提到的:“就古文献学而言,不少历史经验、方法和成果,古为今用的关系更为直接,因此能否充分发掘、总结、继承古文献学的遗产,取得借鉴,对古文献学的发展来说,尤其显得重要和迫切,不仅关系到速度的快慢,而且关系到水平的高低。”我们必须重视文献学的研究工作,发扬文献学的积极作用,发挥文献学承前启后的重要功能。

一、古典文献的研究价值

(一)品味历史,借古惜今

我国古典文献品类繁杂、数量众多,堪称浩瀚。而巨著同样也数不胜数。这些古籍中不乏众多史学古籍,虽然在经、史、子、集四部中史并不是排在最前,但是史学书的重要性是不言而喻的。通过对史学古籍的探索和分析、学习和鉴赏,我们可以更清晰地了解封建时代的社会,甚至是更早期的历史现实,更清楚地发现历史运行的轨迹,历史发展的脉络也更清晰。所以我们可以借鉴古人的发展经验和优秀成果来制定正确的政策,以利于国家的稳定和发展。对于个人来说,也能从历史中找寻到那些能够为自己的发展有积极作用的力量。

(二)传承文化,延续精神

经、史、子、集四部中,不论哪一部中所承载的知识和内容,无一不是几千年来中国古典文化的精华和延续。同时也从各个方面、不同角度记录了整个中华民族发展壮大的过程。古典文献中所代表的已经不仅仅限于文字、知识、历史了,而高于这一切的是精神,是整个民族在几千年发展中一步一步发展、一人一人承担而延续下来的文化。而这些文化又代表了整个民族、整个历史中的优秀的、值得我们骄傲的文化,其中所蕴含的民族精神也同样代表了整个民族的个性的力量。

(三)价值典范,提高自我

作为传承学问的代表,我们应该自觉、主动地走进文献,接受文献学的知识体系,并且加以系统的训练,更重要的是感受文献学的熏陶。当今社会浮躁、烦乱的风气日益严重,做研究并不是为了真的研究,而是为了功名利禄,所以研究的成果都显得不坚固,很虚浮。然而古典文献中所体现的是历代文献学家们所做出的切身的实践努力和博学笃行的功力,所以文献学的学习以及对古文献的研究,应该自觉融入古典文献的朴素学风之中,砥砺意志,用心诠释经典并学习经典,最终吸收经典加以发扬。古典文献中所蕴含的是真的立世起代的价值典范,是我们国家区别于他国的强大的价值支柱。

(四)辨章学术,考镜源流

章学诚先生的这一句简单明了的总结其实很革命性地概括了文献学的价值和作用,通过对古代文献细致的研究、诠释,加上校勘学、目录学、版本学三条线路的共同努力,能够较为全面地概括出古典文献的内容,更能深入发掘出其价值所在。清晰地分析出古代学术方向和源流,对整个学科的发展是一种细致入微的剖析。使后代的学者研究先人们的成果有了一个明确的方向和可以遵循的道路,更加方便快捷。也使得学术更加细致,研究能够更加深入。

二、文献学研究方法

(一)文献学传统研究方法

传统文献学中所用的方法例如校勘、辑佚、辨伪等不应该算是全面的文献学研究方法,更趋向于是对古典文献的整理和解读。而文献学的方法论体系又没有一个完整的建立,或者说是已经形成了一个认知比较统一的理念。现在对于文献学研究的方法论断为三个层次,即哲学方法、一般科学方法和具体科学方法。

但是,以上的三个层次明显不是文献学所独有的,这种体系并没有办法凸显出文献学的特点和高度。虽然三个层次可以为大部分的学科提供较为宏观的方法论体系,但是文献学是一门既具有高度又有概括综合性,而且需要内外兼修的素质的学科,所以创立一门文献学所独有的,适合于其他学科而无法超越的方法体系是必要的,也是文献学作为一门有高度的学科的体现。

(二)文献学研究的不足

1.学科局限性

文献学定义的纷乱繁杂实际是文献学在目前学科体系中定位不清的直接反映。在官方公布的学科体系中,三个一级学科:中国语言文学、历史学、图书馆学,下均分别设置二级学科“文献学”。不仅如此,其内容也是异曲同工,区别却只是在学术的目的、出发点上。文献学的综合类定义,试图融汇古典文献学与历史文献学两个二级学科,在上述的定义上我们也可以略知一二,但似乎只是强调兼容并包,而忽视文献学学术主体性的建立,故学术定位只是服务于文史研究的基础学科。所以问题多多,使文献学走向了闭塞,远远落后了当年晚清学者们所创造的学科精神和境界。

在研究内容上,古典文献学的研究很明显是着重于某部专著、某个人物、朝代,或者以对一个时期、一个时间段的研究为主。

在研究方向上,以文学、史学等方向为主,其他的则明显不足。

2.研究方法匮乏

文献学研究方法匮乏,多采用其他学科逐渐定型的方法,搬过来进行文献学的研究,采用传统的文献分析和整理。我们需要更先进或者是更为独特的突破点。

3.没有联系

学科之间的联系少,国内与国外经验的交流少,虽然是研究中国古典文献,但是不能说国外学者就不进行同样的研究。几千年来,尤其是近百年来流出的珍贵古籍数量就非常庞大,而国外的研究必定也同样在进行,虽然在成果上无法比拟国内,但是在方法上也许会有值得借鉴的地方,所以我们应该走出去,加强交流。

三、对文献学研究方法的创新意见

既然要创新,就是要用不同于以往的方法,或者是突破于以往的方法,但是作为后辈,知识的吸纳和经验积累必然达不到创新的高度,没有系统的理论体系的熏陶和雄厚的内在素质的培养也拿不出些有用的东西。但每一个学习文献、热衷于文献学的人都会怀着这样的情愫,希望文献学有一个自己的完整系统的方法论体系。笔者根据所看到的一些文献和资料的总结,初步有一些想法。

(一)文献学方法论、文献学研究体系应该建立在一个比较宏观的范畴内

即使是吴枫的《中国古典文献学》、王欣夫的《文献学讲义》、洪湛侯的《中国文献学新编》也都是对古典文献学的探索和总结,仍然是以古典文献的整理研究为主,还是在围绕版本、目录、校勘、注释等文献整理、鉴定的基础上,后来者也是在此基础上将这些总结加诸于各种文献。我认为首先应该突破这些传统,当然,前提是在已经能够掌握这些基础知识。不只是要对古人留下的遗产进行整理和解读,而应该学习古代学者们“为我所用”的态度。学习古人在著作中所表达的价值观和精神。

(二)文献学研究应当把研究和工作分离开来

目录、版本、辑佚、校勘、注释等方法应该算是文献的研究方法,是更为严谨细致的工作。而针对于文献的工作就很多了,例如整理、加工、搜集、管理等。两个方面的工作虽然都是对文献的,但是目的的不同导致二者存在区别。区分开来对各自的进程都会有帮助,效率也会提高。

(三)吸收优秀方法经验并加以创新

我们在前面已经提过了,文献学研究的方法其实多是来自其他学科经验,但是我们应该注意的是,在使用过程中,除了让这些方法有作用之外,还要能够分析出为什么对文献学研究有作用,其中对文献学有作用的地方在哪里,抽取出来加以分析、完善,使之成为文献学自己的方法。独特的方法是能够根据文献学的特点从容进行研究的方法。

除此之外,国外学科研究的先进理论和方法也值得借鉴,这里指的并不一定是成果,虽然我们应该看到国外研究古典文献的成果,但是我们更要关注其进行研究所使用的不同于我们的方法和技术。以西方优秀理论,套用于中国雄厚的文献资源上,更能发挥良好的作用。

(四)认清研究初衷

难倒我们研究文献只是想要还原古人的真迹,聆听古人的教诲?中国古文献学以经学为中心,长期的封建社会中,由于儒家思想被奉为正统,所以经学几乎与整个封建社会的思想史有关。可以说这种思想代表了整个民族的思想,经学的发展也代表了整个社会思想的变化。研究古典文献,我们应该上升到对自己民族、社会的内在思想和价值观、世界观体系的形成发展的研究,是对整个民族信仰和民族精神的研究。

四、结语

综上所述,文献学研究的方法创新是一个灰色地带,诚然,我们能力上和水平上也许达不到这么高的要求,但是我们应该要有古人致学的态度和理想。摆脱浮躁的社会风气,真正进入古典文献研究的朴实的环境中。而且,研究古典文献的目的性应该崇高一点,获取知识、精神的慰藉、价值观的标榜都应该是我们研究古典文献的高尚目标。完善自己、提高自己、弘扬民族的文化和价值观才是真的能够把古人辛苦记录下来的东西传承的最好办法。

科学化、专业化、系统化是我们应该追求的高度。在研究内容、对象、体系上也要得到提高,运用现代技术,加强联系和交流,最重要的是达到古典文献传承下来所应该达到的效果。

古典文献论文篇3

关键词:中古汉语;汉语史;语料库;分词规范;切分原则;词类划分

中图分类号:H109.2文献标识码:A文章编号:1673-9841(2014)03-0136-07

近20年来,中文古籍语料库为包括汉语史在内的诸多学术领域提供了极大便利,由此激发了学术界对古代汉语语料库建设问题的浓厚兴趣,到目前为止,投入使用的或正在建设的中文古籍语料库已达数十种之多;从技术层面看,早期的语料库比较简单,主要是将纸质文献输入计算机,利用较简单的检索软件进行文本搜读,为研究者提供字、词、句方面的例证及其具体语境,习惯上称之为平面型语料库。随着超文本技术的发展,又出现了一些XML文档数据库,实现了传统语言学工具书的多层级组合检索。但是,现有数据库的缺陷也显而易见:基本上只能用来阅读或搜寻文本,很少添加词性、义项、语法地位等比较复杂的语言学信息。为了满足实际研究的需要,国内逐步开始建设深加工的古代汉语语料库。在这样的学术背景下,我们以国家社科基金重大项目“深加工中古汉语语料库建设研究”为依托,展开了中古汉语语料库的研制工作。建设过程中,发现了许多值得思考的问题。本文拟就其中的语料选取、词语切分及分词规范等问题,进行一些讨论。

一、语料的选择

无论是不作标注的生语料库,还是添加各种标注的熟语料库,语料的选择都是影响语料库质量的重要因素。概而言之,语料的选择实际上包含了两方面的考量:选取怎样的语料、怎样选取语料。前者指的是选择语料时所依据的基本原则,后者偏重于选取语料的具体操作过程。关于语料选择的一般性原则,国内外学者已经进行了较为深入的研究,取得了不少共识。结合这些共识,在全面考虑中古汉语及中古典籍具体情况的基础上,我们确定了选取语料的四条原则,进而确定了进入语料库的中古文献。

第一,语料样本的代表性。

首先,所选语料能够反映汉语史特定阶段的基本特点,对中古汉语语料库而言,所选语料必须既能从整体上反映中古汉语的真实面貌,又能展示中古汉语局部的各种较突出的特点。众所周知,中古汉语包括口语和书面语两个系统,各阶段的口语是通过书面语体现出来的。汉语史的研究对象实际上是包含着不同数量口语成分的书面语。口语化程度较低的文献以史书为代表,语言风格较典雅规范,夹杂了少量的口语用法;口语化程度较高的文献主要是部分汉译佛典、笔记小说、尺牍作品、俗文学作品、医农杂著等。不同题材、不同体裁的文献又有各自的语言特色,词汇方面尤为突出。语料库中的文献必须充分展现所有类型文献的词汇、语法特征。换句话说,对语料库中全部或部分语料进行研究之后,其分析结果可以概括为中古汉语整体或某一指定部分的语言特点。

其次,所选语料在汉语史领域受到普遍关注,同时对中国古代社会具有重要影响。中古汉语语料库的目标用户是从事汉语史研究的学者群,主要用于中古汉语词汇史、语法史研究,也可用作上古汉语、近代汉语研究的辅工具。因此,语料的选取虽然无法囊括所有的中古语料,却必须覆盖中古阶段各种类型的语料,以满足汉语史领域内不同层次、不同旨趣研究者的实际需要;从更广阔的角度看,中古汉语语料库作为人文社会科学领域部级重大课题之一,未来的使用者不能仅局限于汉语史领域,还需要为中古时期史学、考古学、思想史、科技史、文化史等相关学术领域提供值得信赖的原始材料。为了实现这一目标,所选语料必须是受到各个领域高度重视、应用极为广泛的文献。基于上述认识,中古汉语语料库以官修正史作为最重要的语料类型;同时遴选了一定数量的汉译佛经文献,代表口语化程度较高的中古作品;以部分笔记小说、杂帖作品、南北朝诗歌代表中古俗文学作品;以《齐民要术》、《肘后备急方》等代表各种专门文献。这就基本覆盖了中古阶段最具代表性的文献类型。

第二,文本类型的平衡性。

一个语料库是否具有较高的学术价值,关键在于其中的语料能够在多大程度上与当时的现实语言相吻合,既能宏观反映最重要的语言规律,又能微观展示尽可能多的语言事实。汉语史上的语言现象、语言事实主要是通过历代文献体现出来的。选用多少语料样本才能充分反映各方面的语言特点,目前还没有公认的标准。因此,只能根据对中古汉语的总体认识、以往的建库经验进行主观判断,大致确定各种类型文献的比例,尽量保持不同类型文本之间的平衡性。中古汉语的基本特点是,大多数文献以文言为主体,掺杂着或多或少的口语成分;部分文献显示了古白话的兴起,包含着大量的口语用法;纯粹口语化的文献在中古阶段虽然逐渐增多,其绝对数量却难以同文言作品并驾齐驱;出土文献和传世文献的语言存在较大差异。与这些特点相对应,中古汉语语料库中的文献,最重要的类型是代表文言系统的正史作品,入库文献7种,总字数约350万;第二是包含较多口语成分的子部作品,如汉译佛经、中土佛道作品、笔记小说、诗歌等,入库文献近30种,总计约300万字;第三是强调实用、口语性较突出的医农杂著等,入库文献3种,约30万字;最后是具有一定口语性、语言风格与传世文献存在较大差异的出土文献,主要包括敦煌吐鲁番文献、魏晋至隋唐的碑刻文献等,约80万字。从入库文献的字数统计看,上述四类文献在入库文献中所占比例大致为46%、40%、4%、10%。

第三,语料之间的关联性与区别度。

任何大型语料库都不可能囊括所有文献,如郑家恒所说:“不管语料库规模多大,建立时经过多么仔细的设计,都不可能覆盖语言的所有现象和模式,也不可能准确地按比例表示这些现象。”因此,语料库规模的扩大固然很有意义,却不是最重要的。更为关键的是语料是否具有代表性,就文献样本的选取而言,主要体现在两个方面:

首先,同类文献保持一定的关联度,有利于提供足够的语言研究信息。语言研究不光需要说明语言中存在着什么样的语言事实,还常常需要掌握这些事实的出现概率。频率统计目前已经成为中古词汇、语法研究不可或缺的手段,数据统计、定量分析的物质基础就是各种类型的数据库。因此,中古汉语语料库不仅应该覆盖中古绝大多数词汇、语法现象,而且每种特定语言现象在语料库中的频率也应达到一定数量,才能为各种角度的定量分析提供坚实的文献基础。根据这样的现实需求,中古汉语语料库中,篇幅较大的语料至少需要选取两种以上的同类文献,如官修正史、汉译佛经中的律藏作品等;篇幅较小的语料则需要较多的同类文献,同时应尽量避免那些题材过于冷僻、中古阶段难以找到同类文献的语料。较典型者如中古阶段的医农杂籍,往往只有一两种题材相同的作品。如果出现这种情况,则需要在相近时代的文献中遴选同类性质的作品。以唐人韩鄂《四时纂要》为例,据缪启愉考证,成书约在唐末五代初,这在汉语史上已属于近代汉语早期,超出了中古汉语的范畴,但存世的中古农书只有贾思勰《齐民要术》,为了保持入库语料的平衡性,只有考虑将《四时纂要》增补入库。

其次,不同文献保持一定的区别度,以保证对语言事实足够高的覆盖率。中古汉语语料库如同其他语料库一样,需要为中古汉语研究提供丰富的中古汉语词汇、语法样本,虽然难以覆盖中古汉语词汇、语法的所有模式,也无法按照准确比例表示中古汉语各种词汇、语法现象,但为了尽量接近这样的目标,其中的文本必须包含中古汉语研究所需的各种类型语料,不能让任何一种文本占据绝对优势地位。从语料库建设的操作层面看,无论人工操作或机器操作,增加同类性质的文献较容易扩大语料库规模;相反,语料库中文献的区别度越大,操作过程越复杂,难度就会随之增加。但对一个深加工的语料库而言,显然不能过分看重语料库的规模。为了贯彻这一原则,中古汉语语料库以传世文献中的正史作品、佛经作品为主体,也选取了一定数量的笔记小说、文学作品,兼顾了医书、农书等专门性较为突出的文献;从语体角度看,比较典雅的文言作品占了相当大比例,也包含较口语化的白话作品,还吸收了整体语言风格与传世文献存在较大差异、能够体现不同类型文献之间区别度的敦煌吐鲁番出土文献等作品。

第四,入库文献的特色性。

如前所述,国内已经研制了多种古代文献语料库,部分语料库使用得相当普遍,如四库全书电子版、国学宝典、二十五史全文检索系统、大正藏全文检索系统、汉籍检索、中国基本古籍库、龙语瀚堂典籍数据库等。由于研究旨趣、使用对象不同,各语料库在选取入库文献时均体现出了各自的特色,如:国学宝典的文献较驳杂,以古代语料为主,兼收部分现代语料;大正藏检索系统、二十五史检索系统分别以佛教典籍、官修正史为主体;汉籍检索系统收录了先秦至民国的经史子集文献;中国基本古籍库收录了民国以前的历代名著及各学科基本文献;龙语瀚堂系统收入了部分出土文献。这些语料库中的文献既有大量重叠,也都有一些罕见于其他语料库的特色文献。得益于此,古代典籍的电子化程度越来越高,为包括汉语史在内的众多学术领域提供了极大便利。到目前为止的古代文献语料库,基本上以传世文献为主,其中绝大多数为刻本文献。为了更全面地反映中古汉语的实际面貌,中古汉语语料库除了传世文献外,增加了部分出土文献,主要是吐鲁番出土文书、汉魏六朝至隋唐的碑刻文献,还收录了以六朝杂帖作品为主的未见于其他语料库的部分抄本文献,这两部分文献共80多万字,对于中古汉语研究来说,数量已相当可观。这部分文献由于未经整理,以往很少有人涉足,语料价值基本上没有得到利用。中古汉语语料库的收录、整理,可望在很大程度上改变这一被动局面。

基于上述原则,本课题组分批次确定了下列入库文献:(1)官修正史:《后汉书》、《三国志》、《魏书》、《南齐书》、《北齐书》、《梁书》、《陈书》;(2)汉译佛经:《中本起经》、《杂譬喻经》、《撰集百缘经》、《生经》、《贤愚经》、《杂宝藏经》、《十诵律》;(3)中土佛道作品:《高僧传》、《洛阳伽蓝记》、《经律异相》、《法显传》、《观世音应验记三种》、《太平经》、《神仙传》;(4)笔记杂著:《论衡》、《列子》、《西京杂记》、《抱朴子内篇》、《世说新语》、《颜氏家训》、《水经注》、《幽明录》、《冥祥记》、《殷芸小说》、《拾遗记》;(5)诗歌杂帖:魏晋南北朝诗歌、魏晋南北朝杂帖;(6)医农典籍:《齐民要术》、《四时纂要》、《肘后备急方》;(7)出土文献:部分敦煌吐鲁番文献、汉魏至隋唐碑刻文献。除上述语料外,还有部分文献处于遴选阶段,会分批次增补进去。中古汉语语料库最终的原始语料共约1000万字,语料库总库容预计将达1600万字。

二、词的切分及分词规范

对于标注词性、词义、语法地位等多种语言研究信息的熟语料库来说,词的切分是所有标注工作的前提。所谓“词的切分”,是指按照特定的规范,对汉语中连续的字串进行切分并重新组合成词串的过程,这是中文信息处理有的基础性课题。英语文本中,词(word)与词(word)之间存在“空格”这样的自然分界符,词的辨识基本上不存在什么障碍;汉语文本则以汉字为书写单位,一个接一个地按句连写,词与词之间没有形式上的界限标记,难以简单而准确地辨识;就其本身而言,汉语的词缺乏形态变化,不具备纯客观的切分条件。因此,任何一个标注型汉语语料库,都无法回避“词的切分”这一关键问题。

相对于古代汉语来说,现代汉语的情况较为简单。切分词的时候,往往可以借助比较一致的语感做出判断;基于现代汉语的各种语法规则也相对明晰。因此,现有的各种现代汉语语料库,通常采用基于词典的机械分词方法:依靠语感及各种现代汉语词典,事先编制一个词表,贮存在电脑系统中,处理入库文本时,根据这一词表进行比对及判断[4],虽然还存在着词表中未登录词的识别、歧义词语的判定等问题,但总体而言,电脑系统自动切分之后,通过人工干预进行校正,足以得到普遍认可的结果。词表制作的理论基础是1990年颁布的国家标准《信息处理用现代汉语分词规范》(GB/T13715-92),部分学者根据语料库的操作实践对这一标准进行了更为细致的解释、说明。总体上看,现代汉语语料库的加工已经有了一整套科学性、整理性较高的分词规范。源于现代汉语语料库的这套分词规范,也为古代汉语语料库提供了不少值得借鉴的经验。

古代汉语与现代汉语又有着显著差别,在古代汉语语料库建设过程中,词的切分不可能照搬现代汉语的做法。古代汉语中,对词的切分及标注存在较大影响的词的特点,体现在两个方面:

第一,词类划分尚未形成统一的认识。国内比较通行的语法体系中,词类数量有种种不同说法。《暂拟汉语语法教学系统》将汉语的词划分为11类:名词、动词、形容词、数词、量词、代词、副词、介词、连词、助词、叹词。大学语法教科书一般分为12~14类,黄伯荣、廖序东分为14类,胡裕树分为13类。部分语法著作划分得更细,如熙分17类,郭锐分19类。古代汉语词类相对少一些,《马氏文通》分9类,之后各种语法体系通常增加1到2类,如殷国光分1l类。针对古代汉语的具体情况,往往还会在较复杂的词类下面细分若干小类,如郭锡良把代词分成了人称代词、指示代词、疑问代词、无定代词4个小类,副词分为程度副词、范围副词等6个小类。此外,古代汉语中还包含较普遍的兼类、活用现象,同样是一个相当棘手的问题。

第二,词和词组缺乏客观性的判断标准。这一问题从20世纪50年代起开始困扰汉语词汇研究,至今未得到圆满解决。陆志韦《北京话单音词词汇》序言较早提出这个问题,引发了学术界的热烈讨论,王力、吕叔湘、林汉达、孙常叙先后提出了一些区分词和词组的具体方法。80年代以后,这方面研究更加深入。刘叔新提出“准词”概念以指称那些处于从自由词组向词过渡的中间状态的语言单位。也有不少学者讨论古代汉语中词和词组的界限,张永言提出以词的分离性为主要标准、以结构的整体性为补充标准、以意义的整体性为辅助标准;殷国光提出“过渡词”之说,与刘叔新的“准词”可谓殊途同归。这些研究对中古汉语语料库中词的切分具有重要的参考价值。

简而言之,学者们对辨别词和词组的方法达成了几点共识:(1)扩展法:能插入其他成分进行扩展的是词组,反之,是复合词;(2)词组的意义能够通过字面综合出来,复合词的意义则不能通过构成成分的简单相加而得出;(3)词组的构成成分能够颠倒次序,复合词则不能;(4)词组的内部结构比较松散,复合词的内部结构比较紧密;(5)组成成分里有粘着语素的,一般是复合词。成分都是自由语素的,结合其他条件来辨别是词组还是复合词。这些方法基本上可以解决现代汉语中词和词组的界限问题。用于中古汉语,仍然存在一些问题,主要原因在于中古阶段相当多的词语经历了从自由词组到词的凝固过程,中间确实存在亦此亦彼的“准词”状态。对于每一个具体的词,这个渐进的过程何时完成,虽然有时可以借助工具书,并综合其特定时期的出现频率以及上下文语境做出初步判定,但在更多情况下,这种判定仍然存在很大的难度。

这些悬而未决的问题对于汉语词汇研究是至关重要的,但短时间内又不能得到彻底解决。中古汉语语料库主要是为学界提供一个中古汉语词汇、语法的语料平台,其中的大多数词语,学术界并没有太大争议;本课题组无意也不可能对词类划分、词的切分等问题得出终极性结论;组内成员从较优秀的硕士生到博士生再到专业教师,学术修养存在一定差异。因此,必须建立一套符合语言学基本要求的、便于组内成员具体操作的规则,前者保证语料库具有较高的学术价值,后者则使整个课题能够顺利地进行下去。经过长时间反复讨论,课题组内部大致形成了下列共识:

第一,词类划分采用汉语史学者普遍认可的、比较容易操作的标准,共分13类。与之相对应,建立一套面向中古汉语语料库的、规范的词类标记集,以减少数据转换的麻烦,所划分的词类及其标注符号为:名词(n)、动词(v)、形容词(a)、数词(m)、量词(q)、代词(r)、副词(d)、介词(p)、连词(c)、助词(u)、语气词(y)、叹词(e)、拟声词(o)。需要说明的是,这套词类划分及其标记集,主要是为了解决中古汉语语料库数据交换过程中词类标记的统一问题而建立起来的,并不能看作中古汉语词类的规范,也不妨碍对古代汉语词类的深入研究。此外,随着中古汉语语料库建设的发展,将来必然会对现有的词类进行更为细致的划分,因此,这个词类划分及标记集,应该具有一定的可扩展性。我们的思路是,借鉴现代汉语语料库的做法,对部分较为复杂的词类预设出若干小类及相应的标记符号:名词之下,预设了专有名词(np)、普通名词(ng)、时间名词(nt)、处所名词(ns)、方位名词(n1);动词之下,预设了助动词(vu)、趋向动词(vd)、系动词(v1)、不及物动词(vi)、及物动词(vt);形容词之下,预设了性质形容词(aq)、状态形容词(as);数词之下,预设了基数词(mc)、序数词(mo)、助数词(mu);量词之下,预设了名量词(qn)、动量词(qv)、时量词(qt);代词之下,预设了人称代词(rh)、指示代词(rd)、疑问代词(rw);助词之下,预设了结构助词(us)、动态助词(ua)、语气助词(um)。这一处理方式,基本上解决了中古时期的个体词语在现阶段语料库中的词性问题,也为将来的细化分类及研究留下了足够空间。目前,为了使中古汉语语料库建设能够顺利进行,在实际操作过程中,除了用来满足特定知识检索的需要而设立的专有名词外,各个词类之下原则上不再划分次类。这样的词类划分体系,是根据中古汉语语料库建设的具体情况,对黄伯荣、廖序东《现代汉语》的词类划分、中古汉语词类的固有特点进行折中的结果,虽然带有一定的杂糅色彩,却在很大程度上提高了语料库建设的可操作性。对于中古汉语中较为常见的兼类、活用现象,遵循“依句辨品,,的原则:根据词语在句子中的语法功能确认其词性;典故词、成语等不予切分,同样按照在句子中的语法功能标注其词性。

第二,以分词单位作为中古汉语语料库的基本单位。分词单位包括中古汉语阶段全部的词和少量使用频率及凝固程度较高的词组。这个概念借鉴了现代汉语语料库的做法,主要是为了避免陷入词和词组的争议。因为在实际操作过程中,界定分词单位通常比界定词或词组更容易把握;也有利于解决本身相当棘手、词汇语法研究较少关注的专有名词、专名词组、成语、习语等问题,同时便于系统软件对规则的理解和应用。

第三,分词单位的成员主体是词。关于词的切分,按照下列步骤依次展开:(1)分离出《汉语大词典》包含中古用例的所有词条及其义项,初步建立一个中古汉语词语义项数据库。(2)分离出蔡镜浩《魏晋南北朝词语例释》、方一新《东汉魏晋南北朝史书词语笺释》、王云路、方一新《中古汉语语词例释》、董志翘、蔡镜浩《中古虚词语法例释》、丁福保《佛学大辞典》、李维琦《佛经词语汇释》中收录的词语及其义项。由于我们的义项库属于动态数据库,下一阶段还将陆续分离出江蓝生《魏晋南北朝小说词语汇释》、王云路《六朝诗歌语词研究》、张永言《世说新语辞典》、江蓝生、曹广顺《唐五代语言词典》、李维琦《佛经释词》及《佛经续释词》等断代研究或专题研究成果中的词语及其义项,并密切关注《中国语文》、《语言研究》、《古汉语研究》等专业期刊,及时梳理中古词语研究的最新成果。剔除上述成果中与《汉语大词典》词语、义项数据库重合的条目,其余条目分别补人数据库,从而建立起中古语料库专用的中古词语义项数据库。需要说明的是,在建立专用义项库的过程中,在词条的立目、义项的分合、释义的表述等方面,必然遇到大量的《汉语大词典》与其他工具书、学术论著不尽一致的情况,处理这些问题的基本原则是:以《汉语大词典》为主要标准,其他工具书、论著的成果则主要用来弥补《汉语大词典》的某些不足,如增补《汉语大词典》失收词条、纠正比较明显的释义错误等。当《汉语大词典》与其他工具书义项分合不一、释义差异较大的时候,同样强调以《汉语大词典》的义项设立、释义表达为主要标准,尽量避免过多地陷入具体问题的争议之中。(3)确定分词单位时,坚持适当从严的原则。具体切分时,每一个切分出来的词语均需与中古汉语词语义项数据库中的词条进行比对,以确认是否成词。凡义项库中未登录的词语,尤其是数量众多的同义复词、专业性较强的行业术语、代表地名或人名的专有名词,经组内专家与理论组(本项目的子课题组之一)集中讨论,共同认定其性质。排除了误切的条目之后,将确认无误的条目补充到义项库中,同时以备注形式逐一添加统一标识。为将来建立未登录词数据库积累原始数据。同时强调不能因为中古词语义项数据库收录了某个词,就把文本中同一形体的语言单位机械地认定为分词单位。

第四,为了尽可能地保持一致的切分标准,制定了若干比较具体的分词规则:(1)除专名词语、外来词语外,由四个以上音节构成的词组,一律不作为分词单位,必须予以切分;四音节的语言单位,如果结合较紧密、使用频率较高或者存在增义、转义现象,一律视为分词单位不再切分,理论上视为分词单位中的词组。(2)来自异族语言的音译外来词,不予切分。(3)“阿、第、有”后加单音节名词构成的词或词组,不予切分;“头、子、然、复、如、尔”前加单音节名词、动词、形容词、连词、副词构成的词或词组,不予切分。(4)普通名词:结合紧密,分开后如果违背原有组合意义的名词性词组,一律视为分词单位,不予切分。一年的十二个月份,一律作为分词单位,不予切分。民族名、国名、地名中的“族、人、国、郡、州、县、邑、城、里、江、河、山”等,单独划分。只有两个字的民族名、国名、地名,一律不予切分,如:《世说新语・言语》“昔武王伐纣,迁顽民于洛邑”中的“洛邑”指洛阳城,视为一个分词单位,不予切分;《洛阳伽蓝记・凝玄寺》“洛阳城东北有上商里,殷之顽民所居处也”中的“洛阳城”切分为“洛阳”、“城”两个分词单位。帝王年号与后边的附加成分,一律予以切分,如:《高僧传・神异上・竺佛图澄传》“以晋怀帝永嘉四年来适洛阳,志弘大法”中的“永嘉四年”切分为“永嘉”、“四年”两个分词单位;与此类似的“永嘉末”、“永嘉中”、“永嘉之初”等,同样应予切分。(5)专有名词,以《世说新语》的语料为例:人名、表字、封号、谥号、职官名,均作为分词单位,不予切分;与姓氏连用时,也看作一个整体,不予切分。如,李膺、李元礼(李膺,字元礼),王安丰(王戎,封为安丰侯),晋文王(司马昭,死后谥文),裴令公(裴楷,曾任中书令),陈太丘(东汉陈,曾任太丘长),祖光禄(祖纳,时任光禄大夫),桓常侍(桓彝,官至散骑常侍),王丞相(王导,曾任丞相);尊号也不予切分,如,郗公(郗鉴,曾任司空、太尉等职);含有地名的封号、职官名,其中的地名应予切分,如,扶风王(扶风,郡名),荆州刺史(荆州,州名)。(6)动词:动词前的否定副词,一律予以切分。动词与趋向动词结合的词组,一律予以切分。动宾结构、动补结构的词或词组,中间如果可以插入其他成分,应予切分。可否插入,原则上根据中古文献中有无实际用例进行判断。如:《高僧传・译经上・摄摩腾传》“既而游方弘化,遍历诸国”中的“游方”,《汉语大词典》虽然已经单独立目,但中古文献的很多用例中尚未完全凝固,中间可以插入其他成分,基本意思保持不变。《颜氏家训・兄弟》:“方其幼也,父母左提右挈,前襟后裾,食则同案,衣则传服,学则连业,游则共方,虽有悖乱之人,不能不相爱也。”根据《颜氏家训》的用例,原则上将南北朝文献中的“游方”视为应予切分的词组。单音节动词后加“为、作、成、得、至”等成分的动补结构,使用频率、凝固程度较高的,可以作为一个分词单位,不予切分;反之,则予以切分。(7)形容词:两个单音节形容词并列且改变词性的,一律不予切分。(8)数词:数词和量词一律切分;数位词一律不予切分。

古典文献论文篇4

关键词:古籍文献数字化学科建设古籍整理古籍保护

中华文化源远流长,广博精深,古籍文献蕴藏着我国五千年历史的全部智慧精髓,它不仅是中国悠久文化的传统明证,也是中华民族的立世之本,更是我们不可或缺的精神力量。古籍文献本身所具有的历史文物性、学术资料性以及艺术代表性,对研究我国古代的社会风貌以及生产、科学文化的发展,都具有极其重要的作用。因此,我们不仅应该好好加以保护,更应该充分利用这一宝贵资源。古籍文献数字化,有效地保存了我国现存的古籍资源,并借助信息技术,以发掘其中隐含的知识内涵,为我国古籍文献的开发利用奠定了基础。因此,将古籍文献数字化作为一门独立学科体系来研究,是摆在我们面前的一个全新的课题。

1古籍文献数字化学科建设的重要性

古籍是特殊文献,既具有罕见的史料价值,又具有珍贵的文物价值。其中有些孤本、珍本,纸张已经变质变脆,而作为文献资料的古籍不可避免地要供人阅读。因此,如何有效地保护好这些珍贵的古籍文献,又不影响其正常使用,就成了古籍收藏单位所面临的迫切需要解决的问题。而古籍数字化以后,读者可以通过光盘或者网络浏览阅读善本,可以任意查找珍本书籍,避免了直接翻阅古籍的诸多不便,从而解决了古籍保存和使用的矛盾。古籍文献数字化,是保护和传承古文献最有效的形式,也是古籍整理工作的必然趋势。

古典文献学应该是一个开放的学科,在研究方法上可以吸取诸如文化人类学、阐释人类学、文化地理学、区域社会史等学科的成果,拓宽研究视野。中国古典文献学是一门基础性学科,是国学研究的基础。它支撑了众多以古代文化学术为研究对象的专业、学科的研究工作,促进了它们的持续良性发展。同时,中国古典文献学又是一门综合性学科,只有以各学科的知识积累为基础,不断充实自己的研究内容,才能保证研究成果的准确性、可靠性。古典文献学界要以接纳、包容的心态,积极吸收其他学科的研究成果,特别是加强同文学、历史、哲学等人文学科学者的联系,共同促进学术事业的发展。

2古籍文献数字化学科建设的现状

当今,Internet已成为信息传播的主要媒介。作为一种全新的文献存在方式,数字化古籍文献,经过短短十数年的发展,已经向我们昭示其强大的生命力与广阔的应用前景,同时也提供了一个新兴交叉学科的发展契机。

2.1基础理论研究缺失

古籍文献数字化理论的研究薄弱,尤其是系统理论缺乏。当前,有关古籍文献数字化的研究,过多地集中在对古籍文献数字化资源的调查和利用上,深层次的理论探究涉及较少。对于古文献资源来说,古籍文献数字化,只是技术手段上的革新,其本质上仍然属于古籍整理之范畴。古籍文献数字化,也面临着版本选择、文字校勘、文献考证等古籍整理的基本环节。所以,从事古籍文献数字化工作的相关人员,须具备古文献学的基本知识。

2.2技术手段革新

古籍文献数字化,主要是利用现代电子信息技术,对古籍文献进行加工、处理,形成大型数据资源库,藉以揭示古文献中所蕴涵的丰富的信息资源。随着信息技术的飞速发展,古籍文献数字化的相关技术也日渐成熟,且取得的成就十分突出。

从数字化古籍文献利用的角度看,信息化的古籍产品呈多元、自主开发的态势,这样就使读者获得了更为广阔的阅读、科研空间,从根本上改变了传统查阅方式及学习模式。故引入数字化技术,是古籍文献再生性保护的必然趋势。

2.3学科队伍的不作为

一方面,由于古籍文献数字化的应用前景十分广阔,与之相关的高等院校、科研机构、企业大多着眼于古籍文献数字化项目的开发利用,同时也带来重复选题、资源浪费、效率低下等诸多问题;另一方面,从事古文献研究和史学的学者,虽认为数字化的古籍文献有益,但却不作为;真正投身于古籍文献数字化规划项目事业、推动古籍文献数字化进程的学者,却是图书馆、信息管理学界之人士,此种状况严重制约了古籍文献数字化学科的建设与发展。

3古籍文献数字化学科的研究对象和学科性质

3.1研究对象

每一门学科,都有其研究对象。确定研究对象,是一个学科成立的根据和发展的逻辑起点。“古籍文献数字化”,是指以古籍文献为对象进行的数字化工作,它包含了两个基本要素:一是“古籍文献”,二是“数字化”。我们在探讨“古籍文献数字化”的研究对象时,就必须从这两个基本要素以及二者的结合上入手,并考察古籍文献数字化是否具有特殊的研究领域。

作为文献的一种类型,古籍的数字化与其他文献的数字化相比,有共性,但也有其个性。古籍的个性,体现在其特殊的外观和历史文物价值上。为了体现这些个性,需要我们采取一些特殊的加工手段和技术措施。因此,根据古籍的特点来进行数字化,是“古籍数字化”学科的研究对象,更是提高古籍文献数字化水平最主要的途径。

古籍文献数字化,应根据古籍的特点来进行,并通过数字化的操作过程,对古籍文献中所包含的信息进行重组。

将古籍的特点与数字技术的特点相结合,既要充分考虑古籍本身所具有的特点,让经过数字化处理后的古籍文献,保持原有的文化特征与内涵;同时又要考虑数字技术及信息处理技术对文本和信息处理的过程,让后者所具有的信息分析、聚类以及海量信息处理等优势得到充分发挥,使过去必须用人工进行处理的事情,甚至是人工不可能完成的事情,让计算机来处理,实现从古籍影像的数字再现到古籍内容的分析、聚类,从单种古籍内容的处理到海量文献的综合处理,从简单的文本转换到信息重组甚至知识挖掘,这将是今后古籍数字化学科重要的研究领域。

3.2学科性质

古籍文献学,吸收了目录学、版本学、校勘学、计算机科学等多学科的研究成果和方法,博采众家所长,以全新的视角,将古籍文献作为一种数字信息资源,动态地展示在人们面前,诠释传统古籍与人类社会文化繁衍之间的交互关系。转贴于古籍整理是对古籍原文的整理加工,以便于人们阅读与研究。从学科体系上看,古籍整理从属于文献学,文献学是“把整个古籍整理工作统统包括了进去,可见文献学全部内容之庞大”。因而,将古籍数字化定位于古文献学的分支学科,使之从文献学与信息技术交叉的角度,来审视古籍整理领域中特有的现象与规律,并形成一门边缘性交叉学科,意义十分重大。

古籍文献数字化的重点,在于计算机技术同古文献学的融合,它不是简单的拼凑或叠加,而是融合原有基础上的提高与升华,并会随着时代的发展而变化。从古籍数字化的角度来看,是研究新技术、新环境下的古籍整理的问题;而从信息技术的角度来看,是研究、拓展数字技术在古文献学中的应用。因此,古籍文献数字化,实际上要涉及到古文献学、古籍整理、信息学、计算机科学与技术、现代通讯技术等诸多学科领域,具有十分明显的跨学科性质。通过以上的分析,我认为对古籍文献数字化学科可以这样描述:古籍文献数字化学科,是研究古文献在数字化、信息化过程中的特质和规律,指导数字技术在古籍整理领域中的应用,以优化信息环境下的古文献学科研究领域。

4古籍数字化学科的研究内容

古籍文献数字化,不仅是技术条件下的古籍整理方式的一种尝试,更在于它是一项跨越在自然科学和社会科学两个科学领域上的系统工程。为了实现旧有典籍的数字化进程,古籍文献数字化涉及众多学科知识的融合,并将形成具有自身特色的理论体系和结构框架。

古籍数字化学科的建设与发展需要有一个过程,其初创期可以着眼于以下三个方面:

4.1数字化古籍整理学

古籍数字化是一项复杂的系统工程,不仅仅是文献载体的转换,还包括对古籍的版本考证、文字校勘、史实考订、目录编纂等工作,其制作过程的本身仍然是对古籍进行整理。可以说,整理工作的好坏决定着古籍数字化的质量优劣。因此,数字古籍也必须遵循古籍整理的一般过程和相应规则,而探究技术条件下古籍整理的独特规律将有助于古籍数字化的进一步研发

4.2中文信息处理技术

中文信息处理技术,是我国特有的、利用计算机系统来处理中文信息的技术,发展至今已取得了不小进展。但古籍文本的信息处理,既包含古籍外部体式或内容的数字转换和再现,如页面的扫描、文本的数字化转换、光学字符识别以及版式还原等,还包括文本数字转换后的应用,如智能检索、内容关联等。其共性与个性的把握,需在中文信息处理范围内专门引入特定的古籍处理范式。

4.3古籍数字化管理理论

古籍数字化的管理理论,是指对古籍数字化实践活动的全过程实行有效调控的理论。它涵盖了对古籍数字化成果及产品的预测、决策和评价的研究,古籍数字化的管理体制和开发机构的研究,古籍数字化从业者的素质及技能的研究等。针对古籍数字化而进行的管理活动,不仅仅是为了提高古籍数字化实践活动的效率,更在于通过有效的管理使古籍数字化更好地服务于广大读者。因此,必须加强对古籍数字化管理理论的总结研究,以给古籍数字化管理的实践提供强有力的理论支持。

5结语

古籍文献数字化,不能只着眼于数字技术,或市场运作,其更加深刻的内涵在于,数字技术所承载的内容,这需要通过学科建设这一途径来完善其相关理论体系,从而折射出古典文献在内容上对于人们的使用价值,并成为活着的文化生命与民族精神传承资源。

参考文献:

[1]黄永年.古籍整理概论[M].上海:上海书店出版社,2001.10.

[2]李国新.中国古籍数字化资源的进展与任务[J].大学图书资料学报,2002(1):21-26.

[3]郑永晓.古籍数字化与古典文学研究的未来[J].文学遗产,2005(5):130-137.

[4]徐筱红.刍议高校图书馆古籍整理工作[J].高校图书情报论坛,2006(1):48-50.

[5]陈力.中文古籍数字化的再思考[J].国家图书馆学刊,2006(2):42-49.

[6]徐清,石向实等.古籍数字化资源的深度开发[J].图书情报工作,2007(3):95-97.

[7]程微.对我国图书馆古籍管理数字化的三点认识[J].图书馆论坛,2008(3):61-64.

[8]李明杰,俞优优.中文古籍数字化的主体构成及协作机制初探[J]..图书与情报,2010(3):34-44.

古典文献论文篇5

关键词:《中华大典?法律典?法律理论分典》;编纂原则和规则;谨守与变通

中图分类号:DF08

文献标识码:ADOI:10.3969/j.issn.1008-4355.2012.03.01

盛世修典。《中华大典》堪称一代匡世名典。《中华大典》是一项国家重大文化出版工程,该工程于1989年开始试典,1992年正式启动编撰。作为一部中国历代汉文字古籍的新型类书,《中华大典》分为24个典,包含100多个分典,收入两万多种古籍,共约8亿多字,是《永乐大典》的两倍多,是《古今图书集成》的4倍多,将超过中国所有古代类书字数的总和。《中华大典?法律典》有《法律理论分典》、《刑法分典》、《诉讼法分典》、《民法分典》、《经济法分典》、《行政法分典》6个分典组成,总字数6-7000万左右。它续600年前《永乐大典》《永乐大典》编纂于明朝永乐年间,保存了14世纪以前中国历史地理、文学艺术、哲学宗教和其他百科文献,与法国狄德罗编纂的百科全书和英国的《大英百科全书》相比,都要早300多年,堪称世界文化遗产的珍品,也是中国最著名的一部大型古代类书。《永乐大典》共计有22,877卷、目录60卷,分装成10,095册,全书字数约3亿7千万字。据粗略统计,《永乐大典》采择和保存的古代典籍有七、八千种之多,数量是前代《艺文类聚》、《太平御览》、《册府元龟》等书的五、六倍,就是清代编纂的规模最大的类书《古今图书集成》也只有1万卷、1亿6千万字,不到《永乐大典》的一半。清代编纂的大型丛书《四库全书》,收书也不过3,000多种。《永乐大典》的规模更是西方同时代的典籍所望尘莫及的。《永乐大典》屡遭浩劫,大多亡于战火,今存不到800卷。雄伟博大之类书气魄,贡献于中华文化的传承与弘扬之伟业。编纂《中华大典》是国家的一项文化发展战略性决策。作为出版工程,有关部门给《中华大典》戴了四顶帽子:“中华人民共和国国务院批准的重大文化出版工程”、“国家文化发展规划纲要的重点出版工程项目”、“新闻出版总署列为‘十一五’国家重大工程出版规划之首”、“国家出版基金重点支持项目”。

见《中华大典?法律典?法律理论分典》扉页。西南师范大学出版社,巴蜀书社2011年11月第一版。

这样的定位在当今出版界已经高得无法再高了。《中华大典》当然应成为传世之作!成为中华文化传承之作!成为国家文化宝库的镇馆之作!成为国礼之作!

感谢时代,让我们际会修典伟业。一介书生,机缘巧合,能参与《中华大典?法律典?法律理论分典》的编纂,贡献所学,亦足以不负平生,能不殚精竭虑?!

历经两个多年头夙兴夜寐的努力,《法律理论分典》终于在2011年11月正式出版,2012年1月印装完毕。当厚厚的四大卷分典送到案头,望着那大气、典雅、精美的装帧,闻着那熟悉的、淡淡的墨香,欣慰之余,不禁百感交集。在现代法理学理论和分类的指导下编纂《法律理论分典》是一项前无古人的大胆尝试。如何既尊重古籍文献、避免削足适履又服从《中华大典》经目纬目体例格式,如何既保留中华古代礼法范畴体系和理论特色又适应现代法学理论逻辑和思维方式,如何既谨守《中华大典》编纂原则和技术规范又能根据中华古代法实际有所权宜和融通,如何才能寻求到一种通今达古、充满古香古色又能让现代人看得懂的《法律理论分典》编纂体例和标题用语体系……面对一系列的如何,真是令人费尽心思、绞尽脑汁。重读着几乎能背得出的《法律理论分典?说明》

见本文附件1。,回忆的闸门轰然洞开,一发难收。就势把《法律理论分典》编纂过程中一些思考整理成几个片断公诸于世,一来与读者分享,二来求方家指教。

一、关于《法律理论分典》资料收集的范围

《中华大典》工作委员会和编纂委员会给各个分典在资料收集方面定的原则是“竭泽而渔,应收尽收”。问题是,涉及到中国古代法律理论这个领域,“泽”有多大,鱼有多少,让人颇费周折。

更多范文

热门推荐