新闻中心

您现在的位置是: 首页 > 新闻中心 > 正文

包伟民教授主讲“史学前沿”课程第五讲:数字人文及其对历史学的新挑战

发布者:历史学院 发布时间:2018-04-04 13:04 阅读量:
     2018年3月29日下午,我院包伟民教授来到了“史学前沿”讲座课堂,同大家分享了自己在利用数据库从事史学研究的体会。包老师长期关注宋代财政问题,近年又集中探讨宋代城市和乡里制度问题。

 
    包老师指出,目前计算机数据库对于研究者来说,有检索资料、提出议题和统计分析三个方面功能。他结合自身使用数据库的经验,通过生动鲜活的研究案例,详细解释了单纯利用计算机数据库做研究的弊端;在此基础上,强调学术研究者在数据库使用方面的能动性和学养积累的重要性。

     讲座伊始,包老师回顾了自身在在初次使用电脑时经历的一个“换笔”的调适过程,即需要从原来的手抄笔记、作文到适应键盘打字、写文章。技术的发展影响人类历史的发展,宋代雕版印刷业的发达,也影响到了那个时期的读书人。包老师援引苏东坡在熙宁九年(1076)密州任上为李常(1027 1090)藏书房所写记文,其中感叹当时书籍摹刻便利,士人学子在书市很容易寻得诸子百家之书,说明苏东坡所处时代正是雕版印刷术开始普及的时期。包老师认为我们正处在一个信息技术高速发展的时期,随着各种文献数据库的建设、电子图书的普及,可谓是进入了“数字人文”时代。对于文史研究者来说,有代表性的数据库有:文渊阁《四库全书》全文检索数据库、中国基本古籍库、中国知网等,这些数据库各有特点,在极大方便研究者查找文献的同时,也因为市场利益驱动,产生了诸如作者版权纠纷和数据库使用费用昂贵等问题。

     包老师梳理了学界对数据库使用的不同见解,继而谈了自己对“晚清除外的中国古代史领域”应用数据资料库的一些体会。他提到,数据库的使用,使得检索数量大增,研究者有机会在很短时间内就掌握前人未曾寓目的材料;但传统考据学亦要求信息的大量获取,数据库的使用只是方便了我们获得更多资料,从这个角度而言,数据带来的变化只是量变,而非质变。更有甚者,由于数据库检索获得信息量过大,反而导致关键、有效的信息的淹没;且中国古代史研究中最大的一个难题是,存世资料绝大多数是描述性的文本,而数码技术处理时,是定量处理,这就产生了张力。

     具体而言有以下三点:(1)文献中可能用不同的词汇来指称一个对象,研究者非遍览史籍难以知晓;(2)中国古代历史文献记载中,文本字面含义与史实之间常常存在错位,这就使得事情变得更为复杂;(3)文人士大夫行文遗墨,笔下常见隐语、反讽、比拟、转喻等手法,有时文本与史实之间隔着好几层关系。包老师结合自己近年来的研究实例,如《中国近古时期“里”制的演变》、《说“坊”  唐宋城市制度演变与地方志书的“书写”》等文,细致解释了上述问题。他认为,虽然有学者指出利用数据库“e-考据”要有清晰的问题意识与灵活的搜寻技巧,但是,对于一些基本历史文献,认真通读,细心体会,仍然是中国古代历史研究必不可少的一道“工序”。

     针对数据库“提出议题”和“数据统计”两个方面的功能,包老师既承认数据库在这方面的巨大优势,但同时也认为:“能否通过大数据分析来发现史事中问题,其前提仍在于研究者对于历史社会基本脉络及其细节的掌握是否充分,‘读书得间’,尤其在史学训练的初步阶段,不可跨越”。他以近年来有人利用“中国历代人物传记资料库(CBDB)”做出的具体研究和自己对宋末入仕元朝士人心态的研究为例,认为(1)存世文献记载零散,数据库的统计分析难以保证结论的普遍性;(2)经过一定的条件界定,难免会筛选、过滤历史信息,造成信息的衰减;(3)偶然存世、零散、残缺与每一单篇都颇具个性色彩的古代历史文本,在被统合到数据库后,或者被分解开来以其局部与其它资料相联系、对比、分析,或者以其一部或整体与其他资料相加、统计、核算,都会存在一个损失其个性、脱离其历史背景的问题。

 
    讲座的最后,包老师指出:“如何在符合学科特点的基础上,更有效地利用信息技术,以推动历史学研究的深化发现,对史学从业人员来说,的确是一个新课题、新挑战。”包老师与现场同学进行了互动交流,他鼓励青年学子,可以多关注这方面的问题,将来更好地利用数据信息研究历史。

(图、文:年惠龙)