[1]刘杰.对图书馆特色数据库建设的思考[J].牡丹江师范学学报,2005(5.
[2]韦衣昶.特色馆藏资源的数字化建设[J].大学图书馆学报,2001,(6.
[3]王盾,张红燕,袁宝财.等特色全文数据库的建立及其在网上的信息服务[J].图书馆理论与实践,2004(4.
[4]邓晓辉.网络环境下的特色数据库建设[J].图书馆学研究,2001,(1.
《大数据》一书对美国大数据的应用进行了十分详细的介绍与分析,我印象最深的为两点。
第一,以海量数据的处理作为政策制定的依据。看这本书的时候,我想到了这两年很火的一个美国人——斯诺登。在其曝光的“棱镜”计划中美政府直接从包括微软、谷歌、雅虎、Facebook、AOL、Skype以及苹果在内的国际公司服务器收集信息。美国政府从这些海量数据中寻找自己需要的数据,并以此作为所谓安全政策制定的依据之一。姑且不论媒体对此计划的口诛笔伐及相应的道德风险,仅从政策制定方面来说,依据于海量数据的政策制定科学性肯定比一般计划要高得多。
2007年,雅虎 首席执行沃兹博士在《自然》上发表的《21世纪的科学》中提到,得益于计算机技术和海量数据库的发展,我们每个人在现实世界中的活动得到前所未有的记录, 这种记录也更为细致,为社会科学的定量分析提供了极为丰富的数据。打个比方,从你的QQ空间、微博、微信中一个普通朋友都能了解到你在哪儿、做了哪些事 情、现在的状态是什么,而新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为社会行为的研究提供了大量的数据。我想到最近比较火爆的穿戴设备,如果 该技术得到普及过后,拥有穿戴设备的人群的生活轨迹、生理各项指标都能轻而易举地得到,相信这些大量的原始数据如能安全有效利用定能为卫生政策的制定提供 科学依据。
第二,万事万物, 凡存在,皆联网,凡联网,皆计算。2005年起,美国食品与药品管理局开始在药品上推行配备RFID做法即每个食品包装上安装一个薄如纸张或小如豆粒的无 线传感器。通过这个移动传感器,对食品进行连续跟踪,一旦相应的安全事故爆发,就能通过数据库追踪溯源,快速确定传染源与影响范围。这一技术相对于国内尚 在起步阶段的食品追溯具有极强的借鉴性。上面提到的穿戴设备其实就可以视为一个穿戴在人身上的RFID。
2010年的时 候,美国国家气象局在全国2000两客运大巴上装备了传感器,随着大巴的移动,沿途手机所有地点的温度、湿度、露水、光照度等数据,并立即传给国家气象局 数据中心。数据的采集是每10秒中一次,每天采集10万次以上的数据,这些实时的、高精度的数据意味着天气预报将不再仅仅是”预“,将逐渐走向“实”报、 “精”报。
“一代有一代之文学”[6]的观念自明代就得到了许多学者的认同,从文体的演变来看文学的发展是中国古代文学教学中经常用到的方法。楚***、汉赋、唐诗、宋诗,通过对文体序列的排位来总结文学发展概况,这就容易给学生一个错误的引导,提及汉代,只重视赋;论及唐代,只谈诗歌。对于学生而言,这样的教学其实不利于他们对文学发展有一个全面的认识,反而容易进入一个狭隘的学习视野。文学的发展有时间的跨度,文体的完备也需要一定的时间,今天我们回顾古代文学的发展,虽然具备了对文学体裁进行总结的条件,然而在教学中一味强调“一代有一代之文学”,并在教学实践中遵循前人“只重视唐诗、宋词、元曲讲解”的做法,不利于学生真正全面认识文学的发展。以宋代文学为例,一直以来宋词作为宋代的代表性文体得到了学界的广泛重视,在教学中也一直是教学的重点,长期以来这似乎已经是一种共识。然而在大数据环境下,随着越来越多的古代文学作品数据库的建立,对宋代文学的发展似乎也应有一个新的判断。“古今文章,至我宋集大成矣。”[7]“宋之文超汉轶唐,粹然为一王法。”[8]宋人对宋文的发展不仅有着较为自觉的理论认识,而且是颇为骄傲与自豪的。客观讲,宋文所取得的成就并不逊于宋词,但长期以来,在宋代文学的教学中,宋文往往是在古文运动中简单讲述,学生也很难对此有深入的认识。就当下对宋文的整理来看,已经出版的《全宋文》计360册,收录近万人的17万余篇作品。虽不能以量的多少来讨论文学成就的高下,但如此丰富的文学遗产显然是今人所不能忽视的。而且随着全宋文数据库的编制,为我们全面认识宋文提供了极大的便利。借助数据库的搜索引擎,在教学中可以更好地展示宋文的发展及其所形成的文学特色、所取得的文学成就。如此一来,就不至于给学生留下宋代文学仅仅是宋词成就斐然的刻板印象了。明清文学更是如此,长期以来在教学中重小说轻诗文的现象非常严重;随着古籍的整理以及当下众多古诗词数据库的研发,明清诗文也逐渐引起人们越来越多的关注,因此在本科教学中也应有所体现。
众多的古诗词数据库提供了较为全面的经典古诗词和古诗文,并且这些数据库大多提供检索分析,具有一定的智能化特点。文学内容的演变是文学发展的具体表现,文学作品也是文人对特定时代社会生活的审美反映,同一题材在不同时期所反映的不同主题就很好地呈现了文学的发展。借助于众多古典文学数据库,对不同时代同类题材的文学作品进行分析得以轻松实现。文学发展中文学形式的演进、继承与革新等相关话题借助于当下的古籍数据库都有了新的教学思路,通过数据分析进行相关知识的讲解,更利于学生的理解与接受。
作业设计是教学的一个重要环节,而课程作业作为课堂学习的延续,既是学生进行独立学习的活动,也是学生学习过程中的重要内容。当下古代文学教学在作业设计上也存在着一定的问题,大体表现在:作业形式单一;作业内容简单化,在问与答中难以调动学生的兴趣;作业评价与反馈效果不明显等,而且这些问题长期以来在教学中都未能引起足够的重视。
在大数据背景下,海量资料、数据挖掘技术、多维检索方式等丰富了古代文学教学中的作业设计。以杜甫为例,传统的古文学教学中,关于“杜甫”的作业设计常常是“杜甫诗歌的‘诗史’性质”;“杜甫诗歌的艺术风格”;“杜甫诗歌的叙事手法”;“杜诗的地位与影响”等等,这些问题的设计都过于概念化,未能体现个性化,也难以激发学生的学习兴趣。而在大数据背景下,有了大量可供利用的信息资料,在揣摩教材与掌握学生学习的实际情况的前提下,可以精心设计多种形式的古代文学作业。就杜甫而言,对于汉语言专业的学生,根据其专业要求,可以借助数据库设计一些较为深入的研究型作业,比如可以布置“通过安史之乱中杜甫的行迹与创作的数据分析,理解杜诗的‘诗史’性质”,以及“通过对古诗词数据库的分析来解构后人对杜甫的评价以及杜甫的影响”等。因为有数据与材料的支撑,这较之简单的对杜诗“诗史”性质的'平铺直叙,更容易加深学生的认识与理解,而且完成这一作业的本身就是较为有趣的探索过程。古诗词数据库大多都有检索功能,如北京大学李铎教授主持研发的《〈全宋诗〉分析系统》就提供多维的检索分析方式,学生可以借助这些数据库进行检索,搜集后世有关杜诗评价的诗文,然后进行分析归纳,通过数据分析发现问题。对于非汉语言专业的学生还可以联系其专业特点布置作业,比如对于新闻学专业的学生,可以布置“题壁诗与传播”“宋词中的传播方式”“笔记小说中的新闻传播”等;对于文秘专业的学生,可以布置“笔记小说中文秘形象的书写”等;对于广告专业的学生可以布置“古代名人在当下的品牌价值”等。这些作业都需要学生通过搜集大量的信息与资料后进行数据的统计与分析完成,其结论的获得印象也就较为深刻。这较之传统教学模式中的作业布置,其评价效果也较为明显,学生是否理解、掌握了这一问题在作业中会有着清晰的体现。
3.1标准化、规范化
在数据库建设过程应制定和遵循有利于长远发展的标准,主要包括:通信标准(TCP/PI、码标准、标准通信置标语言/可扩展置标语言(SGML/XML、元数据(Met标准、检索语言标准、安全标准等。CALIS在特色数据库子项目建设中采用《我国数字图书馆标准规范研究》项目所推荐的一系列相关标准、元数据标引格式规范、文献著录的有关国际标准和国家标准;各高校在建设特色数据库时有必要参照使用。
3.2共建共享
特色数据库的建设不仅要考虑各部门、各系统和各地区的协调,还应该在全国范围内实现合理布局、合作共建。高校图书馆在特色库建设上像过去在合作共建联合采购外文数据库、集团采购CALIS方面那样,在特色数据库建设中的分工建设、统一共享、统一采购软件等。更深层合作共建应次,实现共享
3.3突出特色
高校图书馆在建设数据库中,要集中有重点地开发某一领域或某一品种的数据库,选题必须是在馆藏基础上充地域特色、学科特色、专题特色,表现出独一无二。
3.4深层次加工原始文献
对于有传统馆藏文献转换而来的数据,要在标引,链接上下功夫,让原生态的文献产生多处知网节,以便用户的检索使用。
3.5完善的检索工具
充分吸收成熟而先进的建库技术和完善的检索技术,能适应脱机、光盘、联机和网络检索,直接获取一次文献。多设置检索点,在检索途径上,应初级检索与含有布尔逻辑算符高级检索并行以充分挖掘数据库资源。
3.6适度宣传
特色数据库要立足用户市场,即发挥知识效益也要发挥经济效益,实现以文养文良性发展的数据库发展的道路,关键是做宣传和促销工作,具体的可以采取.网页广告、培训讲座、主动推介等方式推销自己。
3.7数据要及时更新、长期维护实现可持续发展
领导必须重视、统筹安排,全面部署,有一套专业力量队伍,先立项论证,一旦确立,便持之以恒,对于已建成的一定规模的特色数据库,要保证有可靠的数据资源,有专门的人员续建更新数据,也要专业人员后续维护,以保持数据库的正常运作和数据的不断更新,尽,实现特色库的可持续发展。
随着计算机、信息技术、文字识别技术、检索技术、扫描技术的发展,我国高校依托馆藏信息资源,针对用户的信息需求,对某一学科或某一专题有利用价值的信息进行收集、分析、评价、处理、存储,并按照一定标准和规范将本馆特色资源数字化,建立起特色数据库。具有自己鲜明的特色和独创性。所建特色库如果发布上网,形成网络资源,为更多的用户会快捷方便获取系统资源,这对形成资源共享的信息化和整体化无疑是有积极的促进作用的,然而就笔者对黑龙江省所属11个高校所建特色库的网上调查得知,实际的状况不是十分乐观,问题很多,感觉大多数学校的特色库反而不“特”。本文以网络调查的形式,析出存在的问题、叙述现状、并提出发展建议。
由近些年来,我国古籍数字化工作取得了显著的成绩,常用的古诗词数据库,如由北京大学数据分析研究中心和北京欣诺格科技有限公司联合研制的《全唐诗分析系统》与《全宋诗分析系统》、郑州大学《全唐诗库》、稻香居“全唐诗宋全词在线检索”等,这些数据库不仅仅提供检索功能,更重视数据的分析。如《全唐诗分析系统》与《全宋诗分析系统》在重出诗提取、格律诗标注、字及字组的频率分布统计等都带有智能化的特点,其多维的检索分析方式有利于可靠的数据发掘。王兆鹏教授与搜韵诗词共同打造的《唐宋文学编年系地信息平台》在这方面更是有了进一步发展。
显然,在大数据环境下资料的获得相对来说容易了很多,在具体的教学中,无论是作家作品的讲解、文学发展的梳理还是课程作业的设计,都可借助于巨量资料、数据分析的便利,真正实现以文学作品为本位的教学模式。仍以苏轼为例,通过众多的古诗词数据库,将其人生行迹与文学创作历程相联系,学生可以对其文学创作的动态变化有一个清晰的认识,这样苏轼文学风格的形成、文学成就的获得也就自然明了了。同样,借助于古诗词数据库,围绕苏轼对其同时代文人的创作进行梳理,那么,关于词中“以诗为词”“婉约派”“豪放派”等相关问题的探讨也就迎刃而解了。无论是课堂教学还是课程作业的设计,大数据环境下古代文学教学改革有了切实可行的路径。而且在这种教学模式下,学生的学习主动性得以真正地调动起来。无论是带着问题对作品进行分析,还是在对作品的分析中发现问题,学生在探讨的过程中因为对作品了解的深入,也就不难获得情感的体验及审美的感受,这对提高其鉴赏能力和专业素养是大有裨益的。
综上所述,古籍数字化、古诗词数据库的研发不仅为学者的研究带来了极大的便利,也为高校古代文学教学工作带来了更多的生机。首先,多种形式的古籍数据库丰富了课堂教学的内容,有利于调动学生情绪,活跃课堂气氛。其次,众多的古诗词数据库为学生爬梳材料、探究问题带来了丰富的资源,有利于培养学生的问题意识、科研能力。再次,大多数据库虽重数据分析,但对于古诗词数据库而言,分析结论的获得是建立在文学作品的基础上,这又有利于让古代文学的教学重回文学本位,以文学作品为本。
© 2022 xuexicn.net,All Rights Reserved.