2.1数据库的学科特色只限于纸本文献的转换,学科、地域特色不够突出
表一显示,被调查特色库48,属于馆藏纸质文献的电子转换、原文献题录的数据库有28个占总数据库的53%,而体现学科特色的仅有15个,占总数的30%,体现地域文化特色和地域经济的只有2个学校建立了地域特色数据库,占学校总数的18%,以建库总数算,体现地域特色的只有5个不到总数的10%,表明,目前数据库的选题还只停留在学位论文、科研成果、学科导航层面,没有把真正体现专业特色、地域特色作为选题的重点。除了齐齐哈尔大学和黑龙江商业大学建立地域经济、文化或抗日的数据库外,其他高校都没有涉猎。
2.2建库的标准化与规范化较差
通过对能够访问的4所高校调查,特色库建设中存在许多不标准、不规范的问题。经访问得知,建库的标准不够规范,高校自选软件,建库过程都是依据软件自身所带的标准建库,对数据采集、数据加工、数据检索、数据传递、数据交换以及数据维护等标准各异,没有采用的国际标准,建立兼容性强、标准高的数据库。在访问这些数据库时,我们遇到很多问题:由于文本格式不规范,数据下载困难或不能下载;由于检索令不规范,同一系统中出现有多个检索命令;由于标引不规范,文献信息检索经常出现误检、漏检现象等。
2.3数据的深层次加工与后续维护力度不够,数据更新慢
以齐齐哈尔大学为例,文献加工方面:该校的“博、硕士学位论文数据库”等只是纸质文献的数字化转换,数据库停留在一次性建设上,没有深入加工和提供增值服务。
数据更新方面:在被调查的11个数据库中,有7个数据库(有1个数据丢失从2007年11月30日到2008年5月30日数据没有更新,占64%。
后续维护维护与可否使用方面:在对该校11个数据库33次调查中,我们发现数据库没有技术维护、读者不能够点击访问的次数各有15次,占抽查次数的45%,音像数据库数据完全丢失,已无法访问。我们对黑龙江省另3个可访问的高校的抽查也得到近乎一样的结果,(另3个高校的访问登陆太慢,没有列出每次调查数据许多高校图书馆数据库搭建后,后续建工作停滞,数据更新停止,数据库的维护工作长期以来处于一种相对滞后和缓慢的状态,很多数据库的数据长期处于不可用或不更换的状态。
2.4检索点设置与检索系统不完善
数据库最大的功用在于检索,以齐齐哈尔大学为例,该校使用TPI检索技术,只提供初级检索和二次检索途径,途径单一,我们发现数据库设置的检索点和数据所做的标引并不一致,比如“野生经济植物图片数据库”,数据标引的“形态分布”在检索点上没有设置,没有设计高级检索功能,有个别的自建数据库就根本没有检索功能。
2.5重建轻用现象普遍、数据库联网使用率低
高校图书馆的特色数据库虽然发展的很快,但调查得知,11所高校图书馆上网率不到36%,而实际联通率还要更低,多数高校进行IP网段封锁,外单位用户应用搜索引擎检索很难查询到高校的自建数据库,即使检索得到,绝大多数数据库也没有权限访问,特色数据库仅供校园网用户内部使用。
2.6共享和市场化理念亟待提高
高校图书馆自建特色数据库,其目的是为不具备本地资源的用户提供研究资料,实现资源共享。这是建立特色库的宗旨所在。而大多数图书馆是重藏轻用或者把资源封闭起来,不是积极宣传自己推销自己,投入偌大的人力物力建起的`数据库,今供少数人使用,是违背建库初衷的,如何像清华大学的CNKI和中国人民大学的复印报刊资料那样,能够被98%的高校利用,走向市场化,是需要一定的促销手段。
由近些年来,我国古籍数字化工作取得了显著的成绩,常用的古诗词数据库,如由北京大学数据分析研究中心和北京欣诺格科技有限公司联合研制的《全唐诗分析系统》与《全宋诗分析系统》、郑州大学《全唐诗库》、稻香居“全唐诗宋全词在线检索”等,这些数据库不仅仅提供检索功能,更重视数据的分析。如《全唐诗分析系统》与《全宋诗分析系统》在重出诗提取、格律诗标注、字及字组的频率分布统计等都带有智能化的特点,其多维的检索分析方式有利于可靠的数据发掘。王兆鹏教授与搜韵诗词共同打造的《唐宋文学编年系地信息平台》在这方面更是有了进一步发展。
显然,在大数据环境下资料的获得相对来说容易了很多,在具体的教学中,无论是作家作品的讲解、文学发展的梳理还是课程作业的设计,都可借助于巨量资料、数据分析的便利,真正实现以文学作品为本位的教学模式。仍以苏轼为例,通过众多的古诗词数据库,将其人生行迹与文学创作历程相联系,学生可以对其文学创作的动态变化有一个清晰的认识,这样苏轼文学风格的形成、文学成就的获得也就自然明了了。同样,借助于古诗词数据库,围绕苏轼对其同时代文人的创作进行梳理,那么,关于词中“以诗为词”“婉约派”“豪放派”等相关问题的探讨也就迎刃而解了。无论是课堂教学还是课程作业的设计,大数据环境下古代文学教学改革有了切实可行的路径。而且在这种教学模式下,学生的学习主动性得以真正地调动起来。无论是带着问题对作品进行分析,还是在对作品的分析中发现问题,学生在探讨的过程中因为对作品了解的深入,也就不难获得情感的体验及审美的感受,这对提高其鉴赏能力和专业素养是大有裨益的。
综上所述,古籍数字化、古诗词数据库的研发不仅为学者的研究带来了极大的便利,也为高校古代文学教学工作带来了更多的生机。首先,多种形式的古籍数据库丰富了课堂教学的内容,有利于调动学生情绪,活跃课堂气氛。其次,众多的古诗词数据库为学生爬梳材料、探究问题带来了丰富的资源,有利于培养学生的问题意识、科研能力。再次,大多数据库虽重数据分析,但对于古诗词数据库而言,分析结论的获得是建立在文学作品的基础上,这又有利于让古代文学的教学重回文学本位,以文学作品为本。
胡适说中国人习惯于当“差不多先生”,凡是马马虎虎、不求精确。黄仁宇认为,中国不懂得用数字来管理国家。作者引用这两位先生的名 言,当然是要彰显传统中国和今天美国之间的差异。但是我们也必须认识到:这两位先生身经当时中国的混乱,激愤而出此言。在大数据浪潮迅猛而来的时候,中国 与100年前已经完全不一样了,我们已经有足够的能力与自信来面对各项挑战。2003年中国开始着手制定医疗系统的最小数据集,3年之后卫生部出台了第一 版中国医院最小数据集的标准。也是在2003年,中国创立了第一个全国性的大型社会调查项目,开始对社会的发展和变迁进行全方位、综合性、纵贯性的问卷访 谈调查,即“杨文昊在KOD里面穿的裤子”。可以看到,中国政府和企业已经投入到了大数据时代的浪潮之中了。我个人也有几点应对的想法。
一是鼓励、扶持基 于数据的创新创业。书中提到,政策扶持的传统方法,可能是以政府主导建立大数据产业园,对新兴企业提供办公场所等便利条件或者现金支持,这固然有效,但更 为有效的是调动全社会的力量。调动全社会的力量来支持可以包括扶植民间团体,快速推进新技术、新理念在全社会的传播。现在云技术大众基本上都耳熟能详了, 而这主要是各大互联网服务上都相继推出了相应的云服务以及各大媒体对这项技术的关注,促进了大众对新技术的了解与支持。
二是政府机构要建 立专门机构来统筹管理数据工作。在大数据时代不同的数据需要整合,公安、消防、民政、社保等等数据都需要进行联动,将沉睡在数据库内的数据唤醒,为政府制 定政策所用,避免各自为政、多头管理的情况发生。数据的联通也能在一定程度上减少群众的“办证”问题,相信在大数据时代,大家可能只需要一张身份卡就能满 足绝大部分的数据需要。
三是围绕个人数据安全,加强管理。任何技术都是双刃剑,耍得好可以披荆斩棘,耍得不好则会害人伤己,大数据也不列外。如何保障个人隐私也成为了大数据时代面临的一个重大挑战。
上周把黄伟豪写的《数据分析思维:产品经理的成长笔记》一书看完了,虽然讲的是不同领域的数据分析思维,但也算是小有收获。
作者从事的是金融行业,具体来说是在四大行中的一家工作,从技术岗位到产品岗位,跨度较大,书中讲述了作者在工作中遇到的一些数据分析案例,通过数据指导业务发展。其实很多时候并不需要用到很高大上的算法、模型,即使是使用最基础的分析方法,只要能解决问题,提供不同的思路,同样是可行的。除了提到工作中的案例,作者还介绍了他是如何走上数据分析之路,他的工作方法,对数据分析在工作中的应用,面面俱到。同时,作者也展望了,从IT时代到DT时代,银行业从业者该如何去迎接挑战,提出了自己的想法,是否切实可行,那就不是我这个外行人能评述的。
对我来说,感触最深的就是作者提到他自己也在运营一个公众号—萌大叔的数据哲学,因为要写文章,每天除了本职工作外,业务时间用来看书、思考、总结,最后写成文章,作者曾连续三个月每天更新一篇文章,提到这些,我是深有同感,当然我的`产量、质量肯定是不如人家,在做这件事的过程中,感觉就是有一只隐形的手在指引着我,促使我必须不断去思考这段我在工作中有没有新的收获,比如是否使用到新的工具,又或者说对工具中的某些功能的掌握是否更扎实,工作中是否有用到某种分析方法、工作思路又是如何形成的,把前述思考记录下来,一是对自我工作的总结,经验就是从一件件小事中摸索出来的。除了对现有工作的思考、总结外,必须把眼光放得更远,近期或远期有可能会用到的工具,现在是不是可以开始学习,学习的心得体会也可以记录下来,更能加深学习的效果,将来如果要用到,一时想不起来该如何操作,也有备份,这些事情都是当下及之后一段时间可以去做的。
习惯的养成是非常重要的,即使刚开始写的质量不高,但必须坚持下来,不断改进,从量变到质变肯定是有一个过程,而且这也要求自己必须不断去学习,只有不断的输入,才会有更多的输出。读书也是,不必只限于与工作相关的书籍,或者是自己感兴趣的书籍,涉猎不同类型的书,视野才会更开阔,多了解些东西,至少不是件坏事吧。
3.1标准化、规范化
在数据库建设过程应制定和遵循有利于长远发展的标准,主要包括:通信标准(TCP/PI、码标准、标准通信置标语言/可扩展置标语言(SGML/XML、元数据(Met标准、检索语言标准、安全标准等。CALIS在特色数据库子项目建设中采用《我国数字图书馆标准规范研究》项目所推荐的一系列相关标准、元数据标引格式规范、文献著录的有关国际标准和国家标准;各高校在建设特色数据库时有必要参照使用。
3.2共建共享
特色数据库的建设不仅要考虑各部门、各系统和各地区的协调,还应该在全国范围内实现合理布局、合作共建。高校图书馆在特色库建设上像过去在合作共建联合采购外文数据库、集团采购CALIS方面那样,在特色数据库建设中的分工建设、统一共享、统一采购软件等。更深层合作共建应次,实现共享
3.3突出特色
高校图书馆在建设数据库中,要集中有重点地开发某一领域或某一品种的数据库,选题必须是在馆藏基础上充地域特色、学科特色、专题特色,表现出独一无二。
3.4深层次加工原始文献
对于有传统馆藏文献转换而来的数据,要在标引,链接上下功夫,让原生态的文献产生多处知网节,以便用户的检索使用。
3.5完善的检索工具
充分吸收成熟而先进的建库技术和完善的检索技术,能适应脱机、光盘、联机和网络检索,直接获取一次文献。多设置检索点,在检索途径上,应初级检索与含有布尔逻辑算符高级检索并行以充分挖掘数据库资源。
3.6适度宣传
特色数据库要立足用户市场,即发挥知识效益也要发挥经济效益,实现以文养文良性发展的数据库发展的道路,关键是做宣传和促销工作,具体的可以采取.网页广告、培训讲座、主动推介等方式推销自己。
3.7数据要及时更新、长期维护实现可持续发展
领导必须重视、统筹安排,全面部署,有一套专业力量队伍,先立项论证,一旦确立,便持之以恒,对于已建成的一定规模的特色数据库,要保证有可靠的数据资源,有专门的人员续建更新数据,也要专业人员后续维护,以保持数据库的正常运作和数据的不断更新,尽,实现特色库的可持续发展。
上周把黄伟豪写的《数据分析思维:产品经理的成长笔记》一书看完了,虽然讲的是不同领域的数据分析思维,但也算是小有收获。
作者从事的是金融行业,具体来说是在四大行中的一家工作,从技术岗位到产品岗位,跨度较大,书中讲述了作者在工作中遇到的一些数据分析案例,通过数据指导业务发展。其实很多时候并不需要用到很高大上的算法、模型,即使是使用最基础的分析方法,只要能解决问题,提供不同的思路,同样是可行的`。除了提到工作中的案例,作者还介绍了他是如何走上数据分析之路,他的工作方法,对数据分析在工作中的应用,面面俱到。同时,作者也展望了,从IT时代到DT时代,银行业从业者该如何去迎接挑战,提出了自己的想法,是否切实可行,那就不是我这个外行人能评述的。
对我来说,感触最深的就是作者提到他自己也在运营一个公众号—萌大叔的数据哲学,因为要写文章,每天除了本职工作外,业务时间用来看书、思考、总结,最后写成文章,作者曾连续三个月每天更新一篇文章,提到这些,我是深有同感,当然我的产量、质量肯定是不如人家,在做这件事的过程中,感觉就是有一只隐形的手在指引着我,促使我必须不断去思考这段我在工作中有没有新的收获,比如是否使用到新的工具,又或者说对工具中的某些功能的掌握是否更扎实,工作中是否有用到某种分析方法、工作思路又是如何形成的,把前述思考记录下来,一是对自我工作的总结,就是从一件件小事中摸索出来的。除了对现有工作的思考、总结外,必须把眼光放得更远,近期或远期有可能会用到的工具,现在是不是可以开始学习,学习的也可以记录下来,更能加深学习的效果,将来如果要用到,一时想不起来该如何操作,也有备份,这些事情都是当下及之后一段时间可以去做的。
习惯的养成是非常重要的,即使刚开始写的质量不高,但必须坚持下来,不断改进,从量变到质变肯定是有一个过程,而且这也要求自己必须不断去学习,只有不断的输入,才会有更多的输出。读书也是,不必只限于与工作相关的书籍,或者是自己感兴趣的书籍,涉猎不同类型的书,视野才会更开阔,多了解些东西,至少不是件坏事吧。
作业设计是教学的一个重要环节,而课程作业作为课堂学习的延续,既是学生进行独立学习的活动,也是学生学习过程中的重要内容。当下古代文学教学在作业设计上也存在着一定的问题,大体表现在:作业形式单一;作业内容简单化,在问与答中难以调动学生的兴趣;作业评价与反馈效果不明显等,而且这些问题长期以来在教学中都未能引起足够的重视。
在大数据背景下,海量资料、数据挖掘技术、多维检索方式等丰富了古代文学教学中的作业设计。以杜甫为例,传统的古文学教学中,关于“杜甫”的作业设计常常是“杜甫诗歌的‘诗史’性质”;“杜甫诗歌的艺术风格”;“杜甫诗歌的叙事手法”;“杜诗的地位与影响”等等,这些问题的设计都过于概念化,未能体现个性化,也难以激发学生的学习兴趣。而在大数据背景下,有了大量可供利用的信息资料,在揣摩教材与掌握学生学习的实际情况的前提下,可以精心设计多种形式的古代文学作业。就杜甫而言,对于汉语言专业的学生,根据其专业要求,可以借助数据库设计一些较为深入的研究型作业,比如可以布置“通过安史之乱中杜甫的行迹与创作的数据分析,理解杜诗的‘诗史’性质”,以及“通过对古诗词数据库的分析来解构后人对杜甫的评价以及杜甫的影响”等。因为有数据与材料的支撑,这较之简单的对杜诗“诗史”性质的\'平铺直叙,更容易加深学生的认识与理解,而且完成这一作业的本身就是较为有趣的探索过程。古诗词数据库大多都有检索功能,如北京大学李铎教授主持研发的《〈全宋诗〉分析系统》就提供多维的检索分析方式,学生可以借助这些数据库进行检索,搜集后世有关杜诗评价的诗文,然后进行分析归纳,通过数据分析发现问题。对于非汉语言专业的学生还可以联系其专业特点布置作业,比如对于新闻学专业的学生,可以布置“题壁诗与传播”“宋词中的传播方式”“笔记小说中的新闻传播”等;对于文秘专业的学生,可以布置“笔记小说中文秘形象的书写”等;对于广告专业的学生可以布置“古代名人在当下的品牌价值”等。这些作业都需要学生通过搜集大量的信息与资料后进行数据的统计与分析完成,其结论的获得印象也就较为深刻。这较之传统教学模式中的作业布置,其评价效果也较为明显,学生是否理解、掌握了这一问题在作业中会有着清晰的体现。
高校图书馆已全面启动特色数据库建设,在局部、个别馆取得了一定的进展,各高校能从多方面、多角度开发本馆的特色资源,建立形式多样的数据库,但是,据表一和表二统计数据看出存在的问题也比很多,特色不突出、很少把自己的突出的学科特色和地域特色作为建库的重点,70%以上学校自建的特色库还是处于自建自用的状态,不能被外网访问,没有实现资源共享,纸质文献的数字化没有深入加工,数据更新、维护停滞表现出特色库发展并不是沿着可持续发展势头进步,整体上建设还处于初级阶段,没有形成较为完善的建设体系、共享体系和服务体系。
© 2022 xuexicn.net,All Rights Reserved.