《大数据》一书对美国大数据的应用进行了十分详细的介绍与分析,我印象最深的为两点。
第一,以海量数据的处理作为政策制定的依据。看这本书的时候,我想到了这两年很火的一个美国人——斯诺登。在其曝光的“棱镜”计划中美政府直接从包括微软、谷歌、雅虎、Facebook、AOL、Skype以及苹果在内的国际公司服务器收集信息。美国政府从这些海量数据中寻找自己需要的数据,并以此作为所谓安全政策制定的依据之一。姑且不论媒体对此计划的口诛笔伐及相应的道德风险,仅从政策制定方面来说,依据于海量数据的政策制定科学性肯定比一般计划要高得多。
2007年,雅虎 首席执行沃兹博士在《自然》上发表的《21世纪的科学》中提到,得益于计算机技术和海量数据库的发展,我们每个人在现实世界中的活动得到前所未有的记录, 这种记录也更为细致,为社会科学的定量分析提供了极为丰富的数据。打个比方,从你的QQ空间、微博、微信中一个普通朋友都能了解到你在哪儿、做了哪些事 情、现在的状态是什么,而新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为社会行为的研究提供了大量的数据。我想到最近比较火爆的穿戴设备,如果 该技术得到普及过后,拥有穿戴设备的人群的生活轨迹、生理各项指标都能轻而易举地得到,相信这些大量的原始数据如能安全有效利用定能为卫生政策的制定提供 科学依据。
第二,万事万物, 凡存在,皆联网,凡联网,皆计算。2005年起,美国食品与药品管理局开始在药品上推行配备RFID做法即每个食品包装上安装一个薄如纸张或小如豆粒的无 线传感器。通过这个移动传感器,对食品进行连续跟踪,一旦相应的安全事故爆发,就能通过数据库追踪溯源,快速确定传染源与影响范围。这一技术相对于国内尚 在起步阶段的食品追溯具有极强的借鉴性。上面提到的穿戴设备其实就可以视为一个穿戴在人身上的RFID。
2010年的时 候,美国国家气象局在全国2000两客运大巴上装备了传感器,随着大巴的移动,沿途手机所有地点的温度、湿度、露水、光照度等数据,并立即传给国家气象局 数据中心。数据的采集是每10秒中一次,每天采集10万次以上的数据,这些实时的、高精度的数据意味着天气预报将不再仅仅是”预“,将逐渐走向“实”报、 “精”报。
3.1标准化、规范化
在数据库建设过程应制定和遵循有利于长远发展的标准,主要包括:通信标准(TCP/PI、码标准、标准通信置标语言/可扩展置标语言(SGML/XML、元数据(Met标准、检索语言标准、安全标准等。CALIS在特色数据库子项目建设中采用《我国数字图书馆标准规范研究》项目所推荐的一系列相关标准、元数据标引格式规范、文献著录的有关国际标准和国家标准;各高校在建设特色数据库时有必要参照使用。
3.2共建共享
特色数据库的建设不仅要考虑各部门、各系统和各地区的协调,还应该在全国范围内实现合理布局、合作共建。高校图书馆在特色库建设上像过去在合作共建联合采购外文数据库、集团采购CALIS方面那样,在特色数据库建设中的分工建设、统一共享、统一采购软件等。更深层合作共建应次,实现共享
3.3突出特色
高校图书馆在建设数据库中,要集中有重点地开发某一领域或某一品种的数据库,选题必须是在馆藏基础上充地域特色、学科特色、专题特色,表现出独一无二。
3.4深层次加工原始文献
对于有传统馆藏文献转换而来的数据,要在标引,链接上下功夫,让原生态的文献产生多处知网节,以便用户的检索使用。
3.5完善的检索工具
充分吸收成熟而先进的建库技术和完善的检索技术,能适应脱机、光盘、联机和网络检索,直接获取一次文献。多设置检索点,在检索途径上,应初级检索与含有布尔逻辑算符高级检索并行以充分挖掘数据库资源。
3.6适度宣传
特色数据库要立足用户市场,即发挥知识效益也要发挥经济效益,实现以文养文良性发展的数据库发展的道路,关键是做宣传和促销工作,具体的可以采取.网页广告、培训讲座、主动推介等方式推销自己。
3.7数据要及时更新、长期维护实现可持续发展
领导必须重视、统筹安排,全面部署,有一套专业力量队伍,先立项论证,一旦确立,便持之以恒,对于已建成的一定规模的特色数据库,要保证有可靠的数据资源,有专门的人员续建更新数据,也要专业人员后续维护,以保持数据库的正常运作和数据的不断更新,尽,实现特色库的可持续发展。
2.1数据库的学科特色只限于纸本文献的转换,学科、地域特色不够突出
表一显示,被调查特色库48,属于馆藏纸质文献的电子转换、原文献题录的数据库有28个占总数据库的53%,而体现学科特色的仅有15个,占总数的30%,体现地域文化特色和地域经济的只有2个学校建立了地域特色数据库,占学校总数的18%,以建库总数算,体现地域特色的只有5个不到总数的10%,表明,目前数据库的选题还只停留在学位论文、科研成果、学科导航层面,没有把真正体现专业特色、地域特色作为选题的重点。除了齐齐哈尔大学和黑龙江商业大学建立地域经济、文化或抗日的数据库外,其他高校都没有涉猎。
2.2建库的标准化与规范化较差
通过对能够访问的4所高校调查,特色库建设中存在许多不标准、不规范的问题。经访问得知,建库的标准不够规范,高校自选软件,建库过程都是依据软件自身所带的标准建库,对数据采集、数据加工、数据检索、数据传递、数据交换以及数据维护等标准各异,没有采用的国际标准,建立兼容性强、标准高的数据库。在访问这些数据库时,我们遇到很多问题:由于文本格式不规范,数据下载困难或不能下载;由于检索令不规范,同一系统中出现有多个检索命令;由于标引不规范,文献信息检索经常出现误检、漏检现象等。
2.3数据的深层次加工与后续维护力度不够,数据更新慢
以齐齐哈尔大学为例,文献加工方面:该校的“博、硕士学位论文数据库”等只是纸质文献的数字化转换,数据库停留在一次性建设上,没有深入加工和提供增值服务。
数据更新方面:在被调查的11个数据库中,有7个数据库(有1个数据丢失从2007年11月30日到2008年5月30日数据没有更新,占64%。
后续维护维护与可否使用方面:在对该校11个数据库33次调查中,我们发现数据库没有技术维护、读者不能够点击访问的次数各有15次,占抽查次数的45%,音像数据库数据完全丢失,已无法访问。我们对黑龙江省另3个可访问的高校的抽查也得到近乎一样的结果,(另3个高校的访问登陆太慢,没有列出每次调查数据许多高校图书馆数据库搭建后,后续建工作停滞,数据更新停止,数据库的维护工作长期以来处于一种相对滞后和缓慢的状态,很多数据库的数据长期处于不可用或不更换的状态。
2.4检索点设置与检索系统不完善
数据库最大的功用在于检索,以齐齐哈尔大学为例,该校使用TPI检索技术,只提供初级检索和二次检索途径,途径单一,我们发现数据库设置的检索点和数据所做的标引并不一致,比如“野生经济植物图片数据库”,数据标引的“形态分布”在检索点上没有设置,没有设计高级检索功能,有个别的自建数据库就根本没有检索功能。
2.5重建轻用现象普遍、数据库联网使用率低
高校图书馆的特色数据库虽然发展的很快,但调查得知,11所高校图书馆上网率不到36%,而实际联通率还要更低,多数高校进行IP网段封锁,外单位用户应用搜索引擎检索很难查询到高校的自建数据库,即使检索得到,绝大多数数据库也没有权限访问,特色数据库仅供校园网用户内部使用。
2.6共享和市场化理念亟待提高
高校图书馆自建特色数据库,其目的是为不具备本地资源的用户提供研究资料,实现资源共享。这是建立特色库的宗旨所在。而大多数图书馆是重藏轻用或者把资源封闭起来,不是积极宣传自己推销自己,投入偌大的人力物力建起的`数据库,今供少数人使用,是违背建库初衷的,如何像清华大学的CNKI和中国人民大学的复印报刊资料那样,能够被98%的高校利用,走向市场化,是需要一定的促销手段。
1 刘俊英等.现代化进程中的大学图书馆期刊工作研究.图书馆理论与实践,2002,(2:25-27
2 叶继元.入世后我国外刊资源建设的主要问题与对策.图书情报工作,2002,(10:101-105
3 同1
4 欧阳轻娥等.入世后外刊资源建设刍议.情报探索,2002,(3
5 蔡丽萍.外刊工作研究综述.郑州轻工业学院学报(社会科学版),2001,(3:64-66
6 王凌等.论建立全国文献信息资源共建共享机制.河南图书馆学刊,2000,(3:43-45
7 2003年度全国高校图书馆外文期刊订购协调会议纪要.大学图书馆学报,2002,(4:89
8 朱硕峰.国家图书馆在外文文献资源保障体系中的作用.国家图书馆学刊,2002,(3:21-25
9 国家科技部.关于“九五”期间文献资源建设和发展的若干意见
在我国高校人文学科领域中,古代文学课程有着非常重要的作用,它不仅是汉语言文学专业的核心课程,也是其他人文学科诸如国际汉语教育、戏剧与影视文学、文秘、新闻、广告等专业的专业基础课。然而学界当下对于古代文学教学的现状并不满意,对古代文学教学中存在的问题有较为充分的认识和探讨[1-3]。正如戴建业教授《大学中文系古代文学教学现状与反思》所言,“多年来,各大学中文系古代文学教学,主要是通过‘中国文学史’课程完成的,教师较多在课堂上向学生讲授一长串线索,一大堆概念,一大批作家,古代文学中的许多经典名篇,学生却读得不多,也较少求甚解,更不可能去涵泳。这种教法与学法类似于一种‘买椟还珠’的现代版。”[4]尽管现在很多学校汉语言专业分别开设了中国古代文学史和古代文学作品选读等课程,但在具体的讲授中往往仍然是以时间为线索讲背景谈概念,而很少对作品进行解读,更不用谈情感的体验和审美的感受了。对于大多数没有接受过古诗词训练的大学生而言,走马观花式的作品讲解、简单粗略的作家介绍、文学现象的概念式总结,都很难激发学生学习的兴趣。这样的教学模式导致学生为了应付而死记硬背一些概念名词,并不能从实际上真正提高其专业修养和人文素养。
2011年,麦肯锡在《大数据:创新、竞争和生产力的下一个新领域》的研究报告中,正式提出了“大数据”一词。随后,这一话题不仅成了计算机行业内的热门话题,也引起了各行各业的广泛热议。对“大数据”这一概念,人们从不同的角度提出了不同的理解,人们普遍认为大数据即海量数据、巨量资料。更有学者认为,“大数据超越了海量数据的含义,它描述的是随着数据量和数据类型激增而逐渐衍生出来的一种现象,不仅包括大规模、多样化的数据集,还包括对这种数据集进行高速采集、处理与分析以提取价值的技术架构与技术过程。”[5]从数据的角度看,大数据的特征被概括为4V,即数据量大(Volume、数据类型多(Variety、价值稀疏性(Value、速度快(Velocity。基于以上特点,大数据在社会生活中的应用越来越广泛,在教育部颁发的《教育信息化十年发展规划(2011—2020》的指导下,我国高校也越来越重视信息化教学。在这一背景下,古代文学教学中相关问题,如作家作品的分析、文学发展历程、作业的设计等,也可以从多个方面做适当调整,以期进一步提高教学质量。
© 2022 xuexicn.net,All Rights Reserved.