2.1数据库的学科特色只限于纸本文献的转换,学科、地域特色不够突出
表一显示,被调查特色库48,属于馆藏纸质文献的电子转换、原文献题录的数据库有28个占总数据库的53%,而体现学科特色的仅有15个,占总数的30%,体现地域文化特色和地域经济的只有2个学校建立了地域特色数据库,占学校总数的18%,以建库总数算,体现地域特色的只有5个不到总数的10%,表明,目前数据库的选题还只停留在学位论文、科研成果、学科导航层面,没有把真正体现专业特色、地域特色作为选题的重点。除了齐齐哈尔大学和黑龙江商业大学建立地域经济、文化或抗日的数据库外,其他高校都没有涉猎。
2.2建库的标准化与规范化较差
通过对能够访问的4所高校调查,特色库建设中存在许多不标准、不规范的问题。经访问得知,建库的标准不够规范,高校自选软件,建库过程都是依据软件自身所带的标准建库,对数据采集、数据加工、数据检索、数据传递、数据交换以及数据维护等标准各异,没有采用的国际标准,建立兼容性强、标准高的数据库。在访问这些数据库时,我们遇到很多问题:由于文本格式不规范,数据下载困难或不能下载;由于检索令不规范,同一系统中出现有多个检索命令;由于标引不规范,文献信息检索经常出现误检、漏检现象等。
2.3数据的深层次加工与后续维护力度不够,数据更新慢
以齐齐哈尔大学为例,文献加工方面:该校的“博、硕士学位论文数据库”等只是纸质文献的数字化转换,数据库停留在一次性建设上,没有深入加工和提供增值服务。
数据更新方面:在被调查的11个数据库中,有7个数据库(有1个数据丢失从2007年11月30日到2008年5月30日数据没有更新,占64%。
后续维护维护与可否使用方面:在对该校11个数据库33次调查中,我们发现数据库没有技术维护、读者不能够点击访问的次数各有15次,占抽查次数的45%,音像数据库数据完全丢失,已无法访问。我们对黑龙江省另3个可访问的高校的抽查也得到近乎一样的结果,(另3个高校的访问登陆太慢,没有列出每次调查数据许多高校图书馆数据库搭建后,后续建工作停滞,数据更新停止,数据库的维护工作长期以来处于一种相对滞后和缓慢的状态,很多数据库的数据长期处于不可用或不更换的状态。
2.4检索点设置与检索系统不完善
数据库最大的功用在于检索,以齐齐哈尔大学为例,该校使用TPI检索技术,只提供初级检索和二次检索途径,途径单一,我们发现数据库设置的检索点和数据所做的标引并不一致,比如“野生经济植物图片数据库”,数据标引的“形态分布”在检索点上没有设置,没有设计高级检索功能,有个别的自建数据库就根本没有检索功能。
2.5重建轻用现象普遍、数据库联网使用率低
高校图书馆的特色数据库虽然发展的很快,但调查得知,11所高校图书馆上网率不到36%,而实际联通率还要更低,多数高校进行IP网段封锁,外单位用户应用搜索引擎检索很难查询到高校的自建数据库,即使检索得到,绝大多数数据库也没有权限访问,特色数据库仅供校园网用户内部使用。
2.6共享和市场化理念亟待提高
高校图书馆自建特色数据库,其目的是为不具备本地资源的用户提供研究资料,实现资源共享。这是建立特色库的宗旨所在。而大多数图书馆是重藏轻用或者把资源封闭起来,不是积极宣传自己推销自己,投入偌大的人力物力建起的`数据库,今供少数人使用,是违背建库初衷的,如何像清华大学的CNKI和中国人民大学的复印报刊资料那样,能够被98%的高校利用,走向市场化,是需要一定的促销手段。
[1]赵琳.大数据背景下如何加强企业财务管理工作探究[J].经管空间,2017(04:73-74.
[2]莆天银.大数据背景下财务管理工作探讨[J].同仁学院学报,2017(09:68-69.
[3]邱楚惠.大数据背景下企业财务管理的挑战与变革[J].财会学习,2016:23-24.
在我国高校人文学科领域中,古代文学课程有着非常重要的作用,它不仅是汉语言文学专业的核心课程,也是其他人文学科诸如国际汉语教育、戏剧与影视文学、文秘、新闻、广告等专业的专业基础课。然而学界当下对于古代文学教学的现状并不满意,对古代文学教学中存在的问题有较为充分的认识和探讨[1-3]。正如戴建业教授《大学中文系古代文学教学现状与反思》所言,“多年来,各大学中文系古代文学教学,主要是通过‘中国文学史’课程完成的,教师较多在课堂上向学生讲授一长串线索,一大堆概念,一大批作家,古代文学中的许多经典名篇,学生却读得不多,也较少求甚解,更不可能去涵泳。这种教法与学法类似于一种‘买椟还珠’的现代版。”[4]尽管现在很多学校汉语言专业分别开设了中国古代文学史和古代文学作品选读等课程,但在具体的讲授中往往仍然是以时间为线索讲背景谈概念,而很少对作品进行解读,更不用谈情感的体验和审美的感受了。对于大多数没有接受过古诗词训练的大学生而言,走马观花式的作品讲解、简单粗略的作家介绍、文学现象的概念式总结,都很难激发学生学习的兴趣。这样的教学模式导致学生为了应付而死记硬背一些概念名词,并不能从实际上真正提高其专业修养和人文素养。
2011年,麦肯锡在《大数据:创新、竞争和生产力的下一个新领域》的研究报告中,正式提出了“大数据”一词。随后,这一话题不仅成了计算机行业内的热门话题,也引起了各行各业的广泛热议。对“大数据”这一概念,人们从不同的角度提出了不同的理解,人们普遍认为大数据即海量数据、巨量资料。更有学者认为,“大数据超越了海量数据的含义,它描述的是随着数据量和数据类型激增而逐渐衍生出来的一种现象,不仅包括大规模、多样化的数据集,还包括对这种数据集进行高速采集、处理与分析以提取价值的技术架构与技术过程。”[5]从数据的角度看,大数据的特征被概括为4V,即数据量大(Volume、数据类型多(Variety、价值稀疏性(Value、速度快(Velocity。基于以上特点,大数据在社会生活中的应用越来越广泛,在教育部颁发的《教育信息化十年发展规划(2011—2020》的指导下,我国高校也越来越重视信息化教学。在这一背景下,古代文学教学中相关问题,如作家作品的分析、文学发展历程、作业的设计等,也可以从多个方面做适当调整,以期进一步提高教学质量。
“一代有一代之文学”[6]的观念自明代就得到了许多学者的认同,从文体的演变来看文学的发展是中国古代文学教学中经常用到的方法。楚***、汉赋、唐诗、宋诗,通过对文体序列的排位来总结文学发展概况,这就容易给学生一个错误的引导,提及汉代,只重视赋;论及唐代,只谈诗歌。对于学生而言,这样的教学其实不利于他们对文学发展有一个全面的认识,反而容易进入一个狭隘的学习视野。文学的发展有时间的跨度,文体的完备也需要一定的时间,今天我们回顾古代文学的发展,虽然具备了对文学体裁进行总结的条件,然而在教学中一味强调“一代有一代之文学”,并在教学实践中遵循前人“只重视唐诗、宋词、元曲讲解”的做法,不利于学生真正全面认识文学的发展。以宋代文学为例,一直以来宋词作为宋代的代表性文体得到了学界的广泛重视,在教学中也一直是教学的重点,长期以来这似乎已经是一种共识。然而在大数据环境下,随着越来越多的古代文学作品数据库的建立,对宋代文学的发展似乎也应有一个新的判断。“古今文章,至我宋集大成矣。”[7]“宋之文超汉轶唐,粹然为一王法。”[8]宋人对宋文的发展不仅有着较为自觉的理论认识,而且是颇为骄傲与自豪的。客观讲,宋文所取得的成就并不逊于宋词,但长期以来,在宋代文学的教学中,宋文往往是在古文运动中简单讲述,学生也很难对此有深入的认识。就当下对宋文的整理来看,已经出版的《全宋文》计360册,收录近万人的17万余篇作品。虽不能以量的多少来讨论文学成就的高下,但如此丰富的文学遗产显然是今人所不能忽视的。而且随着全宋文数据库的编制,为我们全面认识宋文提供了极大的便利。借助数据库的搜索引擎,在教学中可以更好地展示宋文的发展及其所形成的文学特色、所取得的文学成就。如此一来,就不至于给学生留下宋代文学仅仅是宋词成就斐然的刻板印象了。明清文学更是如此,长期以来在教学中重小说轻诗文的现象非常严重;随着古籍的整理以及当下众多古诗词数据库的研发,明清诗文也逐渐引起人们越来越多的关注,因此在本科教学中也应有所体现。
众多的古诗词数据库提供了较为全面的经典古诗词和古诗文,并且这些数据库大多提供检索分析,具有一定的智能化特点。文学内容的演变是文学发展的具体表现,文学作品也是文人对特定时代社会生活的审美反映,同一题材在不同时期所反映的不同主题就很好地呈现了文学的发展。借助于众多古典文学数据库,对不同时代同类题材的文学作品进行分析得以轻松实现。文学发展中文学形式的演进、继承与革新等相关话题借助于当下的古籍数据库都有了新的教学思路,通过数据分析进行相关知识的讲解,更利于学生的理解与接受。
不过有意外收获,作者在文章后部主要讲了,大数据带来的消极影响,例如政府会通过大数据判断一个人将要出现的违法行为,提前对他进行拘捕,或者监视(这个已经在纽约警察局使用)但这样带来严重的后果,现在的法律是基于人已经发生的行为进行处罚,如果我们今后使用这套系统来作为法官的判决依据的话,这样就违背降低我们作为人的重要组成部分---自由选择的能力,行为责任自负。这便成了集体选择的结果,不是个人自由意志了。这样在否认个人为其行为承担责任,实际上就是在摧毁人们自由选择的权利。而且现在的预测不能达到很准确的答案。分析的数据质量不佳就会加剧问题的不良后果。
作者最后说了这么一段话“大数据不是一个充斥算法和冰冷机器的世界,人类的作用依然无法替代,大数据为我们提供的不是最终答案们只是一个参考答案,暂时的,只是问了等待更害的解决办法,在不久的未来。”
另外一个随之而来的问题就是数据授权使用,泄露问题,数据会有二次利用发现潜在价值,但这又产生更严重的问题,二次利用如何授权管理,是否涉及违法。解决办法是通过会计行业,可以有一个充当审计工作的外部算法师,作为第三方公证机构在出现问题时,可以进行审核算法和数据的使用情况,在公司内部也可以设立内部算法师,很类似公司自己的律师一样,一方面参加产品研发,另一方面在公司使用数据出现问题时也可以及时阻止,提醒。
大数据确实在某种程度上可以降低风险,保护国家安全,但信用卡,保险业就会通过大数据分析拒绝一部分人(因为他们还不起账),但我们想想,人类进步,就是通过反抗,妥协,权衡,再平衡。有了一切大数据的`预测,就少了很多的可能性,在某种程度会降低我们的社会进步。
说实话之前听到大数据的概念觉得很有前景,很神奇,很向往,这本书给我带来的更多的是对大数据会给我们带来不亚于克隆人的糟糕影响。让我有了对技术给人类社会带来的负面影响有了一个全面的思考认识。读到后半部分的时候,我很沮丧啊,觉得这么好的技术,竟然负面影响超过了正面的,我很失落,也不再看好大数据。不过后来作者的一席话让我重振信心,他举例,曾经印刷术出现之前大部分的书全部在修道院,教皇手里,有了印刷术之后人们有了书,有了更开阔的思路,更多的想法,有了言论等等,这个的影响力要比大数据大很多,人类还是一步一步建立起来相应的制度,法律,直到今天我们已经有了对应的很完善稳定的法律体系。
我们还是应该对科技充满信心,科技依然是那个推动社会进步的原动力,只是我们需要及时完善相对应的管理措施。
最后说说对作者写的书的评价吧,其实我觉得写的一般,不过很符合外国人的写书风格,简单明了,很容易看懂,理解都不需动脑子,举例很少(可能因为本身合适的例子就很少吧)来来回回就那几个例子,有点像我们高考,来来回回那几个例子,什么场景都能用,哈哈。总的来说还是不错的,评级6分吧。
最后说一句,美国确实在大数据上走在了前面,不是单纯技术上,技术科技学的很快,但是实际运用起来出现的问题,不是其他人能立即学会处理应对的,这又燃起了让我去美帝的***。
传统的古代文学教学模式在讲授具体作家时,对其生平事迹往往按照时间顺序进行串讲,何年中举、何年入仕、何年升降,以及这一时期的文学思想与诗文创作等,这种平直的简介往往不能给学生留下深刻印象。关于作品的讲解,由于课堂时间有限,教师不能对作品做详细的解读,只能走马观花粗略鉴赏;学生大体疏通文意,虽了诗文字面的含义,但常常是不求甚解,至于诗境、文心,因为缺乏对诗文创作背景、时代环境等的了解,难以有情感的体验,没有情感的浸润,也就难以有审美的体验。王兆鹏教授《唐宋文学编年系地信息平台》的建设,为古代文学教学中有关作家作品的讲解提供了一个新的思路。
王兆鹏教授与搜韵诗词共同打造的《唐宋文学编年系地信息平台》,通过将现有的唐宋作家作品编年信息录入数据库进行数字化处理后,与当代、历史地图进行整合,利用GIS技术开发了以地图为平台的信息系统。进入平台后,随意点击地图中的某一地名,就可以看到唐宋哪些文人曾在此停留并留下了哪些篇章;从平台的诗人列表中点击某一诗人的名字,其一生行迹路线图清晰可见。路线图和文字说明相结合,更便于人们直观地了解一个文人的生平轨迹和具体创作。这一信息平台很好地实现了时空维度的交融,而这正是我们在教学中经常忽视的问题。
以苏轼为例,按照现有古代文学史的教材来讲解,大多是先讲苏轼的生平、人生观、创作道路、创作思想,然后以分体的形式讲解其文、诗、词创作等。这样就把作家、作品一分为二地进行讲解,学生所接收的信息是颇为概念化的。由于模糊了时空的问题,给学生的印象就是苏轼其人很旷达、苏轼诗文风格豪迈,而忽视了苏轼文学创作中兼收并蓄的特点。鉴于大数据的丰富资料,在讲解苏轼时我们不妨换个思路,将其人生轨迹与文学创作历程同时进行考察。首先,借助于北宋行政区划图大致拟定其人生轨迹,嘉祐元年(1056年三月苏轼兄弟随父亲离家赶赴汴京参加进士考试,及第同年即丁忧家居。到嘉祐四年(1059年十月,父子三人再度赴京,三人一路唱和编成《南行集》,这是现存苏轼中最早的一批作品,可以看作是他诗歌创作的起点。其次,从嘉祐六年(1061年至嘉祐八年(1063年,以组诗《凤翔八观》为代表的古体诗,关心国事、反映民生疾苦,艺术上也渐趋成熟。熙宁四年(1071年苏轼到达杭州,任通判(知州的助理官,杭州的秀丽山水给诗人带来了极大的创作热情,苏轼描写西湖的诗作已经成为家喻户晓的名句。从苏轼词集来看,他也是从这一时期才开始填词的。再次,熙宁七年(1074年至熙宁九年(1076年,任密州知州,这一时期词的创作有重大发展,初步形成了豪放词风,代表作有《江城子密州出猎》《水调歌头明月几时有》……。在时空的交汇中梳理苏轼的文学创作,黄州、惠州、儋州时期的创作高峰,在京为官时的创作低潮,都清晰地展现了其诗文创作的动态变化。而通过这一变化,更利于学生深入认识、体会苏轼文学风格的特点及形成过程,这较之单纯地讲解、总结,学生的学习热情和学习效果肯定会有所提升。在大数据背景下,借助众多数据和新媒体,这一教学方式得以轻松实现。
胡适说中国人习惯于当“差不多先生”,凡是马马虎虎、不求精确。黄仁宇认为,中国不懂得用数字来管理国家。作者引用这两位先生的名 言,当然是要彰显传统中国和今天美国之间的差异。但是我们也必须认识到:这两位先生身经当时中国的混乱,激愤而出此言。在大数据浪潮迅猛而来的时候,中国 与100年前已经完全不一样了,我们已经有足够的能力与自信来面对各项挑战。2003年中国开始着手制定医疗系统的最小数据集,3年之后卫生部出台了第一 版中国医院最小数据集的标准。也是在2003年,中国创立了第一个全国性的大型社会调查项目,开始对社会的发展和变迁进行全方位、综合性、纵贯性的问卷访 谈调查,即“杨文昊在KOD里面穿的裤子”。可以看到,中国政府和企业已经投入到了大数据时代的浪潮之中了。我个人也有几点应对的想法。
一是鼓励、扶持基 于数据的创新创业。书中提到,政策扶持的传统方法,可能是以政府主导建立大数据产业园,对新兴企业提供办公场所等便利条件或者现金支持,这固然有效,但更 为有效的是调动全社会的力量。调动全社会的力量来支持可以包括扶植民间团体,快速推进新技术、新理念在全社会的传播。现在云技术大众基本上都耳熟能详了, 而这主要是各大互联网服务上都相继推出了相应的云服务以及各大媒体对这项技术的关注,促进了大众对新技术的了解与支持。
二是政府机构要建 立专门机构来统筹管理数据工作。在大数据时代不同的数据需要整合,公安、消防、民政、社保等等数据都需要进行联动,将沉睡在数据库内的数据唤醒,为政府制 定政策所用,避免各自为政、多头管理的情况发生。数据的联通也能在一定程度上减少群众的“办证”问题,相信在大数据时代,大家可能只需要一张身份卡就能满 足绝大部分的数据需要。
三是围绕个人数据安全,加强管理。任何技术都是双刃剑,耍得好可以披荆斩棘,耍得不好则会害人伤己,大数据也不列外。如何保障个人隐私也成为了大数据时代面临的一个重大挑战。
上周把黄伟豪写的《数据分析思维:产品经理的成长笔记》一书看完了,虽然讲的是不同领域的数据分析思维,但也算是小有收获。
作者从事的是金融行业,具体来说是在四大行中的一家工作,从技术岗位到产品岗位,跨度较大,书中讲述了作者在工作中遇到的一些数据分析案例,通过数据指导业务发展。其实很多时候并不需要用到很高大上的算法、模型,即使是使用最基础的分析方法,只要能解决问题,提供不同的思路,同样是可行的`。除了提到工作中的案例,作者还介绍了他是如何走上数据分析之路,他的工作方法,对数据分析在工作中的应用,面面俱到。同时,作者也展望了,从IT时代到DT时代,银行业从业者该如何去迎接挑战,提出了自己的想法,是否切实可行,那就不是我这个外行人能评述的。
对我来说,感触最深的就是作者提到他自己也在运营一个公众号—萌大叔的数据哲学,因为要写文章,每天除了本职工作外,业务时间用来看书、思考、总结,最后写成文章,作者曾连续三个月每天更新一篇文章,提到这些,我是深有同感,当然我的产量、质量肯定是不如人家,在做这件事的过程中,感觉就是有一只隐形的手在指引着我,促使我必须不断去思考这段我在工作中有没有新的收获,比如是否使用到新的工具,又或者说对工具中的某些功能的掌握是否更扎实,工作中是否有用到某种分析方法、工作思路又是如何形成的,把前述思考记录下来,一是对自我工作的总结,就是从一件件小事中摸索出来的。除了对现有工作的思考、总结外,必须把眼光放得更远,近期或远期有可能会用到的工具,现在是不是可以开始学习,学习的也可以记录下来,更能加深学习的效果,将来如果要用到,一时想不起来该如何操作,也有备份,这些事情都是当下及之后一段时间可以去做的。
习惯的养成是非常重要的,即使刚开始写的质量不高,但必须坚持下来,不断改进,从量变到质变肯定是有一个过程,而且这也要求自己必须不断去学习,只有不断的输入,才会有更多的输出。读书也是,不必只限于与工作相关的书籍,或者是自己感兴趣的书籍,涉猎不同类型的书,视野才会更开阔,多了解些东西,至少不是件坏事吧。
© 2022 xuexicn.net,All Rights Reserved.