《大数据》一书对美国大数据的应用进行了十分详细的介绍与分析,我印象最深的为两点。
第一,以海量数据的处理作为政策制定的依据。看这本书的时候,我想到了这两年很火的一个美国人——斯诺登。在其曝光的“棱镜”计划中美政府直接从包括微软、谷歌、雅虎、Facebook、AOL、Skype以及苹果在内的国际公司服务器收集信息。美国政府从这些海量数据中寻找自己需要的数据,并以此作为所谓安全政策制定的依据之一。姑且不论媒体对此计划的口诛笔伐及相应的道德风险,仅从政策制定方面来说,依据于海量数据的政策制定科学性肯定比一般计划要高得多。
2007年,雅虎 首席执行沃兹博士在《自然》上发表的《21世纪的科学》中提到,得益于计算机技术和海量数据库的发展,我们每个人在现实世界中的活动得到前所未有的记录, 这种记录也更为细致,为社会科学的定量分析提供了极为丰富的数据。打个比方,从你的QQ空间、微博、微信中一个普通朋友都能了解到你在哪儿、做了哪些事 情、现在的状态是什么,而新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为社会行为的研究提供了大量的数据。我想到最近比较火爆的穿戴设备,如果 该技术得到普及过后,拥有穿戴设备的人群的生活轨迹、生理各项指标都能轻而易举地得到,相信这些大量的原始数据如能安全有效利用定能为卫生政策的制定提供 科学依据。
第二,万事万物, 凡存在,皆联网,凡联网,皆计算。2005年起,美国食品与药品管理局开始在药品上推行配备RFID做法即每个食品包装上安装一个薄如纸张或小如豆粒的无 线传感器。通过这个移动传感器,对食品进行连续跟踪,一旦相应的安全事故爆发,就能通过数据库追踪溯源,快速确定传染源与影响范围。这一技术相对于国内尚 在起步阶段的食品追溯具有极强的借鉴性。上面提到的穿戴设备其实就可以视为一个穿戴在人身上的RFID。
2010年的时 候,美国国家气象局在全国2000两客运大巴上装备了传感器,随着大巴的移动,沿途手机所有地点的温度、湿度、露水、光照度等数据,并立即传给国家气象局 数据中心。数据的采集是每10秒中一次,每天采集10万次以上的数据,这些实时的、高精度的数据意味着天气预报将不再仅仅是”预“,将逐渐走向“实”报、 “精”报。
2.1数据库的学科特色只限于纸本文献的转换,学科、地域特色不够突出
表一显示,被调查特色库48,属于馆藏纸质文献的电子转换、原文献题录的数据库有28个占总数据库的53%,而体现学科特色的仅有15个,占总数的30%,体现地域文化特色和地域经济的只有2个学校建立了地域特色数据库,占学校总数的18%,以建库总数算,体现地域特色的只有5个不到总数的10%,表明,目前数据库的选题还只停留在学位论文、科研成果、学科导航层面,没有把真正体现专业特色、地域特色作为选题的重点。除了齐齐哈尔大学和黑龙江商业大学建立地域经济、文化或抗日的数据库外,其他高校都没有涉猎。
2.2建库的标准化与规范化较差
通过对能够访问的4所高校调查,特色库建设中存在许多不标准、不规范的问题。经访问得知,建库的标准不够规范,高校自选软件,建库过程都是依据软件自身所带的标准建库,对数据采集、数据加工、数据检索、数据传递、数据交换以及数据维护等标准各异,没有采用的国际标准,建立兼容性强、标准高的数据库。在访问这些数据库时,我们遇到很多问题:由于文本格式不规范,数据下载困难或不能下载;由于检索令不规范,同一系统中出现有多个检索命令;由于标引不规范,文献信息检索经常出现误检、漏检现象等。
2.3数据的深层次加工与后续维护力度不够,数据更新慢
以齐齐哈尔大学为例,文献加工方面:该校的“博、硕士学位论文数据库”等只是纸质文献的数字化转换,数据库停留在一次性建设上,没有深入加工和提供增值服务。
数据更新方面:在被调查的11个数据库中,有7个数据库(有1个数据丢失从2007年11月30日到2008年5月30日数据没有更新,占64%。
后续维护维护与可否使用方面:在对该校11个数据库33次调查中,我们发现数据库没有技术维护、读者不能够点击访问的次数各有15次,占抽查次数的45%,音像数据库数据完全丢失,已无法访问。我们对黑龙江省另3个可访问的高校的抽查也得到近乎一样的结果,(另3个高校的访问登陆太慢,没有列出每次调查数据许多高校图书馆数据库搭建后,后续建工作停滞,数据更新停止,数据库的维护工作长期以来处于一种相对滞后和缓慢的状态,很多数据库的数据长期处于不可用或不更换的状态。
2.4检索点设置与检索系统不完善
数据库最大的功用在于检索,以齐齐哈尔大学为例,该校使用TPI检索技术,只提供初级检索和二次检索途径,途径单一,我们发现数据库设置的检索点和数据所做的标引并不一致,比如“野生经济植物图片数据库”,数据标引的“形态分布”在检索点上没有设置,没有设计高级检索功能,有个别的自建数据库就根本没有检索功能。
2.5重建轻用现象普遍、数据库联网使用率低
高校图书馆的特色数据库虽然发展的很快,但调查得知,11所高校图书馆上网率不到36%,而实际联通率还要更低,多数高校进行IP网段封锁,外单位用户应用搜索引擎检索很难查询到高校的自建数据库,即使检索得到,绝大多数数据库也没有权限访问,特色数据库仅供校园网用户内部使用。
2.6共享和市场化理念亟待提高
高校图书馆自建特色数据库,其目的是为不具备本地资源的用户提供研究资料,实现资源共享。这是建立特色库的宗旨所在。而大多数图书馆是重藏轻用或者把资源封闭起来,不是积极宣传自己推销自己,投入偌大的人力物力建起的`数据库,今供少数人使用,是违背建库初衷的,如何像清华大学的CNKI和中国人民大学的复印报刊资料那样,能够被98%的高校利用,走向市场化,是需要一定的促销手段。
上周把黄伟豪写的《数据分析思维:产品经理的成长笔记》一书看完了,虽然讲的是不同领域的数据分析思维,但也算是小有收获。
作者从事的是金融行业,具体来说是在四大行中的一家工作,从技术岗位到产品岗位,跨度较大,书中讲述了作者在工作中遇到的一些数据分析案例,通过数据指导业务发展。其实很多时候并不需要用到很高大上的算法、模型,即使是使用最基础的分析方法,只要能解决问题,提供不同的思路,同样是可行的。除了提到工作中的案例,作者还介绍了他是如何走上数据分析之路,他的工作方法,对数据分析在工作中的应用,面面俱到。同时,作者也展望了,从IT时代到DT时代,银行业从业者该如何去迎接挑战,提出了自己的想法,是否切实可行,那就不是我这个外行人能评述的。
对我来说,感触最深的就是作者提到他自己也在运营一个公众号—萌大叔的数据哲学,因为要写文章,每天除了本职工作外,业务时间用来看书、思考、总结,最后写成文章,作者曾连续三个月每天更新一篇文章,提到这些,我是深有同感,当然我的`产量、质量肯定是不如人家,在做这件事的过程中,感觉就是有一只隐形的手在指引着我,促使我必须不断去思考这段我在工作中有没有新的收获,比如是否使用到新的工具,又或者说对工具中的某些功能的掌握是否更扎实,工作中是否有用到某种分析方法、工作思路又是如何形成的,把前述思考记录下来,一是对自我工作的总结,经验就是从一件件小事中摸索出来的。除了对现有工作的思考、总结外,必须把眼光放得更远,近期或远期有可能会用到的工具,现在是不是可以开始学习,学习的心得体会也可以记录下来,更能加深学习的效果,将来如果要用到,一时想不起来该如何操作,也有备份,这些事情都是当下及之后一段时间可以去做的。
习惯的养成是非常重要的,即使刚开始写的质量不高,但必须坚持下来,不断改进,从量变到质变肯定是有一个过程,而且这也要求自己必须不断去学习,只有不断的输入,才会有更多的输出。读书也是,不必只限于与工作相关的书籍,或者是自己感兴趣的书籍,涉猎不同类型的书,视野才会更开阔,多了解些东西,至少不是件坏事吧。
上周把黄伟豪写的《数据分析思维:产品经理的成长笔记》一书看完了,虽然讲的是不同领域的数据分析思维,但也算是小有收获。
作者从事的是金融行业,具体来说是在四大行中的一家工作,从技术岗位到产品岗位,跨度较大,书中讲述了作者在工作中遇到的一些数据分析案例,通过数据指导业务发展。其实很多时候并不需要用到很高大上的算法、模型,即使是使用最基础的分析方法,只要能解决问题,提供不同的思路,同样是可行的`。除了提到工作中的案例,作者还介绍了他是如何走上数据分析之路,他的工作方法,对数据分析在工作中的应用,面面俱到。同时,作者也展望了,从IT时代到DT时代,银行业从业者该如何去迎接挑战,提出了自己的想法,是否切实可行,那就不是我这个外行人能评述的。
对我来说,感触最深的就是作者提到他自己也在运营一个公众号—萌大叔的数据哲学,因为要写文章,每天除了本职工作外,业务时间用来看书、思考、总结,最后写成文章,作者曾连续三个月每天更新一篇文章,提到这些,我是深有同感,当然我的产量、质量肯定是不如人家,在做这件事的过程中,感觉就是有一只隐形的手在指引着我,促使我必须不断去思考这段我在工作中有没有新的收获,比如是否使用到新的工具,又或者说对工具中的某些功能的掌握是否更扎实,工作中是否有用到某种分析方法、工作思路又是如何形成的,把前述思考记录下来,一是对自我工作的总结,就是从一件件小事中摸索出来的。除了对现有工作的思考、总结外,必须把眼光放得更远,近期或远期有可能会用到的工具,现在是不是可以开始学习,学习的也可以记录下来,更能加深学习的效果,将来如果要用到,一时想不起来该如何操作,也有备份,这些事情都是当下及之后一段时间可以去做的。
习惯的养成是非常重要的,即使刚开始写的质量不高,但必须坚持下来,不断改进,从量变到质变肯定是有一个过程,而且这也要求自己必须不断去学习,只有不断的输入,才会有更多的输出。读书也是,不必只限于与工作相关的书籍,或者是自己感兴趣的书籍,涉猎不同类型的书,视野才会更开阔,多了解些东西,至少不是件坏事吧。
人对人的看法是不同的,谁对谁公正、大方,他批评、惩罚谁的时候谁都会觉得受到的惩罚是应该的,绝无怨言。
但是过分的偏向与过分的嘲讽会给自己的名誉带来极坏的影响,过分的偏向会使一个学习好、性格傲慢的人,给变成谁提谁烦的一个人。但是嘲讽别人是对别人极大的辱没,但是没有了辱没,世界就会没有成功的动力。为什么这么说呢?因为辱没对于一个有志气的人来说:“辱没就是一个向成功推动的一种力量”。就拿国家该国总理***来说,周总理在少年时就目睹了中国耻辱的一幕。就拿那些说着英、法、德、日语的洋鬼子来说,他们从x片战争之后;外国侵略者就欺负我们中国人,周总理少年时就看到了那些说着英语的外国人欺负我们中国人,从那以后周总理就立志说:“为中华民族之崛起而读书”。周总理在受耻辱的旧社会一直到新中国成立,不都有他的功劳吗?所以我们要在耻辱面前鼓起勇气,在成功面前要虚心。如果面对耻辱低下头的话你会慢慢下落直到自暴自弃,如果在成功面前你显的不谦虚、看不起任何人的话,你就像那爬梯子的人没人帮助,自己爬多高梯子坏了就把自己摔多惨。
那些在清末时傲慢无礼的说着盈盈的英国人和美国人到现在比我们强多少哇?那英、美二国不是正符合了周总理对说英语的美国人说的:“中国人低头走路,是走上坡路。美国人抬着头走路,是走下坡路。所以就偶是因为这些外国人不敢小瞧咱们中国人,外国人眼中旁若无人、骄傲自大,而中国人眼中,可以看到旁若无人的老师教出来的学生是骄傲自大的。而被目中无人的老师辱没的学生是虚心的。骄傲自大的学生不管学习有多好,但是她始终都会走下坡路,而虚心好学的学生始终不会走下坡路,所以目中无人的老师背后就有人议论,而他最看不起的学生往往都会有人支持、鼓励他超过他信任的学生。
因为骄傲、辱没、自大始终是负面的,所以有人在背后骂他、咒他。而虚心的人背后会有人支持他、鼓励他。因为这两种态度就会不同的看法,现实中不仅偶是这样么?
© 2022 xuexicn.net,All Rights Reserved.