关于大数据时代相关毕业论文提纲范文 和大数据时代的信息管理:为了一个更好的世界第六届变化世界中的信息管理国际会综述有关论文范文集

本文关于大数据时代论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

大数据时代的信息管理:为了一个更好的世界第六届变化世界中的信息管理国际会综述

早在1 980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》中明确提出“数据就是财富”的观点,并赞誉大数据为第三次浪潮的华彩乐章.201 2年5月,联合国发布《大数据促发展:挑战与机遇》白皮书,指出大数据对全世界是一个历史性的机遇,可以利用大数据造福人类.在过去三年里,大数据在商业、科技、政府等各个领域都引起高度关注,大数据带来的深刻影响和巨大价值逐渐被认识,它通过技术的创新与发展,以及数据的全面感知、收集、分析、共享,为我们提供了一种全新的看待世界的方法,大数据带来的信息风暴正在全方位地改变着我们的生活、工作和思维.

第六届“变化世界中的信息管理国际研讨会” (Information Management in a ChangingWorld,IMCW)于201 5年1 1月25—26日在中山大学康乐园举行,会议由中山大学与土耳其哈斯特帕大学联合主办,全国图书情报专业学位研究生教育指导委员会协办.IMCW曾经在土耳其、爱尔兰成功举办.会议吸引了来自中国、土耳其、美国、日本、斯洛文尼亚和卡塔尔的多位信息专家、数据管理专家、图书馆专业人士、档案专业人士、计算机与信息科学家,以及学术数据库商与工程师等.开幕式由中山大学资讯管理学院院长助理韦景竹和土耳其哈斯特帕大学Serap Kurbanoglu教授主持,中山大学副校长李善民出席开幕式并致欢迎辞,简要介绍了此次会议的主题:土耳其哈斯特帕大学Bulent Yilmaz教授和YaSar Tonta教授、武汉大学马费成教授分别致辞,Bulent Yilmaz教授介绍了大数据的概念、规则和技术,认为我们应该做好准备迎接大数据社会的到来;YaSar Tonta教授提到大数据在过去两年中带来的全球性影响,既是一个很大的机遇,也是一个很大的挑战:马费成教授认为我们已经进入崭新的信息管理时代,数据研究的收集、组织和整理等方面有很多值得探索的问题.此次研讨会的主题是“大数据时代的信息管理:为了一个更好的世界”,各位专家学者围绕大数据环境下的信息管理,讨论大数据带来的变革和机遇,探讨信息素养和LIS教育,研究大数据相关的法律和政策,寻找大数据环境下各种科学评价方法的选择和应用,探索各类型信息资源的管理,研究用户行为以及数据挖掘、处理、组织和检索的创新方式等重大问题.会议设置了主会场和分会场,其中两大主题报告、七个邀请报告在主会场进行,其余21个讨论报告分别在两个分会场进行.

1 大数据时代的机遇和变革——起点

面对大数据带来的变化,国内外图书情报学界已展开了诸多研究,大数据研究方法体系逐渐形成,积极探索各领域内的数据感知、收集、分析、共享成为共同关注的焦点.

中山大学甘春梅博士利用文献计量法绘制我国有关大数据研究论文的整体结构,采用共词分析法分析各研究主题间的关系,得出383篇CSSCI论文的发表情况及研究进展符合增长模式的模拟指数,29个高频关键词其频率服从幂律分布,10个集群代表我国大数据研究的10个主题,研究主题相对分散表明我国关于大数据的研究发展水平较为不平衡的结论.

同方知网柯春晓社长从传统情报研究方法体系、大数据带来的研究环境变化、情报研究方法的变化和应对策略四方面出发,着重介绍情报研究方法的变化:一是课题选择从主动选题和被动选题到无计划式选题:二是情报搜集的方式发生巨大变化:三是传统的信息整序理论已融入计算机程序中,通过计算机完成整序工作:四是大数据环境下的科学抽象须借助云计算、嵌入抽象方法的大数据平台,以及借助方法的综合应用:五是可视化、动态化和工具化成为情报研究成果表达的新形式:六是通过研究过程的科学记录来评价研究贡献将成为新的评价方法.

在本次研讨会中,有三位学者的报告分别展示了博物馆、文化学和出版业界为应对大数据时代的挑战和机遇进行的深度分析和变革.

日本筑波大学Eiji Mizushima教授用大量的图片展示了国家历史遗址、文化遗产的数字化问题,介绍了历史文化遗产的内涵和面临的危机.现场播放被地震损坏的日本弘道馆记碑相关视频,引发与会者思考历史遗产保护问题.针对历史遗产保护问题,他介绍了日本正致力的几项工作,日本已建立博物馆Darwin Core元数据,日本博物馆的标本信息数据正是以Darwin Core元数据为标准,纳入国家自然博物馆信息管理系统进行管理.他也指出,日本仍有50%的博物馆并未建立标本分类目录,国际上还有众多文化遗产亟待整理和管理.

华中师范大学刘凯博士从文化组学的角度分析大数据,文化组学即文化和基因组相结合,利用数学方法分析海量文本数据,从而分析人类文化的发展和演变.他以社会主义核心价值观的文化基因组分析为对象,在《人民日报》语料库和台湾政治刊物语料库的基础上,利用爬虫和分词技术分析,构建一个多维度的模型分析核心价值观的分布地区和时间,并通过可视化图形展示了分析结果.

中南大学刘灿娇教授介绍了大数据时代数字资源建设的新要求,她以湖南省七个出版社为研究样本,指出数字资源建设存在技术基础薄弱、架构不合理:财政投入极度不足和资源分配不均;资源利用效率低下,效益不足;资源管理机制不健全,第三方评价机构缺失等问题,并建议:提高资本和人才投入水平,巩固建设基础:深化资源聚集和优化资源结构:开阔推广渠道和提高效率;优化管理机制和寻求可持续发展.她强调优化管理机制和寻求可持续发展之路,最重要的是提高数字资源评估系统的质量和建立独立的数字资源评估系统.

2信息素养和LIS教育——基石

信息素养是全球信息化背景下需要掌握的重要技能,对LIS专业学生而言,信息素养更是必备的能力素质.如何通过终身学习和信息素养课程改革提高学生信息素养和技能成为与会专家重点关注的问题.

土耳其哈斯特帕大学Serap Kurbanoglu教授探索了不同国家LIS学生信息素养能力的相似性及差异性,并从LIS课程价值的角度来解决问题.她在2012-2013年通过网络搜集包括18个国家(以欧洲国家为主)、21名研究人员、上千位参与者的数据进行调查.其结果虽因依赖于学生的认知和自我陈述而存在一定的局限性,但仍对LIS教师教学理念、教学方法、教学内容产生一系列影响,未来她还将对更多国家(如亚洲各国)学生信息素养能力进行比较研究.

教育部“长江学者”、武汉大学研究生院院长陈传夫教授针对LIS教育面临的挑战作了主题报告.他通过对国内外LIS领域研究与实践成果的梳理,指出LIS教育面临互联网服务、计算机社会化服务、谷歌图书馆、政府信息公开、大数据应用、公共政策、商业数字图书馆、外包市场、大学发展战略等外部挑战,并对国内LIS教育面临的24个主要挑战进行二维和多维综合分析,总结出LIS教育面临学科内外和机构内外两方面的挑战.他认为,LIS教育专家已关注内部因素的挑战,未来应更多地关注学科和专业机构外的挑战:要注重培养学生跨学科能力和领导技能,并将新兴技术应用到LIS教育中.在变革与创新LIS学科和教育体系时,需提高LIS毕业生的就业竞争力:通过创造更多的项目吸引更多的社会资本支持,进而扩大LIS教育的社会影响力.

在分会场,来自土耳其阿德南·曼德列斯大学的Faydaligul博士回顾了信息素养教育在护理学院的重要性和实践情况,指出信息素养教育可作为每学期的学分制课程:不断发展的“护理信息素养能力标准”可形成一个信息素养教育项目:信息素养课程培训可能由图书馆通过交互式远程教育进行,或独特的Y-代社会化网络来开展.中山大学何靖怡同学从数据素养产生的背景出发,阐述了数据素养能力模型的定义.她通过对中国、美国、英国等国家数据素养模型的数据生命周期、模型的可用情况和构建方法以及模型的有效性进行比较分析,得出了数据素养能力要求越全面,越需要更好的与之相适应的数据素养教育的结论,并提出加强数据管理与数据素养教育的建议.

信息素养及图书情报学教育内涵不断丰富和扩展,国内外对其重要性形成普遍的共识.在充分调查不同地区、不同学科的学生信息素养相似性与差异性基础上,开展有针对性地、细化的、创新的信息素养教育课程,尤为有益.3大数据相关的法律和政策——保障

科学技术日新月异,数据密集型科学兴起,知识或智力资源的占有、配置、生产和运用已成为经济发展的重要依托,知识产权在经济发展中凸显其重要地位.在主会场,受邀专家美国南佛罗里达大学John N.Gathegi教授介绍了商业秘密法律,属于知识产权的一个分支,虽然能够防止未经授权的访问,保护商业机密,但数据挖掘尚未被定义为非法访问,那么在大数据挖掘中,传统商业秘密法律能否保护知识产权呢?他从梳理竞争情报和商业秘密的内涵和外延等相关问题入手,介绍了传统的保护商业秘密的方法和大数据挖掘产生后的整合商业秘密,从工业中一般不被知道的信息和知识、保护商业秘密的程度、获取和复制相同信息是容易还是困难三个角度,分析了常规商业秘密和整合商业秘密的异同,最后,他还提出通过信息公开以推动创新,例如制定严格的商业机密法和员工流动法.

在分会场,土耳其哈斯特帕大学OrCunMadran教授介绍了利用知识共享许可制度来解决共享和复用大数据问题.知识共享即通过法律工具共享和利用创新知识:知识共享许可制度是给公众提供一套简单、标准化的方式共享和利用知识创新,可让学者轻松地从“保留所有权利”的默认值更改至“保留部分权力”,它是不可替代的版权.他还将知识共享许可设计为合法代码、人可读和机器可读三个层次,并举例演示不同类型的许可证以及如何使用工具设置生成许可制度.

4信息计量与评价——导向

量化为特征的评价体系和模型构建充分显示了大数据时代从不同表现形式的数据中挖掘有价值信息的特征,也为完善科学研究、信息分析和用户服务提供客观规范和导向.

土耳其哈斯特帕大学YaSar Tonta教授从科学研究的常用评价方法引出对研究质量的评价,通常对研究人员科研业绩的评估主要是通过同行评议、永久教职和学术表现、研究基金几个方面考量.他分析了JCR是评价学术期刊的指标体系,而非对单篇论文的评价;H指数是用于评价研究人员学术水平的方法但仅适用于部分学科,在物理等学科中具有局限性.他认为专家评价是一种可行的方法:量化指标可以用来佐证和支持同行评议,但不能替代同行评议:定量指标应规范化使用.

南京大学闵超同学从科学领域的“睡美人”现象出发,提出随着学术出版物的大量产生,如何识别“睡美人”成为科学评价的重要话题.他基于Eugene Garfield提出的通过被引用历史识别迟滞承认论文的方法,总结了平均法、百分位法、图像法三种量化指标的方法,指出理想的指标应克服任意阈值参数、仅考虑部分引文曲线和限制某些类型的引用模式三个缺陷,提出利用关联规则分析、社交网络分析和统计方法等大数据挖掘技术寻找这类论文.

华中师范大学王伟军教授认为在线商品的用户评价对后续买家的购买意向和决定有重要影响,然而在线评论与评分之间存在较大偏差,于是从评价介入理论的话语策略和话语标记的类型两个角度出发,构建了用户评价词库并赋值,并选取各类型商品500余条用户评论作为样本进行实证分析,验证了用户评价评分体系的科学性,未来他还将在样本量的扩充、话语标记词库的拓展以及话语评价的全自动化处理等方面深入研究.

中山大学李海涛副教授借鉴顾客满意度模型、技术接受模型、任务技术适配模型中的观测变量,在用户调查基础上获取影响感知质量的相关因素,然后通过专家访谈、探索性因子分析方法,选取感知质量相关的关键因素,将政府门户网站公众满意度结构模型中的结构变量转换为可以测量的观测变量,最后根据理论修正形成政府门户网站公众满意度测评模型,为改进政府门户网站建设提供参考.

5各类型信息资源管理——探索

伴随着科学出版物和科研数据开放存取的发展,以及科学研究第四范式的兴起,网络上出现了成千上万的科学数据仓储,为科研创造开放和简单共享的环境,进而促进开放存取议程.日本鹤见大学Nagatsuka Takashi教授梳理了日本2012-2015年发布的有关科研数据的政策和指导方针,旨在提高公共资金资助研究的效用:介绍了日本学术研究图书馆的科研数据管理(RDM)服务,现已有445个学术机构构建了机构库,超出高校机构库数量的一半.日本已有研究机构和学术研究图书馆作为参与实验项目的共同成员,对科研数据进行DOI注册,图书馆和学术图书馆员正在也应该在科研数据管理中扮演重要的角色.

鹤见大学另一位教授Hiroyuki Tsunoda根据SCI划分出十个学科领域,从日本机构知识库在线(JAIRO)和中国的个人知识库检索系统中分别提取出高被引论文进行对比分析,得出结论:收录高被引论文的机构库中,日本有36个,中国6个:最多的两种文献类型是相似的,都是期刊论文和公告:从全文率看,中国机构库的全文率高于日本机构库.他指出机构库在未来的发展中应重视质量和数量的提高,以促进科学知识大数据共享.

在高校数据管理方面,土耳其安卡拉大学Zeynep Akdogan探讨了高校电子记录管理系统的制度化过程:从正式的通信系统、业务交易、国家或国际标准,法律法规及用户期望出发,构建电子档案管理系统(ERMS),整合一个值得信赖的、可互操作的、可获取的、可靠的电子系统进行正式沟通和业务交流:介绍了根据EMRS结构创建的安卡拉大学“电子记录管理与归档系统模型”(E-BEYAS)应用典范,为高校数据管理提供借鉴.

大规模的数据整理,充分利用巨大的信息资源,无法绕开的研究主题是知识专利研究.在分会场,湘潭大学知识产权学院的两名学生代表肖冬梅教授介绍了中国专利信息资源现状,提出专利信息资源系统的结构可分为国家基本专利数据库和其他相关数据库:特定技术领域的分布式专利数据库:企业产品或生产线专利数据库三层,并提出构建中国专利信息资源体系的建议,应涵盖专利信息的披露系统、专利信息的市场竞争系统以及专利信息产权安排和许可系统.中山大学韦景竹老师对1985-2015年汽车行业的专利数据进行分析,从这些专利数据的时间分布、国别分布、品牌分布、技术生命周期以及在热门领域的技术应用等各个方面进行数量比较,全面分析专利持有者的竞争优势.

中山大学王志红同学围绕在线百科全书被中国LIS期刊引用的频率、最常被谁引用、来自哪些机构的引用、为什么引用以及不同作者和不同文章的引用是否存在显著差异的问题,对LIS学科出版物进行抽样和分析,得出在线百科全书正在发展成为中文LIS期刊中被普遍使用和认可的学术信息资源的结论,在介绍不熟悉的学科领域和流行文化的背景时,由于其便利和公开获取使其成为一种不错的资源选择.

6用户行为——突破

从用户角度出发,信息行为研究随着大数据的发展呈现新的研究范式,基于用户行为的数据挖掘正在逐步突破传统的信息行为研究的难题,深入对动机研究、行为预测以及建模,是日后用户行为研究的重要发展方向.

北京大学张鹏翼副教授关注消费者在产品信息搜寻中的行为特征,她将用户行为分为浏览、登录、个人资料管理、系统、交易、列表处理、检索及其他类型,分析结果显示用户在信息搜寻行为的点击序列次数、时间维度、检索的复杂度呈现不同的特征,基于研究所构建的模型,可以在产品推荐中进行优化.未来可以向基于产品类别的会话特征分析、产品搜索的多任务研究、基于会话特征以及人口统计学特征数据的客户细分、移动电子商务的产品搜索等方面发展.

南开大学李月琳教授从人机交互的角度提出如何识别用户与数字图书馆交互的成功关键因素(Cs)的问题,她借鉴Rockart在1979年提出的关键成功因素模型框架,采用实验嵌入半结构化深度访谈的方法,得出41个用户与数字图书馆交互的影响因素,并最终确定10个关键成功因素,1 5个核心关键因素.她认为未来对于用户与数字图书馆交互研究应结合多种调查方法,采集更多的实验数据,对行为数据进行深度挖掘和分析.

在分会场,华中师范大学程秀峰博士采用语义关联模型构建数字图书馆的用户行为特征库,他选择的用户行为特征以及相应测量的指标,包括用户身份特征、用户时空分布、用户点击及请求、用户兴趣及偏好(浏览及请求)、用户习惯、用户数据流,并自下而上分为数据层、特征层、数据及特征整合层三个层次构建了用户行为特征库,他认为未来数字图书馆呈现聚合化、平行化以及数据海量化的特征,这就要求计算模型能够支持大规模计算来减少误差.

7信息组织与知识发现一应变

信息组织是大数据时代信息管理中最重要的环节,且大数据时代海量数据的聚集和非结构化等特征对信息组织和知识发现方面的挑战和难度越来越凸显.因此,信息组织和知识发现是本次会议的重要议题,在分会场有六个报告与该主题相关.

华中师范大学王忠义副教授从现有分析方法在基于特征的观点挖掘中的局限性出发,发现特定领域知识是基于特征的观点挖掘的关键,以此为基础提出了基于ISO主题图标准的观点挖掘方法,并通过实验对该方法进行了比较和评估.他认为利用主题图谱辅助基于特征的观点挖掘可以解决目前存在的一些问题,但主题图谱的自动构建问题仍亟待研究.

华中师范大学翟姗姗博士以美国农业部n经济研究服务门户为研究对象,使用社会网络分析方法分别构建主题目录链接网络和主题目录语义网络,并对链接网络、内容网络和链接内容整合网络三种方案进行对比分析,发现同时考虑链接和内容,即语义链接网络的实验效果最好,并认为利用关键词索引系统优化主题目录将是未来研究的方向.

土耳其哈斯特帕大学Ozgur Kulcu博士通过收集和对比分析国际和土耳其的案例,如欧盟数字图书馆和土耳其国家档案馆等,发现土耳其的案例数据集是从面向对象的角度,只有对资源或过程的详细描述,且信息与其他资源和机构库之间没有任何逻辑层次关系.因此,他提出数据集既要满足国际标准与平台的期望,也要呈现本地需求和特殊性,最后他针对土耳其数字资源提出一个元数据模型.

斯洛文尼亚卢布尔雅那大学Tomaz Bartol、Karmen Stopar和马里博尔大学Gordana Budimir首先利用COBISS和SciMet门户网站获得了1996年到2014年被Scopus和WOS数据库中收录的斯洛文尼亚研究人员所著的文献作为数据集,共分为六个学科领域,并对数据集及生物技术学科领域数据的作者合作关系进行了可视化分析,从中发现了斯洛文尼亚研究者合作的一种未知模式.

华中师范大学张婷婷同学利用基于统计的关键词抽取方法,以IT-IWF、位置统计分布和词距三个特征变量构建模型,爬取180个链接的网页信息开展实验,并与人工标注关键词方法进行对比验证算法的有效性.实验结果表明对于中文短文本的关键词抽取,只使用TF-IWF方法的精确度高达70%:在实际应用中关键词数量为5是较为合适的:从算法效率上看每秒50—70的请求时算法具有较好的稳定性.实验还发现,除TF-IWF之外,结构信息特征如位置分布和词距并不适用:所提算法也完全能满足个性化推荐的实时需求.

中山大学马翠嫦同学利用体裁分析方法和两轮用户调查,构建开放获取资源聚合单元分类体系并检验了其有效性,分析了不同信息搜寻任务下各层级和各类聚合单元感知有用性的差异.她指出信息搜寻任务与构成单元、功能单元的相关性,使得不同体裁的构成单元或功能单元显现出相关性,并认为聚合单元的可识别性和与用户信息搜寻任务之间的相关性可以用于不同互联网体裁类型资源的细粒度聚合检索系统的设计,以及与特定信息搜寻任务相关的聚合单元集表明这一任务中的聚合单元之间存在语义相关性.

通过该主题一系列的报告,发现构建符合国际化和本地化特色的信息组织标准是大数据时代的重要课题,如何更好地构建语义层面的关系,利用各种自然语言处理技术和数据挖掘算法等深入挖掘海量数据中隐藏的知识,并以可视化方式进行呈现是需要进一步探索和研究的方向.

8结语

本次研讨会在土耳其哈斯特帕大学YaSarTonta教授和中山大学曹树金教授的总结发言和美好祝愿中圆满结束,会议提供了一个重要的交流平台,土耳其哈斯特帕大学、安卡拉大学、阿德南·曼德列斯大学,美国南佛罗里达大学、威尔康奈尔医学院卡塔尔分校,日本筑波大学、鹤见大学,斯洛文尼亚卢布尔雅那大学、马里博尔大学,中国北京大学、武汉大学、南京大学、南开大学、华中师范大学、中南大学、中山大学等高校的专家学者,以及同方知网的工程师等商业人士广泛参与和深入讨论,促进了对当前变化世界特别是大数据环境的认识,加深了在大数据环境下信息管理问题的思考和理解,增进了同仁之间的友谊,开辟了合作渠道.研讨会将对今后面临的大数据基础设施构建,相关的政策、法律问题,以及组织、挖掘和分析海量数据的创新方式提供良好借鉴,为应对大数据带来的机遇和挑战产生积极的解决方案,为推动信息素养、数据素养以及LIS教育朝着可持续方向发展产生深远影响,同时对国际图书情报相关专业的交流和合作向更长久稳定的目标发展发挥重要的推动作用.作者简介张璇,女,中山大学资讯管理学院2014级在

读博士生,中山大学图书馆助理馆员;王志红,女,中山大学资讯管理学院2014级硕博连读生;刘盈盈,女,中山大学资讯管理学院2012级在读博士生,暨南大学图书馆馆员;王灵,女,中山大学资讯管理学院2015级在读博士生,吉首大学图书馆馆员;古婷骅,女,中山大学资讯管理学院2013级在读博士生;王维佳,女,中山大学资讯管理学院2012级在读博士生,中山大学图书馆馆员;刘慧云,女,中山大学资讯管理学院2015级在读硕士生.

收稿日期2016-08-29

(责任编辑:刘洪)

大数据时代论文范文结:

关于本文可作为相关专业大数据时代论文写作研究的大学硕士与本科毕业论文大数据时代论文开题报告范文和职称论文参考文献资料。

1、大数据时代论文

2、关于大数据的论文

3、大数据杂志

4、有关大数据的论文

5、健康大视野杂志

6、毕业论文题目大全集