数据类有关学术论文怎么写 和重建津梁:数据商眼中的程焕文之问方面大学毕业论文范文

本论文为您写数据毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

重建津梁:数据商眼中的程焕文之问

受 访 者:4家数据商的主管和工作人员

访 谈 者:肖鹏,中山大学资讯管理学院博士生

录音整校:赵芷琪,中山大学资讯管理学院本科生

题记 截至目前,在“‘程焕文之问’专题研讨”专栏中,我们听到的主要是来自图书馆界的声音,以及少数法科学者的解读,作为一个专业社群的反思和联合,已然具有重要的意义.但实际上这只是硬币的一面,我们还需要了解硬币的另一面——倾听数据商的声音.

从2015年10月底到2016年3月初,针对“程焕文之问”,笔者在不同场合对4家数据商的主管和工作人员进行了访谈.出于种种原因,本文呈现的只能是访谈内容中很少的一部分.本文的受访者来自不同的国家和地区,所在公司的数据库产品要么已进入中国大陆市场,要么本身就是本土产品,各公司的规模、资源量级、产品受众范围均有所不同.需要说明的是,为了保护受访者的匿名权,本文虽然采用一问一答的形式,但就其内容而言,实际上是把4家数据商受访者的相关言论“融为一炉”,将相同提问的回答整合而成.如果这种处理方式导致某些回答出现逻辑上的矛盾或错误,笔者承担相应的责任.

最后谈点个人感受.在进行第一次访谈前,笔者多少有些忐忑,毕竟准备的每一个问题似乎都潜藏着味,当时凛冬将至,说不定一个哆嗦就会点燃桶.幸运的是,在所有的访谈中,双方既不至于剑拔弩张,也没有太过谨小慎微,大家都抱着解决问题的态度来思考和讨论.从这个角度看,《图书馆论坛》开设“‘程焕文之问’专题研讨”专栏,其意义绝不在于断裂和拆散,而是重新审视图书馆与数据商之间的合作关系,重建津梁.肖 鹏

〇问:请问数据商对“程焕文之问”中十个问题的整体看法如何?

◎答:这些提问很有意义.但需要说明的是,可能程馆长最初写的是博客,所以对数据商的说法比较笼统.实际上,所谓的“数据商”包含很多种,比如Elsevier、Springer更多属于一线的出版商,一般称为Primary Publisher;EBSCO、ProQuest等则是Aggregator(集成商),或许可称为二次出版社(Secondary Publisher).不同的数据商在不同的位置,其提供的服务不同,虽然都有数据库,但定价等情况不太一样;而且国内外的出版商和集成商的情况差别很大,不同公司的定位和策略也有所不同.如果那样“统而论之”,就比较“暧昧”.

〇问:就您的经验看,一般而言,出版商和集成商对数据库的定价依据是什么?这种定价依据在国内外是否有所不同?

◎答:我们这里主要谈的是高校图书馆.在国外,出版商和集成商早期定价的主要依据是校内的学生人数,有些还会把教职员工加进去.中国大陆高校的人数比国外多很多,北京大学、中山大学的人数比国外同类型、同级别的大学更多.在这种情况下,无论是中国大陆图书馆还是出版商和集成商,都认为纯粹用人数来确定售价不是那么合理,因此,其中的一部分就会根据不同高校的需求和情况来制定不同的售价.比如,对985高校、211高校、一本高校、二本高校的售价都有所不同,进行弹性调整.

不过,这种定价模式大概在五六年前开始有所变化,有一些出版商把使用率也作为一个重要因素纳入费用考虑之中.为什么会这样?原因是多方面的.比如,七八年前,一些高校对数据商提出,如果使用率不高,应该降价.他们会说:我们的利用情况不好,续订时就不应该涨那么多嘛.这句话其实衍生了另外一个问题:如果用得不好要向下调整,那用得好是否也可以向上调整呢?

我们应该注意到,数据库每年逐步调整,是有不同原因的.一般纸本刊每年均有涨价,涨幅从个位数至两位数都有;而过往几年,数据库每年的涨幅约5%-7%.其实“程焕文之问”不认同的是那些不合理的涨价模式.

〇问:很多数据内容或出版物由于版权限制,可以说是独一无二、不可替代的,一些学者提出这里头可能涉及垄断问题.

◎答:就每家出版商所出版的期刊而言,确实是独一无二的.但说到垄断,这要看如何定义垄断,比如垄断常常和不透明联系在一起.很多出版商至少有五六十年的历史,甚至还有更久远的.一直以来单本期刊的定价都是公开的,即便在今天,在互联网上仍然可以查到这些期刊的参考,无论是电子版还是纸质版.有些期刊的亚洲版和全球版的不一样,但大多数期刊没有分所谓的中国版、亚洲版、美洲版.从这个层面来讲,期刊的是透明的,本身并没有垄断的意思.为什么会觉得是垄断?关键可能是图书馆觉得一些出版商或集成商把或涨幅提得太高了.

〇问:单本期刊和数据库的整体销售情形可能不太一样.那么,您如何看待同一个数据库在发展中国家与发达国家之间的定价差异?在不同国家和地区,这些不同的又是如何确定的?

◎答:出版商和集成商提高数据库的,要看他们把拉高的原因是什么.从出版商和集成商角度来说,主要有两个因素.第一个因素,很多出版商和集成商是在2002年中国大陆加入WTO之后进来的,那时候的确是降价进入中国大陆市场,后来拉高的原因之一是2002年时的确实非常低.第二个因素,刚进入中国大陆市场时,部分出版商和集成商的数据库在中国大陆的使用率占全球的比例不到十分之一,但近年则上升到四分之一、三分之一.

在全球化差价问题上,现在很少有出版商和集成商给中国大陆所谓的发展中国家.10多年前,的确会有许多出版商和集成商给中国大陆的几乎是半价或是更低的发展中国家.从2002年到2014年,中国大陆的使用率逐渐上升,已经和以前不一样了,因此,出版商和集成商就慢慢拿掉中国大陆所谓的发展中国家优惠条款.

年度涨幅只要在合理区间,还是可以的.什么叫合理区间?可以参考Library Journal每年4月发布的主要学科平均刊价报告.近年数据库的年均涨幅是5%-7%,这应该是可以接受的.某些数据库如果超出这个涨幅,其实有其他考虑,应该看看他们的说法是什么,如果说法不合理,可以坐下来讨论.有句残酷或是比较不中听的话是:商家不能强卖,买家不能强买.希望双方可以找到一个彼此都能接受的范围.

〇问:现在的提议其实陷入了两难的境地.我们看到,在一些案例里,图书馆与数据商都很难接受对方的提议和.

◎答:这要看具体的情况.

第一,看涨幅.研究者可以查询2002年前后出版商进入中国大陆时的定价,以及现在的定价,然后计算刊价的年均涨幅,看是不是5%-7%,也就是上面提到的合理区间.如果年均涨幅处于合理区间,应该可以接受.不过,这一方面的跟踪研究比较少,图书馆的老师如果有兴趣从事这方面的研究,倒是可以鼓励的.

第二,看绝对值.图书馆界跨国跨地区的交流比较多,应该知道大多数出版商和集成商的组团.中国大陆高校可以拿出版商和集成商给自己的与日本、韩国、东南亚、美国、欧洲、澳大利亚、新西兰等国家和地区进行比较,看看不同地区的售价是不是接近.

七八年前XX出版商涨价,与中国台湾地区的高校谈判.该出版商在中国台湾和美国加州两个区域的订单数量差不多,学生情况也类似,于是中国台湾高校的代表拿美国加州高校的相关数据来对比,进行陈诉和说明.最后该出版商有所妥协,涨幅降了些,电子刊与纸本刊捆绑的比例略微向下调整.这一案例说明,如果能拿出正当的理由,大家都是可以谈的.

〇问:“程焕文之问”里有一个很关键的提问,那就是“凭什么在购全文数据库时,数据商要强行捆绑纸质期刊”?

◎答:在这个问题上,图书馆的挑战对象可能是出版商,因为外国集成商在中国大陆的份额比较低,而且也没有所谓的捆绑纸本刊的要求.但是,从出版商的角度来讲,捆绑有捆绑的原因.我个人的理解如下:出版商为什么要捆绑纸本刊?是因为在早期(1995年以前)图书馆订购的是纸本刊,而从纸本刊转向电子刊有一个过程.现在纸本刊基本完成向电子刊的转型,但还是有少许出版商(低于10%)继续捆绑销售纸本刊.大概从2003年、2004年开始,随着条件逐渐成熟,纸电分离(即电子刊与纸本刊分开销售)的比例逐年攀升.在分开销售这个点上,我们常用的案例是:当时有几家大中型出版商开始降价,在购买电子刊时,可以不买纸本刊,而且电子刊比纸本刊便宜,也就带动其他出版商采取类似措施.其实这是一个鼓励用户从纸本刊转向电子刊的措施.

有些出版商还在继续捆绑销售,可能是因为他们在纸转电的过程当中付出的成本相当高,没有办法让图书馆用相同的或更低的来购买这些产品.在互联网时代,很多只有单刊或几种期刊的出版商相继关闭了,如Far Eastern Economic Review,出版商需要找到能够长期生存的方式.捆绑纸本刊对图书馆来讲是很不好的,但也要理解出版商在互联网时代从纸本刊转型为电子刊的非常痛苦的过程,有些出版商不得不捆绑销售.不过,基本趋势是纸电分离.

〇问:我们换一个角度来讨论这个问题.比如,您是如何看待中国大陆的集团采购,如DRAA这种高校数字图书馆联盟的?

◎答:每个国家和地区都在做类务.比如,英国有不同地区的联合采购集团,而与中国大陆市场较为临近的则有中国香港的JULAC、中国台湾的CONCERT、韩国的KESLI等.这种联盟像Buying Club,中心馆议价,成员馆享受优惠价.这种联盟和集团带给出版商和集成商的最大效果是降低成本.举例来说,如果出版商和集成商给DRAA成员的定价是八千美金、一万美金,假若没有DRAA,那么定价很可能是三万、五万,产生这种差异的原因是出版商和集成商付出的招标、行政、人事、交通等成本不同.出版商和集成商对这种联盟和集团乐观其成,虽然会损失点,但整体来讲能达成共赢局面.

〇问:图书馆对数据商还有一个很大的质疑,那就是现在数字资源都是在线获取,并没有保存在本地.2015年9月23日中国国家科技图书文献中心(NSTL)邀请中国国家图书馆、中国科学院文献情报中心、中国科学技术信息研究所、北京大学图书馆、清华大学图书馆等近60个文献信息机构集体签署《数字文献资源长期保存共同声明》,明确宣示图书馆拥有对所采购的数字文献资源进行本土长期保存的权利;为保障这些资源的长期保存,图书馆拥有对所采购数字文献资源的合理的存档权、处理权和服务权.您如何看待这件事情?

◎答A:我们听说了这件事情,没有什么立场去评论.从国家战略来讲,这种事情该做的还是要做.关键在于不同的出版商如何看待此事,或者说他们准备怎么去界定和保护自己的权益.每个卖方跟图书馆签的协议应该都有些不一样,因此要具体看每个卖方与图书馆签订的采购协议及其规定.比如,在元数据方面,在有些图书馆跟卖方签的协议里,会说到我可以用你提供的元数据做本地保存或是二次利用.

◎答B:在这件事情上,出版商和集成商会由于版权权限的不同而有很大的不同,就英美相关集团或公司的情况而言,可能出版商的话语权更强一些.我们不清楚内情.我个人感觉这个声明更多是针对英美出版商.其实在不违反版权法律法规的情况下,很多出版商是愿意积极配合的.

〇问:刚刚谈到出版商的元数据往往会由于版权限制,不能再在产业链条上向下传递.但这些年不少数据商也提出了元数据开放项目和计划,这是否和前面的说法有些矛盾?在开放和开源问题上,对数据商而言,开源系统究竟意味着什么?从一个更高层面,即图书馆资源配置角度来讲,这个问题其实与我们今天访谈的主题息息相关.

◎答:你讲的元数据开放计划是另外一个类型的业务.一般数据商的这些计划,是针对与我们有合作关系的系统厂商的馆藏系统,帮助自动化厂商做整合与最佳呈现,而不是直接面向图书馆用户,不太一样.就开源系统而言,传统上图书馆采购集成管理平台的和维护成本高昂,尤其是国外的国际化系统.其实现在大部分大学生使用谷歌或百度,他们很少进入图书馆,再去看系统的入口或主页.所以国外一些图书馆正在考量:到底要不要再投那么多钱在系统上,或者说该不该把这笔钱转而投在服务和产品方面?开源系统的好处是很低,如果图书馆在开源系统上的投入比较少,就可以把更多资金转投到资源建设上,因此,一些数据商支持开源系统的发展.

〇问:那么,关于开放存取呢?这或许是对数据商冲击最大的模式.

◎答:如果说开源系统是针对现有的集成系统生态,那么开放存取就是针对资源,但这个“资源”所包含的对象可能比大部分人想象的要宽泛.在本质上,用户免费使用的互联网视频和应用其实也是开放存取,而不是仅仅限于学术领域.虽然arXiv之类的学术开放网站历史比较悠久,在物理学等小圈子已经形成了稳定的用户习惯,但在更多的学科,开放存取还是这两年的事情.目前不同国家和地区、不同出版商和不同学术群体对开放存取的意见并不一致——不是说开放不一致,而是对“如何开放”不一致.对图书馆而言,开放存取一方面会降低采购成本,另一方面则必须考虑学术科研发表、机构库维护、重新获取和组织信息的费用,整体而言学校层面的“学术开销”未必会因开放存取而降低.不管如何,从目前的情况看,数据商仍将在开放存取中占有一席之地.当前很多数据商开始进行深入标引、改进出版流程等,以迎合开放存取趋势,关注新形势下的用户需求.

〇问:我们刚才谈到用户需求问题.“程焕文之问”的最后一问是数据商不向图书馆提供详细的用户使用报告,这是否阻碍了图书馆了解用户的情况呢?

◎答A:我认为程馆长的意思是出版商和集成商要帮助图书馆更好地了解读者需求,而不是给一个简单的COUNTER-compliant报告(标准统计使用报告).也许程馆长觉得目前给的统计报告太粗糙,他希望看到更精细的报告,以了解用户要什么,帮助用户学习或了解某些主题的发展趋势和动态.

◎答B:有些国外的高校图书馆会透过某些认证系统(如OpenAthen、ezproxy),要求用户使用资源时要登录相应的账号、填写个人资料,一方面这会涉及这个用户是有权限的用户,不会;另一方面是希望能够给图书馆更完整与详细的使用统计报告.有一些数据商已经在关注这个问题,正在研发数据挖掘之类的服务和工具,未来一段时间这个可能会成为市场的焦点.

今天谈的很多东西,包括前面聊的定价问题、后面谈的开源和资源配置问题,其实对我们来说,数据商与图书馆之间需要彼此理解、互相帮助;双方并非站在对立面,而应是共生局面,甚至是Gong Ho (共好)局面.图书馆服务做得越好,获得的用户评价越高,数据商也才可以长期经营下去.

数据论文范文结:

关于对不知道怎么写数据论文范文课题研究的大学硕士、相关本科毕业论文数据论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

1、关于大数据的论文

2、毕业论文数据怎么找

3、大数据杂志

4、论文数据

5、有关大数据的论文

6、数据挖掘论文