小城镇建设类本科毕业论文范文 与基于聚类分析法的黑龙江省国有林区小城镇建设评价类论文范文文献

本文关于小城镇建设论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

基于聚类分析法的黑龙江省国有林区小城镇建设评价

关凤丽, 顾凤岐

(东北林业大学,哈尔滨, 150040)

摘 要:根据收集到的黑龙江省40个国有林业局(样品集)2008-2012的各指标数据,选取比较主要的14个指标作为考察特征,应用系统聚类法对黑龙江省40个国有林业局小城镇建设情况进行了分类;并确认,分四类为最优聚类方案.根据聚类结果,提出对目前国有林区小城镇建设现状给出针对性评价.

关键词:系统聚类法;国有林区;小城镇建设;分类

收稿日期:2015-01-16

第一作者简介:关凤丽(1991 -),女, 人,硕士研究生.

通讯作者简介:顾凤岐(1963-),男,教授,研究方向:生物数学 .

1.国有林区小城镇建设概况

黑龙江国有重点林区总经营面积为1009.8 万hm2,林地面积857万hm2;活立木总蓄积8.33亿m3;森林覆盖率85%;黑龙江国有林区现有40个林业局、627个林场,和17个林产工业、4个林机修造企业以及公检法司、科研院所、文教卫生、森林调查、建筑施工等处级以上企事业单位140个.林区总人口为160.8万人,职工72.5万人.在生态建设方面,坚持以营林为基础的方针,大力进行人工造林,人工造林保存面积达到293.8万公顷.在经济发展方面,木材产量最高时占全国33.5%,累计为国家生产木材 5.19亿立方米,占全国产量的21%;上缴利税119亿元.在社会发展方面,在昔日人迹罕至、基础设施几近于零的原始林区,建起了星罗棋布的小城镇.

2.指标选取

黑龙江省国有林区小城镇建设包括生态文明、经济发展、产业结构、人口就业、居民生活等方面,影响因素众多,提取出可以评价小城镇建设水平的重要的14个指标,分别为人口密度、城镇登记失业率、医疗人员占总人口比例、在职大中专及其以上学历比例、人均住房使用面积、人均铺装道路里程;经济系统方面的选取GNP、人均GDP、第三产业产值比重、人均第三产业产值;生态系统方面选取的是森林覆盖率、人均林地面积、绿化覆盖率.

3.数据收集与整理

黑龙江省四十个林业局作为聚类对象,14个指标作为聚类特征.收集黑龙江省四十个国有林业局2008-2012的数据资料,主要包括内容如:年度地区生产总值(GDP)、年度末总人口、年度第三产业总产值、年度住房总面积、年度总道路里程、森林面积、绿化覆盖面积等数据样本(略).根据计算公式整理得14个指标数据,见表1.其中的13个指标计算公式如下:人口密度(人/公顷)等于年度总人口/辖区面积,人均GDP(元)等于本年度地区生产总值(GDP)/本年度末总人口,第三产业比重(%)等于本年度第三产业总产值/本年度地区生产总值(GDP),人均第三产值(元/人)等于本年度末第三产值/本年度末总人口,万元GDP耗水量(吨/万元)等于耗水量/本年度地区生产总值(GDP),城镇登记失业率(%)等于(城镇登记失业人口/总人口)*100%,医疗人口比例(%)等于(医疗人口总数/总人口)*100%,在职大中专及其以上学历比例(%)等于(在职大中专及其以上学历职工总数/在职职工总数)*100%,人均住房使用面积(平方米/人)等于本年度住房总面积/本年度末总人口,人均铺装道路里程(米/人)等于本年度总道路里程/本年度末总人口,人均林地面积(平方米/人)等于森林面积/本年度末总人口,绿化覆盖率(平方米/人)等于绿化覆盖面积/本年度末总人口,森林覆盖率(%)等于(森林面积/辖区面积)*100%.

4.数学模型

4.1样本数据标准化

13个影响指标的数据单位口径各不同,为便于选择聚类分析的相似度度量方法,在聚类分析前首先对各指标数据进行标准化处理,标准化公式为

4.2相似性度量及距离的选取与定义

4.2.1相似性度量选取

本文采用夹角余弦衡量相似度大小,将两个变量数据和看作为两空间向量,两向量的夹角余弦可用下列公式计算,令,显然,.

这里,越近似于1时,说明两变量和非常相似,可以聚为一类;反之,越接近于0时,说明两变量和差别很大,不能聚为一类.根据公式(2)计算得到变量间相似度矩阵.

4.2.2样品间与类间距离的定义

样品间距离定义有三大类:闵氏距离、马氏距离、兰氏距离,但一般在实际聚类过程中,为了计算方便,我们也常作一个变换

用表示变量间的距离远近,小则和先聚成一类.

类间距离的定义也有8种:最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和法.归类步骤基本一致,差异仅在于计算方法的不同.

设是样品集,是的非空子集,且满足

则称是的一个分类.用表示和间的距离,又设和分别为和中样品的个数,表示中第个样品与中第个样品之间的距离.这里用类平均法定义类间距离,公式如下

4.3聚类

应用SPSS软件上选择系统聚类法中的组间连接的聚类方法,相似性度量选择余弦值度量法,输出相似性矩阵与聚类分析树状图(见图1).

相似矩阵中的相似度的选取的不同,分类结果也发生变化.简述即为,越大,对相似度要求越高,聚得的类别越多,反之,越小,对相似度要求越低,聚得的类别越少.

聚类结果为:时,为一类,其他各为一类,聚为三十九类;时,为一类,为一类,其他各为一类,聚为三十八类;时,为一类,为一类,为一类,其他各为一类,聚为三十七类;……,时,为一类,为一类, 为一类,其他为一类,聚为四类;时,为一类,为一类,其他为一类,聚为三类;时,为一类,其他为一类,聚为两类.

4.4最优聚类结果的选取

4.4.1树状图法

图1为40个林业局样本集聚类分析树状图,样本相当于最左端的枝叶,依次连接在树上,树根在最右边;顶端尺度表示样品、类之间的距离.比如样本6与样本22的距离最远,因为从样本6出发必须一直下到最右端树根部,再沿另一枝条到达样本22;而样本6与样本15则无需下到最右端树根部.由图形非常直观地看出,聚类不应该多余12类,这样得到的分类中样本之间都能有相当的距离.如果分成6类,只需设想从顶端距离尺度约15~20单位长度中间竖直下切,连接样本的树枝就被分割成6个大枝条,同一枝条上的样本归属于同一类;如果分成4类,只需设想从顶端距离尺度约20~25单位长度中间竖直下切,连接样本的树枝就被分割成4个大枝条,同一枝条上的样本归属于同一类.根据分析问题实际需要选择方案或者根据下面的公式法详细计算选择.

4.4.2公式法

上述读树状图的方法已将三十九类方案大致缩小为两类方案,为精确地将林业局最优聚类找到,可以用下面定义值的方法,表示某方案中所有类间距离的均值,表示各类各样品间距离均值,所以值越大,说明分类越合理.

计算得将40个林业局聚为四或六类时对应的值进行比较,聚为4类时对应的值较大,.

5.结果与分析

最优聚类方案:桦南和通北两个林业局聚为一类,红星、双鸭山和林口三个林业局聚为一类,东方红林业局为一类,其余林业局聚为一类.根据聚类结果分析得,东方红林业局一直独自聚为一类的原因在于,其施业区面积最大,约58万公顷,林木种类繁多且野生资源丰富,创造的经济价值极大,是唯一由国家统计局认定为中国100家最大木材采运企业,林区基础设施建设基本完善,交通便利,人口素质普遍较高;桦南和通北两个林业局均地处黑龙江省北部,生态林木资源及经济发展情况相似,发展水平较好,与其他林业局相比交通运输情况一般,新型小城镇建设情况良好;红星、双鸭山和林口三个林业局,虽经济繁荣,交通便利,但人才素质偏低,人才流失现象较多且人口处低增长趋势;其他林业局小城镇建设各方面稳步进行,发展状况良好.

参考文献:

[1]黑龙省人民政府. 黑龙江省主体功能区规划[EB/OL].(2012-05-18) http://www.chinaneast.gov.cn/2012-05/18/c_131595917.htm.

[2]国家发改委, 国家林业局. 大小兴安岭林区生态保护与经济转型规划(2010-2020)[EB/OL]. (2010-12-23)http://www.gov.cn/zwgk/2010-12/23/content_1771668.htm.

[3]朱建平. 应用多元统计分析[O].北京:科学出版社, 2006.

[4]管宇.实用多元统计分析[O] .杭州:浙江大学出版社. 2011(10):179-182.

[5]常建斌, 顾凤岐, 温广玉等.大兴安岭林火气候的区划[M]. 哈尔滨:东北林业大学学报, 1995(5):98-102.

小城镇建设论文范文结:

关于对不知道怎么写小城镇建设论文范文课题研究的大学硕士、相关本科毕业论文小城镇建设论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

1、小城镇建设论文

2、小论文查重

3、初中历史小论文范文

4、小论文格式模板范文

5、数学小论文三年级

6、大学生小论文范文