收藏 分享(赏)

赣南师范学院科技学院 基于统计分析的公共自行车服务系统评价模型研究.doc

上传人:工建设计 文档编号:21752487 上传时间:2024-04-21 格式:DOC 页数:53 大小:2.43MB
下载 相关 举报
赣南师范学院科技学院 基于统计分析的公共自行车服务系统评价模型研究.doc_第1页
第1页 / 共53页
赣南师范学院科技学院 基于统计分析的公共自行车服务系统评价模型研究.doc_第2页
第2页 / 共53页
赣南师范学院科技学院 基于统计分析的公共自行车服务系统评价模型研究.doc_第3页
第3页 / 共53页
赣南师范学院科技学院 基于统计分析的公共自行车服务系统评价模型研究.doc_第4页
第4页 / 共53页
赣南师范学院科技学院 基于统计分析的公共自行车服务系统评价模型研究.doc_第5页
第5页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于统计分析的公共自行车服务系统评价模型研究摘要 本文针对温州市鹿城区公共自行车管理中心提供的数据,首先对所给数据进行预处理,建立了相关统计模型,运用SPSS20.0、matlab等软件进行统计分析,最后应用关联度分析法对系统进行评价,并提出改进建议。针对问题一:在已处理好的数据基础上,建立了频率与频数、用车时长的统计模型,利用SPSS软件分别统计各站点20天中每天及累计的借车及还车频次,得到每天和累计的借车和还车频次(见表五和表六);并对所有站点按累计的借车和还车频次排序(见表七和表八);对每次用车时长的分布情况进行统计分析,画出其分布图(见图一和图二),由图可知:每天用车时长分布形状非常相

2、似且近似服从分布。针对问题二:在已处理好的数据基础上,建立了使用公用自行车的不同借车卡数量的统计模型,利用SPSS统计20天中每天使用不同借车卡数量,其中最大的为第20天的19885;统计了每张借车卡累计借车次数的分布图(见图三),对图形分析可得:借车次数在10次以内的占,借车次数在10至30次占,借车次数在30至50次占,借车次数在50以上占,最大借车次数高达次。针对问题三:根据问题一的分析,已给站点累计所用公共自行车次数最大的一天是第20天。对于第一小问:利用第20天数据,运用floyd算法求得两站点间最短时间,将站与站间的距离定义为两站间的最短时间与自行车速度之积,同时考虑到了速度和时间

3、的随机误差影响;利用距离的定义,通过matlab计算得两站点最长距离为:,最短距离为:。利用问题一中的频数模型,对借还车是同一站点且使用时间在分钟以上的借还车情况进行统计,得借车频次表(见表十一)和用车时间分布图(见图四)。对于第二小问:根据问题一的统计,第20天的借车和还车频次最高的站点分别为42(街心公园)和56(五马美食林),利用SPSS统计出两站点借、还车时刻和用车时长的分布图(见图五,图六,图七),由图形分析可知:借还车的高峰期与人们上下班的时间非常吻合,在借还车时间上大体都在一小时以内。第三小问:将第20天数据从点到22点每半小时作为一时段,分别统计各站点各时段借还车频数,利用ma

4、tlab编程求出借还车高峰时段(见表十二),并对具有借车高峰时段与还车高峰时段的站点进行归类。(见表十四)针对问题四:根据前三个问题的统计结果,结合公共自行车服务指南,确定评价公共自行车服务系统站点设置和锁桩数量的配置的主要指标有:借车频数、还车频数、可借比例、可还比例、锁桩数目,建立了基于灰色关联分析法和聚类分析的公共自行车服务评价模型,得到评价结果:180个站点分成有优劣之分的三个类(见表十五)。针对问题五:通过查阅相关资料知:公共自行车的其他运行规律主要是借还车时间有限制,用车时间集中在短时间内等。针对此问题提出了相关建议。关键词:公共自行车服务系统 统计分析 灰色关联度分析 聚类分析一

5、、 问题重述1.1问题背景公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城市迅速推广与普及。在公共自行车服务系统中,自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。1.2问题提出了解公共自行车服务模式和使用规则的基础上,根据附件提供的数据,建立数学模型,讨论以下问题:1. 分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序。另外,试统计分析每次用车时长的分布情况。2. 试统计20天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计

6、借车次数的分布情况。3. 找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离。对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。4. 请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做

7、出评价。5. 找出公共自行车服务系统的其他运行规律,提出改进建议。二、问题分析题目提供了20天公共自行车借车和还车等原始数据,本文的关键就是通过分析处理所给数据,建立数学模型来研究公共自行车服务系统,并对公共自行车服务系统进行评级及提出改进建议。2.1问题一分析要统计各站点20天中每天和累计的借车和还车频次,查阅资料知,频数为频率和频数,对于借车与还车频数,可引入0-1变量表示各站第天借车和还车在次记录中出现的频数,各站每天和累计的借车频数就是借出车站号在每天出现的次数和总天数的借车频数和,各站每天的借车频率是借出车站号在每天出现的次数与每天的有效数据,累计的借车频率是累计借车的频数比上总有效

8、数据,对于借车每天及累计的频数类似,从而可建立相应的统计模型。根据以上分析,可统计出各站点20天中每天和累计的借车和还车频次,进而可对所有站点累计的借车和还车频次排序。分析每次用车时长的分布情况,可运用相关软件将分布情况作出。2.2问题二分析要统计20天每天使用公共自行车的不同借车卡的数量,对于各天的借车人数相当多,为此先用相关软件对有效数据进行处理,即将重复的借车卡,累计到不同借车卡的一行中,可得到没有重复的不同借车卡数据,引入0-1变量表示第张卡第个数据中出现的情况,累计求和,就可得到各天不同借车卡的数量,即得相应统计模型,再运用相关软件分析每张借车卡累计次数的分布情况。2.3问题三分析

9、(1)由于站点之间的实际距离很难得到,且城市里人流量较大,自行车行驶速度不可能很大,应比较均匀,所以定义两站点之间的距离,可根据物理中距离与时间和速度的关系定义距离,其中时间的获取可通过数据中所给的站与站之间的用时加以处理后得到。该定义的距离会应不同的骑车速度和时间,导致两站点距离不同,因此速度和时间需要引进误差,且将两相同站点的距离定义为0,为此可得到距离的定义。对于借还车是同一站点且用时一分钟以上的借还车情况直接利用SPSS进行统计即可得出相应结果。(2)根据问题一得到结果,可找到所有站点使用自行车次数最大一天,借车频次高和还车频次最高的站点,根据相应站点的数据,可应用相关软件将各站点的借

10、、还车时刻的分布及用车时长的分布求出。(3)题中给出数据的借车还车时间段为,要求各站点借车还车的高峰时段,可对总的时间段进行划分,考虑到数据量以及统计的精确度,可采用一定时间间隔作为一个时间段,分别统计各个站点在每个事件段内的借车频数以及还车频数,则最高借还车频数对应的时间段即为高峰时段,进而能得出高峰时段各站点的借车频次和还车频次,此处统计工作量可能较大。再对其整体分析,即能得到具有共同借车高峰时段和还车高峰时段的站点的归类情况2.4问题四分析要对目前公共自行车服务系统站点设置和数量的配置做出评价,要根据前几问统计的数据,找出相应的指标,根据问题一,可让借车频数和还车频数作为其中指标,从数据

11、的初步分析来看,借车、与还车频数可能大,说明车流量比较多,从这方面,也可根据题目所提供的站点地理位置,可以知道各个站台的得可借比例(可借车位比上总车位)和可还比例(可借车位比上总车位),作为其中指标,对于数量的配置,根据各站锁桩的数量等作为其中指标,为此可得到相应指标对自行车服务系统进行评价,运用灰色关联分析法,求出各个站点的关联度,进行排序,可再用SPSS聚类分析分成三类,求出每一类的均值,从而进一步确定出类别间的优劣。2.5问题五分析要找出自行车服务系统的其他运行规律并提出改进意见,要先对问题中所有数据的一个时间分布情况、借车高峰、还车高峰、以及站点中桩位设置的合理性,进行改进。而改进的方

12、法可能从现有数据和系统流程不能解决,因此可通过查找其他服务系统中号的服务规则进行改进。三、符号说明 第个站的频数 第天数据记录的有效总数(剔除后的数据) 第个时间在第次记录中的出现次数 第张卡出现的频数 第个站到第个站的距离 第个站到第个站的所用最短时间 时间合成误差 速度随机误差 第个站点的频率 第天借记卡总数 第个站到第个站在数据中出现的次数 人骑自行车的平均速度 第个站到第个站的时间集中数据 第个站到第个站的时间集中数据 测量数据时的不确定度四、模型假设1、以自行车车站号做为借车车站的唯一标识2、附件中所给的数据能准确描述公共自行车系统管理与运营状况3、自行车行驶的过程中,以匀速行驶,行

13、驶过程中不会停留4、异常数据的剔除,不影响数据的整体性五、数据预处理观察整个数据发现有许多异常数据,对任意一天的数据统计发现共提供了181个站点,但是108号站点是空缺值。根据用车时间、用车方式、换车锁桩号、温州鹿城公共自行车服务指南等信息剔除一些不合理数据。n 剔除部分用车时间在分钟:对于数据中用车时间0的,借车者从用一车站借出、同一车站还回,而且借还车桩号基本相同,其可能原因是车辆发现自行车有问题就立即还回和在借车成功后20秒内自行车未推出,则20秒后自动锁上(温州鹿城公共自行车服务指南),这样的情况自行车都属于没有使用;对于数据用车时间1和2的,可剔除同一车站提出同一车站还回,可能原因为

14、车有问题立即还回,车是没有使用的,系统有计算出了该类车的用车时间,因此可以剔除这样的情况的数据,但该数据中有借还车地点不一样不能剔除,因为可能两站之间距离很小能在分钟左右完成。以下表(表一)为例:表一:用车时间为的数据借出车站号借车锁还车车站号还车锁用车时间用车方式94994180会员卡借车169816980会员卡借车1351341会员卡借车42442101会员卡借车191919192会员卡借车5515512会员卡借车n 剔除部分用车时间在分钟:根据温州鹿城公共自行车服务指南无法借、还车处理办法第四条,即借车时听到语音提示“通讯故障暂停使用”,请等待分钟后,换桩借车。可以知道在同一车站提出同一

15、车站还回借还车桩一样的,且用车时间在分钟内这样的数据,自行车可能是无法使用,但系统又在计算用车计时,对于这样的数据可以剔除。以下表(表二)为例:表二:用车时间为的数据借出车站号借车锁还车车站号还车锁用车时间用车方式1311313会员卡借车18120181203会员卡借车492049204会员卡借车702070204会员卡借车11115会员卡借车6416415会员卡借车n 剔除还车桩桩号为0的数据:数据中有极少数的车桩号为0,而且车桩号为0的同时,用车时间也为0,该原因可能为借车者没有还车而导致或该桩号的车被盗,这样的数据是没有意义的,理应剔除。以下表(表三)为例:表三:还车桩桩号为0的数据借出

16、车站号借车锁还车车站号还车锁用车时间用车方式8211000会员卡借车9914000会员卡借车n 剔除用车方式为还车故障的数据:在所有数据中有极少的数据借车时间和还车时间差值并不等于用车时间,在用车方式上写了还车故障,这一部分数据也会影响结果因当剔除,以下表(表四)为例:表四: 用车方式为还车故障统计表借出车站号借车锁还车车站号还车锁用车时间用车方式444780还车故障711444190还车故障n 剔除数据还车车站号不存在的数据:根据温州鹿城公共自行车站点地图可以知站号最大号为6055,但有些数据还车车站号不存在,该类数据有2个分别是在第5天中的借出车站号为9,还车车站号为29999(不存在)和

17、第7天中借出站号为43,还车车站号为29999的,这一类型的数据对研究没有意义应当剔除。n 剔除调试站的数据在20天的数据整理中,发现有4天中出现了调试站,这些调试站分别在第8,9,15,16天中。调试站借车桩位和还车桩位都为1000,而且一直都在桩位上用车时间为0,因此对数据的研究没有意义应当剔除。剔除的所有数据详见附录1。六、模型的建立与求解6.1问题一的解答6.1.1模型一的建立需要统计各站点20天中每天和累计的借车频次,查阅资料知频次为频率和频数,分别建立频率与频数的模型。设为0-1变量,即为第个时间在第次记录中的出现次数,为0-1变量建立模型一:每天各站的频数: 各站累计的频数: 每

18、天各站的频率: 各站累计的频率: 用车时长: 6.1.2模型一的求解n 借、还车频次的计算根据题目所给数据,代入以上模型,利用SPSS进行求解,得各站20天中每天及累计的借车和还车频次,部分数据见下表(表五,表六),具体数据见附录2。表五:20天中每天和累计的借车频次站点编号借车频次借车频次借车累计频次第1天频数第1天频率第20天频数第20天频率累计频数累计频率1850.00253840.002143760.0006421020.003031060.0027014150.0007031700.005051770.004517040.0011942270.006742780.0070810850

19、.0018451290.003831360.003465450.000921771230.003652590.0065933060.00559178520.001541010.0025712840.002171792840.008433700.0094350920.0086180480.001431490.0037919450.00329181590.001751700.004321310.00361表六:20天中每天和累计的还车频次站点编号还车频次还车频次还车累计频次第1天频数第1天频率第20天频数第20天频率累计频数累计频率1870.00258 800.00204 15630.00265

20、21050.00312 1010.00257 15920.00269 31670.00496 1710.00436 26740.00453 42160.00641 2880.00734 51700.00875 51440.00428 1390.00354 24210.00410 1771230.00365 2590.00660 33060.00560 178520.00154 1010.00257 12840.00217 1792840.00843 3700.00943 50920.00862 180480.00143 1490.00380 19450.00329 181590.00175 1

21、700.00433 21310.00361 n 累计频次的排序对以上统计的所有站点累计的借车频次与还车频次,根据频率或频数中的其中一个进行排序,因为频率的计算会有小数的误差,为了方便统计,用频数进行排序,排序结果见下表(表七,表八),具体见附录2。表七:累计借车频次的排序序号站点号借出车站频数142街心公园11513256五马美食林11151319开太百货9192463体育中心西903117790拉菲度假酒店54217886测试点391179162望江路广化桥路口282180153妇女儿童中心254由上表可知,累计借车频数最大的站点号为42(街心公园),借车频数为11513,最小的站点为153

22、(妇女儿童中心),借车频数为254。其差异原因主要是由于地理位置的不同,街心公园在地图中明显位于交易繁华的位置,周围有商场有酒店,借车数相对较多,而妇女儿童中心周围比较空旷人流活动少。表八:累计还车频次的排序序号站点号借出车站频数156五马美食林11509242街心公园11375319开太百货9313463体育中心西930617890拉菲度假酒店568179162望江路广化桥路口299180153妇女儿童中心272由上表可知,累计还车频次最高的站点号为56(五马美食林),还车频数为11509,最小的站点为153(妇女儿童中心)还车频数为272。其差异原因主要是地理位置的不同,五马美食林在地图中

23、查看可知,其周围是社区和商城人流密集。n 每次用车时长的分布对于每次用车时长的分布情况,根据题目中数据,用spss统计出分布时间对应的频数可画出用车时长的分布直方图。随机抽取20天中某几天用车时间与20天累积数据用车时间的分布对比图(图一,图二)。(20天每天的分布图及累计分布图详见附录3)图一:第二天,第十三天时间分布图图二:第20天,20天累积时间分布图由图形分布情况可以看出:每一天和20天内用车时长的分布情况基本相同,而且作出20天所有用车时长的分布情况,其状况也相同。因此分析用车时长可以用20天内累计的数据。通过查找分布图可知,用车时长的分布近似服从分布。对分布情况观察发现时间基本集中

24、在内,而超过1小时的用车时间却很少。6.2问题二的解答6.2.1模型二的建立对于统计20天中各天不同借车卡的数量,将公共自行车每天的数据按借卡号顺序排列,且将同种借卡号出现的次数累积起来,其累积的次数就是借记卡的数量。假设为第张卡出现的频数,为第天借记卡总数,为0-1变量,建立模型二:6.2.2模型二的求解根据题目所给数据,运用SPSS将20天数据中出现的每张借车卡累计借卡次数统计出来,如下表九表九:不同借车卡数量天数不同借车卡数量使用自行车数量天数不同借车卡数量使用自行车数量11665733640111492130039217284346481218070355553950115584131

25、935938726414486297801419334387235178193573915185213606161854137415161120217802718747376491715243296528104621555118151442963596918102781919047376921040296357201988539140由上表(表九)可知,第20天借车人最多,且自行车使用次数也最多,第3天借车人最少,但是自行车使用次数最少的一天是第10天,根据题目中数据,运用SPSS,将20天每张借车卡累计使用次数画出,其分布情况如下(图三)。图三:借车卡累计借车次数分布图由上图(图三)以及统计

26、的数据可知借车次数在10次以内的人最多,而大部分的人借车次数都在30次以内。借车次数在50次以上的人数非常少。对此进行统计得到如下结论:借车次数在10次以内的人占,借车次数都在10至30次占以内,借车次数都在30至50次占以内,借车次数在50次以上的占,最大借车次数高达次.6.3问题三的解答该问要解决的3个小问题,解决问题的数据是根据所有已给站点累计使用公共自行车次数最大一天进行求解,根据(表九)中使用自行车数量可以知道第20天的自行车使用次数最多,因此要根据第20天中的数据,来求解问题三。6.3.1模型三的建立1)距离模型的建立该问需定义两站点之间的距离,要求自行车借换车站点之间的最短(非零

27、)和最长距离,若从地图中逐个测量工作量非常大,因此可根据数据定义出一个表达式用来表示距离。设无向图,其中,两点间的距离当两车站号不同时应与速度和时间有关,当两站号相同时距离应为0,则两站点之间的距离可定义为表达式:对上述表达式解释:由于距离应和速度和时间有关,因此应得到两点骑自行车的时间和速度,对于时间由于同一条路两点间是无向的,而且用车时间也有所不同,对两点间距离的描述应当取最小的一个用于衡量距离,因此有对数据的测量和记录都存在误差因此要有。时间的长短说明行驶的距离长短,由于人在行驶过程中会有速度的差异。因此也因有误差项。对于测量时间的误差可能是由于测量人或测量仪器导致的误差。其原因是在观察

28、有些数据时,发现还车时刻与借车时刻的差值,与对应的用车时间不相等,如还车与借车差值为150时,用车时间却向下取整为1,而测量仪器本身也会有误差。测量仪器误差的原因可用不确定度表示测量人统计时的误差:而测量仪器的误差用不确定度表示:其中为仪器的精度,查资料知为从而得到平方和的根为不确定度作为测量时间误差对于速度误差,是因为骑车人的不同而导致的速度差异为,查找资料得到人在骑自行车时,为慢速为中速为快速,则取为人骑自行车的平均速度,对于取内的一个随机数。因此两站点间的距离最终定义为如下表达式:6.3.2模型三的求解n 两站点间的最短距离和最长距离 要求两站点的最短和最长的距离,可根据模型三的定义,来

29、求解两站点的距离,首先通过matlab(程序见附件4),筛选出第20天两站点间的最短时间,但是在数据中从第站到第站没有多条记录,如果存在绕路的情况,会不准确,所以用floyd算法,得到任意两站点间最短时间(见附件),同时得到站点的连通图,该连通图的权值就是为两站点的最短时间(见附件)。对于求最短时间与最长时间,为减少运算复杂程度,提取第20天用时为和的数据,进而用模型三距离表达式,进行多次计算取得一个均值,得到两站点最短和最长的距离。最长距离为675.0004,最短距离为0.08。具体借还车站号见下表(表十)表十:两站点最长距离(第一行)和最短距离(第二行)借车站号借出车站还车站号归还车站时间

30、距离156三桥下113黎明街道卫生中心45675.000418区政府东17区政府西00.08000n 借还车是同一站点且时间在1分钟以上的借车数据的统计对借还车情况的统计可用模型一统计,统计借车还车频次,最大最小值,均值,用车时间分布图。由于统计的是同一站点的借还车数据,因此借车和还车频次是一样的所以可只统计借车频次。得到如下表(表十一)结果。详细数据见附录5。表十一:借车数据站点借车频数借车频率160.002621270.003058350.0021844120.005242.17890.003932179130.005679180100.004369181130.005679有借车数据可知

31、借车最大站点为52号站点借车51,借车最小站点为153、142和116均为2,借车均值为29。对于第二十天的数据,用spss统计出该天用车时间和频数的分布图(图四)图四:第二十天用车时间大于一分钟用时分布图对第二十天用车时间大于一分钟分布图可知,用车时间在2到10左右频数最多,而数据集中在10到30之间。6.3.3 问题三(2)求解根据问题一中,所统计第20天的借车与还车频次,可以知道借车频次最高的站点为42(街心公园)和还车的频次最高的站点为56(五马美食林),对此可运用相应站点的数据画出相应的借、还车时刻和用车分布,对应图像见下图(图五,图六,图七)。图五:42号站点借车时刻与还车分布对比

32、由上图可知,借车频次最高的借车时刻与还车时刻主要集中在点和之间,了解到该时段属于上下班时期,因此上下班时刻有很大可能对该站点借还车频次造成较大影响。图六: 56号站点借车时刻与还车分布直方图对比图七:42站点与56站点用车时长的对比从图形上来看,用车时长的大概分布在分钟之内的数量比较多,超过1小时的数量相对较少,根据温州鹿城公共自行车的服务指南,可知1小时内是车辆的使用是免费的,大于1小时是按阶梯收费的,说明该城市在自行车收入中,处于低收入状态。6.3.4 问题三中(3)求解n 借车高峰时段与还车时段要统计各站点借车、还车高峰时段,可将时间间隔取为30分钟,借车时刻满足该时间段的,划分到区域中

33、,再将区域中所借车的总数,统计出来,根据该总数,可得到各车站高峰时段,通过matlab计算(程序见附录6),得到数据见下表(表十二)(具体表格见附件7),对于还车的高峰时段类似。 表十二:各站点借、还车高峰时段站点借车高峰还车高峰1 20:30-21:0019:00-19:302 16:00-16:308:00-8:303 17:00-17:308:00-8:304 17:30-18:009:00-9:305 17:00-17:3018:00-18:30177 7:30-8:008:00-8:30178 17:00-17:308:00-8:30179 17:00-17:308:00-8:301

34、80 7:30-8:0016:30-17:00181 17:00-17:308:30-9:00由上表可看到,高峰时段基本处于早上和晚上的上班期,对于这样的情况可考虑增加该时间段的借车费用.n 统计高峰时段各站点的借车和还车的频次设为从时刻到时刻时间段内的频数,去时间间隔为分钟根据1)可以统计到高峰段借车频次和还车频次,进而可得到如以下表格(表十三)(具体见附件8)表十三:高峰段各站点的借车和还车频次站点借车高峰借车频次还车高峰还车频次120:30-21:001619:00-19:3013216:00-16:30118:00-8:3013317:00-17:30408:00-8:3036417:

35、30-18:00209:00-9:3021517:00-17:301318:00-18:301117817:00-17:30138:00-8:301717917:00-17:30448:00-8:30561807:30-8:001416:30-17:001218117:00-17:30188:30-9:0014n 共同借车和还车高峰时段的站点对具有共同借车高峰时段和还车高峰时段的站点进行统计,得到20类情况见表十四(具体表格见附录9)。表十四:借还车高峰时间表借车高峰为7:30-8:00与还车高峰为7:30-8:00的站点站点借车频次借车高峰对应借车高峰时段还车频次还车高峰对应还车高峰时段14

36、3447:30-8:004047:30-8:00741747:30-8:001347:30-8:00821647:30-8:002147:30-8:00831947:30-8:001547:30-8:00 . 借车高峰为20:30-21:00与还车高峰为19:00-19:30的站点站点借车频次借车高峰对应借车高峰时段还车频次还车高峰对应还车高峰时段1163020:30-21:0013 27 19:00-19:3037323020:30-21:00202719:00-19:309383020:30-21:0052719:00-19:30通过对具有共同借车高峰时段和还车高峰时段的站点的归类,可为公

37、共自行车站点的管理提供参考,以能得到更好的管理效果,增大自行车站点的利用率。6.4问题四的解答要对公共自行车服务系统的站点设置和锁桩数量的配置做出评价,根据第一个问题统计的数据,、可用还车频数、借车频数作为其中指标,根据题目所给站点的地理位置中可以知道各站点的借车车位和可停车位,即可用可借比例(借车车位与总车位的比值)和可还比例作为其中的指标,以及锁桩数量可以作为一个站台的评价的指标。因此用上面5个指标来对服务系统作出评价,因此可运用灰色关联分析法和聚类分析进行求解.6.4.1模型四的建立:1确定最优指标集设式中为第个指标的最优值。此最优值可是诸方案中最优值(若某一指标取大值为好,则取该指标在

38、各个方案中的最大值;若取小值为好, 则取各个方案中的最小值),也可以是评估者公认的最优值。不过在定最优值时,既要考虑到先进性,又要考虑到可行性。若最优标志的过高,则不现实,不能实现,评价的结果也就不可能正确。选定最优指标集后,可构造矩阵:式中:为第个方案中第个指标的原始数值。2. 指标值的规范化处理由于批判指标间通常是有不同的量纲和数量级,故不能直接进行比较,为了保证结果的可靠性,因此要对原始指标值进行规范化处理。在这采用均值化法,得到如下公式:得到无量纲化矩阵3. 计算关联序根据灰色系统理论,用关联分析法分别求得第个方案第个指标与第个最优指标的关联系数,即:式子中为分辨系数且在(0,1)内取

39、值,取的越小,区分能力越强,通常取为0.5。从而计算出各指标安排的优劣。若关联度最大,则说明与最优指标最接近,亦即第个方案优于其他方案,据此,可以排出各方案的优劣次序。有了各个方案的排名,可再用SPSS聚类分析分成三类,求出每一类的关联度均值,从而进一步确定出类别间的优劣。6.4.2模型四的求解考虑到现实的可行性,用取均值的方法确定指标一(借车频数)、指标二(还车频数)、指标五(锁桩数量)的最优指标值,对于确定指标三(可借比例)、指标四(可还比例),这样的指数越大越好,最优指标均为可取1,因此得到最优指标集为: 根据题目中数据,可以统计到每站的相应指标数,为此可以矩阵(具体见附件) 得到构造矩

40、阵对于指标的规划处理和计算关联序,运用matlab(程序见附录10)得到各指标对各站点的关联度矩阵为:,对应于第1站到第181站点,运用SPSS将各站用系统聚类,聚类方法ward法分成三类,再求出每一类中包含数据的关联度均值,最终结果为: ,从而判断出类别的优劣,即第三类好于第二类,第二类好于第一类,类别及站点如下表(表十五),详细数据见附录11。表十五:每个站号对应的类别表站号类别站号类别站号类别1531162290315811202142313114329437211162127310411392153471552653381232175348178214136.5问题五的解答观察数据可以

41、发现目前公共自行车服务系统存在的问题主要有:1. 原数据中存在还车锁桩号为0的记录,有很大可能该自行车已遗失2. 在借车高峰时段,可能会存在无车可借,无桩可还的情况3. 该服务系统将公共自行车的租赁时间限于6:00-22:00,可能会对市民的夜间出行带来影响4. 各站点借还车高峰时段有所不同,应区别管理5. 存在用车时间非常长的借车人6. 原数据中存在不少用车时间小于一分钟的记录,不排除自行车损坏的情况针对以上问题,我们提出以下改进方案:1. 加强自行车管理,对借车人进行身份认证等2. 在条件允许的情况下,增加站点或借还车锁桩号3. 对自行车租赁实行分时付费制度,实行小时的租车服务,如在晚间租

42、车较白天更为优惠4. 对借车高峰时段及还车高峰时段进行适当归类,并安排符合各站点情况的管理模式,以为借车人提供更多的便利5. 对于用车时间非常长的情况,可制定惩罚措施,根据实际情况,对于用车时间超过一定程度的借车人进行警告等惩罚。6. 增加巡检及服务人员,及时了解各站点情况,保证站点的正常运行。七、模型评价与推广7.1模型的优点 1、问题三中,定义的距离比较接近实际 2、对大数据的筛选统计分析比较合理3、运用灰色关联分析对原有公共自行车服务系统做出评价,更具有合理性4、采用SPSS软件处理数据,具有速度快、效率高、准确度高的优点7.2模型的缺点1、处理数据时可能存在些数据的遗失,可能计算出来的结果没有达到最佳值7.3模型的推广此模型属于数据分析模型,针对问题四的模型可用于水环境质量综合评价研究、绿色施工的评价及上

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术规范

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报