1、软件开发人员的薪金资历 从事专业工作的年数;管理 1=管理人员,0=非管理人员;教育 1=中学,2=大学,3=更高程度.建立模型研究薪金与资历、管理责任、教育程度的关系.分析人事策略的合理性,作为新聘用人员薪金的参考. 编号薪金资历管理教育0113876111021160810303187011130411283102编号薪金资历管理教育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资料 分析与假设 y 薪金,x1 资历(年)x2 = 1 管理人员,x2 = 0 非管理人员1=中学2=大学3=更高假设资历每
2、加一年薪金的增长是常数;且管理、教育、资历之间无交互作用. 教育线性回归模型 a0, a1, , a4是待估计的回归系数,是随机误差 中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0, x4=0 模型求解参数参数估计值置信区间a011033 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994 -3826 -2162 a4148 -636 931 R2=0.9567 F=226 p0.0001 s2=106R2,F, p 模型整体上可用资历增加1年薪金增长546 管理人员薪金多6883 中学程度薪金比更高的少2994 大
3、学程度薪金比更高的多148 a4置信区间包含零点,解释不可靠!中学:x3=1, x4=0;大学:x3=0, x4=1; 更高:x3=0, x4=0. x2 = 1 管理,x2 = 0 非管理x1资历(年)残差分析方法 结果分析残差e 与资历x1的关系 e与管理教育组合的关系 残差全为正,或全为负,管理教育组合处理不当. 残差大概分成3个水平,6种管理教育组合混在一起,未正确反映.应在模型中增加管理x2与教育x3, x4的交互项 .组合123456管理010101教育112233管理与教育的组合进一步的模型增加管理x2与教育x3, x4的交互项参数参数估计值置信区间a01120411044 11
4、363a1497486 508a270486841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372 -2769a618361571 2101R2=0.9988 F=554 p0.0001 s2=3104 R2,F有改进,所有回归系数置信区间不含零点,模型完全可用 消除了不正常现象 异常数据(33号)应去掉! e x1 e 组合去掉异常数据后的结果参数参数估计值置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171
5、2942a619971894 2100R2= 0.9998 F=36701 p0.0001 s2=4103e x1 e 组合R2: 0.9567 0.99880.9998F:226 554 36701 s2: 104 3104 4103置信区间长度更短残差图十分正常最终模型的结果可以应用模型应用 制订6种管理教育组合人员的“基础”薪金(资历为0)组合管理教育系数“基础”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0, x4=0 x1= 0; x2 = 1 管理,x2 = 0 非管理大学程度管理人员比更高程度管理人员的薪金高. 大学程度非管理人员比更高程度非管理人员的薪金略低. 对定性因素(如管理、教育),可以引入0-1变量处理,0-1变量的个数可比定性因素的水平少1. 软件开发人员的薪金 残差分析方法可以发现模型的缺陷,引入交互作用项常常能够改善模型. 剔除异常数据,有助于得到更好的结果. 注:可以直接对6种管理教育组合引入5个0-1变量. 敬请各位老师提出宝贵意见!