安装
爬虫:jupyter notebook
数据分析:knime
从人民网公布的人事任免中获取干部简历信息。
从简历上提取“姓名”、“性别”、“年龄”、“党派”、“职位”、“干部级别”、“学历”、“是否为清北毕业”、“是否有党校学习学位”、“民族”、“籍贯”、“是否曾在国企任职“、“是否曾在高校任职”、“是否曾在私企任职“、“是否在x省任职过”这些信息。
本项目认为任职为省部级副 职(四级干部)及以上,全部为具有较高培养潜力干部;厅局(地)正职(五级干部)及以 下,若年龄小于该级别平均年龄,则有较高培养潜力(用 1 表示),若年龄大于等于该级别平 均年龄,则认为无较高培养潜力(用 0 表示)
通过knime对各类信息进行相关性分析,剔除与升职潜力不相关的信息。将具有相关性的项在knime上通过Decision Tree 进行训练,并进行验证模型准确度。