基于Web招聘信息的专业技能需求文本挖掘_钟静.pdf
ISSN1009-3044E-mail:wltx@
ComputerKnowledgeandTechnology电脑知识与技术
第15卷第6期(2019年2月)ComputerKnowledgeandTechnology电脑知识与技术
http://
Vol.15,No.6,February.2019Tel:+86-55165690964
基于Web招聘信息的专业技能需求文本挖掘
钟静,罗南超
(阿坝师范学院数学与计算机科学学院,四川汶川623002)
摘要:文章使用八爪鱼采集器在智联招聘网上采集了成都范围内有关计算机科学与技术专业工作招聘的技能要求,通过
数据预处理、关联规则来处理采集到的大量数据,挖掘出各职位和对应能力要求之间的关联程度,以便此专业学生找工作
时了解自己应该掌握的技能侧重点以及学校对工作单位所需要的人才的技能进行有针对性的培养。
关键词:招聘信息;文本挖掘;关联规则
中图分类号:TP311文献标识码:A文章编号:1009-3044(2019)06-0001-02
DOI:10.14004/ki.ckt.2019.0593
目前很多高校呈现出培养的毕业生掌握的技能和企业所whereindex=@index;set@index+=@Incrementend
需要的人才掌握的技能无法匹配,导致大量大学生毕业却无法1.2.2将数据插入到临时表中,把原表drop
和企业招聘条件接轨,没有实际操作能力只能去各种技术补习
把原始表中的数据通过select语句筛选出来,然后批量插
机构培训后才能找到心仪的工作,企业也无法快速找到和自己
入导新表中,这种方式利用了大容量日志(BulkLogged)操作的
需求匹配的毕业生们。我们各个高校可以从这些招聘信息中
优势。由于SELECTINTO,INSERTSELECT是大容量日志操
提炼出自己学校有关专业的就业岗位的用人需求,设置对口的
作,select命令不会产生大量日志文件,因此,执行插入比执行
专业课程,以此来为用人单位培养对口人才;同时也解决了企
删除的效率更高。最后,执行drop命令,删除整个原始表,几乎
业难以找到对口毕业生的难题。本文对“智联招聘”成都地区
不消耗任何时间。
计算机科学与技术专业相关工作岗位的招聘信息进行了挖掘,
--ALTERDATABASEdatabase_nameSETRECOVERY
并且提炼出这些岗位招聘信息里面出现频率较高的技能做了
BULK_LOGGED;insertintonew_tableselectcolumn_listfrom
统计,以便学校为本专业的学生设置合适的课程。
original_tablewherefilter_retaindroptableoriginal_table
1数据挖掘处理把临时表重命名,执行sp_rename或手动重命名,其中