成果名称: 面向科技资源的智能推荐与挖掘系统建设
完成单位: 广东省科技基础条件平台中心,广东省计算技术应用研究所
主要人员: 林珠,罗亮,卢智星,方少亮,陈树敏,赵晓萌,李海威,刘良斌,罗俊博,郑伟鸿,蔡建新,李莎,罗潆,冯鉴光
介绍:

     ①课题来源与背景:课题来源于省级科技计划项目“面向科技资源的智能推荐与的挖掘系统”,背景是在国家和广东省对科技资源工作大力支持下,广东省科技资源整合与汇聚已达到一定基础,但仍需要对这些资源进行分析和综合应用,才能更好地为科技活动提供支撑,更好地进行供需对接。

     ②技术原理及性能指标:由于该项目是建设面向科技资源的智能推荐与的挖掘系统,主要围绕科技资源开展数据质量控制、数据预处理与存储技术、快速检索和精准搜索、推荐系统、热点聚类、关联规则等研究工作。而这些方法最终并运用于科技资源共享服务平台,通过这些方法的运用,实现科技资源的快速检索和供需对接,因此,该挖掘系统成为广东省科技资源共享服务平台的一个组成部分。具体在项目实施过程中,将据质量控制、数据预处理与存储技术、快速检索和精准搜索、推荐系统、热点聚类、关联规则等研究内容和基本方法,最终应用于“混合数据源融合的资源检索方法”、“面向需求大厅的智能推荐算法”这两个实施方案,并最终嵌入平台进行运用。

     ③技术的创造性与先进性。 (1)混合数据源融合的资源检索方法: 从资源的特点和已有数据出发,结果数据库和网络爬虫,将两类数据融合在一起,使得搜索更加全面,同时根据用户的行为分析,对搜索结果进行智能排序,并将用户所访问的页面进行链接分析,将其进行结构化抽取,存入原有的数据库,使得资源库更加完善。 基于混合数据源融合的资源检索方法将不同来源的数据通过数据清洗、归一化处理、特征提取等方式进行多源数据集成,然后根据不同的特征维度进行分层次的相似度排序,最后根据用户行为进行混合排序,最终达到智能检索的目的。 (2)面向需求大厅的智能推荐算法: 结合协同过滤方法和基于内容的推荐方法,首先,其采用了User-based 协同过滤方法,对用户特征向量进行相似度计算,对待解决需求的用户推荐与其相似的用户曾经购买的资源,将这些资源存于用户-资源表1;然后,对待解决需求与提供商特征向量进行基于项目的协同过滤方法,通过相似度计算,形成资源-资源表2;然后,再通过基于内容的推荐方法,采用canopy+kmeans算法,对需求进行聚类,将相似需求划为同一簇,为待解决的需求推荐其同簇中被用于解决需求的资源,形成需求-资源表3;最后,对3个表进行整合,为需求优先推荐重复度高的资源,然后再推荐单表中存在的资源。在该推荐方法中,聚类主要采用canopy+kmeans算法, k-means算法需人为确定簇的数量K值,并且初始簇心是随机选择确定的,因此,在对数据不了解的情况下,很难给定合理的K值。因此,引入Canopy算法,首先通过Canopy算法进行聚类,以确定簇数以及初始簇心的,接着通过K-means算法进行迭代运算,收敛 出最后的聚类结果。

     ④技术的成熟程度,适用范围和安全性: 技术上较为成熟,适用于与科技资源相关的系统和平台,安全性较高。

     ⑤应用情况及存在的问题: 现应用于广东省科技资源共享服务平台,无其它应用;暂未发现存在问题。

     ⑥历年获奖情况; 无获奖情况。

批准登记号:
登记日期: 2024-07-15
研究起止时间: 2016-01-01至2018-11-20
所属行业: 科学研究和技术服务业
所属高新技术类别: 电子信息
评价单位名称: 广东省科学技术厅
评价日期: 2018-11-28