研究目的
通过提出一种基于特征分组的特征选择算法来提高软件缺陷预测的效果,该算法去除冗余特征并从每个组中选取子集以增强预测性能。
研究成果
所提出的特征选择方法显著提升了多种分类器在软件缺陷预测中的AUC值,证明每组选择多个特征比选取单一代表性特征更有效。该方法增强了预测性能,有助于降低软件开发成本并提高质量。
研究不足
该方法由于使用粒子群优化算法(PSO)进行特征选择,可能导致计算量较大,且依赖于特定数据集(NASA和PROMISE),这可能限制其向其他软件领域的泛化能力。潜在的优化方案包括采用更高效的搜索算法或处理更大规模的特征集。
1:实验设计与方法选择:
本研究采用混合Wrapper与Filter框架进行特征选择,先基于对称不确定性和FCBF算法进行特征分组,再通过PSO算法进行组内特征筛选。
2:样本选择与数据来源:
使用开源的NASA和PROMISE数据集,包含软件开发过程、源代码及演化层面的特征,采用Halstead和MCCabe等度量指标。
3:实验设备与材料清单:
未提及具体设备;软件工具包括用于实现分类器与算法的Weka-python-wrapper包。
4:实验流程与操作步骤:
基于FCBF方法对特征分组以处理冗余,随后应用PSO算法每组至少筛选一个特征,通过十折交叉验证和AUC指标评估(分类器包括朴素贝叶斯、逻辑回归、K近邻)。
5:数据分析方法:
计算并比较各方法的AUC值,采用胜/平/负分析评估性能提升。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容