2025年8月30日

今週の活動¶

ODC属性	最高精度アルゴリズム	精度 (%)	再現率 (%)	適合率 (%)
Activity	RNN	47.6±3.5	47.6±3.5	47.8±3.4
Trigger - Code Inspection	RNN	40.3±7.0	40.3±7.0	42.1±8.2
Trigger - Function Test	RNN	37.4±12.8	37.4±12.8	38.0±15.7
Trigger - System Test	RNN	41.4±12.7	41.4±12.7	40.7±16.0
Trigger - Unit Test	Linear SVM	57.5±12.3	57.5±12.3	58.5±14.7
Impact	RNN	33.3±7.5	33.3±7.5	34.4±9.7
Target	Linear SVM	85.6±5.1	85.6±5.1	86.0±5.1
Defect Type	Linear SVM	34.7±5.1	34.7±5.1	34.8±5.5
Qualifier	RBF SVM	39.7±6.8	39.7±6.8	40.3±7.2

ODC属性には形式が明確で分類しやすいものとそうでないものがある
- Target, Age, Sourceはメタデータから自動的に分類できる
- それ以外の属性は分類精度が低く、あまり実用的ではない
ODCはバグ予測との関連性が低い
- ODCは手動による品質管理を目的として構築された分類手法
- 実際にこれまでの研究によって、客観的な分類が難しいことが示唆
- 主観的な要素が多い分類手法を、客観的な情報であるバグ予測に活用することは現実的ではない
ODC属性のうち、Target, Age, Sourceを活用する代わりにGitのメタデータを直接活用し、開発プロセスに関する指標を定量化した方がより客観的で説得力が高い
- 例: レビュー時間、担当した開発者、機能ごとの変更の大きさ、コメント数、テストやドキュメントの有無