2025年8月9日
今週の活動
- 中間発表用スライドのユーザーストーリーを考え、スライドを修正
- できるだけ形式的な説明を避けた
- 手法の細かな説明を省略し、概要を伝えるための構成に変更
- Orthogonal defect classification(ODC)の自動分類に関する論文を読んだ
- 概要
- ソフトウェア欠陥のODC分類を自動化するAutoODCと呼ばれるシステムを開発
- ODC分類を欠陥レポートのテキスト分類問題として捉え、関連性アノテーションと呼ばれる手法によって分類精度を向上させるフレームワークを提案
- 達成できたこと
- 従来人手で行っていたODC分類をナイーブベイズやサポートベクターマシンを用いて自動化
- 専門家の知識を要していた作業をシステム化
- バグレポートのテキストとODC分類の関連性を追加するフレームワークを開発
- ODC分類に無関係なテキストを除去する手法を確立
- 分類器の相対エラーを14〜29%削減
- 達成できなかったこと
- ODCのimpact属性以外の属性の分類性能を評価できなかった
- 大規模なデータセットでは性能が検証されていない
- 2つのドメインでの評価に留まっている
- 人手によるテキストのアノテーション作業が依然として必要
得られた成果
- 発表資料の内容をより分かりやすくした
- ODC分類のうち、impact属性の分類精度についての知見が得られた
- ナイーブベイズやサポートベクターマシンなどの弱学習器とバグレポートの組み合わせでも8割程度の精度が得られることが分かった
直面した課題
- ユーザーストーリーに沿って資料を修正したが、ユーザー(聞き手)の疑問に答える資料としてはまだ不十分
- 想定される質問を事前に考え、その疑問に答えるような内容に変更する必要がある
来週の計画
- 改めて資料を修正する
- ODC分類のimpact属性以外の属性の分類手法についても調査
- バグレポートのテキストのみで実用的なODC分類ができるのかどうかを確認したい