コンテンツにスキップ

2025年8月9日

今週の活動

  • 中間発表用スライドのユーザーストーリーを考え、スライドを修正
    • できるだけ形式的な説明を避けた
    • 手法の細かな説明を省略し、概要を伝えるための構成に変更
  • Orthogonal defect classification(ODC)の自動分類に関する論文を読んだ
    • 概要
      • ソフトウェア欠陥のODC分類を自動化するAutoODCと呼ばれるシステムを開発
      • ODC分類を欠陥レポートのテキスト分類問題として捉え、関連性アノテーションと呼ばれる手法によって分類精度を向上させるフレームワークを提案
    • 達成できたこと
      • 従来人手で行っていたODC分類をナイーブベイズやサポートベクターマシンを用いて自動化
      • 専門家の知識を要していた作業をシステム化
      • バグレポートのテキストとODC分類の関連性を追加するフレームワークを開発
      • ODC分類に無関係なテキストを除去する手法を確立
      • 分類器の相対エラーを14〜29%削減
    • 達成できなかったこと
      • ODCのimpact属性以外の属性の分類性能を評価できなかった
      • 大規模なデータセットでは性能が検証されていない
      • 2つのドメインでの評価に留まっている
      • 人手によるテキストのアノテーション作業が依然として必要

得られた成果

  • 発表資料の内容をより分かりやすくした
  • ODC分類のうち、impact属性の分類精度についての知見が得られた
  • ナイーブベイズやサポートベクターマシンなどの弱学習器とバグレポートの組み合わせでも8割程度の精度が得られることが分かった

直面した課題

  • ユーザーストーリーに沿って資料を修正したが、ユーザー(聞き手)の疑問に答える資料としてはまだ不十分
    • 想定される質問を事前に考え、その疑問に答えるような内容に変更する必要がある

来週の計画

  • 改めて資料を修正する
  • ODC分類のimpact属性以外の属性の分類手法についても調査
  • バグレポートのテキストのみで実用的なODC分類ができるのかどうかを確認したい