1 research outputs found

    Improving the efficiency of software defect fixing based on machine learning

    Get PDF
    本論文は、オープンソースソフトウェア(OSS Open Source Software)を用いた大規模ソフトウェア開発の不具合修正作業の効率化を目的として、不具合票の自動分類システムによるバグトリアージの効率化手法、およびログ異常検出によるバグ解析の効率化手法を提案する.(1) 不具合票の自動分類システムによるバグトリアージの効率化OSSを利用したソフトウェア開発では、報告された不具合に対して適切な担当カテゴリへの分類を素早く行うことが求められる.本論文では、不具合報告のコメントを転移学習したBERTモデルによって担当カテゴリへの分類を行う手法を提案した.OSSプロジェクトの不具合報告を対象とした実験の結果、約87%の精度、約86%の再現率で不具合を各製品のカテゴリに分類することができた.また、BERTモデルの自己注意層の可視化では、モデルが製品に関連する語彙に対して強い注意を向けて判断を行っていることが示唆された.(2) ログ異常検出によるバグ解析の効率化 近年、ソフトウェアシステムの複雑化・大規模化に伴い、実行時に収集されるログデータが膨大になり、その把握が困難になっている.不具合修正作業では、大量のログデータから不具合原因の手がかりとなる部分のみを抽出することで作業時間の大幅な短縮が期待される.本研究では、システムが正常に動作している際のログのパターンを機械学習手法に学習させ、テストデータから異常なパターンのログメッセージを抽出する方法を提案する.ログメッセージの分散表現に基づく異常検出手法では、提案手法はベースラインを上回るAUC値を達成し、再現率において約7%の改善がみられた.また、ログの時間パターンに基づく異常検出手法では、提案手法はベースライン手法と比較して、学習データ量の変化にロバストな異常検出を行えることが分かった.空間プーリングによる大規模ログの異常検出では、提案手法は学習データ量が極端に少ない場合には深層教師あり学習手法を上回る精度を持ち、データ量の変化に対しても高い水準の検出精度を維持できることが分かった.九州工業大学博士学位論文 学位記番号: 工博甲第552号 学位授与年月日: 令和4年3月25日第1章 序論|第2章 深層自然言語処理モデルに基づく不具合票の分類と可視化|第3章 分散表現のワンクラス学習に基づくログデータの異常検出|第4章 時間記憶に基づくログデータの異常検出|第5章 空間プーリングに基づくログデータの異常検出|第6章 結論九州工業大学令和3年
    corecore