名古屋工業大学 大囿研究室
Ozono Laboratory, Nagoya Institute of Technology

AI for Social Issues



メンバー

Florence, Ebrima, 姜, 小森, 黄, 中村, IZZUDDIN, Abdulmalik, 赫

概要

人工知能(AI)のビジネスへの応用が話題になっています.製造業から保険業に至るまで,人工知能を活用する方法を導入しており,時には機械学習のような他の新興テクノロジーと併用しています.ビジネスだけでなく,AIは現実の社会的課題にも大きな影響を与え,さまざまな社会問題に価値ある解決策をもたらす可能性があります.私たちの研究室では,今日世界が直面している解決不可能と思われる社会的危機に立ち向かうために,AIの革新的な応用をどのように利用できるかを考えるプロジェクトもあります.

そのひとつが,デジタル脅威から社会を守るために、インテリジェントシステムを責任を持って適用する方法を探求しています。現在進行中のプロジェクトの一つは、刑事司法におけるビデオ証拠の検証を支援するためのAIベースのディープフェイク検出システムの開発に焦点を当てています。 敵対的生成ネットワーク(GAN)などの深層学習モデルを用いて作成されるディープフェイクは、非常にリアルで説得力のある偽造ビデオを生成することができます。これらの操作されたビデオは、誤情報キャンペーン、風評被害、法的証拠の改ざんなど、悪意のある目的で使用されるケースが増えています。本研究では、監視カメラ映像のような低画質の状況下でもビデオをフレームごとに分析し、高い信頼性で真正性を判断できる堅牢な検出パイプラインを開発しています。 このシステムは、ディープフェイク検出モデルと説明可能なAI技術を適用し、各フレームが操作されている可能性を評価することで機能します。図に示すように、提案システムは入力ビデオクリップを処理し、フレームレベルの偽造確率を生成します。例えば、このシステムは5秒時点で偽造動画の96.87%を偽物と正しく識別し、信頼度閾値を明確に上回りました。さらに、各フレームにおける操作された領域を強調表示するヒートマップが生成され、法医学的分析を支援する視覚的な説明を提供します。 この研究は、法執行機関や法医学の専門家に、視覚的証拠の信頼性の高いスクリーニングを支援する、解釈可能で透明性のあるツールを提供することで、犯罪捜査や司法手続きにおいて真正な映像資料のみが使用されるようにすることを目的としています.

もう一つの研究は,構造化されていないプロジェクト文書から遅延リスク源を検出するために,トランスフォーマーからの双方向エンコーダ表現を用いた質問と回答の自然言語処理技術を利用することです.建設プロジェクトにおける遅延リスクは,公共部門が経験する世界的な現象の一つであり,社会経済的な課題を引き起こしています.本研究の主な目的は,このリスクを発生前に予測・分析できる人工知能(AI)システムを構築することで,この課題を根絶することです.

もう一つの研究は,小規模アパレル店舗におけるPOP(Point of Purchase)作成支援を目的とし,想定顧客の具体化と文章表現の発想を支援するAIシステムの構築を試みたものです.大規模言語モデル(LLM)を活用し,質問応答による顧客像の明確化,文体変更や言い換えによる表現改善,そして複数の視点からの自動評価を通じて,非専門家でも訴求力の高いPOPを作成できるよう支援します.評価実験の結果,本システムを用いることでPOPの魅力が大幅に向上することが示されました.

最後の研究は,日本に留学する外国人学生には「言葉の壁」の問題があると言える.日本語の複雑さには,複数の形式レベルがあり, それぞれが独自のルールやニュアンスなどに支配されている.日本語テキスト処理の様々な側面を扱うために設計された多機能モデルシステムを開発し,ファインチューニングすることである.本研究では,特定のタスクに特化した 異なるモデルを統合し,様々な日本語テキストの生成と翻訳のための総合的な解決を提供する.これらの特化されたモデルの長所を活用することで,システムはその出力において高品質な日本語と文脈の関連性を達成することを目指す.