新規案件リスク予想の手法と根拠

JODAの「新規案件リスク予想」は、過去20年間のJICA事後評価報告書という「定性的知見」と、世界銀行のマクロ経済指標という「定量的コンテキスト」を統合したデータ駆動型の推論エンジンです。リスクの予測に加え、類似案件の「提言」テキストから具体的な対策を構造化抽出するEvidence-Based Countermeasuresエンジンを搭載しています。本ページでは、その内部で稼働する分析パイプラインの詳細なアルゴリズムと、背後にある論理的思考について詳述します。

📊 1. 使用している公的データソース

JICA事後評価報告書

JICAが公表している事後評価の全文テキスト。30カ国・2,379件の報告書から「教訓」「提言」を抽出し、プロジェクトの成否を分けた決定的な要因を「リスク特徴量」として定量化。さらに提言テキストから対策アクションを構造化抽出しています。

世界銀行 WDI / WGI

対象国の7次元マクロ指標：一人当たりGDP、貿易/GDP比率、汚職抑制度、法の支配、政治安定性、電化率、平均寿命。プロジェクト当時の「外部環境」を客観的に定義するために使用します。

IMF世界経済見通し (WEO)

ターゲット国の将来GDP成長率予測（〜2031年）。「案件開始予定年」を指定したProspective Matching（将来のマクロ環境を推計してマッチング）に使用します。

⚙️ 2. 分析パイプラインとアルゴリズムの詳細

Step 01:定性的知見の定量化（NLP Feature Engineering + TF-IDF）

第一のステップは、非構造化データである報告書テキストを、コンピュータが処理可能な「数値ベクトル」へ変換する工程です。 JODAでは、国際協力の文脈に特化した独自構成のドメイン固有シソーラス（類語辞典）を構築しています。

形態素解析によって抽出された単語群に対し、シソーラスを用いた概念マッチングを行い、「土地収用」「予算管理」「遅延」「ガバナンス」「維持管理体制」「外部要因」の6つのリスク軸における出現頻度密度（TF: Term Frequency）を算出します。

単純な出現頻度に加えて**TF-IDF（Term Frequency - Inverse Document Frequency）**による再重み付けを行うことで、ほぼ全ての報告書に出現する一般的なリスク（例：遅延）の重みを自動的に下げ、特定の報告書でのみ顕著なリスク（例：土地収用）の重みを引き上げ、各案件の「本質的な主要リスク」を正確に判定しています。

💡 【初学者向け補記：TF-IDFとは？】

例えば「遅延」という言葉はほとんどの報告書に出てきます。一方「土地収用」はごく一部の報告書にしか出てきません。 TF-IDFは「珍しい言葉ほど重要」という考え方に基づき、ありふれた言葉の影響を自動的に減らしてくれる数学的手法です。これにより「本当にこのプロジェクト特有の問題は何だったのか」をより正確に見抜けるようになりました。

Step 01b:セクター・スキーム情報の2階層構造化

各案件のセクター分類はJICA原分類（約72種）をそのまま保持し、それを11の大分類（交通・運輸、エネルギー、上下水道・衛生等）にマッピングする2階層構造で管理しています。これにより、例えば「交通・運輸セクター全般」での傾向を見つつ、「道路」「鉄道」「港湾」といった小分類レベルまでドリルダウンして、精緻な類似案件マッチングが可能になっています。

また、案件のスキーム（有償資金協力・無償資金協力・技術協力）も検索条件に追加しています。有償資金協力（大規模インフラ）と技術協力（知識移転）ではリスクの構造が根本的に異なるため、スキーム情報を考慮することでマッチング精度が向上します。

Step 02:マクロ・コンテキストの7次元ベクトル化（Spatio-Temporal Alignment）

第二のステップでは、プロジェクトが行われた当時の「国の状況」を客観的に定義します。リスクの顕在化パターンは、その国の一人当たりGDPや政府の有効性（Governance）と密接な相関があるため、世界銀行のWDI/WGI指標を用いて7次元の「マクロ環境ベクトル」を構成します。

💰 1人当たりGDP

🌍 貿易/GDP比率

⚖️ 汚職抑制度

📜 法の支配

🕊️ 政治安定性

⚡ 電化率

❤️ 平均寿命

ここで重要なのは「時系列の同期」です。「2005年のベトナム」と「2024年のベトナム」ではリスクの質が異なるため、過去の各プロジェクトに対し、それが評価された「その当時の年」のマクロデータを紐付けます。各指標は単位が異なるため（ドル、パーセント、指数等）、Z-score正規化を適用し、全ての指標を共通空間にマッピングします。

💡 【初学者向け補記：なぜ7次元もの指標を使うのか？】

GDPだけで国の状況を判断するのは「体重だけで健康を判断する」ようなものです。法の支配や政治安定性など複数の指標を使うことで、「経済水準は似ているが政治的に不安定」といった違いも見分けられるようになり、より正確な「双子」を見つけられます。

Step 03:類似度計量と証拠の転移推論（Similarity Metric & Evidence Transfer）

第三のステップでは、現在の対象国 $V_{target}$ に最も近い「過去の統計上の双子（Macro Twins）」を、7次元空間上のユークリッド距離に基づいて特定します。

$d(p, q) = \sqrt{\frac{1}{n}\sum_{i=1}^{n} (p_i - q_i)^2}$

特定された Top-K 個の類似事例から、「どのようなリスクが高頻度で発生していたか」を抽出し、条件付き確率 $P(\text{Risk} | \text{Macro Context, Sector, Scheme})$ を推計します。セクター小分類やスキームもマッチング条件に含めることで、推定精度を高めています。

💡 【初学者向け補記：似た国を探して何がわかるのか？】

これは「過去の先輩たちの経験を、状況が一番似ている人から順に聞きに行く」という作業をコンピュータで行っているようなものです。「同じ分野（道路なら道路、教育なら教育）で、同じ種類の支援（有償なら有償）をした先輩から聞く」ことで、実効性の高い推論を行います。

Step 04:対策提案の構造化抽出（Evidence-Based Countermeasures）

「リスクの警告」に加え、類似案件の提言（recommendations）テキストから具体的な対策アクションを構造化抽出します。

JICA事後評価報告書の提言セクションには、「〜する必要がある」「〜すべきである」「〜が求められる」といった文型で、具体的な改善アクションが記されています。 JODAはルールベースの自然言語処理パターンでこれらを自動的に検出し、以下の7カテゴリに分類します：

👥 人材育成・技術移転

📋 制度・ガイドライン整備

💰 資金・予算確保

📊 計画・モニタリング強化

🤝 ステークホルダー連携

🔧 維持管理体制構築

⚠️ リスク管理・社会配慮

さらに、各対策の信頼性を裏付けるため、その対策が導出された案件の総合評価レーティング（A〜D）を照合しています。全2,379件中928件からレーティングの抽出に成功しており、評価Aの案件由来の対策が最優先で表示されます。これにより、実績のある対策を優先的に参考にできるようになっています。

💡 【初学者向け補記：なぜ対策の提案までできるのか？】

「過去にこういう失敗がありました」と警告するだけでなく、「その失敗に対して、成功した案件ではこういう対策をとっていました」と具体的な解決策まで提示します。しかも評価が高かった案件（A評価やB評価）からの対策を優先的に見せることで、「実績のある対策」を参考にできます。これは図書館で関連書籍を探すだけでなく、「最も評判の良い本のアドバイス」を先に見せてくれるようなものです。

Step 05:将来予測マッチング（Prospective Matching with IMF WEO）

案件開始予定年（2026〜2031年）を指定した場合、IMFの世界経済見通し（WEO）から対象国のGDP成長率予測を取得し、将来のGDPを推計します。ガバナンス指標など急変しにくい指標は現在値を据え置き、経済水準のみ将来推計するハイブリッド方式を採用しています。

これにより、「3年後のこの国の経済規模は、かつてのどの国のどの時期に相当するか」というWhat-ifシナリオ分析を行い、将来見込まれるリスクを推計します。

💡 もっとわかりやすく言うと... 【図解でわかるリスク予想の仕組み】

⚖️ 3. 手法の限界と科学的誠実性

本モデルは、統計的な「傾向」を示すものであり、特定の案件が必ずその通りになることを断定するものではありません。特に「現場固有の人間関係」「突発的な政治変動」など、マクロ指標や過去のレポートには表れにくい要因については、利用者の皆様による補完的な判断が不可欠です。

対策提案についても、類似案件の提言からルールベースで抽出したものであり、必ずしもターゲット国の文脈に完全に適合するとは限りません。実施にあたっては、現地の制度・慣行を踏まえた適応が必要です。

🚀 4. 現状のシステム制約と将来の展望

本ツールを活用し、より精緻な案件形成を行うため、システム内部を説明する際に留意すべき現在の論理的・リソース的な制約事項を網羅的に記載します。

⚠️ 【重要なシステム制約・完全には実行できていない点】

① 古いPDFデータの抽出欠損（教訓テキストの網羅性）: 20年前の評価レポート等は単なるスキャン画像（非テキスト）であったり、フォーマット化された「教訓」の章が存在しないため、NLP（自然言語処理）エンジンが原文抜粋を取得できず（欠損）、リスク名だけがマッピングされる事例が混在しています。
② 対策ヒューリスティックの限界: 現在の「予測リスク」と「対策提案」の紐付けは、UIフロントエンドでの高度なキーワードマッチング（ルールベース）に依存しています。LLMを用いた意味論的な（セマンティック）完全一致推論を全件リアルタイムで実行するには、計算コストとレスポンス時間の壁があり実現していません。
③ 定的バッチ処理によるタイムラグ（リソース制限）: ユーザーの操作のたびに数千件の全レポートをAIに再読解させることはコスト的に不可能なため、事前にバッチ処理で生成された「静的なデータベース（risk_predictions.json）」を用いて表示しています。リアルタイムな動的解析ではありません。
④ マクロデータの解像度と遅行性: 世界銀行データ（WDI）は年次ごとの集計であり、通常1〜2年の公開ラグがあるため、直近数ヶ月の急激な政変などをアルゴリズムがリアルタイムで検知・反映することは構造上不可能です。

これらの制約を踏まえ、今後は以下の技術的拡張（Future Prospects）を計画しています：

大規模言語モデル（LLM）の動的RAG（Retrieval-Augmented Generation）導入による、欠損した教訓テキストの本文全体からの強制要約抽出
クロスカントリー・ベストプラクティスの自動検出（「ある国の失敗を、別の国の成功事例で解決する」パス推薦）と意味論的対策マッチング
リアルタイムなニュース・SNSデータの解析を取り入れた動的リスクの補完検知
スキーム別のマッチング重み付け（現在のフィルター方式から、スキーム特性を考慮した距離計量への進化）

タンザニア