AI資格ドリル

G検定 大項目7 AIの社会実装に向けて 予想問題と解説

G検定大項目7 AIの社会実装に向けて」の予想問題を11、各問の完全解説つきで掲載しています。全問オリジナル自作・公式シラバス準拠です。

この分野で問われる主な論点
  • AIプロジェクトの進め方
  • データの整備と運用
  • AIの説明性・公平性

間違えやすいポイント(作問者分析)

当サイトの作問時に観察した、取り違えやすい論点です(公式の統計ではありません)。

  • CRISP-DM(進め方の枠組み)とPoC(概念実証)の役割の取り違え。
  • データリーケージ(学習・評価データに正解情報が混入する事故)の見落とし。
  • 説明可能AI(XAI)・公平性・透明性など、近い概念の取り違え。
1 ・ AIプロジェクトの進め方

データ分析やデータマイニングのプロジェクトを、「業務理解」「データ理解」「データ準備」「モデリング」「評価」「展開」の6つの段階に分けて反復的に進める、代表的なプロセスモデルはどれか。

  • PoC
  • MLOps
  • CRISP-DM正解
  • BPR
解説

「業務理解→データ理解→データ準備→モデリング→評価→展開」の6段階を反復しながら進めるデータ分析・データマイニングの標準プロセスがCRISP-DMである。BPRは業務プロセスそのものを抜本的に作り直す経営手法で、データ分析の工程モデルではない。MLOpsは機械学習モデルを本番で継続的に運用・再学習し続けるための方法論。PoCは本格開発前に実現可能性を小規模に検証する取り組みで、6段階の工程モデル全体を指す言葉ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

2 ・ AIプロジェクトの進め方

AI開発を本格的に始める前に、想定した手法で目的が達成できそうかを小規模な試作・実験を通じて検証する取り組みを指す用語はどれか。

  • PoC正解
  • BPR
  • 概念ドリフト
  • オープンデータ
解説

本格的な開発投資に入る前に、想定した手法で目的を達成できそうかを小規模な試作・実験で確かめる取り組みがPoC(概念実証)である。BPRは業務の流れを抜本的に再設計する手法。概念ドリフトは運用中に入力データの傾向が変化してモデルの精度が下がる現象。オープンデータは誰でも自由に利用・再配布できる形で公開されたデータで、いずれも事前の実現可能性検証を指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

3 ・ AIプロジェクトの進め方

AI導入の効果を最大化するために、既存の手順を部分的に改善するのではなく、業務の流れそのものを抜本的に作り直す取り組みを表す用語はどれか。

  • Webスクレイピング
  • BPR正解
  • CRISP-DM
  • クラウド
解説

既存手順の部分改善にとどめず、業務の流れ自体をゼロベースで作り直す取り組みがBPR(ビジネスプロセス・リエンジニアリング)であり、AI導入効果を最大化する前提として重視される。CRISP-DMはデータ分析プロジェクトの6段階の工程モデル。Webスクレイピングはウェブ上の情報をプログラムで自動収集する手法。クラウドは計算資源をネットワーク越しに利用する形態で、いずれも業務プロセスの抜本的再構築を指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

4 ・ データの整備と運用

教師あり学習で用いるデータを準備する際、個々の画像やテキストに正解となるラベルやタグを付与していく作業を指す用語はどれか。

  • アノテーション正解
  • データの加工・前処理
  • Webスクレイピング
  • オープンデータ
解説

教師あり学習で使うデータの一つひとつに、正解となるラベルやタグを付けていく作業がアノテーションである。オープンデータは自由に使える形で公開されたデータ。Webスクレイピングはウェブ上の情報を自動的に抽出して集める収集手法。データの加工・前処理は欠損値処理や正規化などデータを整える工程であり、正解ラベルを付与する作業そのものではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

5 ・ データの整備と運用

個人データを扱うシステムについて、運用が始まってからの事後対応に頼るのではなく、企画・設計の最初の段階から情報保護の仕組みをあらかじめ組み込んでおく考え方を表す用語はどれか。

  • アカウンタビリティ
  • データの加工・前処理
  • プライバシー・バイ・デザイン正解
  • 概念ドリフト
解説

システムやサービスの企画・設計の最初の段階から、あらかじめ個人情報の保護を組み込んでおく考え方がプライバシー・バイ・デザインである。データの加工・前処理はデータを整える工程、アカウンタビリティ(説明責任)はAIの判断について説明する責任、概念ドリフトは運用中にデータ傾向が変わり精度が下がる現象で、いずれも設計段階からの保護の作り込みを指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

6 ・ データの整備と運用

機械学習モデルの開発から本番環境へのデプロイ、運用、再学習までの一連の流れを、継続的かつ効率的に回し続けて安定稼働させるための仕組みや方法論を指す用語はどれか。

  • BPR
  • 概念ドリフト
  • CRISP-DM
  • MLOps正解
解説

機械学習モデルの開発・デプロイ・運用・再学習までを継続的かつ効率的に回し、本番環境で安定稼働させ続けるための仕組み・方法論がMLOpsである。CRISP-DMはデータ分析の6段階の工程モデルで、本番運用を継続的に回す枠組みではない。概念ドリフトは運用中に精度が劣化する現象そのもの。BPRは業務プロセスの抜本的再設計で、いずれもモデルの継続的な運用基盤を指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

7 ・ AIの説明性・公平性

ディープラーニングなどで予測の根拠が人間に分かりにくくなる問題に対し、モデルがなぜその結論を出したのかを人が理解できる形で示そうとする技術や研究分野を指す用語はどれか。

  • フィルターバブル
  • 敵対的サンプル
  • 説明可能AI正解
  • 概念ドリフト
解説

ディープラーニングなどで判断根拠がブラックボックス化する問題に対し、モデルが結論に至った理由を人間が理解できる形で示そうとする技術・研究分野が説明可能AI(XAI)である。敵対的サンプルはモデルを誤認識させるよう微小な変化を加えた入力。フィルターバブルは好みに合う情報ばかりに囲まれる状態。概念ドリフトは運用中に精度が下がる現象で、いずれも判断根拠の解釈性を高める取り組みを指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

8 ・ AIの説明性・公平性

画像などの入力データに、人間にはほとんど気づけないわずかな変化を意図的に加えることで、AIモデルに誤った認識をさせる入力を指す用語はどれか。

  • オープンデータ
  • フィルターバブル
  • 敵対的サンプル正解
  • 概念ドリフト
解説

人間にはほとんど気づけないわずかな変化を入力に意図的に加え、AIモデルに誤った認識をさせる入力が敵対的サンプル(Adversarial Examples)である。フィルターバブルは推薦により好みに合う情報だけに囲まれる状態。概念ドリフトは運用中にデータ傾向が変化して精度が下がる現象。オープンデータは自由に利用できる公開データで、いずれもモデルを欺く加工入力を指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

9 ・ AIの説明性・公平性

検索やSNSの推薦アルゴリズムが利用者の好みに合う情報ばかりを優先表示する結果、自分の関心に近い情報だけに囲まれ、異なる視点に触れにくくなる状態を指す用語はどれか。

  • 敵対的サンプル
  • フィルターバブル正解
  • アノテーション
  • 概念ドリフト
解説

検索やSNSの推薦アルゴリズムが利用者の好みに合う情報を優先表示し続けた結果、自分の関心に近い情報だけに囲まれて異なる視点に触れにくくなる状態がフィルターバブルである。敵対的サンプルはモデルを誤認識させる加工入力。概念ドリフトは運用中に精度が下がる現象。アノテーションはデータに正解ラベルを付ける作業で、いずれも情報の偏った囲い込みを指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

10 ・ AIプロジェクトの進め方

Webサービスの改善で、ボタンの配置が異なる2種類の画面を用意し、訪問してきた利用者を無作為に2つのグループへ振り分けてそれぞれに表示し、購入率などの成果指標がどちらで高くなるかを実際の利用者の反応で比較する検証手法はどれか。

  • CRISP-DM
  • Webスクレイピング
  • PoC(概念実証)
  • A/Bテスト正解
解説

正解はA/Bテスト。2つの案を実際の利用者に無作為に振り分けて表示し、成果指標(購入率など)がどちらで高いかを比較する検証手法である。PoC(概念実証)は本格開発の前に実現可能性を小規模に確かめる取り組みで、2案の優劣を実利用者で比べるものではない。Webスクレイピングはウェブ上の情報をプログラムで自動収集する手法、CRISP-DMはデータ分析を6段階で進める工程モデルであり、いずれも2案を同時に比較して優劣を判定する手法ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)

11 ・ データの整備と運用

学習に用いたデータに、本来は予測の時点で知り得ないはずの正解に関わる情報が紛れ込んでいたため、検証では極めて高い精度が出たのに、本番運用ではまったく精度が出なかった。この原因となる問題を指す用語はどれか。

  • データの品質
  • 概念ドリフト
  • データの加工・前処理
  • データリーケージ正解
解説

正解はデータリーケージ。本来は予測時点で得られないはずの正解に関わる情報が学習データ(特徴量)に紛れ込み、検証では高精度に見えても本番運用で性能が出なくなる問題である。概念ドリフトは運用中に入力データの傾向が変化して精度が下がる現象、データの品質はデータの正確さや目的への適合の度合い、データの加工・前処理はデータを整える工程であり、いずれも正解情報の漏れ込みによって見かけ上だけ高精度になる問題を指す語ではない。

https://www.jdla.org/certificate/general/ (大項目7 AIの社会実装に向けて)