MENU
知識がなくても始められる、AIと共にある豊かな毎日。
AIコーディング

AIF-C01 Domain 1 完全攻略 — AI/ML 基礎と ML ライフサイクルで 20% を取る

ゲンキ

AIF-C01 Domain 1 完全攻略 — AI/ML 基礎と ML ライフサイクルで 20% を取る

AIF-C01(AWS Certified AI Practitioner)の Domain 1「Fundamentals of AI and ML」は、配点 20% を占める土台のドメインだ。AI・機械学習・深層学習の概念整理、学習タイプの使い分け、そして ML 開発ライフサイクルの全工程。ここで問われる知識は Domain 2 以降のすべての前提になるため、最初に固めておくと後半の学習速度が大きく変わる。本記事は公式試験ガイドの 3 つのタスクステートメント(1.1〜1.3)に沿って、出題範囲を網羅的に解説する。

試験全体の仕様と学習計画はAWS AI Practitioner AIF-C01 完全攻略入門(2026-06-08 公開)で整理した。本記事はその各論第一弾にあたる。

忍者AdMax

Domain 1 の全体像 — 3 つのタスクステートメント

公式試験ガイドによれば、Domain 1 は次の 3 つのタスクステートメントで構成される。

タスク公式名中核テーマ
1.1Explain basic AI concepts & terminologiesAI/ML/DL の概念と用語、推論形態、データ種別、学習 3 タイプ
1.2Identify practical use cases for AIAI の適用判断、ML 手法の選択、実世界ユースケース
1.3Describe the ML development lifecycleML パイプライン 9 工程、AWS サービス対応、MLOps、評価指標

この構成が示す通り、Domain 1 は「アルゴリズムを実装できるか」ではなく「概念を正しく区別し、ビジネス課題に対応付けられるか」を問う。数式は出ない。その代わり、「教師あり学習と教師なし学習の違いを説明せよ」「このシナリオに適した ML 手法はどれか」という判断問題が並ぶ。

AIF-C01 の合格を左右する Domain 2・3(合計 52%)も、ここで学ぶ用語の上に成り立っている。たとえば基盤モデルのファインチューニングは「教師あり学習」の一形態であり、RAG の埋め込み検索は「非構造化データのベクトル化」だ。Domain 1 の概念が腹落ちしていれば、生成 AI ドメインの暗記量は確実に減る。

AI・ML・深層学習・生成 AI の入れ子構造

タスク 1.1 の最初の論点は、AI を構成する概念の階層関係だ。試験では「AI と ML の違い」「DL と生成 AI の関係」を選ばせる問題が出る。

整理はシンプルでいい。AI(人工知能) が最も広い傘で、ルールベースのエキスパートシステムも含む「人間の知的タスクを機械で実現する技術全般」。その部分集合が ML(機械学習) で、「ルールを人間が書くのではなく、データからパターンを学習させる」アプローチを指す。さらにその部分集合が 深層学習(ディープラーニング) で、多層ニューラルネットワークを使う ML の一手法。そして 生成 AI は、深層学習の中でも「新しいコンテンツを生成する」モデル群(LLM、画像生成モデル等)を指す。

この入れ子をシナリオに適用できるかが問われる。「IF-THEN ルールで完結する与信判定」は AI ではあるが ML ではない。「売上データから回帰式を学習する」のは ML だが深層学習とは限らない。「契約書の要約を生成する」のは生成 AI であり、同時に深層学習・ML・AI のすべてに属する。

合わせて、タスク 1.1 の用語リストには バイアス(学習データの偏りが予測に反映される現象)、公平性(属性によって予測品質が偏らないこと)、フィット(過学習・過小学習を含むモデルとデータの適合度)、LLM(大規模言語モデル)が明示されている。それぞれ一行で説明できる状態にしておきたい。過学習(オーバーフィッティング)は「訓練データに適合しすぎて未知データで精度が落ちる状態」、過小学習(アンダーフィッティング)は「モデルが単純すぎて訓練データすら捉えられない状態」。この対比は頻出だ。

推論の 2 形態とデータの種類

タスク 1.1 の後半は、推論(インファレンス)とデータの分類を扱う。地味だが、matching 形式の問題で確実に出る領域だ。

推論の 2 形態はこう区別する。

  • リアルタイム推論: リクエストごとに即座に応答を返す。チャットボット、不正検出、レコメンデーションなど、低レイテンシが要件の場面で使う
  • バッチ推論: 大量データをまとめて処理する。夜間の需要予測、月次のチャーン(解約)予測など、即時性が不要でコスト効率を優先する場面で使う

「即時応答が必要か」「コストを抑えたいか」という軸で選ばせるシナリオ問題が典型だ。リアルタイム推論はエンドポイントを常時稼働させるため費用がかかり続ける。バッチ推論は処理時だけリソースを使う。この対比は AWS のサービス設計(SageMaker AI のリアルタイムエンドポイント vs バッチ変換)にそのまま反映されている。

データの種類は 2 軸で整理する。第一軸は構造: 行と列で表せる構造化データ(表形式・時系列)と、そのままでは表にならない非構造化データ(画像・テキスト・音声)。第二軸はラベル: 正解付きのラベル付きデータと、正解なしのラベルなしデータ。教師あり学習にはラベル付きデータが必須で、ラベル付けには人手のコストがかかる。この「ラベルの有無が学習手法を決める」という連結が、次のセクションへの橋になる。

学習の 3 タイプ — 教師あり・教師なし・強化学習

ML の学習タイプは 3 つ。試験では定義の暗記ではなく、シナリオからの判別が問われる。

教師あり学習(Supervised Learning) は、ラベル付きデータから入力と正解の対応を学ぶ。住宅価格の予測(回帰)、スパムメールの判定(分類)が典型だ。「過去の正解データがある」「予測したい値が明確」ならまず教師あり学習を疑う。

教師なし学習(Unsupervised Learning) は、ラベルなしデータから構造やパターンを発見する。顧客セグメンテーション(クラスタリング)、異常検知、次元削減が代表例。「正解はないが、データの中のグループや外れ値を見つけたい」場面で選ぶ。

強化学習(Reinforcement Learning) は、環境との試行錯誤を通じて報酬を最大化する行動方針を学ぶ。ロボット制御、ゲーム AI、そして AWS のサービスでは AWS DeepRacer が教材として知られる。「正解データではなく、行動と報酬のフィードバックループで学ぶ」という構造が判別ポイントだ。

ordering / matching 形式への備えとしては、「シナリオ → 学習タイプ → 代表手法」の 3 段マッピングを作っておくといい。「ECサイトの顧客を購買傾向でグループ分けしたい → 教師なし → クラスタリング」「来月の電力需要を予測したい → 教師あり → 回帰」。この変換が 3 秒でできれば、Domain 1 の判別問題は得点源になる。

AI を使うべき場面・使わないべき場面

タスク 1.2 で最も特徴的なのが、「AI/ML ソリューションが適切でない場面の判断」が公式に出題範囲へ含まれている点だ。AI 推進の資格でありながら、適用しない判断を問う。ここに AIF-C01 の設計思想が表れている。

AI/ML が価値を発揮するのは、公式ガイドの例示によれば「人間の意思決定の補助」「ソリューションのスケーラビリティ確保」「自動化」だ。大量データのパターン認識、人間では処理しきれない規模のパーソナライゼーション、24 時間稼働の監視。こうした場面では AI が費用対効果で勝つ。

一方、AI/ML を避けるべき判断基準は 2 つ示されている。第一に費用対効果が合わない場合。モデル開発・学習・運用のコストが、得られる価値を上回るなら、シンプルなルールベースで十分だ。第二に予測ではなく確定的な結果が必要な場合。税額計算、在庫の引き当て、規制上の判定など、「確率的に 95% 正しい」では許されない処理に ML を使ってはならない。決定論的なロジックで書けるものは、そのまま書くのが正解だ。

この判断軸は実務でもそのまま使える。試験対策としては、「確定結果が必要 → ML 不適」「明文化できるルールで完結 → ML 不要」「パターンが複雑でルール化困難 + 誤差許容 → ML 適合」という 3 分岐を覚えておけば、該当問題はほぼ機械的に解ける。

ML 手法の選択 — 回帰・分類・クラスタリング

タスク 1.2 のもう 1 つの柱が、ユースケースに対する ML 手法の選択だ。試験ガイドは回帰・分類・クラスタリングの 3 手法を明示している。

手法出力学習タイプ典型ユースケース
回帰(Regression)連続値教師あり価格予測、需要予測、所要時間推定
分類(Classification)カテゴリ教師ありスパム判定、不正検出、画像のラベル付け
クラスタリング(Clustering)グループ教師なし顧客セグメンテーション、類似文書のグループ化

判別のコツは「出力が何か」を最初に問うことだ。数値を当てるなら回帰、カテゴリに振り分けるなら分類、正解なしでグループを作るならクラスタリング。「不正取引の検出」は一見特殊に見えるが、出力は「不正 / 正常」の 2 カテゴリなので分類問題だ。「顧客の生涯価値の推定」は金額という連続値なので回帰になる。

3D プリントの文脈に置き換えると理解が速い。印刷失敗(スパゲッティ化)の検出はカメラ画像を「正常 / 失敗」に振り分ける分類。印刷時間の予測はモデル形状やレイヤー数から連続値を推定する回帰。フィラメントの使用傾向によるユーザーグループ分けはクラスタリング。AI外観検査 3Dプリントで「目視」を卒業する(2026-03-01 公開)で扱った YOLO ベースの欠陥検出は、まさに分類(+ 物体検出)の実装例だ。

実世界ユースケースと AWS AI サービスのマッピング

タスク 1.2 の仕上げは、実世界の AI 応用例と AWS マネージドサービスの対応付けだ。公式ガイドが挙げる応用領域は、コンピュータビジョン、NLP、音声認識、レコメンデーション、不正検出、予測(フォーキャスティング)。これらに対応する AWS サービスを一対一で押さえる。

応用領域AWS サービス機能
画像・動画分析Amazon Rekognition物体検出、顔分析、カスタムラベル
自然言語処理Amazon Comprehend感情分析、エンティティ抽出、トピック分類
音声→テキストAmazon Transcribe文字起こし、話者識別
テキスト→音声Amazon Polly音声合成
翻訳Amazon Translateニューラル機械翻訳
対話ボットAmazon Lex音声・テキストの対話インターフェース
文書からの抽出Amazon TextractOCR + フォーム・表の構造抽出
社内検索Amazon Kendraセマンティック検索
レコメンデーションAmazon Personalizeパーソナライズされた推薦

matching 形式で最も狙われやすいのがこの表だ。紛らわしいペアを重点的に区別する。Transcribe(音声→文字)と Polly(文字→音声)は方向が逆。Comprehend(意味の分析)と Textract(文書画像からの抽出)は対象が違う。Kendra(検索)と Personalize(推薦)は「ユーザーが探す」か「システムが薦める」かで分かれる。

これらのマネージドサービスに共通する設計思想は「ML の専門知識なしで API 呼び出しだけで使える」点だ。自前でモデルを学習する SageMaker AI との対比、つまり「まずマネージド AI サービスで足りるか検討し、足りなければ SageMaker AI でカスタムモデルを作る」という選択順序は、Domain 1 と Domain 3 をまたいで繰り返し登場する。

ML 開発ライフサイクル — 公式例示の 9 工程

タスク 1.3 の中心は ML 開発ライフサイクルだ。公式ガイドは ML パイプラインの構成要素として 9 つを例示している。ordering 形式で順序を問われる最有力候補なので、流れで覚える。

  1. データ収集: 学習に使うデータを集める
  2. 探索的データ分析(EDA): 分布・欠損・相関を可視化して データを理解する
  3. データ前処理: 欠損値処理、正規化、外れ値除去
  4. 特徴量エンジニアリング: 生データから予測に効く特徴量を設計する
  5. モデル学習: アルゴリズムにデータを与えて学習させる
  6. ハイパーパラメータ調整: 学習率や木の深さ等、学習の挙動を制御する設定値を最適化する
  7. 評価: テストデータで性能を測る
  8. デプロイ: 本番環境に推論エンドポイントとして配置する
  9. 監視: 本番での精度劣化やドリフトを検出し続ける

重要なのは、これが一方通行ではなく循環する点だ。監視で精度劣化を検出したら、新しいデータで再学習し、再デプロイする。この循環を自動化・体系化する考え方が MLOps で、ソフトウェア開発における DevOps の ML 版にあたる。バージョン管理、自動再学習、デプロイの自動化、モデルの系譜管理が含まれる。

順序問題でよく混同されるのは EDA と前処理の位置(理解してから加工する、の順)と、ハイパーパラメータ調整の位置(学習と評価の間で反復する)だ。「収集 → 理解 → 加工 → 設計 → 学習 → 調整 → 評価 → 配置 → 監視」という 9 拍子のリズムで音読しておくと、本番で並べ替えに迷わない。

SageMaker AI ファミリーと工程の対応

ライフサイクルの各工程には、対応する AWS サービスがある。公式ガイドが例示するのは Amazon SageMaker AI とそのコンポーネント群だ。現行の公式名称は「Amazon SageMaker AI」で、ML モデルの構築・学習・デプロイを一気通貫で担う統合プラットフォームを指す。

工程SageMaker AI コンポーネント役割
前処理SageMaker Data WranglerGUI ベースのデータ準備・変換
特徴量管理SageMaker Feature Store特徴量の保存・共有・再利用
学習・調整SageMaker AI(トレーニングジョブ)マネージドな分散学習と自動チューニング
バイアス検出・説明可能性SageMaker Clarifyデータとモデルのバイアス分析、予測の説明
監視SageMaker Model Monitorデータ品質・モデル品質・バイアス・特徴量寄与の 4 次元ドリフト検出

加えて 2 つの入口を覚えておく。SageMaker Canvas はノーコードで予測モデルを作れるビジネスアナリスト向けインターフェース。SageMaker JumpStart は事前学習済みモデルと基盤モデルのハブで、ゼロから学習せずに既存モデルから始められる。「コードを書かずに ML を試したい部門ユーザー → Canvas」「事前学習済みモデルで素早く始めたい → JumpStart」という対応付けは、matching 問題の定番候補だ。

Clarify と Model Monitor の区別も狙われる。Clarify は「学習前後のバイアス検出と説明可能性」、Model Monitor は「本番運用中のドリフト監視」。時間軸が違う(開発時 vs 運用時)と覚えれば混同しない。この 2 つは Domain 4(責任ある AI)でも再登場する、AIF-C01 全体の最重要サービスペアだ。

モデル評価指標 — 技術指標とビジネス指標

タスク 1.3 の最後の論点は、モデルの評価だ。公式ガイドはモデル性能指標ビジネス指標の両方を挙げており、この二層構造の理解が問われる。

技術側の指標は、問題タイプごとに使い分ける。分類問題では正解率(Accuracy)が基本だが、不正検出のような不均衡データでは「全部正常と答えても 99% 正解」になってしまうため、適合率(Precision)・再現率(Recall)・その調和平均である F1 スコア、そして閾値に依存しない AUC が使われる。回帰問題では予測値と実測値の誤差(RMSE 等)で測る。「不均衡データで Accuracy が役に立たない理由」は、シナリオ問題の頻出テーマなので必ず説明できるようにしておく。

適合率と再現率のトレードオフは、具体例で押さえると忘れない。印刷失敗検出の例で言えば、適合率は「失敗と判定したうち本当に失敗だった割合」、再現率は「実際の失敗のうち検出できた割合」だ。再現率を上げようと検出を敏感にすれば誤報(正常品を失敗と判定)が増えて適合率が下がり、誤報を嫌って閾値を厳しくすれば見逃しが増えて再現率が下がる。「見逃しと誤報のどちらが事業に痛いか」で重視する指標が決まる。医療診断や不正検出は見逃しが致命的なので再現率を、スパムフィルタは誤報(正常メールの誤判定)が痛いので適合率を優先する。この対応付けはシナリオ問題でそのまま出る。

ビジネス側の指標は、モデルが事業に与えた影響を測る。ユーザーあたりコスト、開発コスト、顧客フィードバック、ROI(投資対効果)。技術指標がどれだけ良くても、ビジネス指標が改善しなければそのモデルは成功とは言えない。

試験で問われるのは「F1 スコア 0.95 のモデルが、ビジネス的に失敗することはあるか」という視点だ。答えは「ある」。たとえば推論コストが利益を食い潰す場合、あるいは予測精度は高いが業務フローに組み込まれず使われない場合。AIF-C01 が Foundational 認定として技術者以外も対象にしている以上、この技術とビジネスの接続は出題の核になる。

まとめ — Domain 1 の得点戦略

Domain 1(配点 20%)は、暗記領域と判断領域が半々で構成される。学習の優先順位はこうだ。

  1. 入れ子構造の即答: AI ⊃ ML ⊃ DL ⊃ 生成 AI の階層と、各層の判別基準
  2. 3 段マッピングの習得: シナリオ → 学習タイプ(教師あり/なし/強化)→ 手法(回帰/分類/クラスタリング)
  3. サービス対応表の暗記: AI 応用領域 × AWS マネージドサービスの一対一対応(matching 対策)
  4. 9 工程のリズム化: ML ライフサイクルを順序で言えるようにする(ordering 対策)
  5. AI を使わない判断: 確定結果が必要な場面・費用対効果が合わない場面の判別

Domain 1 の知識は、このあと Domain 2(生成 AI の基礎)で「基盤モデルは自己教師あり学習で事前学習される」「ファインチューニングは教師あり学習」といった形で再利用される。土台を固めたら、配点 24% の生成 AI ドメインへ進んでほしい。AWS AI Practitioner AIF-C01 完全攻略入門(2026-06-08 公開)の 4 週間ロードマップでは、ここまでが第 1 週の前半にあたる。

参照

ブラウザだけでできる本格的なAI画像生成【ConoHa AI Canvas】
ABOUT ME
swiftwand
swiftwand
AIを使って、毎日の生活をもっと快適にするアイデアや将来像を発信しています。 初心者にもわかりやすく、すぐに取り入れられる実践的な情報をお届けします。 Sharing ideas and visions for a better daily life with AI. Practical tips that anyone can start using right away.
記事URLをコピーしました