AWS Certified AI Practitioner について Vol.1

編集履歴
概要
1回目受験の所感
試験範囲
1. 公式ドキュメント
2. 試験内容の概要
今回のアフィリエイト
まとめ

編集履歴

日付	内容
2025/01/12	投稿

概要

2025/1 に「AWS Certified AI Practitioner」再受験する予定なので、自分の知識の整理のために、1回目受験してみた所感と1回目受験までに勉強していた試験範囲についてアウトプットします。

タイトルを「AWS Certified AI Practitioner について Vol.1」としている通り、今後追加で勉強した分はvol2,3…として投稿しようと考えています。

1回目受験の所感

「AWS Certified AI Practitioner」は「AWS Certified Cloud Practitioner」と同じ Foundationalカテゴリの試験です。

「AWS Certified Cloud Practitioner」は1年半前ぐらいに取得しているのですが、その際は主なAWSサービスの名称や大まかなできることを覚えて受験したら1発で取れました。

今回私はその時と同じノリでAI関連のAWSサービスの概要だけ頭に入れて特攻したところ、見事に落ちました。

65問出題のうち15問が採点対象外の調整問題で、それを除いた50問の7割程度取れれば合格ですが、今回の私の結果は6割後半ぐらいの得点でした。

惜しい、と言いたいところですが、正直この手の試験は8割ぐらいとって余裕もって受かりたいところなので、かなり勉強不足を感じています。

敗因は、予想よりもかなりAI/ML自体の基礎知識を問う、または基礎知識が絡む内容が多かったことです。

AWSサービスの知識だけではどうしようもない問題もそこそこあった印象で、AWSサービスの用語を問う際も、「この制度を上げるにはAWSのサービスでどのパラメータを調整するか」といったAI基礎知識とAWSサービスの用語の複合問題として出題されていました。

あとから気づいたのですが、Udemyなどですでに「AWS Certified AI Practitioner」の教材も上がっているようですので、試験に合格したいだけであれば、そういった教材を活用するのがいいと思います。

私は今回試験用の教材を使わずに受けてみたので、せっかくならこのまま使わずに受かってやろう、という思いで「AWS Certified AI Practitioner」特化の教材は用いずに進めようと思います。

ひとまず、この投稿でAWSサービスの知識を整理して、次あたりでAIそのものの学習を(1段落として)まとめられるよう進めようと思います。

試験範囲

公式ドキュメント

公式ドキュメントには下記項目について記載されている。

はじめに
受験対象者について
試験内容
付録

自分の再確認のため、3の中の「試験内容の概要」について、自分なりの整理としてこのセクションに記載します。(ほぼ同じ内容で公式ドキュメントに載っています)

ほかの項目についても受験される方には重要な情報が多いため、一読することをお勧めします。

試験内容の概要

コンテンツドメインと重み設定

ドキュメントによると「AWS Certified AI Practitioner」試験で問われる分野とそれぞれの点数比率は下記の通り。

第 1 分野: AI と ML の基礎 (採点対象コンテンツの 20%)
第 2 分野: 生成 AI の基礎 (採点対象コンテンツの 24%)
第 3 分野: 基盤モデルの応用 (採点対象コンテンツの 28%)
第 4 分野: 責任ある AI に関するガイドライン (採点対象コンテンツの 14%)
第 5 分野: AI ソリューションのセキュリティ、コンプライアンス、ガバナンス (採点対象コンテンツの 14%)

各分野にAWSサービスの内容を問う問題は含まれるものの、第1,2,4分野はAWSサービスの知識のみでは解けない問題も多いため、AIの基本的な知識を試験の約6割以上の範囲で問われると考えていいと思います。

ちなみに、私は上記のうち、1,2,3が不適格、4,5が適格と判定を受けました。

第 1 分野: AI と ML の基礎

AI の基本的な概念と用語の説明
- 基本的な AI 用語の定義
  - AI
  - ML
  - 深層学習
  - ニューラルネットワーク、
  - コンピュータビジョン
  - 自然言語処理 (NLP)
  - モデル
  - アルゴリズム
  - トレーニングと推論
  - バイアス
  - 公平性
  - フィット
  - 大規模言語モデル(LLM)
  - etc..
- AI、ML、深層学習の類似点と相違点の説明
- さまざまな種類の推論について説明
  - バッチ
  - リアルタイム
  - etc…
- AI モデルに含まれるさまざまなタイプのデータについて説明
  - ラベル付きとラベルなし
  - 表形式
  - 時系列
  - 画像
  - テキスト
  - 構造化データと非構造化データ
  - etc…
- 教師あり学習、教師なし学習、強化学習について説明
AI の実用的なユースケースの特定
- AI/ML が価値を提供できる応用分野の認識
  - 人間の意思決定の支援
  - ソリューションのスケーラビリティ
  - オートメーション
  - etc…
- AI/ML ソリューションが適切でない場合の特定
  - 費用対効果の分析
  - 予測ではなく特定の結果が必要な状況
  - etc…
- 特定のユースケースに適した ML 手法の判断
  - 回帰
  - 分類
  - クラスタリング
  - etc…
- 実際の AI 応用例の特定
  - コンピュータビジョン
  - NLP
  - 音声認識
  - レコメンデーションシステム
  - 不正検出
  - 予測
  - etc…
- AWS のマネージド AI/ML サービスの機能の説明
  - SageMaker
  - Amazon Transcribe
  - Amazon Translate
  - Amazon Comprehend
  - Amazon Lex
  - Amazon Polly
  - etc…
開発ライフサイクルの説明
- ML パイプラインの構成要素について説明
  - データ収集
  - 探索的データ分析 (EDA)
  - データの前処理
  - 特徴量エンジニアリング
  - モデルトレーニング
  - ハイパーパラメータのチューニング
  - 評価
  - デプロイ
  - モニタリング
  - etc…
- ML モデルのソースの理解
  - オープンソースの事前トレーニング済みモデル
  - カスタムモデルのトレーニング
  - etc…
- 本番環境でモデルを使用する方法の説明
  - マネージド API サービス
  - セルフホストAPI
  - etc…
- ML パイプラインの各ステージに関連する AWS のサービスと機能を特定
  - SageMaker
  - Amazon SageMaker Data Wrangler
  - Amazon SageMaker
  - Feature Store
  - Amazon SageMaker Model Monitor
  - etc…
- ML 運用 (MLOps) の基本概念の理解
  - 実験
  - 反復可能なプロセス
  - スケーラブルなシステム
  - 技術的負債の管理
  - 本番稼働の準備
  - モデルモニタリング
  - モデルの再トレーニング
  - etc…
- ML モデルを評価するためのモデルパフォーマンスメトリクスの理解
  - 正解率
  - ROC 曲線下面積 (AUC)
  - F1 スコア
  - etc…
- ML モデルを評価するためのビジネスメトリクスの理解
  - ユーザーあたりのコスト
  - 開発コスト
  - 顧客からのフィードバック
  - 投資収益率(ROI)
  - etc…

第 2 分野: 生成 AI の基礎

生成AIの基本概念の説明
- 生成 AI の基礎となる概念の理解
  - トークン
  - チャンク化
  - 埋め込み表現
  - ベクター
  - プロンプトエンジニアリング
  - トランスフォーマーベースのLLM
  - 基盤モデル
  - マルチモーダルモデル
  - 拡散モデル
  - etc…
- 生成 AI モデルの潜在的なユースケースの特定
  - 画像
  - 動画
  - 音声の生成
  - 要約
  - チャットボット
  - 翻訳
  - コード生成
  - カスタマーサービスエージェント
  - 検索
  - レコメンデーションエンジン
  - etc…
- 基盤モデルのライフサイクルの説明
  - データ選択
  - モデル選択
  - 事前トレーニング
  - ファインチューニング
  - 評価
  - デプロイ
  - フィードバック
  - etc…
ビジネス上の問題解決に生成AIを使用する場合の可能性と限界
- 生成 AI のメリットの説明
  - 適応性
  - 応答性
  - シンプルさ
  - etc…
- 生成 AI ソリューションのデメリットの特定
  - ハルシネーション
  - 解釈可能性
  - 不正確さ
  - 非決定性
- さまざまな要因を理解して、適切な生成 AI モデルの選択
  - モデルタイプ
  - パフォーマンス要件
  - 機能
  - 制約
  - コンプライアンス
- 生成 AI アプリケーションのビジネス価値とメトリクスの見極め
  - クロスドメインのパフォーマンス
  - 効率
  - コンバージョン率
  - ユーザーあたりの平均収益
  - 正解率
  - 顧客生涯価値
生成AIアプリケーションを構築するためのAWS-InfrastructureとTechnologyの説明
- 生成 AI アプリケーションを開発するための AWS のサービスと機能の特定
  - Amazon SageMaker JumpStart
  - Amazon Bedrock
  - PartyRock
  - Amazon Bedrock Playground
  - Amazon Q
  - etc…
- AWS の生成 AI サービスを使用してアプリケーションを構築するメリットの説明
  - アクセシビリティ
  - 参入障壁の低さ
  - 効率性
  - 費用対効果
  - 市場投入までのスピード
  - ビジネス目標の達成能力
  - etc…
- 生成 AI アプリケーションの AWS インフラストラクチャの利点の把握
  - セキュリティ
  - コンプライアンス
  - 責任
  - 安全性
  - etc…
- AWS の生成 AI サービスの、コストに対するトレードオフの把握
  - 応答性
  - 可用性
  - 冗長性
  - パフォーマンス
  - リージョン展開
  - トークンベースの価格設定
  - プロビジョンスループット
  - カスタムモデル
  - etc..

第 3 分野: 基盤モデルの応用

基盤モデルを使用するアプリケーションの設計上の考慮事項の説明
- 事前トレーニング済みモデルを選ぶための選択基準の明確化
  - コスト
  - モダリティ
  - レイテンシー
  - 多言語
  - モデルサイズ
  - モデルの複雑さ
  - カスタマイズ
  - 入力/出力の長さ
  - etc…
- 推論パラメータがモデルの応答に与える影響の理解
  - 温度
  - 入出力の長さ
- 検索拡張生成 (RAG) を定義し、ビジネスにおけるその活用方法の説明
  - Amazon Bedrock
  - ナレッジベース
- ベクターデータベースへの埋め込みの保存に役立つ AWS のサービスの特定
  - Amazon OpenSearch Service
  - Amazon Aurora
  - Amazon Neptune
  - Amazon DocumentDB (MongoDB 互換)
  - Amazon RDS for PostgreSQL
- 基盤モデルをカスタマイズするためのさまざまなアプローチのコスト面でのトレードオフの説明
  - 事前トレーニング
  - ファインチューニング
  - 状況に応じた学習
  - RAG
  - etc…
- マルチステップのタスクにおけるエージェントの理解
  - Amazon Bedrock のエージェント
  - etc…
効果的なプロンプトエンジニアリング手法の選択
- プロンプトエンジニアリングの概念と構成の説明
  - コンテキスト
  - 指示
  - ネガティブプロンプト
  - モデルの潜在空間
  - etc…
- プロンプトエンジニアリングの手法の理解
  - 思考の連鎖
  - ゼロショット
  - シングルショット
  - フューショット
  - プロンプトテンプレート
- プロンプトエンジニアリングの利点とベストプラクティスの理解
  - 応答品質の向上実験
  - ガードレール
  - 発見
  - 具体性と簡潔さ
  - 複数のコメントの使用
- プロンプトエンジニアリングの潜在的なリスクと限界の定義
  - 露出
  - ポイズニング
  - ハイジャック
  - ジェイルブレイク
  - etc…
基盤モデルのトレーニングとファインチューニングのプロセスの説明
- 基盤モデルのトレーニングの重要な要素の説明
  - 事前トレーニング
  - ファインチューニング
  - 継続的な事前チューニング
  - etc…
- 基盤モデルをファインチューニングするための方法の定義
  - 指示のチューニング
  - 特定の分野へのモデルの適応
  - 転移学習
  - 継続的な事前トレーニング
  - etc…
- 基盤モデルをファインチューニングするためのデータの準備方法の説明
  - データキュレーション
  - ガバナンス
  - サイズ
  - ラベル付け
  - 代表性
  - 人間からのフィードバックによる強化学習 (RLHF)
  - etc…
基盤モデルのパフォーマンスを評価する方法の説明
- 基盤モデルのパフォーマンスを評価する手法の理解
  - 人間による評価
  - ベンチマークデータセット
  - etc…
- 基盤モデルのパフォーマンスを評価するための関連メトリクスの特定
  - RecallOriented Understudy for Gisting Evaluation (ROUGE)
  - Bilingual Evaluation Understudy (BLEU)
  - BERTScore
  - etc…
- 基盤モデルがビジネス目標を効果的に満たしているかどうかの判断
  - 生産性
  - ユーザーエンゲージメント
  - タスクエンジニアリング
  - etc…

第 4 分野: 責任ある AI に関するガイドライン

責任ある AI システムの開発について説明
- 責任ある AI の特徴の特定
  - バイアス
  - 公平性
  - 包括性
  - 堅牢性
  - 安全性
  - 信憑性
  - etc…
- 責任ある AI の特徴を特定するためのツールの使用方法の理解
  - Amazon Bedrock のガードレール
  - etc…
- モデルを選択するうえでの責任ある慣行の理解
  - 環境への配慮
  - 持続可能性
  - 道徳的主体性
  - etc…
- 生成 AI を使用する際の法的リスクの明確化
  - 知的財産権侵害の申し立て
  - 偏ったモデル出力
  - 顧客の信頼喪失
  - エンドユーザーリスク
  - ハルシネーション
  - etc…
- データセットの特徴の特定
  - 包括性
  - 多様性
  - キュレートされたデータソース
  - バランスの取れたデータセット
  - etc…
- バイアスと分散の影響の理解
  - 人口統計グループへの影響
  - 不正確さ
  - オーバーフィット
  - アンダーフィット
  - バイアス
  - 信頼性
  - etc…
- 真実性を検出およびモニタリングするためのツールについて説明
  - ラベル品質の分析
  - 人間による監査
  - サブグループ分析
  - Amazon SageMaker Clarify
  - SageMaker Model Monitor
  - Amazon Augmented AI (Amazon A2I)
  - etc…
透明性の高い説明可能なモデルの重要性の認識
- 透明性の高い説明可能なモデルと、透明性の低い説明不可能なモデルの違いの理解
- 透明で説明可能なモデルを識別するためのツールの把握
  - Amazon SageMaker Model Cards
  - オープンソースモデル
  - データ
  - ライセンス
- モデルの安全性と透明性の間のトレードオフの特定
  - 解釈可能性
  - パフォーマンスの測定
- 説明可能な AI のための人間中心設計の原則の理解

第 5 分野: AI ソリューションのセキュリティ、コンプライアンス、ガバナンス

AI システムを保護する方法の説明
- AI システムを保護するための AWS のサービスと機能の特定
  - IAM ロール
  - ポリシー
  - アクセス許可
  - 暗号化
  - Amazon Macie
  - AWS PrivateLink
  - AWS 責任共有モデル
  - etc…
- ソース引用とデータ出典の文書化の概念の理解
  - データリネージ
  - データのカタログ化
  - SageMaker Model Cards
  - etc…
- 安全なデータエンジニアリングのベストプラクティスの説明
  - データ品質の評価
  - プライバシー強化技術の実装
  - データアクセス制御
  - データの完全性
  - etc…
- AI システムのセキュリティとプライバシーに関する考慮事項の理解
  - アプリケーションセキュリティ
  - 脅威検出
  - 脆弱性管理
  - インフラストラクチャ保護
  - プロンプトインジェクション
  - 保管中および転送中の暗号化
  - etc…
AI システムのガバナンスとコンプライアンス規制の認識
- AI システムの規制コンプライアンス基準の特定
  - 国際標準化機構 (ISO)
  - System and Organization Controls (SOC)
  - アルゴリズム説明責任法
- ガバナンスと規制コンプライアンスを支援する AWS のサービスと機能の特定
  - AWS Config
  - Amazon Inspector
  - AWS Audit Manager
  - AWS Artifact
  - AWS CloudTrail
  - AWS Trusted Advisor
  - etc…
- データガバナンス戦略の説明
  - データライフサイクル
  - ログ記録
  - レジデンシー
  - モニタリング
  - 観察
  - 保持
- ガバナンスプロトコルに従うためのプロセスの説明
  - ポリシー
  - レビューサイクル
  - レビュー戦略
  - 生成 AI セキュリティスコーピングマトリックスなどのガバナンスフレームワーク
  - 透明性基準
  - チームトレーニング要件
  - etc…