データサイエンティスト検定リテラシーレベル(DS検定★)とはどんな資格試験なのか、ヤンジャクリン講師が解説します。
試験範囲や出題内容、必要な学習レベル、また合格基準や難易度などについても考察しますので、ぜひ参考にしてください。
目次
DS検定試験とは
データサイエンティスト検定リテラシーレベル(DS検定★)は、一般社団法人データサイエンティスト協会によって実施されている、今大注目の検定試験です。
2021年9月に第1回目が実施された比較的新しい検定であり、データ活用人材の需要が高まるにつれて受講者数はますます増加していくと予想されます。
データサイエンスと呼ばれる大きな分野に含まれる、データ加工、機械学習、データ分析、エンジニアリング、数理統計学、ビジネスなど、様々な知識やスキルを広くカバーしています。
DS検定の目的
DS検定の取得により、データサイエンティストに必要な入門レベルの実務能力や知識、および、裏でそれを支える数理統計学やAI教育のリテラシーレベルの実力を有していることを証明できます。
データサイエンティストを目指す人達とそれを必要とする産業界を結びつけることがデータサイエンティスト協会の指針のひとつです。
データサイエンティストに必要なスキルを一般的に、データサイエンス力・データエンジニアリング力・ビジネス力、と3つのカテゴリに分けて考えることができます。
とはいえ、データサイエンティストに必要な素養は様々で、全てに精通している人材は稀であり、「データ分析官」の方はビジネス系寄り、業務系寄り、フロント寄りなどと言われ、「AIエンジニア」の方は開発・実装重視と言われています。
データサイエンスの専門企業だけではなく、一般企業の社員が全員持つべき「データリテラシー」についてはこちらをご覧になってください。
参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ
DS検定試験の概要
出題形式 | 選択式問題 |
問題数 | 90問程度 |
試験時間 | 90分 |
会場 | 全国の試験会場で開催(CBT) |
出題範囲 | ・スキルチェックリストの3カテゴリ(データサイエンス力、データエンジニアリング力、ビジネス力)の★1(見習いレベル)相当 ・ 数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム |
受験費用 | 一般:10,000円(税抜) 学生:5,000円(税抜) |
試験時期 |
年2回(春・秋) |
公式参考書 | 「最短突破 データサイエンティスト検定(リテラシーレベル) 公式リファレンスブック」 |
DS検定の試験科目 必要な知識とスキル
DS検定に出題される内容をより詳しく解説します。
上記では、データサイエンス、データエンジニアリング、ビジネスの3つの枠組みについて話をしましたが、ここでは各分野において求められる個別の知識やスキルを紹介します。
データの活用事例
まず、全体像を掴むためには、社会におけるデータ・AIの活用事例を知る必要があります。
アガルートアカデミーのDS検定対策講座では、冒頭のPart1で実際のデータサイエンティストの会社で行われているデータ活用案件を豊富に紹介します。
データリテラシー
そして、サイエンス、エンジニアリング、ビジネスのどれを学ぶにしても、重要となる基本的なデータリテラシーも出題されます。
参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ
データサイエンス
データサイエンスは最も広い出題分野です。
代表的な出題項目が以下となります。
- 機械学習の基本概念である、人工知能、機械学習、ディープラーニングの関係性
- 学習と予測の仕組み、機械学習モデルの構築と運用の流れ
- 教師あり学習、教師なし学習、強化学習
- 特徴量設計・データ前処理
- 機械学習・データ分析の代表的な手法(例:線形回帰、ロジスティク回帰、決定木、アンサンブル学習、K-means、ナイーブベイズ、ニューラルネットワーク)
- 学習済みモデルの評価、 精度指標、ROC曲線、AUC
- モデルの最適化、ハイパーパラメータのチューニング
- 画像・動画データの形式、処理と解析(画像分類、物体検出、セグメンテーション)
- 音声データの形式、音声処理
- 自然言語の処理(形態素解析、構文解析、意味解析)
- 時系列データ、時系列分析
- モデルの予測結果の解釈、局所的説明と大域的説明
データエンジニアリング
- データ収集の技術、 ウェブクローリング・スクレイピング
- データの保管: ストレージ、データストア、データベースなど
- リレーショナルデータベース(RDB)、SQLとnoSQL
- ER図
- テーブルの正規化、正規化の各種
- データ基盤、クラウド、 サーバー
- データ転送、 バックアップ、 データ処理
- セキュリティ上の注意点(機密性、完全性、可用性)、 攻撃と防御、アクセス制御
ビジネス力
ここではデータ分析プロジェクトの進め方、契約や開発の種別、そして軽視してはいけない法規制について問われます。
- データサイエンティストに求められるビジネス力
- データ分析プロジェクトの進め方
- 現状把握: ビジネスモデル、プレイヤー、一次情報、二次情報
- 課題の定義: スコーピング、5フォース分析、MECE、ロジカルシンキング
- 目標の設定(KPI、KGI、KPIツリー)
- 仮説の立案と検証
- ドキュメンテーション、結果の考察と説明
- 契約の種別: 請負契約、準委任契約
- 開発の形式:ウォータフォール開発、アジャイル開発
- データ倫理、コンプライアンス
- AIが社会に及ぼす影響、ELSI、GDPR
- 個人情報保護法、プライバシー、要配慮個人情報と機微情報
- 匿名加工情報、オプトアウト制度
- 公平性と透明性:ブラックボックス問題、説明可能AI(XAI)、人間中心のAI社会原則、
- 知的財産権、特許権、著作権、
- 不正競争防止、営業秘密、限定提供データ
統計学・数学
上記以外に、統計学・数学の基礎も問われます。
例えば統計学では以下が代表的な出題項目です。
- 記述統計学と推測統計学
- 基礎統計量とその使い分け(平均値、中央値、最頻値)
- データの広がりを示す指標(分散、標準偏差)
- 母集団から標本の無作為抽出
- 統計的推定
- 統計的仮説検定
- 二変数間の関係性(共分散、相関係数、因果関係)
数学では、微分や線形代数の高校レベルの問題が出題されることがあります。
DS検定の合格ライン・合格基準
DS検定のおおよその合格基準はDS検定の公式サイトの上で公表されています。
2022年6月10日~6月30日に実施された2022年第2回目の合格ラインの目安は正答率約80%でした。
受験者数 | 約2900名 |
合格者数 | 1453名 |
合格率 | 約50% |
合格ラインの目安 | 正答率約80% |
※過去参考値 2022年は試験問題が刷新されるため上記の通りではありません
ただし、試験ごとに振れ幅が想定されるので、あくまでも目安だと思ってください。
あくまでも個人的な感覚としては、以下のような水準を達成するまで勉強をされている方は合格圏内に入ると推測しています。
- 本記事に羅列されている出題項目を一通りご自身の言葉で「どういうことなのか」を他人に説明できるようになる
- アガルートのDS検定対策講座を履修し、その8割を「よく理解できている」レベルにあること、並びに、講座に付属する模擬試験で8割以上の点数を取れている
参考として、同じくAI資格のG検定の合格率は7割前後と言われています。
CBT会場で試験終了と同時に、「データサイエンス」「データエンジニアリング」「ビジネス」の各分野、及び総合の得点率が印刷された紙がPCから出力され、受験者の出来の速報として参考になります。
試験が行われた月の翌月中には、合否の結果とともに、詳細なスコアシートを受験する際に登録するマイページからダウンロードできるようになります。
この詳細なスコアシートを見れば、上記の各分野で出題された各詳細項目の正答率と全受験者の平均点を知ることができます。
以下に、データサイエンス分野におけるスコア詳細の一例を添付します。

DS検定の難易度
DS検定は筆者からみて、今までの国内のデータサイエンス資格の中で最も難易度が高いものと思っています。
DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。
さらに、比較的新しい資格試験であり、参考書や講座がG検定など他の資格試験ほど数多くはない、ネット上の情報も多くはないのも事実です。
それでも、DS検定への注目度が急上昇しており、今後は非常に伸びていく資格試験と予想されており、社員に重要な教養として企業では集団としてDS検定を目指すことも多くなってきました。
統計検定やG検定に合格した後に、次のステップとしてDS検定に挑戦される方が多いです。
過去にG検定を受験したことのある方はDS検定の受験が大変有利です。
データサイエンスの分野など、出題内容に親和性があるためです。
プログラミングのスキルはDS検定にとって重要ではありません。
しかしプログラミングやデータ操作の経験があるとエンジニアリングの分野とのなじみが良くなるかもしれません。
数学や統計学は中学・高校で学んだレベルの範囲で出題されます。
統計学は演習も含めてアガルートのDS検定対策講座の中で十分に教えいたします。
文系出身の方など、数学をもう少し勉強したい方は補助として公式参考書の使用をお勧めします。
関連記事:データサイエンティストを目指す方におすすめの8資格
G検定との違い
今では、ITパスポート、G検定、DS検定はデータサイエンス人材になるための3つの関門と言われています。
以前こちらでG検定を紹介しました。
関連コラム:G検定(ジェネラリスト検定)とは?【データサイエンティストに関わる資格】
DS検定はG検定よりも、出題範囲が2割ほど広いと言われています。
G検定はディープラーニングやそれを応用した最先端技術の非常に深い技術(ニューラルネットワークの仕組み、強化学習、自然言語処理、画像認識のCNN、音声生成など)の部分を問う問題が多いです。
DS検定ではこれらが薄くなっている反面、ビジネス、エンジニアリングの知識が増えます。
また数学・統計学に関する出題も若干G検定のより多い可能性があります。
また、DS検定の方が難易度が少しだけ高いと言われています。
そのため、G検定を先に受験してからDS検定に挑む方もいます。
ただ、2つの検定試験は出題が被っていない部分が多くあるので、独立した資格試験と思ってください。
どちらも同じくらいデータサイエンティストを目指す方に重要です。

Di-Lite3大資格の難易度比較
他に、Di-Liteの3大資格には、G検定、DS検定、ITパスポートがあります。
この中で、DS検定が一番難しく、次にG検定、次にITパスポートと言われています。
しかし、これには個人差が大きいので、あくまでもひとつの目安と受け取ってください。
上記に書かれているように、DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。
「Di-Lite (ディーライト)」とは、「デジタルを使う人材」であるために、全てのビジネスパーソンが、共通して身につけるべきデジタルリテラシー範囲です。「Di-Lite」は現在、「ITソフトウェア領域」「数理・データサイエンス領域」「AI・ディープラーニング領域」の3領域として定義され、その学習すべき範囲として、「ITパスポート試験」「G 検定」「データサイエンティスト検定」の3つの試験のシラバス範囲が推奨されています。
デジタルリテラシー協議会