データサイエンティスト検定リテラシーレベル(DS検定★)とはどんな資格試験なのか、ヤンジャクリン講師が解説します。

試験範囲や出題内容、必要な学習レベル、また合格基準や難易度などについても考察しますので、ぜひ参考にしてください。

資料請求でデータサイエンスの基礎が学べる講義を無料プレゼント
  ・講座(G検定・機械学習・データ分析など) 約3時間分

現役プロ講師によるわかりやすい講義

1分で簡単!今すぐ見れます(会員登録→お申込み→講座視聴)

20日間無料で講義を体験!

DS検定試験とは

データサイエンティスト検定リテラシーレベル(DS検定★)は、一般社団法人データサイエンティスト協会によって実施されている、今大注目の検定試験です。

2021年9月に第1回目が実施された比較的新しい検定であり、データ活用人材の需要が高まるにつれて受講者数はますます増加していくと予想されます。

データサイエンスと呼ばれる大きな分野に含まれる、データ加工、機械学習、データ分析、エンジニアリング、数理統計学、ビジネスなど、様々な知識やスキルを広くカバーしています。

DS検定の目的

DS検定の取得により、データサイエンティストに必要な入門レベルの実務能力や知識、および、裏でそれを支える数理統計学やAI教育のリテラシーレベルの実力を有していることを証明できます。

データサイエンティストを目指す人達とそれを必要とする産業界を結びつけることがデータサイエンティスト協会の指針のひとつです。 

データサイエンティストに必要なスキルを一般的に、データサイエンス力・データエンジニアリング力・ビジネス力、と3つのカテゴリに分けて考えることができます。

とはいえ、データサイエンティストに必要な素養は様々で、全てに精通している人材は稀であり、「データ分析官」の方はビジネス系寄り、業務系寄り、フロント寄りなどと言われ、「AIエンジニア」の方は開発・実装重視と言われています。

データサイエンスの専門企業だけではなく、一般企業の社員が全員持つべき「データリテラシー」についてはこちらをご覧になってください。

参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ

DS検定試験の概要

出題形式選択式問題
問題数100問程度
試験時間100分
会場全国の試験会場で開催(CBT)
出題範囲・スキルチェックリストの3カテゴリ
(データサイエンス力、データエンジニアリング力、ビジネス力)の★1(見習いレベル)相当
数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム
受験費用一般:10,000円(税抜)
学生:5,000円(税抜)
試験時期第8回:2024年11月9日(土)~12月1日(日)
第9回:2025年3月8日(土)~3月30日(日)
※第10回以降は、決まり次第更新。

【過去の日程】
第1回:2021年9月11日(土)~9月30日(木)
第2回:2022年6月10日(金)~6月30日(木)
第3回:2022年11月15日(火)~12月5日(月)
第4回:2023年6月3日(土)~6月25日(日)
第5回:2023年11月11日(土)~12月3日(日)
第6回:2024年3月9日(土)~3月31日(日)
第7回:2024年6月8日(土)~6月30日(日)
公式参考書最短突破 データサイエンティスト検定(リテラシーレベル) 公式リファレンスブック

DS検定の試験科目 必要な知識とスキル

DS検定に出題される内容をより詳しく解説します。

上記では、データサイエンス、データエンジニアリング、ビジネスの3つの枠組みについて話をしましたが、ここでは各分野において求められる個別の知識やスキルを紹介します。

データの活用事例

まず、全体像を掴むためには、社会におけるデータ・AIの活用事例を知る必要があります。

アガルートアカデミーのDS検定対策講座では、冒頭のPart1で実際のデータサイエンティストの会社で行われているデータ活用案件を豊富に紹介します。

データリテラシー

そして、サイエンス、エンジニアリング、ビジネスのどれを学ぶにしても、重要となる基本的なデータリテラシーも出題されます。

参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ

データサイエンス

データサイエンスは最も広い出題分野です。

代表的な出題項目が以下となります。

  • 機械学習の基本概念である、人工知能、機械学習、ディープラーニングの関係性
  • 学習と予測の仕組み、機械学習モデルの構築と運用の流れ
  • 教師あり学習、教師なし学習、強化学習
  • 特徴量設計・データ前処理
  • 機械学習・データ分析の代表的な手法(例:線形回帰、ロジスティク回帰、決定木、アンサンブル学習、K-means、ナイーブベイズ、ニューラルネットワーク)
  • 学習済みモデルの評価、 精度指標、ROC曲線、AUC
  • モデルの最適化、ハイパーパラメータのチューニング
  • 画像・動画データの形式、処理と解析(画像分類、物体検出、セグメンテーション)
  • 音声データの形式、音声処理
  • 自然言語の処理(形態素解析、構文解析、意味解析)
  • 時系列データ、時系列分析
  • モデルの予測結果の解釈、局所的説明と大域的説明

データエンジニアリング

  • データ収集の技術、   ウェブクローリング・スクレイピング
  • データの保管:  ストレージ、データストア、データベースなど
  • リレーショナルデータベース(RDB)、SQLとnoSQL
  •  ER図
  •   テーブルの正規化、正規化の各種
  •   データ基盤、クラウド、  サーバー
  •  データ転送、  バックアップ、 データ処理
  •   セキュリティ上の注意点(機密性、完全性、可用性)、  攻撃と防御、アクセス制御

ビジネス力

ここではデータ分析プロジェクトの進め方、契約や開発の種別、そして軽視してはいけない法規制について問われます。

  • データサイエンティストに求められるビジネス力
  • データ分析プロジェクトの進め方
  • 現状把握: ビジネスモデル、プレイヤー、一次情報、二次情報
  • 課題の定義: スコーピング、5フォース分析、MECE、ロジカルシンキング
  • 目標の設定(KPI、KGI、KPIツリー)
  • 仮説の立案と検証
  • ドキュメンテーション、結果の考察と説明
  • 契約の種別:  請負契約、準委任契約
  • 開発の形式:ウォータフォール開発、アジャイル開発
  • データ倫理、コンプライアンス
  • AIが社会に及ぼす影響、ELSI、GDPR
  • 個人情報保護法、プライバシー、要配慮個人情報と機微情報
  • 匿名加工情報、オプトアウト制度
  • 公平性と透明性:ブラックボックス問題、説明可能AI(XAI)、人間中心のAI社会原則、
  • 知的財産権、特許権、著作権、
  • 不正競争防止、営業秘密、限定提供データ

統計学・数学

上記以外に、統計学・数学の基礎も問われます。

例えば統計学では以下が代表的な出題項目です。

  • 記述統計学と推測統計学
  • 基礎統計量とその使い分け(平均値、中央値、最頻値)
  • データの広がりを示す指標(分散、標準偏差)
  • 母集団から標本の無作為抽出
  • 統計的推定
  • 統計的仮説検定
  • 二変数間の関係性(共分散、相関係数、因果関係)

数学では、微分や線形代数の高校レベルの問題が出題されることがあります。

DS検定の合格率・合格ライン・合格基準

2024年3月に実施された第6回目試験の合格率は44%でした。

過去の実施結果も見てみると、2021年9月に実施された第1回から合格率は下がっており、第3回以降約40%台を推移しています。

合格ラインの目安は、第1回から常に正答率約80%となっていて、非常に高い正答率が求められることがわかります。

試験実施日受験者数合格者数合格率合格ラインの目安
第7回(2024年6月実施)ー名ー名ー%ー%
第6回(2024年3月実施)約2,500名1,089名約44%正答率約79%
第5回(2023年11月実施)約3,750名1,427名約38%正答率約79%
第4回(2023年6月実施)約3,050名1,347名約44%正答率約79%
第3回(2022年11月実施)約2,600名1,088名約42%正答率約79%
第2回(2022年6月実施)約2,900名1,453名約50%正答率約80%
第1回(2021年9月実施)約1,400名927名約66%正答率約80%
出典:過去実施結果一覧|一般社団法人データサイエンティスト協会

試験ごとに振れ幅が想定されるので、あくまでも目安だと思ってください。

あくまでも個人的な感覚としては、以下のような水準を達成するまで勉強をされている方は合格圏内に入ると推測しています。

  • 本記事に羅列されている出題項目を一通りご自身の言葉で「どういうことなのか」を他人に説明できるようになる
  • アガルートのDS検定対策講座を履修し、その8割を「よく理解できている」レベルにあること、並びに、講座に付属する模擬試験で8割以上の点数を取れている

参考として、同じくAI資格のG検定の合格率は7割前後と言われています。

CBT会場で試験終了と同時に、「データサイエンス」「データエンジニアリング」「ビジネス」の各分野、及び総合の得点率が印刷された紙がPCから出力され、受験者の出来の速報として参考になります。

試験が行われた月の翌月中には、合否の結果とともに、詳細なスコアシートを受験する際に登録するマイページからダウンロードできるようになります。

この詳細なスコアシートを見れば、上記の各分野で出題された各詳細項目の正答率と全受験者の平均点を知ることができます。

以下に、データサイエンス分野におけるスコア詳細の一例を添付します。

DS検定の難易度

DS検定は筆者からみて、今までの国内のデータサイエンス資格の中で最も難易度が高いものと思っています。

DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。

さらに、比較的新しい資格試験ということもあり、参考書や対策講座がG検定など他の資格試験と比較すると少なく、ネット上の情報も多くはないのも事実です。

それでも、DS検定への注目度が急上昇しており、今後は非常に伸びていく資格試験と予想されており、社員に重要な教養として企業では集団としてDS検定を目指すことも多くなってきました。

統計検定やG検定に合格した後に、次のステップとしてDS検定に挑戦される方が多いです。

過去にG検定を受験したことのある方はDS検定の受験が大変有利です。

データサイエンスの分野など、出題内容に親和性があるためです。

プログラミングのスキルはDS検定にとって重要ではありません。

しかしプログラミングやデータ操作の経験があるとエンジニアリングの分野とのなじみが良くなるかもしれません。

数学や統計学は中学・高校で学んだレベルの範囲で出題されます。

統計学は演習も含めてアガルートのDS検定対策講座の中で十分に教えいたします。

文系出身の方など、数学をもう少し勉強したい方は補助として公式参考書「最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版」の使用をお勧めします。

書籍名最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版
目次第1章 DS検定とは
第2章 データサイエンス力
第3章 データエンジニアリング力
第4章 ビジネス力
第5章 数理・データサイエンス・AI(リテラシーレベル)モデルカリキュラム
データサイエンティスト検定リテラシーレベル模擬試験 問題
データサイエンティスト検定リテラシーレベル模擬試験 解答例
ページ数328ページ
著者名菅 由紀子など
出版社技術評論社
発売日2022年5月14日

関連記事:データサイエンティストを目指す方におすすめの8資格

G検定との違い

今では、ITパスポート、G検定、DS検定はデータサイエンス人材になるための3つの関門と言われています。

以前こちらでG検定を紹介しました。

関連コラム:G検定(ジェネラリスト検定)とは?【データサイエンティストに関わる資格】

DS検定はG検定よりも、出題範囲が2割ほど広いと言われています。

G検定はディープラーニングやそれを応用した最先端技術の非常に深い技術(ニューラルネットワークの仕組み、強化学習、自然言語処理、画像認識のCNN、音声生成など)の部分を問う問題が多いです。

DS検定ではこれらが薄くなっている反面、ビジネス、エンジニアリングの知識が増えます。

また数学・統計学に関する出題も若干G検定のより多い可能性があります。

また、DS検定の方が難易度が少しだけ高いと言われています。

そのため、G検定を先に受験してからDS検定に挑む方もいます。

ただ、2つの検定試験は出題が被っていない部分が多くあるので、独立した資格試験と思ってください。

どちらも同じくらいデータサイエンティストを目指す方に重要です。

Di-Lite3大資格の難易度比較

他に、Di-Liteの3大資格には、G検定、DS検定、ITパスポートがあります。

この中で、DS検定が一番難しく、次にG検定、次にITパスポートと言われています。

しかし、これには個人差が大きいので、あくまでもひとつの目安と受け取ってください。

上記に書かれているように、DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。

「Di-Lite (ディーライト)」とは、「デジタルを使う人材」であるために、全てのビジネスパーソンが、共通して身につけるべきデジタルリテラシー範囲です。「Di-Lite」は現在、「ITソフトウェア領域」「数理・データサイエンス領域」「AI・ディープラーニング領域」の3領域として定義され、その学習すべき範囲として、「ITパスポート試験」「G 検定」「データサイエンティスト検定」の3つの試験のシラバス範囲が推奨されています。

デジタルリテラシー協議会

まとめ

DS検定試験とは

  • 一般社団法人データサイエンティスト協会が実施
  • データ加工、機械学習、データ分析、エンジニアリング、数理統計学、ビジネスなど、様々な知識やスキルを広くカバー

DS検定の試験科目

  • データの活用事例
  • データリテラシー
  • データサイエンス
  • データエンジニアリング
  • ビジネス力
  • 統計学・数学

DS検定の難易度や合格ライン・合格基準

  • DS検定は今までの国内のデータサイエンス資格の中で最も難易度が高い
  • 2024年第7回目の合格ラインの目安は正答率約79%

DS検定のG検定との違い

  • DS検定はG検定よりも、出題範囲が2割ほど広い
  • DS検定の方が難易度が少しだけ高い
データサイエンス(G検定・AI・機械学習・データ分析)

資料請求でデータサイエンスの基礎が学べる講義を無料プレゼント
  ・講座(G検定・機械学習・データ分析など) 約3時間分

現役プロ講師によるわかりやすい講義

1分で簡単!今すぐ見れます(会員登録→お申込み→講座視聴)

20日間無料で講義を体験!

実践的な
Python・データ分析スキル

を身に付けたい方へ

何から手をつけたら良いかわからない

独学で挫折したことがある

専門的な内容で身近に相談できる人がいない

このような悩みをお持ちでしたら
AI Academy Bootcampにご相談下さい!

「目的別学習コース」と「手厚いサポート」

AI Academy Bootcampに無料相談する>>

この記事の著者 ヤン ジャクリン

ヤン ジャクリン (講師紹介はこちら

2015年 東京大学大学院 理学系研究科物理学専攻 修了(理学博士)
2015年 高エネルギー加速器研究機構 素粒子原子核研究所(博士研究員)
2017年 株式会社GRI(現職) 講師 兼 分析官
2019年 Tableau Desktop Certified Associate 資格取得

・英検1級
・TOEFL IBT試験満点

北京生まれ、米国東海岸出身(米国籍)、小学高学年より茨城県育ち。

万物の質量の源となるヒッグス粒子の性質を解明し、加速器実験による新粒子発見に関する研究を行い、国際・国内学会発表20件以上、査読論文5件以上。
10年以上に渡り、幅広い年齢層の学習指導を学習塾や大学などで実施(5科目、英会話、受験指導、素粒子物理など)。
現在は、株式会社GRIにて、データ分析官(データ前処理、可視化分析、マーケティング施策の分析 他)
公開講座および法人研修を多数開設。

講座を見る