資格

【講師が解説!】DS検定とは?難易度や合格ラインも解説【データサイエンティスト検定リテラシーレベル】

  • このエントリーをはてなブックマークに追加
  • LINEで送る

データサイエンティスト検定リテラシーレベル(DS検定★)とはどんな資格試験なのか、ヤンジャクリン講師が解説します。

試験範囲や出題内容、必要な学習レベル、また合格基準や難易度などについても考察しますので、ぜひ参考にしてください。

最短合格を目指す最小限に絞った講座体系

1講義30分前後でスキマ時間に学習できる

現役のプロ講師があなたをサポート

20日間無料で講義を体験!

DS検定試験とは

データサイエンティスト検定リテラシーレベル(DS検定★)は、一般社団法人データサイエンティスト協会によって実施されている、今大注目の検定試験です。

2021年9月に第1回目が実施された比較的新しい検定であり、データ活用人材の需要が高まるにつれて受講者数はますます増加していくと予想されます。

データサイエンスと呼ばれる大きな分野に含まれる、データ加工、機械学習、データ分析、エンジニアリング、数理統計学、ビジネスなど、様々な知識やスキルを広くカバーしています。

DS検定の目的

DS検定の取得により、データサイエンティストに必要な入門レベルの実務能力や知識、および、裏でそれを支える数理統計学やAI教育のリテラシーレベルの実力を有していることを証明できます。

データサイエンティストを目指す人達とそれを必要とする産業界を結びつけることがデータサイエンティスト協会の指針のひとつです。 

データサイエンティストに必要なスキルを一般的に、データサイエンス力・データエンジニアリング力・ビジネス力、と3つのカテゴリに分けて考えることができます。

とはいえ、データサイエンティストに必要な素養は様々で、全てに精通している人材は稀であり、「データ分析官」の方はビジネス系寄り、業務系寄り、フロント寄りなどと言われ、「AIエンジニア」の方は開発・実装重視と言われています。

データサイエンスの専門企業だけではなく、一般企業の社員が全員持つべき「データリテラシー」についてはこちらをご覧になってください。

参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ

DS検定試験の概要

出題形式 選択式問題
問題数 90問程度
試験時間 90分
会場 全国の試験会場で開催(CBT)
出題範囲 ・スキルチェックリストの3カテゴリ(データサイエンス力、データエンジニアリング力、ビジネス力)の★1(見習いレベル)相当
数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム
受験費用 一般:10,000円(税抜)
学生:5,000円(税抜)
試験時期 年2回(春・秋)

第3回試験日:2022年11月15日(火)~2022年12月5日(月)

参考
第1回:2021年9月11日~9月30日
第2回:2022年6月10日~6月30日
公式参考書 最短突破 データサイエンティスト検定(リテラシーレベル) 公式リファレンスブック

DS検定の試験科目 必要な知識とスキル

DS検定に出題される内容をより詳しく解説します。

上記では、データサイエンス、データエンジニアリング、ビジネスの3つの枠組みについて話をしましたが、ここでは各分野において求められる個別の知識やスキルを紹介します。

データの活用事例

まず、全体像を掴むためには、社会におけるデータ・AIの活用事例を知る必要があります。

アガルートアカデミーのDS検定対策講座では、冒頭のPart1で実際のデータサイエンティストの会社で行われているデータ活用案件を豊富に紹介します。

データリテラシー

そして、サイエンス、エンジニアリング、ビジネスのどれを学ぶにしても、重要となる基本的なデータリテラシーも出題されます。

参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ

データサイエンス

データサイエンスは最も広い出題分野です。

代表的な出題項目が以下となります。

  • 機械学習の基本概念である、人工知能、機械学習、ディープラーニングの関係性
  • 学習と予測の仕組み、機械学習モデルの構築と運用の流れ
  • 教師あり学習、教師なし学習、強化学習
  • 特徴量設計・データ前処理
  • 機械学習・データ分析の代表的な手法(例:線形回帰、ロジスティク回帰、決定木、アンサンブル学習、K-means、ナイーブベイズ、ニューラルネットワーク)
  • 学習済みモデルの評価、 精度指標、ROC曲線、AUC
  • モデルの最適化、ハイパーパラメータのチューニング
  • 画像・動画データの形式、処理と解析(画像分類、物体検出、セグメンテーション)
  • 音声データの形式、音声処理
  • 自然言語の処理(形態素解析、構文解析、意味解析)
  • 時系列データ、時系列分析
  • モデルの予測結果の解釈、局所的説明と大域的説明

データエンジニアリング

  • データ収集の技術、   ウェブクローリング・スクレイピング
  • データの保管:  ストレージ、データストア、データベースなど
  • リレーショナルデータベース(RDB)、SQLとnoSQL
  •  ER図
  •   テーブルの正規化、正規化の各種
  •   データ基盤、クラウド、  サーバー
  •  データ転送、  バックアップ、 データ処理
  •   セキュリティ上の注意点(機密性、完全性、可用性)、  攻撃と防御、アクセス制御

ビジネス力

ここではデータ分析プロジェクトの進め方、契約や開発の種別、そして軽視してはいけない法規制について問われます。

  • データサイエンティストに求められるビジネス力
  • データ分析プロジェクトの進め方
  • 現状把握: ビジネスモデル、プレイヤー、一次情報、二次情報
  • 課題の定義: スコーピング、5フォース分析、MECE、ロジカルシンキング
  • 目標の設定(KPI、KGI、KPIツリー)
  • 仮説の立案と検証
  • ドキュメンテーション、結果の考察と説明
  • 契約の種別:  請負契約、準委任契約
  • 開発の形式:ウォータフォール開発、アジャイル開発
  • データ倫理、コンプライアンス
  • AIが社会に及ぼす影響、ELSI、GDPR
  • 個人情報保護法、プライバシー、要配慮個人情報と機微情報
  • 匿名加工情報、オプトアウト制度
  • 公平性と透明性:ブラックボックス問題、説明可能AI(XAI)、人間中心のAI社会原則、
  • 知的財産権、特許権、著作権、
  • 不正競争防止、営業秘密、限定提供データ

統計学・数学

上記以外に、統計学・数学の基礎も問われます。

例えば統計学では以下が代表的な出題項目です。

  • 記述統計学と推測統計学
  • 基礎統計量とその使い分け(平均値、中央値、最頻値)
  • データの広がりを示す指標(分散、標準偏差)
  • 母集団から標本の無作為抽出
  • 統計的推定
  • 統計的仮説検定
  • 二変数間の関係性(共分散、相関係数、因果関係)

数学では、微分や線形代数の高校レベルの問題が出題されることがあります。

DS検定の合格ライン・合格基準

DS検定のおおよその合格基準はDS検定の公式サイトの上で公表されています。

2021年9月11日~9月30日に実施された2021年第1回目の合格ラインの目安は正答率約80%でした。

受験者数約1400名
合格者数927名
合格率約66%
合格ラインの目安正答率約80%
参照:2021年第1回目DS検定開催報告
※過去参考値 2022年は試験問題が刷新されるため上記の通りではありません

ただし、試験ごとに振れ幅が想定されるので、あくまでも目安だと思ってください。

あくまでも個人的な感覚としては、以下のような水準を達成するまで勉強をされている方は合格圏内に入ると推測しています。

  • 本記事に羅列されている出題項目を一通りご自身の言葉で「どういうことなのか」を他人に説明できるようになる
  • アガルートのDS検定対策講座を履修し、その8割を「よく理解できている」レベルにあること、並びに、講座に付属する模擬試験で8割以上の点数を取れている

参考として、同じくAI資格のG検定の合格率は7割前後と言われています。

CBT会場で試験終了と同時に、「データサイエンス」「データエンジニアリング」「ビジネス」の各分野、及び総合の得点率が印刷された紙がPCから出力され、受験者の出来の速報として参考になります。

試験が行われた月の翌月中には、合否の結果とともに、詳細なスコアシートを受験する際に登録するマイページからダウンロードできるようになります。

この詳細なスコアシートを見れば、上記の各分野で出題された各詳細項目の正答率と全受験者の平均点を知ることができます。

以下に、データサイエンス分野におけるスコア詳細の一例を添付します。

DS検定の難易度

DS検定は筆者からみて、今までの国内のデータサイエンス資格の中で最も難易度が高いものと思っています。

DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。

さらに、比較的新しい資格試験であり、参考書や講座がG検定など他の資格試験ほど数多くはない、ネット上の情報も多くはないのも事実です。

それでも、DS検定への注目度が急上昇しており、今後は非常に伸びていく資格試験と予想されており、社員に重要な教養として企業では集団としてDS検定を目指すことも多くなってきました。

統計検定やG検定に合格した後に、次のステップとしてDS検定に挑戦される方が多いです。

過去にG検定を受験したことのある方はDS検定の受験が大変有利です。

データサイエンスの分野など、出題内容に親和性があるためです。

プログラミングのスキルはDS検定にとって重要ではありません。

しかしプログラミングやデータ操作の経験があるとエンジニアリングの分野とのなじみが良くなるかもしれません。

数学や統計学は中学・高校で学んだレベルの範囲で出題されます。

統計学は演習も含めてアガルートのDS検定対策講座の中で十分に教えいたします。

文系出身の方など、数学をもう少し勉強したい方は補助として公式参考書の使用をお勧めします。

G検定との違い

今では、ITパスポート、G検定、DS検定はデータサイエンス人材になるための3つの関門と言われています。

以前こちらでG検定を紹介しました。

関連コラム:G検定(ジェネラリスト検定)とは?【データサイエンティストに関わる資格】

DS検定はG検定よりも、出題範囲が2割ほど広いと言われています。

G検定はディープラーニングやそれを応用した最先端技術の非常に深い技術(ニューラルネットワークの仕組み、強化学習、自然言語処理、画像認識のCNN、音声生成など)の部分を問う問題が多いです。

DS検定ではこれらが薄くなっている反面、ビジネス、エンジニアリングの知識が増えます。

また数学・統計学に関する出題も若干G検定のより多い可能性があります。

また、DS検定の方が難易度が少しだけ高いと言われています。

そのため、G検定を先に受験してからDS検定に挑む方もいます。

ただ、2つの検定試験は出題が被っていない部分が多くあるので、独立した資格試験と思ってください。

どちらも同じくらいデータサイエンティストを目指す方に重要です。

Di-Lite3大資格の難易度比較

他に、Di-Liteの3大資格には、G検定、DS検定、ITパスポートがあります。

この中で、DS検定が一番難しく、次にG検定、次にITパスポートと言われています。

しかし、これには個人差が大きいので、あくまでもひとつの目安と受け取ってください。

上記に書かれているように、DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。

「Di-Lite (ディーライト)」とは、「デジタルを使う人材」であるために、全てのビジネスパーソンが、共通して身につけるべきデジタルリテラシー範囲です。「Di-Lite」は現在、「ITソフトウェア領域」「数理・データサイエンス領域」「AI・ディープラーニング領域」の3領域として定義され、その学習すべき範囲として、「ITパスポート試験」「G 検定」「データサイエンティスト検定」の3つの試験のシラバス範囲が推奨されています。

デジタルリテラシー協議会

最短合格を目指す最小限に絞った講座体系

1講義30分前後でスキマ時間に学習できる

現役のプロ講師があなたをサポート

20日間無料で講義を体験!

この記事の著者 ヤン ジャクリン

ヤン ジャクリン (講師紹介はこちら

2015年 東京大学大学院 理学系研究科物理学専攻 修了(理学博士)
2015年 高エネルギー加速器研究機構 素粒子原子核研究所(博士研究員)
2017年 株式会社GRI(現職) 講師 兼 分析官
2019年 Tableau Desktop Certified Associate 資格取得

・英検1級
・TOEFL IBT試験満点

北京生まれ、米国東海岸出身(米国籍)、小学高学年より茨城県育ち。

万物の質量の源となるヒッグス粒子の性質を解明し、加速器実験による新粒子発見に関する研究を行い、国際・国内学会発表20件以上、査読論文5件以上。
10年以上に渡り、幅広い年齢層の学習指導を学習塾や大学などで実施(5科目、英会話、受験指導、素粒子物理など)。
現在は、株式会社GRIにて、データ分析官(データ前処理、可視化分析、マーケティング施策の分析 他)
公開講座および法人研修を多数開設。

講座を見る

専門スタッフが丁寧に対応!