説明可能AI(Explainable AI; XAI)

なぜモデルの解釈性が重要なのか 画像認識、音声認識、自然言語処理など数多くの分野でブレークスルーをもたらしたディープラーニング技術の元となるアルゴリズムは、ニューラルネットワークです。 ... 続きを読む

確率と確率変数とは

確率とは? 確率とは一言でいうと、ある出来事(統計学では「事象」)がどの程度起こりやすいかを数量的に表した値です。 日常生活を送る上で「絶対」というものは殆どありません。よって私たちは、... 続きを読む

データリテラシーとは

今では、データ分析官、データコンサルなどの専門家だけではなく、幅広い職業分野において、ビジネススキル・基本教養の1つとしてデータリテラシーが求められています。 個人だけではなく、経営層および... 続きを読む

データ分析における仮説検証

データサイエンティストは1つのデータ活用プロジェクトの中で、 課題定義から結果報告までを行う必要があり、一般的に以下の順番で進めます。 1.課題定義と仮説立案→  2.仮説検証→  3.検証結... 続きを読む

よく聞くKPIとKGI

データ分析の業務を進めるのにあたって、依頼側が達成したい目的・目標を意識すべきです。そうすると、目標達成のために、分析に使うべきデータやアプローチが明確になります。 この記事では、ビジネス上の... 続きを読む

アジャイル開発とウォーターフォール開発の違い

データ分析プロジェクトの要件に、システム開発が含まれる場合があります。システム開発の進め方として、ウォータフォール開発(古くから使用)と アジャイル開発(近年普及)が代表的です。 これらはデー... 続きを読む

母集団と標本

本日は、統計学でよく聞く「母集団」と「標本」について語りたいと思います。 統計学で最もよく使われるアプローチは記述統計学(descriptive statistics)と推測統計学(infer... 続きを読む

Excelで度数分布表・ヒストグラムを作成

データの分布を可視化するための代表手段の1つはヒストグラムです。 ヒストグラムとは、データがとりうる区間(階級)ごとのデータの個数(度数)を分布として表現したグラフです。横軸は階級、縦... 続きを読む

AIを用いた画像生成〜ディープフェイクの現状〜

AIや機械学習は既存のデータに対する予測や識別に活用されるというイメージが強い中、近年ではディープラーニングを用いて、画像、動画、音声、文章を新しく生み出す技術(「深層生成モデル」)が実現されていま... 続きを読む

すぐできる!特徴量の相関を調べる&可視化

「データサイエンスもくもく会」を10月から開始し、皆さんのおかげで、5回を開催することができました。もくもく会とは、毎回異なるトピックで講義し、ディスカッションする、無料オンライン・サロンで... 続きを読む

プロ講師の授業を体験!