本稿では、統計検定の概要を確認した後、とくに統計検定2級に焦点を当てて、詳しい内容と試験対策方法を紹介します。
統計検定とは
統計検定は、日本統計学会が実施する、統計学についての検定試験です。1級(準1級)から4級までが用意されており、公式WEB(https://www.toukei-kentei.jp/about/)によると「データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。日本統計学会は、中高生・大学生・職業人を対象に、各レベルに応じて体系的に国際通用性のある統計活用能力評価システムを研究開発し、統計検定として実施します。」とされています。
資格試験の概要と形式
各級の概要や試験形式などを、確認しておきましょう。公式WEBに挙げられている各級の試験概要・合格率・受験料は以下の通りとなります。
合格率
受験料
統計検定2級の場合の総費用
統計検定2級の場合、受験料は5,000円、過去問集(1,540円)と参考書を数冊購入(3,000円〜10,000円程度と概算)とすると、おおよそ20,000円いかないくらいが総費用となりそうです。後述のスクールやセミナーを利用する場合は50,000円〜100,000円程度が追加で発生することになります。
CBT(Computer Based Testing)方式でほぼいつでも受験できる!
統計検定は、会場での筆記試験の他、テストセンターのコンピュータ上で受験し、その場で合否を知ることができるCBT方式も採用しています。筆記試験のみの時代は年に2回しか受験できなかった統計検定2級ですが、CBT方式の導入により、ほぼどのような時期にも受験することが可能となりました。学習準備が整った最適なタイミングで受験することができますので、不要に焦ったり、無理をしたスケジューリングを行ったりする必要はありません。このような受験のしやすさも統計検定の良さの1つと言えるでしょう。
時代に求められる資格:統計検定取得のメリット
内閣府の出した「AI戦略 2019」ではその教育改革の具体的目標を「デジタル社会の「読み・書き・そろばん」である「数理・データサイエンス・AI」の基礎などの必要な力を全ての国⺠が育み、 あらゆる分野で人材が活躍」としています。このような時流の中、各企業でも社員の数理・データサイエンスリテラシー育成のペース・メーカーとして統計検定の取得を推奨しているところが増えています。
例えば、統計検定のWEBではダイキン工業が2018年の新入社員100人ほぼ全員に統計検定を受験する研修プログラムを実施した事例や、大塚製薬研究所で研究所社員に対して統計検定2・3級相当の研修を実施している例が紹介されています。どちらも必ずしもデータ分析職ではないことに注目して下さい。このような例は、WEB上で実にたくさん見つかるでしょう。
その他、統計検定2級の、就職/転職活動上のメリットと業務におけるメリット(有用性)を紹介しておきましょう。
統計スキルのスタンダード:履歴書にかける統計検定2級
企業において統計検定の取得推奨となるグレードはほとんどの場合2級です。まれに3級が、専門職の場合には準1級以上が推奨されることがあります。また、データサイエンティストをはじめデータ分析関連の職業では募集要項の必須知識として統計検定2級程度の統計学の知識を挙げている企業も多いです。
例えば、求人情報サイトにおいて募集要項を「統計検定2級」をキーワードとして検索すると、データサイエンティスト・データアナリスト・機械学習エンジニアなどデータ分析関連の職業が様々挙がってくるのがわかるでしょう。
お勉強で閉じない実質的効果あり:業務で役立つ統計検定2級
もちろん、就職や転職などキャリア上のメリットだけが統計検定2級のメリットではありません。例えば、資格試験の学習の中で培った図表・グラフの取り扱いは、業務プレゼンテーションにおけるデータの表現で役立つでしょう。また平均値・中央値・分散・標準偏差などの基礎的な統計量についての詳しい知識は、データの意味を要約することにも、データを正しく解釈することにも共に有用でしょう。仮説検定や実験計画法の知識は、業務におけるP D C Aサイクルに科学の力を加えるし、重回帰分析を学べば、どのような業務でも必要とされる「予測」作業を自分のものにすることができます。統計検定は、数ある資格試験の中でも実践的な資格と言えるでしょう。
統計検定2級:詳細編
上で見てきたように、統計検定はまさに時代の求める資格であり、中でも統計検定2級は、データを扱う社会人にとっての統計スキルのスタンダードになろうとしています。
ここからは、統計検定2級の詳しい内容と対策方法を紹介していきます。
試験範囲
統計検定2級の試験範囲は、以下のように与えられています。まだ統計学の学習を始めていない方や統計検定の受験を検討している段階の方は、以下に現れる用語が一切わからなくても気にする必要はありません(読み飛ばしてください。)
【出題範囲】統計検定公式WEBから。詳細は出題範囲表を参照ください。以下の内容に加え、統計検定3・4級の内容が含まれます。
- 1変数データ(中心傾向の指標、散らばりの指標、中心と散らばりの活用、時系列データの処理)
- 2変数以上のデータ(散布図と相関、カテゴリカルデータの解析、単回帰と予測)
- 推測のためのデータ収集法(観察研究と実験研究、各種の標本調査法、フィッシャーの3原則)
- 確率(統計的推測の基礎となる確率、ベイズの定理)
- 確率分布(各種の確率分布とその平均・分散)
- 標本分布(標本平均・標本比率の分布、二項分布の正規近似、t分布・カイ二乗分布、F分布)
- 推定(推定量の一致性・不偏性、区間推定、母平均・母比率・母分散の区間推定)
- 仮説検定(p値、2種類の過誤、母平均・母比率・母分散の検定[1標本、2標本])
- カイ二乗検定(適合度検定、独立性の検定)
- 線形モデル(回帰分析、実験計画)
もし統計学を大学で既に学んだことがある方は、この試験範囲が学部における統計学入門授業のラインナップに近い印象を受けると思いますが、実際、大学生向けの「統計学入門」テキストの多くは統計検定2級の範囲とかなりの程度オーバーラップをしている場合が多いでしょう。
大雑把な表現を加えておくと「記述統計(3級)から推測統計の基礎(推定・仮説検定・回帰分析のそれぞれ基礎事項)まで」が統計検定2級の範囲となります。
試験の難易度は?:働きながら取るのは簡単じゃない(学生は逆にチャンス!)
統計検定2級の難易度は、簡単ではありません。特に、統計を一度も学んだことがない社会人がゼロから統計検定2級取得を目指す場合、きちんとした計画作りと対策が必須となります。
WEB上のブログ記事では「1週間で合格した」とか「マークシートなのでふんわり理解しておけば良い」などの甘め記事が散見されますが、現役理系大学生やそれなりのバックボーンを持っている方・数学や統計学を最後に学んでから日が経っていない方が書かれているケースが多いので、社会人の方は間に受けない方が無難でしょう。
大学生向けの標準的な講義で半期あるいは通年分程度の分量であることを考えると(もちろん大学の通年授業で扱う全ての項目が試験範囲となるわけではありませんが)働きながら勉強する社会人が「1週間で合格」はどう考えても非現実的だとわかるはずです。
勉強時間(期間)の目安は?:数ヶ月はかかります
そこで、統計学を全く勉強したことがない人が、統計検定2級に合格するまでの対策期間としては、毎週土日に数時間の勉強を行うとして、おおよそ半年程度を目安とすると良いでしょう。もちろん個人差はあり、数学が得意な人など3ヶ月程度で合格する人もいるかと思いますが、最初の見積もり(ざっくりとしたスケジューリング)としては半年程度で仮置きしておくのが無難です。
数学はどの程度必要か?:高校数学の一部が必要です
統計検定2級で使用する数学は、基礎的な計算技能に加え、高校数学の一部(順列・組合せ・確率・簡単な微積分)が必要です。忘れてしまった人は必要な単元のみを高校数学のテキストを用いて集中的に復習するのが良いでしょう。
数学は、避けようと思えば避けられないこともないです。実際、高校数学を直接扱う問題を全てスキップしたとしても、他が良くできていれば合格点に届くことはできます。ただし、高校数学を扱う問題の、数学の問題としての難易度は高くありません。練習をしないまま見切りをつけてしまうことは少しもったいないかもしれません(数学以外の問題の得点率を高めるのも同じくらい難しいでしょう。)
必勝!項目ごと対策法
試験範囲は相応に広いので、項目ごとの躓きやすい点や得点源となりやすい点を押さえながら効率的に学習を進めましょう。ここから紹介する内容はまだ学習を進めていない方は無視して次節に進んでください(そして勉強を始められてから時々戻ってきて参考にしてみて下さい。きっとお役に立てる部分があると思います。)
全体:なるべくはやく過去問演習に移行することが鍵!
統計検定はすでにかなりの回数が実施されています(2020年で検定開始10年目です。)ですので、過去問のストックも相応にあり、過去問を主体とした対策が立てやすい環境になっています。市販の問題集に時間をかけ過ぎることなく、早い段階で過去問を紐解き、過去問を解く→間違えた問題の類題をテキストで演習→過去問を解く→・・・と言うサイクルに入るのが得策でしょう。本番直前で始めて過去問を見た、と言う状態だけは避けてください。
全体:手を動かして問題を解こう
社会人の勉強の何よりの障壁は学習時間が取れない、と言うことかもしれません。そのため、多くの人が通勤の移動時間や寝る前のちょっとした時間に、教科書を読んで、学習を進めようとします。
しかし、統計検定2級は(例えば大学卒から時間が経っていて、しかも統計学の学習が初めての社会人が)ふんわりとした理解で合格できる試験ではありません。手を動かして問題を解く、という作業はスキップできない過程として最初から認識しておく必要があります。少しでも、5分でも、手を動かす時間をとりましょう(大変だと思いますが・・・。)
記述統計:統計検定2級には3級の問題が3~4割出題されます
統計検定2級では3級範囲の問題が少なくないボリュームで出題されます(公式の数字ではありませんが、3〜4割程度出題されるようです。)3級の過去問は良い練習となるので是非活用しましょう。3級過去問でスコアが伸びない場合、基礎的概念でつまずきがある可能性が高いですので、良いチェック機能も持ちます。
仮説検定:ロジックはサクッと押さえて問題演習を繰り返そう
仮説検定は統計学独特の考え方で、初学者泣かせのところがあります。そのため、腹落ちする理解を求めて、分かりやすい「読み物」を何冊も手に取ってしまう方がいますが、「読み物」に時間をかけることは資格試験の勉強としてはあまり効率が良くありません。仮説検定の細かい理解は問題演習を通して学ぶと言うスタイルの方が、おそらく圧倒的に効率が良く、そして深く理解できるでしょう。
推定:区間推定に注目
統計学的ツールのスタンダードと言えば仮説検定だと思ってしまう方も多いようですが、推定(特に区間推定)と検定には優劣はありません。特に近年、仮説検定の濫用とも呼べるような事態が多々起こっていることから、信頼区間の活用はますます注目されていくでしょう。やや業界事情っぽくなってしまったのですが、推定と検定で勝手に優劣をつけず同等程度のバランスで学びましょう。
確率変数:ごまかさずに扱いに慣れておこう
統計検定2級の受験者の中には、確率変数(X)と実測値(x)の区別を曖昧なままで済ませてしまう方が相当程度いますが、確率変数と実測値の区別をつけながら式を立てることは推測統計の理解を深め、安定してスコアを出すには欠かせないポイントになります。さらに、確率変数は”統計学のアルファベット”のような基礎概念なので、今後の伸び代を考えると、確率変数をちゃんと理解して学んだ人と曖昧な理解で済ませた人では、実務応用の場面で差が大きく開いていくでしょう。投資効果は大きい、と考えて今からでも、確率変数と実測値の区別を意識して扱ってみてください。
確率変数:EやVやCOVなどの記号の扱いに慣れよう
期待値や分散、共分散を計算する演算子E[X]・V[X]・C O V[X]についての公式とは早めに仲良くなっておくのが良いでしょう。これらの記号操作を難しく感じられる方も多いかもしれませんが、実際のところほとんどの記号は計算を楽に行うために導入され利用されています(文系泣かせの記号であるΣも同様です)。大学科目の意匠のために記号が使われているのではなく、本質的に便利だということを理解し、勉強初めから避けずに利用してみるのが得策です(大丈夫、すぐに慣れます。)
線形モデル:回帰レポートを徹底的に理解しょう
統計検定2級の最後の問題は回帰分析が出題されることが多く、とくに回帰レポート(回帰分析結果)の読み取りが出題されます。決定係数(R squared)や回帰係数の読み取りはもちろん、分散分析表の自由度などをきちんと答えられるようにしておきましょう。
回帰レポートは、表中の各セルの値が論理的につながっている形式になっている(例えば回帰係数の推定値を標準誤差で割るとt値になる)ことを理解して、一部がマスクされても復元できるようにしておきましょう。
それでもどうしても数学が苦手な人へ
大学卒業後に一切数学に関わることなく何年も経ってしまった人にとって、高校数学や数理統計の内容は、若干、負担が大きいかもしれません(そうなって当然です。)また、元々数学や数理科目が大の苦手という人もいるでしょう。そういう方はまず統計検定3級の取得を目指して学習を進め、余裕があれば2級の対策に移行するという形をとることをお勧めします。3級なんて初等的過ぎて無駄と思われるかもしれませんが、そんなことはありません。項目別対策法のところでも記載しましたが、まず統計検定2級には相当程度3級の内容が出題されますので、3級の勉強はそのまま2級対策にもつながっています。加えて、3級自体が持つ積極的な魅力も紹介しておきましょう。
3級取得は無駄じゃない!ビジネスシーンで「使える」3級
統計検定3級の試験範囲である記述統計は、単純化を許せば「表・グラフ・基本統計量(平均・分散など)の正しい理解を問う試験」です。当然2級ほど高度ではありませんが、より多くの人に必要とされている試験、という見方もできます。2級が活用できるかどうかは企業や状況を選びますが、3級内容はほぼどのような環境でも必要でしょう。3級取得は2級取得の準備とだけ捉えると少し回り道に思えるかもしれませんが、統計の業務活用の側面から見ると決して回り道ではなく、一つの有用な学習過程と言えると思います。
統計検定の学習におすすめの参考書
ここではおすすめの参考書/問題集を紹介します。対策法のところでも述べましたが、学習のポイントはあくまで「過去問演習」を中心に沿えること。テキストはサブだと心得ておきましょう。
過去問:『統計検定 2級 公式問題集(2017-2019年)』
過去問は必須です。テキストタイトルは「公式問題集」となっていますので注意してください。また最新版は3年分の掲載しかないため、2017年より過去分が必要な場合は別途購入する必要があります。
公式テキスト:『統計学基礎』
公式テキストは重要であるけれど、人によって「合う/合わない」があるため、「合わない」と感じたらキッパリ見切りをつけて自分にとって使いやすいテキストを使いましょう
王道参考書:東京大学教養学部統計学教室『統計学入門』(東京大学出版)
大学教養課程の統計学の教科書として王道的な位置にいる1冊です。統計検定2級範囲と重なるところが多く、記述統計から回帰分析までを扱っています(ただし分野によって過少部分も過大部分もあります。)推測統計の理論を確率変数の言葉できちんと理解したいという方にお勧めできます。
仮説検定の考え方に慣れる:小島寛之『完全独習 統計学入門』(ダイヤモンド社)
統計学的仮説検定や信頼区間という(初学者にとって)ちょっとクセのある概念について、相当直感的に解説しています。これらの概念がどうしても腹落ちしない、という方は視野が開ける経験をすることができるでしょう。ただし、直感的な解説にとどまるため、本書を読んだことで統計検定2級の問題が解けるということにはまずなりません。読んで、理解したら、そこに止まらず速やかに問題演習に入りましょう。
順列・組み合わせ・確率など高校数学の復習に:坂田アキラ『坂田アキラの 場合の数・確率・データの分析が面白いほどわかる本』(KADOKAWA)
順列や組み合わせなど、パターンの列挙と数え上げが弱い方は、高校数学のテキストで練習すると良いでしょう。高校数学のテキストは数多く、受験市場が成熟しているため良書も多いので書店で「合う」本を選ぶのが良いと思いますが、例えば上記の1冊を手にとってみて下さい。
独学は難しいと思ったら:こんなにある!?統計検定対策をサポートするコンテンツ
例えば企業勤務をしながら資格試験の勉強を独学するのは、決して簡単なことではありません。統計検定対策を行なっているスクールやセミナー、WEBコンテンツは様々ありますので是非活用してみてください。
個別レッスン&セミナー(教室)
大人のための数学教室 和
社会人向けの数学・統計学教室です。個別指導で数学のレッスンを行なっています。
統計検定に対応したセミナーも開催しています。
すうがくぶんか
こちらも社会人向けの数学教室です。上記と同じく個別指導で統計検定のレッスンを受けることもできますし、統計検定対応の長期集団セミナーも開催しています
オンラインコンテンツ
最近は統計検定2級用のオンライン・コンテンツも増えています。ここで紹介しているもの以外も複数見つかるでしょう。
代ゼミ教育総研
大学受験で有名な代ゼミ講師が提供するオンラインセミナーです。
データサイエンス研究所
まとめ
統計検定2級は、統計学の基礎知識を有していることを示す資格として広く認知されるようになってきました。業務の現場では、統計検定2級を持っていると「統計学の基礎用語で会話ができる人」という認定を与えられます。必ずしもデータ分析の専門職でなくても、データ分析専門職と共同する機会や、データ分析タスクを依頼される機会が増えていくかもしれません。データ分析があらゆる領域で必要とされていく中、統計検定2級も、あらゆる領域で有用な資格になっていくでしょう。
著者:meifelyuki
フリーランスのデータサイエンティストとして、大学や企業などをフラフラしながら様々なデータサイエンス業務に携わっています。データサイエンスを「する/教える/作る」の全てが好きです。レガシーな統計解析も、kaggleな機械学習も、強力だけど時にブラックボックスな深層学習も平等に好きです。お仕事の依頼は編集部まで!