TRANS.Blog

経営(ヒト・モノ・カネ)に関して定量的な分析を発信する 株式会社トランスのブログ

退職予測「正解率80%」はどれだけ意味があるのか?(理論分析)

今回は、退職予測がどれだけ事業に利益をもたらすか考察するために
「退職予測の正解率はどれだけ意味があるのか?」
という課題について考えてみます。

※関連記事は「退職(予測)に関するデータ分析結果(まとめ) 」よりご覧ください。

 

退職予測「正解率80%」は意味がない!?

退職を80%予測できると聞いたことがあるのですが本当ですか?

正解率80%の予測はできます。ただ内容次第では事業への貢献はないかもしれません。

退職予測を弊社の成果につなげることはできますか?

はい、意味のある結果にできるか考えてみましょう。

 

人事戦略において、「離職率(退職率)低減」を1つのKPIとしている企業も多いかもしれません。

 

「退職率低減」のために、いろいろな手法があると感じていますが、その中で
退職しそうな人を事前に見つけ出し、フォローすることで退職を防ぐ
という方法があります。

この手法では、どれだけ
「”適切に”退職リスクがある人を事前に見つけ出せるか」
が重要になります。

 

一方で、この”適切に”という考え方が難しく、共通的な指標や見解がないことも事実としてあります。

そこで今回は、退職予測に対する考え方を整理してみます。

 

 

0.(参考)未来予測に関する予測精度とは?

 未来予測では、以下の表のように「予測結果」と「実際の結果」を比較して、予測精度の評価を行います。

ここでは、
・「正解率」は、表の「左上」と「右下」の合計割合であること
をご理解いただければと思います。

 

f:id:trans-inc:20181010182743p:plain

※予測精度の詳細は、「未来予測における予測精度のいろいろな算出方法」の記事をご参考ください。

 

1.退職予測「正解率80%」に意味がない場合

まずはじめに、退職予測の「正解率80%」がどのような場合には、事業として効果的な数字でないのかを確認します。

1-1.退職率が低い場合

例えば、以下のような退職予測モデルがあったとします。

f:id:trans-inc:20181010182847p:plain

この場合、「正解率」は、
・「退職」と予測して、実際に「退職」だった「1人」
・「在職」と予測して、実際に「在職」だった「100人」
の合計割合になるため、
(1人 + 100人)/ 121人 ≒ 約83% = 正解率
となります。

一方、表をよく見てみると
・「実際に退職した人」は「11人」
・「実際に退職した」「11人」のうち、「退職を予測できた」のは「1人」
となっており、
正解率83%でもほとんど意味のある予測ができていない
ことがわかります。

 

ちなみに、「実際の退職率」と「ランダムに退職を予測したときの正解率」の関係をまとめると以下のようになります。
※「ランダムに予測」とは、すべての情報を加味せず「適当に」予測した結果です。

f:id:trans-inc:20181010183941p:plain

表を見ると
・退職率10%の場合、ランダムに予測しても正解率82%
・退職率5%の場合、ランダムに予測しても正解率90%
・退職率2%の場合、ランダムに予測しても正解率96%

であることがわかります。

※仮に「年」ではなく「月」で予測していると、「年間退職率24%≒月間退職率2%」になるため、ほとんどの企業で正解率96%以上になることもわかります。

 

そのため、
退職率によっては「正解率80%」だけでは、よい予測ができているのかわからない
という問題があることがわかりました。

 

1-2.データに不備がある場合

機械学習」で予測を行う場合、
使用するデータによっては、予測精度と関係なく「正解率が高くなる」
可能性があります。

 

詳細は割愛しますが、以下のような場合には注意が必要になります。
・「学習データ」と「検証データ」が同じ期間である場合
・「休職データ」など「退職」につながるデータが含まれている場合
・退職直近で変化するデータ(勤務時間、評価など)が含まれている場合

 

 

 

2.なぜ企業は予測結果のすべてを公表しないのか?

「1.退職予測「正解率80%」に意味がない場合」を見ていくと、
「正解率80%」の意義は、「詳細内容」を明らかにして初めてわかる
と言えるかと思います。

 

一方で、過去の様々な企業の発表では、「詳細内容」が明らかにされていない場合がほとんどです。

 

理由の1つとしては、
退職予測の結果をある程度示してしまうと、退職率が予測できてしまう
という問題があるかなと感じます。

 

難しい部分ですが、うまく課題をクリアして、各社の知見を共有していけるとよいなと個人的には感じています。

 

3.退職予測はどうすれば意味があるのか?

一方、「正解率」ではなく、別の観点で考えると、「退職予測」の有用性が見えてきます。

 

例えば、以下のような「退職予測」ができたとします。

f:id:trans-inc:20181010194619p:plain

このモデルでは、正解率85%(=(5人+80人)/ 100人)ですが、
退職と予測した10人のうち、5人が実際に退職しています(50%)。

 

全体での退職率は、20%(=20人/ 100人)であるため、
退職予測モデルが予測した従業員に優先的にすると、
従来の2.5倍(50% / 20%)の効率で退職リスクへのサポートができる
ということがわかります。

 

このように、退職予測は、
その予測結果をどのように使うのか?
まで含めて設計できると、事業成果につながる分析になる可能性があると考えています。

 

4.まとめ

 今回、
「退職予測の正解率はどれだけ意味があるのか?」
という疑問を検証し、
「正解率80%」以外の条件がわからないと、意味のない予測の可能性がある
ということを確認しました。


一方で、
予測した結果を適切に用いることで、正解率が低くても事業貢献できる可能性がある
ことも考えられる結果になりました。

 

次回以降の記事では、実データを用いて「どれくらい退職を予測できるのか?」ということに挑戦していきます。

※関連記事は「退職(予測)に関するデータ分析結果(まとめ)」よりご覧ください。

 

もし具体的に「退職予測」をされている方がいらっしゃいましたら、ぜひご意見いただけますと嬉しく思います。

「適性試験」は採用に使えない?正しい試験の選び方とは?

 今回は実際に分析したデータを基に
適性試験を正しく使って成果に結びつける方法」
について考えてみます。

 

適性試験は採用の意思決定に使いにくい?

 

適性試験を実施しているのですが、採用の精度があがりません。

試験によっては、現実がうまく反映されない試験もあるようです。

利用する適性試験によって精度は変わるのでしょうか??

 

人事の方からよくいただく質問の1つに
「採用精度をあげるためには、どの適性試験を利用すればよいですか?」
という内容があります。

適性試験では、いろいろな指標の結果が出るものの、いざ採用の意思決定に利用しようとすると
「ストレス耐性」の部分だけしか見ていない…
という企業も多いかもしれません。

今回は、「適性試験」の使い方で陥りがちな罠と、適性試験の選び方について考えてみます。

 

 

適性試験で「採用意思決定」がうまくいかない5つの例

まず実際の適性試験を分析した結果から、「採用」にうまく使えない事例を確認してみます。

 

1.入社の"前後"で「適性試験」の結果が変わる

以下のグラフは、入社前後である適性試験の数値(一部)を比較した結果です。

f:id:trans-inc:20190201223817p:plain

グラフより
・「早期退職者」「在職者」共に、入社後は数値が下がる
・「早期退職者」は「在職者」よりも、数値の下がり幅が大きい
ということがわかります。

もちろん「入社」という大きなイベントを減ることで適性が変化している可能性もありますが、
入社前後で結果が変わってしまう”適性試験”がある
ということがわかります。

 

2.適性試験の数値が「高い」ほうが「低評価」になる

以下のグラフは、ある適性試験の結果(入社前)と、「入社後評価」の関係性を示したものです。

f:id:trans-inc:20190201223908p:plain

グラフより
・「(入社後)低評価」の人ほど、適性試験の「責任感」や「ストレス耐性」が「高い」
ということがわかります。

一般的には「責任感」や「ストレス耐性」が高いとよいされる場合が多いですが、
「スコアが高い」ほうが「入社後評価が低くなる」適性試験がある
可能性があることがわかります。

 

3.能力試験は、評価と関係性がない

以下のグラフは、「言語能力」「論理能力」と「入社後評価」を比較した結果です。

f:id:trans-inc:20190201223937p:plain

グラフより
「能力試験」の数値は「評価」とあまり関係ない
(統計的有意差はない)
ということがわかります。

※「大学偏差値」や「高校偏差値」についても、複数の企業での分析において、評価との関係性が小さいことがわかっています。(ただし、多くの企業において、そもそも偏差値平均が高いため、「著しく能力」の数値が低い場合には「評価が下がる」可能性はあります。)

 

4.一般的な事例と、自社の場合が異なる場合がある

以下のグラフは、適性試験SPI)の結果と「入社後評価」を比較した結果です。

f:id:trans-inc:20190201224104p:plain 

「営業系」の場合、この5つの指標は
【「く」の字の”逆”】の方が高評価(=「社会的内向性が低い(左寄り)」)
と言われているようなのですが、この会社では
高評価者は「社会的内向性が高い(右寄り)」
という結果になっています。
※この会社は「ソリューション営業」に近いため、「営業」といってもいろいろな種類があることが一因かなと感じています。

 このように会社によって状況が異なる場合があるため、
一般論が自社では当てはまらない
可能性があることがわかります。

 

5.分析の仕方が間違えている

複数の会社で分析された結果において、
「高評価者の平均値で採用基準を作成しており、実は高評価者のほとんどが採用基準を満たしていない」
ことが散見されます。
※参考:ハイパフォーマー分析をしても、よい人材は採用できない??

これは「分析において指標の”組み合わせ”を考慮していない」ことに起因するため、採用基準の分析を行う場合には、
採用基準の組み合わせを考慮した正しい分析・検証が必要
ということがわかります。

 

適性試験をしっかりと採用に生かすためには?

前述の事例を見ると「適性試験を実施しても意味ないの?」という疑問も生まれてきます。一方で、うまく適性試験を利用して、採用精度を高めている事例もあります。

 

適性試験を利用する目的が、「採用」である場合には
「よい適性試験」とは「入社後評価」や「早期退職者」を見極められる試験であること
と言い換えることができます。

 

そのため、
適性試験結果」から「入社後の評価・退職」が実際にどのくらい予測できるか否か
が、その適性試験が「よい適性試験」か否かの基準になります。

 

予算が許せは、「実際に自社で検証してみる」ことが望ましいですが、難しい場合には、適性試験の販売会社に入社後評価・退職の予測結果(できれば具体的な数字)を聞いてみるとよいでしょう。

 

まとめ

今回、
適性試験の種類によっては、入社後の予測ができない試験もある
適性試験を選ぶ際には「実際にどれだけ予測できるか」を確認することが重要
ということがわかりました。

 

もちろん、適性試験をうまく利用することができれば、採用精度を高められることが多いので、「使い方が重要」だと考えています。
※今回の分析は、詳細を公開しにくい事情もあるため、もしご興味を持っていただいた場合には、お手数ですがこちらよりご連絡いただき、お話させていただければ幸いです。

 

みなさまは、どのように適性試験を利活用されていらっしいますか?ぜひご意見いただけますと嬉しく思います。
※また認識違いなどございましたら、不勉強で恐縮ですがご指摘いただけますと幸いです。

 

ハイパフォーマー分析をしても、よい人材は採用できない??

 今回は企業の実データを基に
「なぜ高評価者の特徴分析をしても、よい人を採用できないことが多いのか?」
という課題について考えてみます。

 

ハイパフォーマー(高評価者)分析のやり方を間違えている??

 

ハイパフォーマーの分析をしたのですが、採用がうまくいきません。

単なる統計的な分析では、高評価者は採用できないかもしれません。

ハイパフォーマーを採用したいのですがどうすればよいでしょう?

「高評価者を採用」するための、分析を行ってみましょう。

 

人事の方に伺うと
「高評価者の基準」を分析して作成したのに、実際に採用すると高評価者が増えない
というお話をいただくことも多いです。

今回は、高評価者分析の流れを解説しながら、陥りがちなミスと、その解決策を考えてみます。

 

「性格診断」を例に「ハイパフォーマー分析」をしてみる 

今回は100名の企業のデータ(評価×性格診断(SPI))を見ていきます。当該の企業では、以下のような評価の分布になっており、「高評価」(=ハイパフォーマー)を採用するための「性格診断」の基準を見ていきます。

f:id:trans-inc:20190111211516p:plain

ステップ1:会社のカルチャーに合う人を採用する

「カルチャーフィット」という言葉が注目を集めているように、"従業員のパフォーマンス"と”会社のカルチャー”は、関係性がある場合が多いです。

そこでまずは、会社全体のカルチャーを見るために、全社員における「性格診断の平均値」を見てみます。

f:id:trans-inc:20190111211839p:plain

この会社では、「活動意欲が高く」「慎重性が低い」という特徴があることがわかります。

なるほど!では全社のカルチャーにあった「活動意欲が高く」「慎重性が低い」人を採用しましょう!

と、なってしまうと、高評価者が採用できない基準になってしまう可能性があります。

 

ここで重要な点が、「作成した基準を検証する」ことです。

 

次に、この2つの基準(活動意欲が高い・慎重性が低い)を使用したときに、過去の従業員がどの程度当てはまるかを集計してみます。

f:id:trans-inc:20190111212306p:plain

結果、この2つの基準では、
・基準を満たす(=採用する)従業員のうち、36%が高評価
 ※残りの64%は普通/低評価者
・実際の高評価の従業員26人のうち42%(11人)が該当
 ※高評価者の残り58%(15人)該当しない(=採用しそびれる)
結果になることがわかります。

 

このように検証してみると、この基準を使っても、ハイパフォーマー(高評価者)を採用しにくい可能性が高いと感じられるのではないでしょうか?

 

ステップ2:会社の「高評価者」の特徴に合う人を採用する

次に「高評価者」を採用するために、「高評価者の特徴」に注目してみます。

f:id:trans-inc:20190111214431p:plain

グラフより、高評価者の特徴は
慎重性が低い」「達成意欲が高い」「従順性が低い」「自己尊重性が高い
ということがわかりました。

再度、この高評価者の特徴4つで、既存社員を”検証”してみます。

f:id:trans-inc:20190111214827p:plain

高評価者の特徴4つの基準を使用すると
・基準を満たす(=採用する)従業員のうち、56%が高評価
・一方、実際の高評価の従業員26人のうち、81%(21人)は採用できない
という結果になりました。

この基準は、全体に占める高評価者の割合は上がったもの、採用できる人が少なくなる(=採用難易度があがる)という結果になってしまいました。

これは実は(?)
「高評価者」の平均を超える「高評価者」は少ない
※高評価者には、いろいろなタイプがいるため
ことが原因と考えられます。

以下は、高評価者個人ごとの性格診断結果を示したグラフですが、4つの基準を満たしている高評価者7人中1人(Fさん)のみであることがわかります。

f:id:trans-inc:20190111215419p:plain

 

ステップ3:会社の「高評価者」の特徴を基準を甘くして採用する

ステップ2では、高評価者を採用しようとしても、実際の高評価者の81%を採用しそびれてしまうことがわかりました。

そこで、より多くの採用者を出せるよう、ステップ2の「高評価者の平均以上」という基準を、ステップ3では「特徴4つを持っている(=偏差値50以上)」という基準に変えてみます。

 

先ほどの高評価者の特徴4つ(慎重性・達成意欲・従順性・自己尊重性)が偏差値50以上の場合に、どの程度高評価者を採用できるのか、既存社員で検証した結果が以下です。

f:id:trans-inc:20190111220242p:plain

結果としては、
・実際の高評価の従業員26人のうち、73%(19人)を採用できる
・一方、基準を満たす(=採用する)従業員のうち、61%は普通・低評価
となり、3つのステップの中では、一番実用に近いと感じるものの、
採用する人の6割は高評価では”ない” 可能性がある基準となりました。

 

高評価者の採用基準は「要素の組み合わせ」に着目

ここまでの分析の問題点として、
1つずつの特徴をそれぞれ抽出してから、組み合わせている
という点があります。

 

最後に、「組み合わせ」を考慮して、抽出した4つの基準(「敏感性が低い」「社会的内向性が高い」「身体的活動性が高い」「懐疑的志向性が高い」)を使って、検証した結果を以下に示します。

f:id:trans-inc:20190111221718p:plain

f:id:trans-inc:20190111222017p:plain
結果、組み合わせを考慮して、基準を作成すると
・基準を満たす(=採用する)従業員のうち、84%が高評価
・実際の高評価の従業員26人のうち、62%(16人)を採用できる
 ※残りの38%も別の組み合わせ基準で採用可能
となることがわかりました。

 

この組み合わせを考慮する分析は、もちろん1つずつ手作業でも行えますが、「機械学習」(AI)を使うと比較的簡単に行うことができます。

※「機械学習」を行った結果は以下の記事に詳細を記載しています。

 

まとめ

今回、
・会社全体や高評価者の単純な特徴だけでは、高評価者は採用できない
 ※高評価者の特徴をすべて持つ高評価者は少ない
特徴の組み合わせを考慮した採用基準を作成できると高評価者の割合が向上
 ※「機械学習」(AI)を用いることで、組み合わせを考慮しやすい
する可能性があることがわかりました。

 

HRデータは検証が難しいことも多く、つい「既存社員で基準の検証」するステップを飛ばしてしまいがちですが、しっかりと検証を行うことで、よりよい採用基準が作れるようになると感じております。

 

みなさまは、採用基準の作成にどのような工夫をされていますか?ぜひご意見いただけますと幸いです。

 

「従業員モチベーション」と「業績・退職」は関係するのか?

今回は、企業の実データをもとに
従業員のモチベーションと業績は関係するのか?
という課題について考えてみます。

 

「従業員のモチベーション」は重視すべき?

 

従業員のモチベーションは高めるべきでしょうか?

高いほうがよいと思いますが、目的次第かとは思います。

モチベーションと業績の関係性を定量的に確認することはできますか?

仮定は必要ですが、定量的に分析してみましょう。

 

近年、「エンゲージメント」「従業員満足(Employee Satisfaction)」「従業員ロイヤルティ(eNPS)」などの重要性が指摘されています。

 

 一方、「従業員のモチベーションは気にするべきではない」という主張もみられます。

 

いずれの主張も、実験結果があったり、論理的な説明があるため、「どちらの主張が正しいの?」という疑問を持つ人もいるかもしれません。

 

そこで今回は、企業の大きな目的である「業績を高める」という観点を軸に
「従業員のモチベーション」と「業績」や「退職」は関係するのか?
という課題を考えてみます。

 

※「組織の未来はエンゲージメントで決まる」の本では、

  • エンゲージメント:主体的・意欲的に取り組んでいる状態(自発的な貢献意欲)
  • 従業員満足度:職場環境や給与、福利厚生などへの満足度
  • モチベーション:行動を起こすための動機
  • ロイヤルティ:組織に対する帰属意識、忠誠心

とされており、「エンゲージメント」と他の3つの言葉は区別されています。 「何を計測しており」「本当に成果に結びつくのか」は、それぞれの診断ごとに分析する必要性を感じています。

 

 すべての従業員の「業績」を数値化する

 「モチベーション」(エンゲージメント)の問題で難しいと感じるのは
それぞれの「業績(成果)」をどのように計測(数値化)するか?
という点です。

 

「業績(成果)」を数値化できる業務であればわかりやすいですが、数値化できない仕事も多いです。

 

そのため、過去の研究事例では、数値化して比較しやすい仕事(例えば「コールセンターの受電数」など)が、「モチベーション」と「業績(成果)」の関係性を分析するために行われてきました。

一方、上記の分析が「汎用的な結論を導けるか?」という点については、検討の余地があると感じています。

 

そこで今回は1つの仮説として複雑な仕事を数値化するために
・チームの業績 = マネージャーの業績評価
という仮定をおいてみます。

※マネージャーの評価は業績(成果)の割合を反映させている会社も多いのである程度、確からしい仮定かなと考えています。

 

「従業員のモチベーション」と「業績」の関係性

 先ほどの仮定に基づき
・チームの「従業員のモチベーション」 = モチベーション点数のチーム平均値
・チームの「業績」= マネージャーの業績評価
という2つの指標の関係性を分析してみます。

 

以下のグラフは、ある企業の102のチーム(マネージャー)に対し、「チームのモチベーションの平均点数」と「マネージャーの平均業績評価」を示したものです。

f:id:trans-inc:20181122230016p:plain

 

結果、
モチベーション平均点数が70以上のチームは、チーム業績が高い可能性がある
(平均点数が70未満のチームは、統計的に優位なチーム業績の差はみられない)
ということがわかりました。

 

「平均点数70以上」は、今回の指標ではかなり低い出現率になるため、上記の結果は
モチベーションが著しく高ければ、業績向上につながる
(逆に、モチベーションがある程度の高さにとどまると、業績貢献まではつながらない)
可能性があることが示唆されました。

 

ただし、今回のチームはほぼすべてがモチベーション点数が全ての会社の平均以上だったため
モチベーションが低いと、業績が下がる可能性がある
点については、検証ができていません。

 

「従業員のモチベーション」と「退職」の関係性

 次に、「業績」の中の「費用」という観点から、「モチベーション」と「退職」の関係性について分析してみます。
別記事の通り「1人が退職すると年収の相当の利益損失」の可能性があるためです。

 

先ほどと同様に、「チームのモチベーションの平均点数」と「退職率(全体平均を1とした時の値)」の関係性をグラフにしました。

 

f:id:trans-inc:20181226104630p:plain

結論として、
チームのモチベーションと退職率には、統計的に優位な関係性はない
(モチベーションが低いと退職が増える可能性はあるかもしれない)
という結果になりました。

 

まとめ

 今回、1つの企業のみのデータですが、
・モチベーションが著しく高ければ、業績向上につながる
(逆に、モチベーションがある程度の高さだと、業績貢献まではつながらない)
・チームのモチベーションの高さと、退職率はあまり関係性がない
”可能性がある”ことがわかりました。
(※ただし、「マネージャーの評価」が「チームの業績」に比例すると仮定しており、モチベーションが平均以下のケースは未検証)

 

逆に「従業員のモチベーションは気にするべきではない」という主張は、
一定範囲内のモチベーションの場合、モチベーションの高低と業績に関係性は少ない
という側面をとらえている可能性もあるのかなとも感じております。

 

みなさまの会社では、「モチベーション」(エンゲージメント)をどのように考えられていますか?マネジメントの分析については、まだまだ明らかになっていないことも多いと感じています。ぜひご意見いただけますと幸いです。

 

 

(参考文献)

State of The Global Workplace GALLUP社(「ストレングスファインダー」などを提供)
「エンゲージメントの高いチームは、収益性や生産性が高まる」という結果。
※対象企業は「22 organizations」「45 countries」「1.2M employees」となっており、グローバル展開している大手企業が主な対象になっていると考えられる。

「エンゲージメントと企業業績」に関する研究結果 株式会社リンクアンドモチベーション
「エンゲージメントスコアが高い企業は、翌年の売上/利益の伸びが大きくなる」という結果。

Great Place To Work 研究レポート
「働きがいのある会社(ベストカンパニー)は、売上の対前年伸び率が高い」
「ベストカンパニー10社は、日経平均より投資対リターンの割合が高い」という結果
※「業績」と「働きがい」の因果関係はわからない(「成長」している企業が「働きがい」が高い可能性もある)と記事中に記載あり。 

 

 

勤怠データから「退職しそうな人」を予測できるか?

今回は、企業の実データをもとに
勤怠データから退職しそうな人を予測できるか?
という課題について考えてみます。

 ※関連記事は「退職(予測)に関するデータ分析結果(まとめ)」よりご覧ください。

 

「勤怠データ」から「退職しそうな人」を予測できるか?

 

従業員が「退職」してしまうと、企業にとっては大きな利益損失につながります。
前回記事の通り「1人の退職で年収相当の利益を損失している」可能性があります。

 

そこで、「退職しそうな人」を事前に予測し、認識のズレを補正したり、サポートを手厚くすることで、退職を防ぐ試みがいろいろと行われています。

 

今回はその中でも、「従業員の勤怠データ」から「退職しそうな人」を予測できるか分析してみます。

 

「勤怠データ」における「退職者」の特徴分析

 まずは、「退職者」について「勤怠データ」に特徴があるか?を確認してみます。以下のグラフは、「退職」直前までの、退職者の「総労働時間の平均」のデータです。

f:id:trans-inc:20181122201340p:plain

今回の企業においては、
退職者」は「退職5か月前」に過去の平均総労働時間の最低値(13か月前)を下回る
ことがわかります。
※「1~2か月前」になると、有給消化なども含んだ結果になります。

 

そのため、
「退職者」は退職前に労働時間が減る傾向がある
ということがいえます。

 

「勤怠データ」における「退職者」を予測できる?

 次に、「勤怠データ」について「機械学習」を行い、「退職の予測」ができるか確認してみます。


予測するためのデータとして、
「労働時間」「休み回数」「早退回数」「遅刻回数」「休み明け遅刻回数」「出社時間」「退社時間」
を使用しました。
※ただし、「退職前1~3か月」のデータは、退職がすでに確定してしまっており、打ち手につなげられない可能性があるため、「退職前4か月以前」のデータのみを使用します。

 

約300人に対して、機械学習(AI)を行い、予測結果と実際の結果を以下の表にまとめました。(以降の数字は合計300人となるように丸めています)

f:id:trans-inc:20181210190750p:plain

上記では、
・「退職」と「在職」の正解率は88%((1人+262人)/300人)
ですが、
・実際に退職した36人中1人しか、退職を予測できていない
結果となっており、未来予測としてはほとんど意味がない結果となりました。

 

次に、退職を予測できる人数が増えるように、機械学習の内容を調整して、再度分析をしてみます。

f:id:trans-inc:20181210191104p:plain

結果、
・退職者37人中8人の予測はできた
一方で、
・「退職と予測」した65人中、「実際に退職」した人は8人
しかおらず、実際の利用を考えると、ほぼ使えない結果になってしまいました。

 

結論として、
(今回の分析では)「勤怠データ」から「退職」を予測できない
という結果になりました。

 

まとめ

 今回、
「退職者」の「勤怠データ」には傾向がある
 ※「退職前に労働時間が減少する」など
ただし、その特徴だけでは(今回の分析では)未来予測はできない
という結論になりました。

 

データ分析をしていると「統計的に傾向(=有意差)がある」場合でも、「未来予測ができない」ことも多いです。

※例えば、1000人の会社で退職率10%(100人)の場合、退職者100人の20%(20人)、在職者900人の10%(90人)が【特徴X】である場合、統計的に【退職者は特徴Xを持っている傾向】がありますが、【特徴Xを持つ110人(20人+90人)の中から、退職者(20人)を見つけることは難しい】となります。

 

もちろん「特徴」はあるため、機械学習アルゴリズムを工夫することで、未来予測できる可能性はゼロではないと考えています。

 

もし「勤怠データ」から「退職の未来予測」でよい結果が得られている方がいらっしゃいましたら、ぜひご意見を頂けますと嬉しく思います。

 

※以下の記事では、「退職の未来予測」が一定できた分析内容を紹介しています。

 

 

機械学習(AI)を使うと「退職」はどの程度予測できるのか?

今回は実際の企業データを分析した結果から
「入社後の情報(評価)から退職を予測できるか?」
という課題について考えてみます。

 ※関連記事は「退職(予測)に関するデータ分析結果(まとめ)」よりご覧ください。

 

退職(離職)は予測できるか?

 

従業員の離職を予想する方法はありますか?

データがあれば、傾向をつかむことは可能です。

既存の評価データだけでも、分析できますか?

はい、どの程度未来予測ができるか見てみましょう。

 

前回記事では、「1人が退職すると年収相当の利益損失」の可能性があることがわかりました。特に「ハイパフォーマー」や「将来の幹部候補」には、退職してほしくないと考える企業は多いかと思います。

 

そこで今回は、
・入社後の情報(評価)から「退職」をどの程度予測できるか?
また
・退職しやすい人はどのような特徴がみられるか?
について、実際のデータを使って分析をしていきます。

 

「退職」を機械学習(AI)で予測する

 まずは「退職した人」について、機械学習(AI)を用いて予測を行ってみます。

 

今回は、比較的多くの企業でデータとして残っていると考えられる
・勤続年数、評価、等級、異動回数、給与金額
のみを利用して分析してみます。
(「性別」「年齢」などの属性情報は、あまり「退職」の予測に寄与しないことを別途確認しています。)

 

今回は、
・「2012年~2015年」のデータを、予測モデルを作る「学習データ」
・「2016年~2017年」のデータを、「テストデータ」(以下の検証結果で利用)
としています。

 

機械学習はプログラムが頑張ってしまうので、さっそく結果です。

 

f:id:trans-inc:20181126200319p:plain

※該当企業の2016年~2017年に在籍していた約1000人(人数は丸めています)に対する分析結果です。

 

結果、
正解率は「83%((31人+795人)/1000人)
「退職」と予測し、実際に「退職」だった人は、「46%」(31人/67人)
となりました。
※「正解率」は「退職と予測し、実際に退職した人」と「在職と予測し、実際に在職の人」の合計の割合です。

 

今回の企業では当該期間の退職率は「約17%」だったため、
機械学習を用いることで2.7倍(46%/17%)の確率で退職を予測できる
ことがわかりました。

 

今回の退職予測に意味はあるか?

 今回の結果の解釈としては、
統計的な予測モデルとしては、改善の余地がある
一方、実利用を想定すると、ある程度有効に使える可能性がある
という結論だと考えています。

 

統計的な予測モデルの観点では、実際の退職者「169人」中「31人」(約2割)しか退職を予測できていないため、予測精度はまだまだ改善の余地があると感じます。
※ただし、退職については様々な要因があるため、1つの予測モデルだけでは限界があり、複数の要因を検証できる予測モデルが必要とも感じています。

 

一方、実利用を考えると、機械学習(AI)が予測した「67人」(うち31人退職)の「退職リスクが高い人」に対し、サポートを手厚くする施策を実施することで、全体に対する施策よりも効果的な施策を実行できる可能性があります。

 

予測結果を具体的にどのように施策に落とし込めるかが、予測がどれだけ意味があるかを決めるポイントかなと考えています。

 

退職しやすい人の特徴とは?

 実際に機械学習に取り組まれている方の悩みとして
機械学習の結果だから!という理由では現場が動いてくれない」
という話を伺うことがあります。

そこで今回は、複雑な予測モデルの要素を分解し、「退職者」の特徴を抽出しています。
※具体的には、予測モデルから影響度の高い部分を仮説として抜き出しています。

 

今回の企業の場合、「等級」と「給与上昇の回数」が、退職予測に比較的強い影響を与えていることがわかったため、「等級」ごとに「給与上昇回数」と退職率の関係性をまとめてみました。

f:id:trans-inc:20181121211226p:plain

結果、
・「若手」では、「給与上昇回数が多い」ほうが退職率が高い
 ※特に、上昇回数が0.75~1回/年の場合、退職率は約2倍になる
 ※ただし、「最も給与上昇回数が高い層」(1.25回/年以上)は、退職率は低い
・「中堅以上」では、「給与上昇回数が少ない」ほうが退職率が高い
という結果になりました。

 

上記を解釈すると
「若手」は、一定の評価をされている人(トップではない2番手)が、退職しやすい
傾向があるといえます。
この結果は、個人的な感覚ともあう部分があると感じます。
※この層の若手は将来の組織を支える大切な人財の場合が多く、期待値ギャップを埋めるなど、優先的にサポートができるとよいのかなと感じます。

 

もちろん「機械学習による予測モデル」のほうが「精度」は高いですが、現場を巻き込み「成果を生む」ことを重視すると、上記のような単純集計を用いたほうが、成果に近づけるのかもしれません。

 

まとめ

 今回、入社後の情報(評価)から「退職を予測できるか」という課題に対し
・正解率は「83%
・「退職」と予測し、実際に「退職」だった人は、「46%(31人/67人)
機械学習を用いることで約3倍の確率で退職を予測できる
という結果を得ることができました。

 

また、退職しやすい人の特徴として
「若手」で、一定の評価(ただしトップではない)をされている場合
※中堅以上ではあまり評価されていない場合
があることがデータから示唆されていることを確認しました。

 

みなさまの会社では、退職リスクに対して、どのような取り組みをされていますか?ぜひご意見をいただけますと幸いです。

 

離職率(退職率)の算出方法3パターンを解説

今回は、
 離職率が1%改善すると、どれだけ利益貢献するか?
の記事の補足として、「離職率(退職率)の算出方法」 についてまとめます。

※関連記事は「退職(予測)に関するデータ分析結果(まとめ) 」よりご覧ください。

 

一言で「離職率」といっても、いろいろな考え方がありますので、自社の離職率を業界平均や他企業と比べる場合には、注意する必要がありそうです。 

 

 A.離職率厚生労働省が定義)

 厚生労働省「雇用動向調査」の定義によると、離職率

常用労働者数に対する離職者の割合をいい、次式により算出している。

離職率 = 離職者数 / 1月1日現在の常用労働者数 × 100 (%)

となっています。

企業に置き換えると「1月1日」ではなく、期初にする企業も多いので、この離職率

A.離職率 = 離職者数 / (期初1日目の)従業員数

と言い換えることができるかと思います。

 

ただし、この定義の離職率は比較的多くの企業で使われているかと思いますが、
「該当期内に入社した人の離職率は計測できない」
という問題があります。

例えば、4月~翌年3月の離職率を考える際、4月2日以降に入社し3月までに離職した人は、離職者数に含まれない 計算式になっています。

ベンチャー企業や短期契約の社員が多いような、人数の増減が激しい企業だと、本質を見誤る可能性がある指標となっています。

 

B.入社直後離職率(+離職率(対象期間1日目を除く))

Aの離職率の問題を改善するために、以下の離職率を追加で設定している企業もあります。

B-1.入社直後離職率 =(対象期間内に入職した)離職者数 /(対象期間内の)入職者数

この場合、4月1日から翌年3月31日までに、100人を採用して、そのうち15人が翌年3月31日までにやめてしまったとすると、

  • 対象期間内(4月1日~翌年3月31日)の 入職者数 : 100人
  • 対象期間内(4月1日~翌年3月31日)の 離職者数 : 15人
  • 入社直後離職率 = 15% ( = 15人 / 100人)

 と計算することができます。

 

ただし、B-1.入社後離職率を、A.離職率と併用しようとすると

AとB-1の離職率の両方に、「期初1日目に入職(入社)した人が含まれる」

という問題が起こってしまいます。

そのため、B-1.入社後離職率を使う場合には、A.離職率から「期初1日目に入職した人を除く」必要があり、

B-1.入社直後離職率 =(対象期間に入職の)離職者数 /(対象期間の)入職者数
B-2.既存社員離職率 = (対象期間前日に在職の)離職者数 /(対象期間前日の)従業員数

とい2つの離職率を使っているようです。

 

C.1年(3年)以内離職率

AやBの指標は、「特定の期間内に”離職”した割合」を主に算出する指標でした。一方で、新卒入社のように「特定の期間に”入職”した人が、その後離職する割合」も「離職率」の1つの指標とされています。

 

Aの離職率を定義している厚生労働省は「新規学卒者の離職状況」の調査において、同じ名前の「離職率」を以下のようにも定義しています。

(3年目)離職率 = 4月~3年後3月までに離職した者 / 3月~6月に新規学卒として雇用保険に加入した者

 

この定義はよく企業でも「新卒の離職率」として使われていることを目にします。最近では「3年」以内だけでなく、「1年」以内の離職率を見ている企業も多いように感じます。

簡易化すると、この定義は

C.1年(3年)以内離職率 = (対象期間に入職の)1年(3年)以内の離職者数 / (対象期間の)入職者数

と定義できるます。 

 

まとめ

離職率(退職率の定義をまとめると)

 

f:id:trans-inc:20181002223639p:plain

の4つ(3パターン)が主な定義としてあることがわかりました。

 

これに加えて、「契約形態(正社員、契約社員 など)」や「新卒・中途」の区分、さらに最近では通年採用をしている企業も増えていたりと、どんどん退職率の計算がややこしくなってきています。

 

また入社後の評価によって「高評価者の離職率」をKPIとしている企業もいるようです。

 

もしみなさまの会社で上記以外の退職率の考え方をしていらっしゃる方がいれば、ぜひご連絡をいただけますと大変嬉しく思います。

 

 

※上記すべての退職率をワンクリックで自動計算してくれるサービス「TRANS.HR」を提供しています。(退職率自動計算機能など無料でご利用いただけます。)