面接官の主観に頼らない評価制度が必要
グーグル人事担当上級副社長であったラズロ・ボック氏が書かれた「WORKS RULES!」によれば、ほとんどの面接で時間を無駄にしている要因は、面接者が最初の10秒で得た印象を、残りの99.4%の時間を印象を確証するためだけに費やしていること(良い印象を受けた場合はその人の良いところを探す、悪い印象を受けた場合は落とす理由を探す)であると述べています。
面接官は意識せずとも、自分の好きなものや信じていること、慣れ親しんでいる価値観のみで評価することがあります。認知心理学者や社会心理学者はこの現象を確証バイアスと呼んでおり、確証バイアスを回避するためには、きちんと工夫された評価制度が必要です。
客観的な評価尺度が必要
日本の人事評価制度では、評価尺度の運用が非常に未発達であると言われています。長年、採用の場だけではなく、勤怠評価を行う現場管理者の評価能力を信頼しすぎてしまい、過小評価・課題評価されるケースは往々にして起こりえます。
評価尺度を使いこなすことは簡単なことではありません。日本では組織行動論が中心で、人事心理学といわれる分野を専門にする研究者も少ないため、客観的な評価尺度について説明している文献も多くはありません。
会社によっても、組織風土や業務内容が異なるため、一般的な評価尺度が必ずしも自社に適しているとも限りません。まずは一般的な評価尺度(アセスメント技法)を理解し、自社ではどのように適用するのか、考えるところから始めましょう。
本記事は、グループワークに使える評価方法の紹介としておりますが、実際はグループワークだけに限らず、採用後のパーフォーマンス評価にも使うことができる評価尺度や技法を説明いたします。
評価する目的から設問を決める
評価と設問は表裏一体です。評価の最終目的から、どのような基準で評価を行うのかを決めることで、設問を設定できるようになります。
例えば、エンジニアリングであれ生産管理であれ、会社の技術部門の応募であるならば、何らかのワークサンプルテストを受けてもらう事が良いでしょう。プログラミング開発者を探しているのであれば、簡単なプログラムを書いてもらい、実際に何故このように作成したのかを説明してもらうことで、履歴書では分からないスキルや論理力、表現力などがわかります。
個別面接であった時、設問として「あなたが・・・した時のことを話してください」よりも「この問題を解決するためのアルゴリズムを書いてください」といった設問になります。「問題」の内容については、現場担当者と相談しながら、業務で必要な基本知識レベルで決めると良いです。
グループワークの設問もこれらと同じ度合いで考慮した方が良いと考えています。
評価基準の決め方について
評価基準の決め方として、様々な尺度が存在します。
この記事では、代表的な5つの尺度について、簡単な概要を紹介いたします。
- グラフィック・レーティング尺度(Graphic Rating Scales)
- 行動頻度尺度(BFS:Behavioral Frequency Scale)
- 行動基準評定尺度(BARS:Behaviorally Anchored Rating Scales)
- 行動観察尺度(BOS:Behavioral Observation Scale)
- 行動要約尺度(BSS:Behavioral Summary Scales)
グラフィック・レーティング尺度(Graphic Rating Scales)
一番簡単で運用しやすいと言われている尺度法です。5段階(よくできている、まあまあできている、普通、あまりできていない、できていない)で評価する方法です。
ペイターソン(Paterson, 1922)によって考案されました。評価項目ごとに分析的ないし弁別的に評価する意味で一定の意義がありますが、正確さやフィードバックの妥当性などに関しては問題が多いと指摘されています。
グラフィック・レーティング尺度は、何を持って3とするのか、具体的な指定はありません。面接官Aにとっては2の評価だが、面接官Bにとっては3の評価である、などの評価の違いが生まれやすいです。
そのため、客観的で分かりやすい基準を設けることが必須になります。しかし、応募者の発言や行動が、どの基準に該当するのか、面接官が思考プロセスを鍛える必要があります。このような脳への負担が増すほど、評価エラーや歪も多くなってしまいます。
グラフィック・レーティング尺度法は簡単ではありますが、評価基準については人によってばらつきがでるため、原始的かつ精度が低い方法であると言えます。
グラフィック・レーティング尺度例
Initiative(積極性)
Poor 1 2 3 4 5 Excellent
できていない すばらしい
出典元『JAPAN EXCELL SOLUTION』職能資格制度を再構築する評価尺度とアセスメント技法
行動頻度尺度(BFS:Behavioral Frequency Scale)
行動頻度尺度は、評価項目ごとにどれぐらいの頻度で行動したか、という回数を設けることで評価する尺度法です。
グローテの本『パフォーマンス評価完全ガイド』(Dick Gorte “The Complete Guide to Performance Appraisal” 1996)によれば、行動頻度尺度(Behavioral Frequency Scale)は評価項目ごとに頻度を示すスケールを用意し、選択させる方式として定義されています。
グローテは業務評価フォームを、行動頻度尺度と類似した方式で作成し、自身が最も推奨している方法です。上記のグラフィック・レーティング方式よりも直感的に理解しやすく、頻度による評価基準のため、客観性もあります。
行動頻度尺度例
出典元『JAPAN EXCELL SOLUTION』職能資格制度を再構築する評価尺度とアセスメント技法
行動基準評定尺度(BARS:Behaviorally Anchored Rating Scales)
行動基準評定尺度とは、グラフィック・レーティング尺度の改善版の立ち位置にあります。グラフィック・レーティング尺度に、客観的な行動基準を評価基準として追加したものです。
行動基準評定尺度(Behaviorally Anchored Rating Scales)は1960年代にアメリカの学者P.C.SmithとL.Kendallによって提案されました。
下記の図例では、客観的な行動基準の決め方としては、クリティカル・インシデントを拾い出すことで決めています。段階は1から7に拡張されています。
実際に導入するためには、行動基準を決めなければならないため、作成に時間と手間がかかる点には注意しましょう。
行動基準評定尺度例
出典元『リクルート マネジメント ソリューションズ』RMS Message 45
行動観察尺度(BOS:Behavioral Observation Scale)
行動観察尺度は、行動頻度尺度と類似した手法です。与えられた文例に対して、キーとなる行動(評価基準)を取り上げ、頻度を5段階で評価する方法です。
行動観察尺度は、ラザム(Latham)によって推奨され、ウエックスレイとの共著(『業績評価を通じた生産性の向上』(Gary Latham and Kenneth Wexley “Increasing Productivity Through Performance Appraisal” Addison Wesley 1981)で説明されています。学術的には、ほとんどの文献や論文で参照されるほど、有名なものです。
巻末には、50の行動文例が掲載されているので、興味のある方は一度ご覧になってみてください。(英語です)
行動観察尺度例
出典元『JAPAN EXCELL SOLUTION』米国型人事評価と日本への示唆【第6回】業績評価を適正化する尺度法(2)
行動要約尺度(BSS:Behavioral Summary Scales)
行動基準評定尺度を、更に詳細化して、複数の段階について行動記述を示すことで、評定をしやすくする目的で、行動要約尺度は作られました。
ボーマンら(Borman, Hough, and Dunnette, 1976)によって開発された尺度法です。行動基準評定尺度 Behaviorally Anchored Rating Scales (BARS)の評価基準では、段階ごとの出来ごと評価だけでは、実際のパフォーマンスとの相関性を評価しづらかったり、一部の行動のみ一致する場合の評価が悩ましいことから生まれました。
例えば「自分の考えに根拠があり、客観的に説明できた」という評価基準があった場合を考えます。応募者の行動が「自分の考えに根拠があるが、客観的に説明できていない」や「考えに根拠がなく、一貫性がないが、客観的には説明できている」など一部のみ該当する場合、評価者は評価基準がなく、悩んで評価がばらつくことがあります。
行動要約尺度例
出典元『JAPAN EXCELL SOLUTION』職能資格制度を再構築する評価尺度とアセスメント技法
グループで成功できるかどうかを示す4つの評価項目
評価尺度について説明いたしましたが、そもそも何を評価するかを決めなければ、評価尺度も意味を成しません。
参考情報として「WORKS RULES!」に掲載されているGoogleでの評価項目を紹介致します。
Googleは、スキルを見極める技術的能力テストに加え、応募者がグループで成功するかどうかを予測できる4つの明確な評価項目をまとめていますので、紹介致します。
①一般認識力
実生活において困難な問題をどのように解決してきたのか、どのように学習するのかという項目です。新たな状況に適応できるか、頭の良い人材かを評価します。
決して学校の成績や試験がどれだけ良かったのか、を確認することではありません。
②リーダーシップ
様々なプロジェクトに関わる上で、リーダーを任せることもあれば、リーダー以外の立場になることもあります。
リーダーとして、リーダーシップを発揮できるかはもちろんのこと、役目を終えたら他のメンバーと同じ立場に戻ることができるかどうかが重要視されます。
③「自分の企業的であること」
GoogleはGoogle内で成功する人材を探しています。
「成功する人材」の定義として、以下のような属性が含まれます。
- 愉快なことを楽しむ
- ある程度の謙虚さを備えている
(自分の間違いを認められない人は、なかなか身につかない属性) - きわめて誠実である
(従業員ではなく企業オーナーであって欲しい) - 曖昧さを楽しむ余裕がある
(事業がどう進展するかはわからないため、Google内で舵取りをするには
社内で多くの曖昧さと向き合わなければならない) - 人生において勇気のいる、あるいは興味深い道を進んできたという証拠を手にしている。
Googleの定める「成功する人材」は、あくまでも例に過ぎません。実際に活用するのであれば、自社の社風や活躍している人材から、どのような属性があれば自社で成功する人材なのかを分析し、評価項目に追加することが重要です。
④職務関連知識
Googleでの4つの評価項目のうち、きわめて重要性が低いのは、担当している職務について既に知識があるかどうか、としています。
Googleの推理と経験によれば、同じ仕事を長いこと上手にこなしてきた人は、他の業務で困難に直面した場合に、それまで成功してきた解決策を繰り返そうとする傾向があることを述べています。
心理学者のアブラハム・マズローは「手にしている道具が金槌だけだとすれば、あらゆるものを釘のように扱いたくなるはずだ」と同様の内容です。
このような解決策の問題として、新たなものをつくりだすチャンスを失ってしまうことが挙げられます。対照的に、自ら学ぼうとする好奇心旺盛な人は、ほぼあらゆるケースで正しい答えをだすばかりか、きわめて斬新な解決方法を生み出す可能性がはるかに大きいとGoogleは述べています。
もちろん、特定の専門知識を必要とされる職務はあります。例えば、税務申告書の記入方法を知らないスタッフだけで構成される税務部門を持ちたい企業はありません。ただ、税務部門であっても経歴が異なる新しい考え方のスタッフを混ぜるよう、Googleは工夫しています。
自社の規模感や採用戦略に適した、使いやすい評価尺度を選ぼう
本記事では、グループワークはもちろんのこと、採用選考や人事評価でも使える一般的な評価尺度(アセスメント技法)と、Googleにおける評価項目例について紹介しました。
再三の説明にはなりますが、採用選考において、人を正しく評価するためには下記3つのステップが必要です。
- 人事担当者が自社のことを深く理解し、「求める人物像」を明確化する
- 「求める人物像」に必要な属性から、評価するための質問やテスト、グループワークを実施する
- 客観的な評価基準を設けて、必要な属性を評価する
評価基準の決め方としては、面接官(評価者)のスキルとの兼ね合いで決めると良いでしょう。客観的に評価できる評価尺度であっても、正しく使えなければ、誤った評価をしてしまう可能性があります。
特にグループワークで、実務で活躍している社員を評価者とする場合は、評価尺度を正しく使うためのトレーニングを実施するのはコストもかかります。
全ての応募者を客観的に正しく評価できるようになれば、企業としての強みともなります。是非一度、自社の規模感や採用戦略に適した、使いやすい評価尺度について検討してみるのはいかがでしょうか?