まとめ

  • 2つの属性x, yが独立で無相関であっても、その和を基準に選抜をすれば逆相関が生まれる

口の悪さとエンジニアとしての能力に相関があるかどうか、という話題をFacebookで見て「それ数理モデルで説明できるぞ」と思ったので書いてみた。

まず、エンジニアがxとyの2つの能力を持っているとする。例えばxが口の良さでyがプログラミング能力だと思ってもよい。 この2つの能力が標準正規分布に従うとすると、全エンジニアの分布は以下のようになる。能力間に相関はない。 image

で、世の中には選抜の機会がある。上記分布からランダムに10人選び出し、その中で能力の総和 x + y が一番大きい人だけを選ぶ、という選抜を行おう。選抜された人の分布は以下のようになる。 image

ちなみに相関係数は -0.46 である。xが小さくなるほどyが大きくなる、という相関があるわけだ。 選抜された人の能力の平均はそれぞれ 1.1 程度。つまり偏差値で言うなら61くらい。 それくらい「能力が高い人たちの集団」であるにもかかわらず、xが全エンジニア平均の0よりも小さい人がいる。 意外かもしれないが選抜された人の1割くらいがそうだ。

この「xが平均より悪い人たち」のスキルの平均は(-0.37, 1.87)だから、偏差値で言うなら46と69。エンジニア全体の分布と比較すると、平均より少々xが悪いことと引き換えにyが格段に高い、ということになる。

この逆相関は10倍という高い競争率の選抜を掛けたことによって発生している。例えば高い競争率の大学の研究室は似た状況だから、口が悪いけどもプログラミングスキルが高いということは大いにあり得る。 一方で、口の悪い人が就活で訪れた場合、その人は選抜を経ていない、もしくは「選抜で勝った人は就活をすることなく就職していて、負けた人だから就活している」とも言える。なので、そういう人は採用しなくてよい。

追記: なおこの実験では x + y という総合的なスキルで選抜をしてから、 xの低い人のyの高低を見ている。 綜合的なスキル x + y で測ると、選抜された人の平均スキルは 2.2 で、 口の悪い人の平均スキルは 1.5 である。 つまり「総合スキルで選抜された人のxは観測できるがyは観測できないという状況で、yの高い人を採用したいならxの低い人を取ることは合理的だが、総合的に x + y の高い人を取りたいなら素直にxの高い人を取った方がいい」ということになる。

#数理モデル思考#合流点バイアス#選択バイアス

#要実験

  • このモデルでは面接においてxが観測できてyが観測できない。
    • これはさほど不自然な仮定ではない。面接の限られた時間においても観測しやすい属性と、時間を掛けなければ観測できない属性がある。
      • これを例えば「一定時間ごとにノイズののった値をサンプリングできる」とすると、サンプリング間隔の小さい属性ほど速く正しい値に近づくし、ノイズの少ない属性ほど同様。
      • ノイズは属性の値と無相関だが、現実には「故意に能力を低く見せる」という人もいる。src
        • これはおそらく、誰にでも均等に能力を低く見せているのではなく、相手を見て変えている。
        • 他人から評価されることの効用が飽和し、他人から評価されることのコスト(関係維持コスト)が飽和しない場合、ある程度以上の関係構築は費用対効果が悪化する。
        • 能ある鷹は爪を隠す
  • 属性xに耐性のない人の問題 src
    • 組織がxに耐性のない人で占められている場合(同僚にxの高いメンバーがいると効用が下がる場合)と、そうでない場合で差が出る
    • なのでxに耐性のない人で占められている組織はxの高い人を評価しない
    • これは誰が悪いかというより組織の特徴、xの高い人がその組織にマッチしなかったというだけなのでxの高い人は別の職場を探せばよい
    • xに耐性のある組織の方がyの高い人を採用しやすい
    • もう1軸「口の悪さに対する免疫z」があるのではないか
      • zが高い人はxの低い人とのコミュニケーションに問題を感じない
      • zの低い人はxの低い人とのコミュニケーションによって不利益を被る
      • 多分エージェントシミュレーションすると二極化が起きそう#要実験