中国大手企業Huawei、職務経歴書の要約AIによる採用プロセスの効率化

人事のアイキャッチ

中国大手企業のHuaweiのHR(人事・採用活動)に関する取り組みについてご紹介します。

採用活動は多くの企業で重要な業務であり、大きなコストがかかります。
今回紹介する論文では、職務経歴書を要約することで、採用プロセスを効率化するという内容でした。

職務経歴書や履歴書を要約して業務効率化

Huaweiが自社で持っている職務経歴書に関するデータの詳細については非開示でしたが、職務経歴書には、言語、教育、経験、個人情報、スキルの5つの欄があるようです。
例えばその1つである経験欄では、求職者の過去の業務経験の役職や内容の詳細がわかります。

職務経歴書は熱心な求職者ほど長い記載になりがちです。
採用担当者は送付されてくるすべての職務経歴書を読み解きながら、自社が求める人物像とのマッチング度合いを検討する必要があります。
AIを活用することができれば、たとえ求職者の経験欄にどれだけ長い記載があっても、「Pythonのリードエンジニア3年」や「プロダクトマネージャー5年」といった短い表現に要約することができます。
これによって、例えば責任の重さといった観点から職務経歴書をソート(整理)することができるため、採用担当者の業務効率化が可能になります。

この論文ではどのような技術によって要約が上手くできるのか比較分析を行っています。

比較するAIアルゴリズム

この論文ではいくつかのオープンなデータセットと非開示の職務経歴書のデータセットを用い、複数の言語モデルで要約性能の比較を行っています。
以下は論文中で使用されていたモデルとその簡単な説明です。

  • LSTM(Long Short-Term Memory)
    • 再帰型ニューラルネットワーク(RNN)の一種で、時系列データを扱うために設計されたものです。
    • 基本的なRNNとは違い、LSTMは「ゲート」と呼ばれる機構を導入することで、情報の流れを制御し、長期的な時系列データにも対応できるようになりました。
  • BART(Bidirectional and Auto-Regressive Transformers)
    • BARTは時系列データなどのシーケンスなデータを扱うためのTransformerモデルです。
    • 大規模なデータセットで学習(pre-train)を行い、タスクごとに追加の学習(fine-tuning)を行うことで様々なタスクに応用することが可能です。
  • Bart-Large
    • BARTの大規模なモデルで、より多くのデータで学習しており、パラメータ数もBARTと比べて多いです。
    • 通常、言語モデルの性能は学習データ数やパラメータ数などに依存しているため、基本的にはBARTよりもあらゆる点で性能が良いです。
    • 一方、モデルサイズが大きければ大きいほど計算コストも増大するため、BARTと比べて追加の訓練や推論に時間がかかります。
  • Pegasus-X
    • PEGASUSは”Pre-training with Extracted Gap-sentences for Abstractive SUmmarization Sequence-to-sequence”の略で、BARTを文章に特化させたモデルです。
    • PEGASUS-Xは、PEGASUSの拡張バージョンで、より大規模なデータで学習され、パラメータ数もPEGASUSよりも多くなっています。これにより、要約タスクの精度が向上しています。
  • T5 (Text-To-Text Transfer Transformer)
    • T5はすべてのNLPタスクを”テキストからテキストへ”の変換問題として扱います。
    • これにより、様々なタスクに対して一つのモデルで対応することが可能になります。

どのAIベースモデルが最も良かったか

結果として、職務経歴書の要約タスクにおいては、Bart-Largeが最も性能が良いということがわかりました。
また、オープンなデータセットでfine-tuningをし、その後に再度職務経歴書データセットでfine-tuningをするという手法を試したところ、BARTモデルでは性能が向上しましたが、Bart-Largeでは性能が向上しませんでした。

また同グループは、「職務経歴書のデータ数が75と比較的少なかったのですが、より大量の職務経歴書を活用すればより高性能な要約ができるだろう」と考察しています。

【アナリストによる分析】

まだ技術的な課題はありますが、今回紹介した論文を使用することで、長文の職務経歴書を要約することが可能になります。
職務経歴書を要約することで、より短時間で職務経歴書を評価し、採用にかけるコストを削減することができるようになると思います。

また、職務経歴書を要約することで、求職者の経歴やスキルを高速に概観することができるようになりますが、求職者がどのポジション・職種に適しているかを判断することまではできていません。
そのため今後は、職務経歴書からその人の適性などを測定することが求められると思いました。
適性がわかることで、より適切なポジションへの配属や人材開発が可能になります。

今回の論文では英語のデータセット・職務経歴書しか扱っていませんでしたが、ChatGPTを用いることで日本語でも同等以上に要約ができると思います。
しかし、ChatGPTはその仕様上、外部サーバにデータを送る必要があります。
職務経歴書などの個人情報に関するデータは非常に機密性が高いため、漏洩のリスクが生じます。
そのため、実際の業務で職務経歴書の要約を行うには、外部サーバを使用しない、ローカルで動かせる言語モデルを作る必要があります。

この記事を書いた人
自然言語処理の研究開発をしている大学院生です。
大手シンクタンクのインターンに参加した経験から金融分野にも興味が広がっています。

【所属】
早稲田大学 人間科学研究科

【発表した論文】
・システム発話の感情分類による制御を行ったマルチモーダル対話システム(第一著者)
・語用論的対話方策を使用するルールベースの対話システム(第一著者)
・保育現場での実用に向けたテキストベースファシリテーション対話システムの開発(第一著者)
・相談者の期待の種類を考慮する恋愛相談対話システムの検討(第二著者)
・深掘り質問を活用したカタカナ語学習支援対話システム(第二著者)