2023年7月29日に開催された製薬×データサイエンス Meetup 2023 ヘルスケア・イノベーションを先導する製薬データサイエンティストの挑戦!講演&キャリア相談会(オンライン)に参加いたしました。
製薬業界における課題がわかりやすく、企業ごとの特色や関心、得意分野にもかなり幅があることが伝わってきました。
医薬品の研究開発の流れは以下のようになっており、上手く開発が進んだとしても販売までに10年〜15年ほどの時間がかかると言われています。
加えて、開発の難易度も高く、創薬の成功確率は1万分の1の確率とも言われています。
また、業界全体としてIRR(内部収益率)も低下傾向にあり、データ分析やAIを活用してどれだけ創薬プロセスを効率化できるかが求められるとのことでした。
小野薬品工業では、書籍や新聞記事などのRWDを対象に未知の医療ニーズを探し出すAIの開発を行っています。
アプローチは分類モデルの構築となりますが、アノテーションにおいて認識のすり合わせに尽力し、何度もディスカッションを行いながらガイドラインの作成を行っていたとのことです。
実際にパーキンソン病においても試しているとのことでしたが、人手収集と比較すると圧倒的に少コストかつ短時間で収集することができるようになったようです。
住友ファーマでは、TwitterなどのSNSから使用している薬剤の交換表現を抽出する取り組みの発表がありました。
例えば「アレルギーが出るため薬剤Aから薬剤Bに変更した」といった形で抽出できれば薬剤の改善や新規ニーズの同定にも繋がります。
基盤モデルにはT5を使用し、ChatGPTでは金銭コストが膨大になること、抽出タスクにおいては精度が自作の方が高いこと、セキュリティやプライバシーについても深い検討が必要になることなどから比較していました。
武田薬品工業からは、レセプトデータから希少疾患患者数や潜在患者の予測を行うAI開発の取り組みの紹介がありました。
特に希少疾患においては確定診断ができないケースも多く、潜在患者の予測を行うことで早期の治療サービスを提供できるようになります。
疾患の種類によって精度は異なるため、電子カルテの利活用と合わせていく展望があるようです。
アステラス製薬の発表の中で分子化合物における言語モデル応用の可能性について触れられていました。
医薬品を構成する成分の設計には2次元や3次元の構造データが必要になりますが、この分子構造の表現にはWLN, SMILESなどの専用の記法が用いられます。
専用言語というと、例えばChatGPTはプログラミング言語やSQLなどの活用が得意であり、現在流行しつつあるLLMによる新規化合物の発見に期待されます。
武田薬品工業やアステラス製薬は他社とは異なり、MLOpsについても強調していました。
例えば新規データは日々蓄積しますが、送られてきたデータを前処理にかけ、モデル構築を行い、本番環境へとデプロイすることが求められます。
このプロセスをすべて自動化するだけではなく、Web画面で最新のモデル情報についても確認しやすくなっており、最新データを活用した高精度のモデルをユーザに効率よく提供できるようになっているようです。
業界トップの2社ということもあり、他の参加企業と比較するとMLOpsの話題を強調していた点が印象的でした。
AIの活用を始めたチームであってもMLOps/DevOpsといった継続的かつ効率的な運用については知見が十分でない企業も多い状況です。
データパイプライン構築やインフラ基盤の構築などは、外部の専門家に依頼すると知見がすぐに得られるメリットがあります。
製薬業界以外の一般的なIT企業でさえMLOps/DevOpsに関しては専門家にコンサルを依頼し、サービス運営基盤を整えることは一般的です。
製薬・医療業界はデータの特性が特殊なため、この業界に知見がありながらAI開発に強い専門家にコンサルティングを依頼できれば、しっかりとビジネスを進めるための一歩が安全に踏み出せます。