2023年7月27日にJapan Healthcare Innovation Hub(JHIH)が主催する「生成系 AI について学ぼう ~ 機械学習の基礎から医療での応用まで ~」に参加いたしました。
前半では基礎的な回帰モデルの紹介から、後半は医療分野における応用についての講演がありました。
登壇者がAWSの方ということもあり、AWSがどのようにヘルスケア&ライフサイエンスにおける展望に期待しているのかが伝わってきました。
基盤モデルとは、大規模なデータから学習を行った事前学習済みモデルを指します。
特に、私達が普段使用する日本語などを含む文章を学習の素材にした場合、言語モデルと呼ばれる言語処理に強い基盤モデルが構築できます。
また、言語の基盤モデルは大規模言語モデル(LLM)と呼称されることもあります。
話題のChatGPTはいくつかのトリックはありますが、上記でいう基盤モデルやLLMに代表されるモデルとなります。
特に基盤モデルは過去のモデルと比較するとパラメータ数が多いことが特徴であり、2018年以降はパラメータの数は年々10倍になっています。
莫大なパラメータを持つモデルが膨大なデータを学習することで、賢い基盤モデルが構築されます。
ChatGPTを筆頭とした生成AIは様々な専門領域での応用が期待されており、医療分野はその中でも市場規模と合わせて期待も大きなものとなっています。
まず、この分野において着目すべき事例として、Natureに掲載された「Foundation models for generalist medical artificial intelligence」が取り上げられていました。
この研究はマルチモーダルに汎用的な知識を会得し、様々なタスクに対応を行う医療に特化したAIであるGMAIを構築するという取り組みになります。
上記の図のように、例えば音声入力を受け付けながら学習済みの知見からQAを行い、読影を行うことが一つの目標となります。
生成AIによって紹介状、医療請求事務、事前承認の自動生成といったインテリジェントな文書処理が期待されるとのことでした。
特に、生成を扱う基盤モデルにおいては電子カルテの要約などが期待されており、医療従事者にとっては日々の繰り返し作業となる手続きを効率化することが求められます。
pLMはタンパク質が持つアミノ酸配列を学習データとし、訓練した言語モデルを指します。
このモデルによって以下のようなタスクを解くことが可能になることが期待されます。
特に、実験検証された生成配列のうち新規タンパク質49個のうち31個は設計に成功したと主張する研究もあるため、単に学習データに含まれる天然タンパク質の情報を「記憶」しているだけでなく、タンパク質構造の設計原理まで学習できている可能性があることが知られています。
一方で、期待する機能を持ったタンパク質を見つけることはまだ困難なため、この分野の発展には今後も期待されています。
AmazonBedrockという生成系AIアプリをサーバレスに素早く開発するサービスを提供予定のようです(講演時はLimited Previewの段階)。
Amazonが主体となって提供する基盤モデルの他に、Stability AIやcohereといった著名なAIプロバイダーが提供するモデルへもアクセスができるようです。
加えて、基盤モデルを自作をする場合であっても選択肢が用意されており、独自の基盤モデルをスクラッチで作成することや、公開済みの基盤モデルを追加チューニングすることも容易にしていき、様々なアプローチを試しやすくしていくようです。
特に、AWSからはHealthOmicsやHealthScribeといったヘルスケア&ライフサイエンスに特化したサービスも続々と公開予定になっています。
ほとんどの企業は、ChatGPTのように提供された言語モデルを活用するか、公開済み基盤モデルをファインチューニングするかのアプローチをとることになります。
ファインチューニングの場合は従来のAI開発のような専門的なエンジニアリング知識が必要になります。
一方で、モデルを活用するだけであったとしても、その言語モデルを活用することで、どの程度問題が解決されるのか検証を行う必要があります。
どの言語モデルを選択するか、またどのような指標で判断するのかは人間が現実課題に合わせて検証する必要があります。
データ分析に対して知見のある企業においても、言語モデルを活用した開発についてはモーダルが全く異なるため、最初の一歩が難しいという状況は頻出します。
医療分野について知識がありながら言語モデルを使用するAI技術についても詳しい専門家にコンサルティングを依頼することで、プロジェクトをスムーズに立ち上げられるようになります。
そしてもっと大事なことですが、AI開発や活用を文化として社内に根付かせていくことで始めてAIの恩恵を受けることができ、競争の激しい医療業界においても自社のプレゼンスを発揮することができるようになります。