不来院の予約を予測

毎年1,500万人が診療予約をとったのに来院しない、イギリスの国民健康サービス(NHS)は患者に来ないよりもキャンセルするように促している。NHSは、これらの来院しなかった診療予約のコストは年間2億1600万ポンド(2,325人のフルタイムの一般開業医の年間給与に相当)にのぼると推定している。

似たような状況が出てくる米国では、「来院しない予約のコストは年間1,500億ドルと推定されている」と、ヘルスケア・イノベーションによると。

Einstein Prediction Builder(EPB)のおかげでこのようなシナリオの予測を生成するのに適しています。十分な過去の診療予約データがSalesforceに保存されてEPBを使えば、システム管理者が問題解決するようにAIを適用することができます。

この記事の続きは、アインシュタイン予測ビルダーを設定して「不来院の予約」になる可能性を予測する方法を紹介しています。

まず「https://www.kaggle.com/」からサンプルデータをダウンロードしましょうhttps://www.kaggle.com/joniarroba/noshowappointments 過去来院しない予約データをセールスフォースの「スプレッドシートからカスタムオブジェクトを作成」機能を使って数分で自動的に「予約」オブジェクトを作成しつつデータを取り込むことができます。

次にEPBを使って予測モデルを作成します。

予測結果より単純に”来院”又は”来院しない”だけ知りたいので予測に「Yes/No」質問回答を指定します。

予測モデルに参考するために「来院しない予約」データを指定する必要があります。 そのため「予約」オブジェクトより来院しない予約を絞り込めるように「No-show=来院しない」項目を指定します。 このデータセットには2016年4月から2016年6月の間に行われた診療予約が含まれているので、構築するモデルが2016年5月25日以前の予約から学習し、2016年5月26日以降に行われる予約について予測が生成されると仮定してみましょう。

「Data Checker=データを確認する」セクションには、次のようなことが書かれていることに気づくでしょう。 学習データセットには72427レコードがあります。そのうちの57,303件の "No Show =来院しない"が 予測対象レコードは9,573件(2016年5月26日以降の予約)になります。

Einsteinは今,あなたの予測をどの項目に基づいて行うべきかを 尋ねています. このデータセットに含まれているほとんどの項目は、あなたの予測を作成するために使用することができます。 例えば,この予測を作成するために含まれている項目は以下の通りである. 予約日、曜日、予定日 患者の年齢層、近隣地域、前回「来院しない」 患者の既往症(糖尿病、高血圧)

しかし、いくつか項目を除外する必要があります。例えば

  • バイアスがかかる可能性がある項目。
  • 回答が漏れる可能性がある項目(潜在的な「データ・リーカー」)
  • 予測に影響を与えないことが知られているシステム項目(例:所有者ID=OwnerId)

最後に予測結果を格納する項目を命名・作成する

[Build Prediction]ボタンを押下すると予測モデルを構築して始められます。

予測モデルの構築が完了された場合構築ステータス="Ready for Review"に変更され 予測に関する「Scorecard」ボードに入って予測指標、予測結果を確認できます。

次のステップは、予測を有効にするかどうかを決定する段階になります。予測スコアカードは、決断を下すために必要な主要な情報を明らかにします。 ・予測質「Prediction Quality」50に近い数字は、モデルが「コインを投げる」よりも優れていないことを意味します。この場合、スコア71が良いということになります。これを読んでいるML/データサイエンティストにとって、スコアはROC曲線下面積(AuROC)であり、異なるモデルの予測性能を比較するために使用される一般的な指標です。

・上位の予測指標は、スコアを生成する際にモデルが考慮するデータについてのいくつかの洞察を提供します。この場合、上位予測指標は以下の通りでした。

  • 24時間以内に予定されている予約
  • 患者の前歴は「来院しない」です。
  • 患者年齢別ブラケット
  • "詳細=Detail "タブを開いて予測因子の完全なリストとそれらの相関を確認できます。

予測結果を確認 スコアリングプロセスが終了すると、Salesforce のリストビューまたはレポートにスコアを追加、確認できます。

上の図を見ると、最高得点の記録はほとんどが「来院しない」であることがわかります...でも、待ってください、予測が正しいかどうかはどうやって検知ができますか?どうやって「予測されたPredicted No Score=予測スコア」を「来院しない」の予測に変換ことができるのでしょうか?さらに、どのようにして予測と実際に起こったことを評価することができますか? 次のブログで予測結果、インサイトの読み方を解説する予定です。

では次は何をするの? スコアが「来院しない」の良い指標であると仮定すると、「来院しない」を見極める方法を手に入れたことになります! 今後の「予約するのに来院しない」を防ぐために、どのように活用しますか?「来院しない」防止策としては、以下のようなものがあります。

問題意識を高める。 ・ターゲットを絞った "予約するのに来院しない"の意識向上キャンペーンを行う。 ・ホットスポットを特定するために、年齢層とジオ(近隣/郡/州)による実際の "来院しない"率を統計する。

次回の予約時に「来ない」と思われる人を積極的にターゲットにしています。

  • 予約日の1~5日前に予約のリマインダーをメールで送信します。
  • 予約日の24時間前にSMSで予約のリマインダーを送信

参照元記事:https://medium.com/salesforce-einstein-platform/einstein-prediction-builder-predict-medical-appointment-no-shows-709c1f8c5498

Happy Coding!

Posted in AI, Salesforce, Vietnam Offshore on Jun 01, 2020