Process Mining Basics

プロセスマイニングの概要についてご説明します。

→プロセスマイニング入門はこちら


INDEX

●概要 - Overview

プロセスマイニングとは? - Process Mining

●プロセスマイニングの経営的インパクト - Business Impact

●プロセスマイニングの適用範囲 - Application Area

●プロセスマイニングの4つのアプローチ - Four Approaches of Process Mining

●プロセスマイニングの基本手順 - Basic Procedure

●イベントログとは? - Event Log?

●プロセスマイニングツール - Process Mining Tools

●プロセスマイニング実行の組織体制 - Process Mining Team


概要 - Overview

プロセスマイニングは、ひとことで言えば「ビッグデータ分析ソリューション」です。プロセスの流れを可視化することにより、プロセスに潜む様々な問題の特定を容易にし、業務改革、デジタルトランスフォーメーション(DX)を促進します。

プロセスマイニングは1990年代末、オランダ で誕生しました。当時、Eindhoven技術大学の教授で、著名なコンピュータサイエンティストであったWil van der Aalst氏が生みの親です。

Aalst氏は、従来のヒアリング主体の業務分析手法が手間がかかり、かつ客観性に欠けるという問題に直面していました。そこで、その頃からSAPを始めとする業務システムが企業に浸透しつつあったことから、これら業務システムに残されているイベントログデータから、業務プロセスを再現できるのではないかと考えたのがプロセスマイニングの始まりです。

2000年代は、業務システムから抽出されたイベントログデータから、できるだけ現実の業務手順を再現できるような「アルゴリズム」の開発が学術研究主体で進められました。当時から、研究者が活用してきたツールがオープンソースの「ProM」です。

2010年代から、優れた商用ツールが次々と登場します。デスクトップで高速に走るDisco、現在、業界最大手のCelonis、そしてシミュレーション機能に強みを持つmyInvenioなどです。そして、企業のデジタル化の流れが加速し、より多くの業務がITシステム上で行われるようになったことで、欧州の企業を中心に、プロセスマイニングの採用が大きく進展、近年はRPAに続く最大のITトレンドになっています。

日本では、2019年初頭から本格的にプロセスマイニングが紹介され、たちまち多くの注目を集めました。2020年は日本でも、早くも本格普及期に入る可能性が高まっています。日本企業では、全社、本社だけでなく、グループ企業全体での根本的な業務改革やデジタルトランスフォーメーション推進が待ったなしの状況だからでしょう。

グローバルな競争にさらされている現在の日本企業にとって、徹底した効率化の追求と優れた顧客体験の提供にはDXの推進が必須。そして、DXの推進には、デジタルデータに基づき、リアルタイムで業務プロセスを可視化し、問題点と即時是正できるプロセスマイニングの実行が不可欠です。


プロセスマイニングとは? -Process Mining?

ビッグデータ分析手法である「プロセスマイニング」は、主に業務プロセスの「見える化」を目的としています。分析対象として、業務遂行に用いられる様々なシステム、具体的にはERPやCRM、SFA等の操作内容を詳細に記録したデータ、すなわち「イベントログ」を用います。

プロセスマイニングを行う主な目的は、プロセスに関わる様々な問題を発見することです。例えば価値を生まない無駄な手順や、非効率な活動、業務の滞留が発生しているボトルネックなどを特定し、是正することで、プロセスを開始してから完了するまでの所要時間を短縮、あるいは、プロセスに係るコスト削減を狙います。

プロセスマイニングは、多くの場合、複数の部門をまたがる長大なプロセスについての、数年分のイベントログデータを扱うためデータ量は膨大となります。したがって、いわゆる「ビッグデータ分析」の一種と言えます。

ビッグデータを分析することで、新たな知見を探り出すアプローチは「データマイニング(データの鉱脈堀り)」と呼ばれますが、プロセスマイニングは、文字通り「プロセス」についてのビッグデータ分析であることから、「プロセスマイニング(プロセスの鉱脈堀り)」と呼ばれています。


プロセスマイニングの経営的インパクト -Business Impact

プロセスマイニングは前項でご説明した通り、プロセスに関わる問題を発見し、是正することで、所要時間を短縮したり、コストを削減したりすることです。その結果として、事業運営の視点からは、以下のような効用(ベネフィット)が期待できます。

1 売上拡大 – Sales Growth

リードタイムが短縮するということは、端的には生産性の向上を意味します。すなわち、時間当たりでさばける案件が増えるため、より多くの製品を製造できるようになります。したがって、より多くの受注をこなせるようなったりします。こうして、売上の拡大が期待できるというわけです。

2 利益率向上 – Margin Expansion

生産性の向上によって、製造原価が下がると同時に、業務プロセスに係る無駄なコストを削減できるため、利益率の向上につながります。コストが下がった分を販売価格の引き下げに反映させれば、価格的な競争力を高めることも可能です。

3 顧客満足向上 – Customer Satisfaction Improvement

プロセスのリードタイム短縮、具体的には、顧客からの注文を受け付けてから納品までの「受注プロセス」の所要時間を短縮できれば、「貴社は納期が短くて助かる」とお客様に感謝されるでしょう。また、プロセスのムリ、ムラ、ムダをなくせば、配送ミスなどの業務上の手違いも減り、顧客とのトラブル発生を未然に防ぐことができます。

すなわち、業務プロセスの改善が顧客への価値提供に関わるものであった場合、顧客満足度の向上に結びつき、新規顧客の固定化や既存客との取引拡大が期待できます。


プロセスマイニングの適用範囲 - Application Area

プロセスマイニングは、ビジネスプロセスの管理を目的とする「ビジネスプロセスマネジメント(BPM)」における業務プロセス分析のひとつとして発展してきました。したがって、組織・企業に属するスタッフの業務プロセスの分析が多く行われてきています。ビジネスでは様々な業務システムが活用されており、これら業務システムに記録・蓄積されているイベントログが分析対象です。具体的には、業務プロセス分析のためのイベントログデータの抽出元としては以下のようなものがあります。

  • ERP: SAP、Oracle、MicrosoftなどのERPシステム
  • CRM/SFA: Salesforce、SugarCRM’sなどの顧客管理、販売管理システム
  • MA:Pardot, Marketo, Hubspotなどのマーケティングオートメーション
  • ISMS:ServiceNowなどのヘルプデスクシステム
  • CTI:コールセンターで問い合わせ対応に利用されるシステム

近年は、顧客の行動プロセス、例えば初回問い合わせから購買に至る行動、すなわち「カスタマージャーニー」をプロセスマイニングを通じて分析するアプローチも少しずつ増えてきています。

また、医療機関などでは、患者の検査プロセスや治療プロセスにプロセスマイニングが応用されるケースも多く、この場合、電子カルテのようなシステムからのイベントログだけでなく、MRIなどの医療機器のマシンログに対するプロセスマイニングが行われています。さらに、今後、IOTの進展によって様々な場所に設置されたセンサーが生成する「イベントログ」が大量に蓄積されていくと予想されます。このIOTデータもまた、プロセスマイニングによって思いもしない価値ある知見が発見できる宝の山になりえると考えられます。


プロセスマイニングの4つのアプローチ – Four Approaches of Process Mining

プロセスマイニングというビッグデータ分析のアプローチとしては、一般に以下の4つがあります。なお、4つ目の「運用サポート」は、近年、プロセスマイニングの新たな活用法として注目が高まってきたものであり、従来は1から3までの3つのアプローチが基本でした。

1 プロセス発見 - Process Discovery

業務システムなどから抽出されたイベントログデータから、プロセスマイニングツールを使って「フローチャート」の形で業務フローを描き出す=プロセスモデルを作成する。これが「プロセス発見」です。近年、業務の多くがシステム上で遂行されることによってブラックボックス化した業務の流れが、フローチャートとして見える化されることからプロセス発見と呼ばれます。

業務手順がフローチャートとして把握可能となると、業務量が多い箇所はどこか、どこが業務が滞留するボトルネックになっているかが手に取るようにわかります。プロセスに係る問題個所の特定が容易になるというわけです。

2 適合性検査 - Conformance Checking

イベントログデータから再現されたプロセスは、「as-isプロセス」です。現実のありのままのプロセスですね。一方、企業によっては、標準的な手順を検討し、「理想プロセスモデル」すなわち「to-beプロセス」を定義している場合もあります。

こうした企業の場合、「to-beプロセス」をプロセスマイニングツールにアップロードすることで、「to-beプロセス」と「as-isプロセス」の比較分析を行い、あるべきプロセスからの現実のずれ=逸脱を発見することが可能です。これが「適合性検査」です。

あるべき姿(to-be)に対してに対して、現実(as-is)がどれだけ合致しているかを確認することから「適合性検査」と言います。適合性検査が特に有益なのは、法令順守の観点から、厳密な手順を踏むことが求められるような業務プロセスを是正、維持する場面です。すなわち、「監査(Audit)」に有効なアプローチです。

3 プロセス強化 - Process Enhancement

プロセス強化は、プロセス発見や適合性検査を通じて特定した問題点を解消するだけでなく、より優れたアプトプット、より短い所要時間、より安い業務コストを目指して、現状よりも優れた業務プロセスを創り出すことを目指します。これは、新たな「to-beプロセス」を定義することだといえるでしょう。

4 運用サポート - Operational Support

プロセスマイニングは、プロセス発見、すなわち過去の、完了済みプロセスのイベントログからas-isプロセスを把握することが出発点です。さらに、適合性検査やプロセス強化によって、新たな業務プロセスを定義し、新業務プロセスべーすでの運用を始めたら、その後は、着実に、逸脱なく、新業務プロセスが実行されているかを継続的にモニタリングすべきでしょう。

運用サポートでは、現在走っている「未完了のプロセス」のデータをプロセスマイニングツールにリアルタイムで流し込み、完了までの推定リードタイムを予測したり、逸脱した手順や過度の業務集中、ボトルネックの発生を捕捉し、関係者に通知、即時の是正を図るものです。

プロセスマイニング分析は、BPRや業務改革プロジェクトにおいてひと回ししたら終わりではありません。新業務プロセスへと改訂後の効果検証とモニタリングを通じて、継続的なプロセス改善(Continuous Process Improvement)につなげてこそ、その最大の価値を手にすることができます。


プロセスマイニングの実行手順 – Basic Procedure

プロセスマイニングは大きくは3つの工程で構成されます。すなわち、「データの準備」、「プロセスマイニング分析」、「分析結果の評価」です。

1 データの準備 - Data Preparation

データの準備は、分析対象となるイベントログデータを抽出するところからスタートします。例えば、購買に関わるプロセス(P2P:Purchase to Pay)を分析したい場合、まず分析対象となるデータがどこにあるかを明確化する必要があります。もしSAPシステムを利用していた場合には、プロセスマイニングに必要なデータは、SAPのどのモジュールのどのテーブルにあるデータ項目かを判断し、データ抽出のための指示書を作成することになります。実際のデータの抽出は、多くの場合、SQLなどのスクリプトを活用します。

イベントログデータが抽出できたら、次にデータの加工です。プロセスマイニング分析用の所定のデータフォーマットへとデータを変換したり整形したりする作業を行います。データ量が限られている場合ば、EXCELでも十分、データ加工を行うことが可能です。しかし、データ量が膨大な場合、EXCELでは反応が遅くなり、作業効率が低下しますので、データ加工のための専用ツール、「ETLツール」を用いてデータを加工します。

こうして、プロセスマイニング分析のための所定のデータフォーマットへとデータを加工できたら、通常、「CSVやEXCELファイル」にてプロセスマイニングツールにアップロードし、次工程のプロセスマイニング分析へと移ります。

2 プロセスマイニング分析 - Process Mining Analysis

イベントログデータのアップロードが完了したら、「マッピング」と呼ばれる基本設定を行いさえすれば、すぐに様々な分析機能を実行することができます。どのような分析ができるのかはツールによって多少異なりますが、主な分析機能としては以下のようなものがあります。

  • 頻度分析:処理件数に基づく分析です。購買プロセス(P2P)の場合、基本的に「購買依頼番号」の件数で計算が行われます。一般に、処理件数が多い箇所ほど業務が大変であり、ボトルネックになりやすいということが言えます。
  • パフォーマンス分析(時間分析):プロセスの開始から終了までの総所要時間(スループット)や、活動ひとつひとつの処理時間(サービスタイム)や、待ち時間(ウェイティングタイム)を算出します。
  • バリアント分析:あるプロセスのスタートとゴールは同じでも、その道筋(トレース)には様々なバリエーションが発生します。銀行の住宅ローン処理プロセスを例にとると、申請書類に記入漏れがあれば、申請者に再記入をお願いすることになります。また、処理の途中で担当者がミスを起こすと再度手順をやり直す(リワーク)ことが必要となります。このように、現実のプロセスは想定した通りには決して流れないため、多くのプロセスパターン=バリアントが存在します。バリアント分析では、これらのバリアントの比較分析を行い、また、バリアントの中から、理想的な手順を踏んでいるプロセス=「ハッピープロセス」を特定する、といった作業を行います。
  • 適合性検査:イベントログデータだけでなく、理想プロセス(to-beプロセス)を記述したファイル(BPMN形式)も併せてアップロードすれば、as-isとto-beの比較分析を行い、逸脱プロセスを特定することが可能です。
  • 基本統計量:例えば、ある業務プロセスの開始から終了までの所要時間(スループット)について、平均、最大、最小、中央値などの数値を確認することができます。
  • 活動マップ:活動マップは、業務プロセスを構成する個々の活動を誰が担当したかを一覧できるものです。業務と担当者との関係性が把握しやすく、業務職掌(SOD: Segregation of Duties)上の問題(担当外の人間が業務を行っており、責任の所在があいまいになっている、など)をあぶりだすことができます。
  • ソーシャルネットワーク:業務を通じて、どの担当者とどの担当者が関連性があるかを「ネットワーク図」の形で表したものです。企業・組織の業務プロセスにおける一般的な関係性には2種類があります。ひとつは、同じような業務を行っているものです。例えば請求書の確認を複数の担当者が手分けしてやっている場合、この「類似業務を遂行する関係」ということになります。もうひとつは、「共同作業」の関係です。例えば、ある担当者が作成した申請書類を別の担当者が確認、承認するといった、業務の受け渡し関係がある場合、「共同作業」を行うもの同士という関係があることがソーシャルネットワークで示されます。
  • 予測分析:予測分析機能は、運用サポートの一環です。現在走っている案件について、過去のプロセスマイニング分析結果に基づく予測式にあてはめ、あとどのくらいの時間で完了しそうか=完了までの所要時間を算出してくれます。予測分析が示した推定所要時間が、所定のKPIの目標値よりも長くなりそうな場合、担当者は当該案件のリードタイム短縮のための対策を講じることができるというわけです。
  • シミュレーション: イベントログから再現されたas-isプロセスについて、業務の流れを改訂したり、あるいは一部の活動をRPAによって自動化した場合に、どの程度、所要時間の短縮や業務コストの削減が見込めるかをシミュレーションすることで検証することが可能です。
  • BPMNモデリング:業務フローを記述する方法には様々なものがあります。簡便なものとしては、パワーポイントでも可能です。しかし、社内外の関係者に共有したり、BPMシステムでの運用を行うなら、世界標準となっている表記法である「BPMN(Business Process Modeling and Notation)」に準拠すべきでしょう。プロセスマイニングツールは、as-isプロセスを自動的にBPMN準拠のフローチャートに変換することができます。さらに、そのBPMNのプロセスモデルに新たなプロセス追加するなどの編集機能を持つツールもあります。

3 分析結果の評価 - Evaluation of the Analysis

プロセスマイニングツールを使って、as-isプロセスを見える化する、またto-beプロセスとの比較分析による適合性検査を行う。こうした分析を通じて、プロセスの問題個所を事実ベースで把握することができました。

ただ、プロセスマイニングができるのはここまでです。プロセスマイニングによって、ここに逸脱がある、あそこにムダがある、ボトルネックがある、といった「現象(WHAT)」は見えてきますが、では「なぜムダがあるのか」、「なぜボトルネックが発生してしまうのか」、という「原因(WHY)」は分析結果からは読み取れません。

分析結果の評価(Evaluation)とは、プロセスマイニングの分析結果の中から、特に掘り下げて分析すべきポイントを押えつつ、根本原因(Root-cause)の解明に取り組むことです。

根本原因を探り当てるためには、プロセスマイニングツールから離れ、現場の担当者へのヒアリングを行ったり、実際に業務がどのように行われているかを観察するといった作業も必要となります。

そうした作業も必要となるのなら、従来の業務分析手法とプロセスマイニングは大して変わらないのでは?とお感じになるかもしれませんが、全く違います。従来の業務分析では、まず現象(WHAT)を明らかにするためのヒアリングや観察から始める必要がありました。

しかしプロセスマイニングからスタートすれば、すでに「現象(WHAT)」は事実ベースで把握できていますから、ヒアリングや観察は、「なぜそうなっているのでしょうか?」と問うことで、「原因(WHY)」を掘り下げていくことができるのです。


イベントログとは? – Event Log?

イベントログは、プロセスマイニングの対象となるデータの総称です。ITに詳しい方が連想されることの多い「エラーログ」ではありません。また、「マスターデータ」でもありません。

イベントログは、業務システム等を担当者が操作した内容を詳細に記録したものです。例えば、購買プロセスであれば、購買要求、購買承認、見積もり依頼、発注依頼、検品、請求書受領、請求書支払いなどの個々の活動がシステム上で行われた際に、タイムスタンプと共に記録されたデータであり、「トランザクションデータ」と呼んだほうがわかりやすいでしょう。

トランザクションデータには価格や数量の変更や、非承認による再申請といった変更履歴も含まれています。これにより、業務遂行に関わる手戻りや繰り返しなどの非効率性などが浮き彫りにできるというわけです。

システムによっては、変更履歴がなく、常に最新の活動に上書きされたイベントログしかないケースもあります。このようなデータですと業務の流れがが正確に再現されないため、プロセスマイニング分析を行うことは困難になります。


プロセスマイニングツール – Process Mining Tools

プロセスマイニングを行うためには、専用のツールを用いる必要があります。

イベントログデータから、フローチャートの形でプロセスモデルを描き出すアルゴリズムは、プロセスマイニング独自のものであり、いわゆる「BIツール」にはそのような機能はありません。また、 プロセスマイニングはビッグデータ分析です。分析するデータ量は数十ギガ、行数で言えば数百万行以上になることがほとんどです。 したがって、大量データから高速で分析を行い、プロセスモデルを作成するためには専用ツールが不可欠となります。

2020年1月現在で、プロセスマイニングツールは世界に30以上存在しています。プロセスマイニングの発祥の地である欧州で最も多いのですが、米国、カナダ、オーストラリアなどにも有力なツールがあります。

プロセスマイニングツールは商用、つまり使用料が必要なものだけでなく、オープンソースのものもあります。それぞれについて、以下に主要なツールを挙げます。

商用ツール – Commercial

  • Celonis:ドイツ。業界最大手です。運用サポートに強みがあります。タスクマイニング機能あり。日本語ローカライズ中。
  • myInvenio:イタリア。シミュレーションに優れています。タスクマイニング機能あり。日本語ローカライズ済み。
  • Disco:ドイツ。最も早くから開発、販売されてきたツール。
  • LANA Process Mining:ドイツ。日本語ローカライズ済み。
  • Process Gold:ドイツ。現在はUiPath傘下となり、UiPathのラインアップのひとつ。
  • Signavio:ドイツ。もともとBPMツールですがプロセスマイニング機能も装備。
  • ABBYY Timeline: OCR製品で知られるABBYY社が2019年に買収したツール。日本語ローカライズ済
  • Minit:スロバキア。タスクマイニング機能あり。

オープンソース – Opensource

  • Apromore:オーストラリア。大企業向けには有償版もあります。
  • ProM:プロセスマイニングが生まれたオランダで開発。2000年代前半から学術研究に活用されてきました。

プロセスマイニング実行体制 – Process Mining Team

プロセスマイニングを実行するために必要なチームメンバーは以下の通りです。

プロセスオーナー – Process owner

プロセスオーナーは、プロセスマイニングの分析対象となるプロセスに関して、直接の権限や責任を持つ方です。プロセスマイニングの結果、ボトルネックなどの問題が発見され、それに対する解決策が提示された場合は、それを承認(非承認)する立場になります。

分析対象プロセスが複数の部門にまたがる場合は、プロセスオーナーはそれぞれの部署のトップがプロセスオーナー になるよりは、より上位の事業部長クラス、あるいは役員クラスがプロセスオーナーになってもらうのがいいでしょう。

プロジェクトマネージャー ー Project Manager

プロジェクトマネージャーは、文字通りプロジェクトの進捗管理を行う役割を担います。大企業になると、複数のプロセスを対象とするプロセスマイニングが並行して走ることが一般的であり、データサイエンティストなどの専門家のリソースが限られることから、並行するプロジェクトとのリソース配分も調整しつつ円滑にプロジェクトを推進していかなければなりません。

ドメインエキスパート – Domain expert 現場担当者

ドメインエキスパートとは、分析対象プロセスに含まれる各活動を遂行する現場の担当者のことです。従来の業務分析におけるヒアリングでは、彼らドメインエキスパートに協力を仰ぎ、現場でどのような手順で業務を行っているかを確認します。

プロセスマイニングの場合、まずはイベントログデータで業務の流れを可視化します。したがって、ドメインエキスパートの役割は、プロセスマイニングの結果から洗い出された問題点の根本原因を堀りさげるために、イベントログでは拾いきれない詳細な業務内容を伝えることです。

IT管理者 – IT administrator

IT管理者は、分析対象となるイベントログデータがITシステムのどこにどのように蓄積されているかを確認し、イベントログデータを抽出する役割があります。どのデータ項目が必要なのかは、データサイエンティストからの「データ抽出依頼書」の内容を参照します。

データサイエンティスト – Data scientist

データサイエンティストは、プロセスマイニング分析のための分析計画を立案するとともに、分析目的に照らして必要なデータ項目は何かを決定して「データ抽出依頼書」に落とし込み、IT管理者にイベントログデータ抽出を依頼します。

また、抽出されたイベントログデータに対して、ノイズとなるデータを除去したり、データを変換するなど、プロセスマイニングツールにアップロードするためのクリーンなイベントログを作成します。この作業を「データ前処理(Data Preparation)」と呼びます。データ前処理を行うイベントログデータは大容量であるため、ETLツールや、Python、SQLなどのスクリプトを活用します。

なお、プロセスマイニングツールは、多くの場合、データサイエンティストが操作しますが、ツール自体の操作はBIツールと同様、それほど技術的な素養は必要しないため、基本的な操作はプロセスマイニングの関係者全員がある程度行えるようになるのが望ましいでしょう。

プロセスアナリスト – Business analyst

プロセスアナリストは、BPM(Business Process Management)の知識を有し、プロセスマイニングの結果をプロセスだけでなく、人・組織、システムなど多面的な視点で評価し、非効率なプロセスやボトルネックを特定、根本原因分析のために、ドメインエキスパートへのヒアリングや、現場の観察調査などを行います。

プロセスコンサルタント – Business consultant

ビジネスコンサルタントは、業務改革・改善のための方法論、リーンマネジメントやシックスシグマなどの知識を有し、プロセスマイニングを通じて炙り出した問題点の解決策を立案し、その実行を提案、管理することが役割です。

*上記は、果たすべき役割によって説明していますが、データサイエンティスト、プロセスアナリスト、プロセスコンサルタントの3人については、求められる知識やノウハウ、経験がある程度重なり合います。現実には、一人のコンサルタントがこれらの役割を複数担うケースもあります。

project team