フローは、タスクと呼ばれる小さな処理を順次実行することで、最終的に求める結果を得るための一連のデータ処理におけるプロセスとその処理基盤のことです。
ユーザーは、ノードと呼ばれる部品をフローの編集画面上でつなぎ合わせていくことで、分析処理を構築できます。
分析のためのノードは、プロジェクト上に存在するファイルや分析スクリプトと紐づいています。
それぞれ、分析に与えるための入力データや、タスクとしての働きをします。
タスクはタスクごとにコンテナを持っており、その中にタスクを実行するための必要最小限かつタスク独自の実行環境を持ちます。
フローの主な利用目的は、以下のとおりです。
分析内容の理解度向上
有識者が作成した分析のデータフローが図示されることで、他ユーザーの理解を早めます
分析の効率化
一度作成したフローのデータノードとタスクノードを画面上で繋ぎ変えるだけで、コーディングをせずに分析を実行できます。
分析プロセスの見える化
分析プロセス、および実行状況が見える化でき、失敗したところから再度実行できます。
分析モデルの再利用
他のユーザーやユーザーが過去に作成した分析モデルで利用したデータ、モデル、およびパラメーターを簡単に利用できます。