Azure Data Factoryとは？Glueとの違いから学ぶデータ統合サービスの全体像について

Microsoft Azure

Table of Contents

はじめに

Azure Data Factory（ADF）は、Microsoft Azureが提供するクラウドベースのETL／データ統合サービスです。AWS Glueと同様に、GUIを使ってノーコードまたはローコードでETLパイプラインを設計・実行できる点が特長です。

この記事では、ADFの基本構成、主なコンポーネント、Glueとの違いや共通点を交えて、初心者にもわかりやすく解説します。

ADFは、クラウドやオンプレミスに点在する様々なデータソースから、データを抽出・変換・格納（ETL）するためのオーケストレーションサービスです。

ものすごく簡単に言うと

バラバラな場所（S3・DB・CSVなど）にあるデータを、集めて、加工して、キレイに整理して、次のシステムに渡す仕事をしてくれるクラウド上の自動処理の工場

データを抽出・変換する自動化プラットフォームとしてAWSのGlueが有名ですね。

AWS GlueとAzure ADFの違いを理解する：ETL構築の共通点と使い分け

Azure Data Factoryは以下のようなコンポーネントで構成されます。

比較項目	Azure Data Factory	AWS Glue
処理方式	GUI中心のワークフロー構成	GUI + コード（PySpark）対応
実行エンジン	Sparkベース（Data Flow） or SSIS	Sparkベース
トリガー方式	スケジュール／イベント／Webhook	スケジュール／イベント
データカタログ	Purview／Data Catalog	Glue Data Catalog
拡張性	DatabricksやSynapseと統合しやすい	RedshiftやAthenaと親和性高い

Azure Data Factoryは、GUI操作で視覚的にパイプラインを構築し、さまざまなソース間でETLを自動化できる強力なサービスです。AWS Glueと同様の思想で構築されており、マルチクラウドのデータ統合を考える上でも理解しておくべき存在です。

GUIベースでのETL構築が得意な方、Azureに既に環境がある方には、ADFは非常に親和性の高い選択肢となるでしょう。

最新情報をチェックしよう！