GLOSSA

データエンジニア

でーたえんじにあ

Data Engineer

一言でいうと

データの収集・加工・配信のパイプラインを設計・運用する役割のこと。

詳しい意味

データエンジニアは、データの収集・加工・配信のパイプライン(ETL / ELT)と、データ基盤(DWH / データレイク / データマート)を設計・構築・運用する役割です。データサイエンティスト・アナリスト・MLエンジニアが「データを使う側」なら、データエンジニアは「データを使える状態に整える側」。BigQuery / Snowflake / dbt / Airflow / Spark / Kafka などのスタックに精通します。データ品質・パイプラインの信頼性・コスト最適化・データガバナンス(誰がどのデータを使えるか)の責任を持つことが多く、SREとデータサイエンスの間に位置するハイブリッド職種です。

何に使うか

分析環境を整備したいとき。ETL / ELT パイプラインの設計と運用。複数システムのデータを統合する横断基盤の構築。

どんな時に出るか

「データエンジニアに依頼」「データパイプラインが詰まった」「データ品質の改善」といった場面で登場します。

具体例

  • データエンジニアが Airflow + dbt でデータパイプラインを構築し、BIチームにマートを提供している。
  • データエンジニアの不在で、データ分析の手前で常に詰まる組織になっていた。

別名・略称

data engineer(でーたえんじにあ)DE(でぃーいー)

関連語

ETLデータウェアハウスデータレイク

間違えやすい語

MLエンジニア

初心者向けメモ

工場の「物流担当」のような役割です。原料(生データ)を仕入れ、加工して、必要な部署(分析者)の手元に正確に届ける。料理人(データサイエンティスト)が美味しい料理を作れるかは、物流担当の腕次第、という重要な役割です。

この説明に改善点はありますか?

この説明を修正提案する新しい用語を提案する

提案は管理者が確認した後に反映されます