Data preparation

ˈdeɪtə ˌprɛpəˈreɪʃən データプリパレーション

1. データ準備、データ前処理

生データを分析や機械学習モデルが利用できる形式に変換するプロセス全体を指します。これには、データのクリーニング、欠損値の処理、データ変換、正規化、特徴量エンジニアリングなどが含まれ、分析の品質を大きく左右する重要なフェーズです。
Data preparation is a crucial step in any data science project. (データ準備は、あらゆるデータサイエンスプロジェクトにおいて極めて重要なステップです。)
関連
Data cleaning
Feature engineering
Data preprocessing
ETL