data preprocessing

[ˈdeɪtə ˌpriːˈprɑːsɛsɪŋ] データ プリプロセシング

1. 生データを分析や機械学習モデルの訓練に適した形式に変換するプロセス。

データ前処理とは、収集された生のデータがそのままでは分析や機械学習モデルに利用できない場合に、それを適切な形に加工・整理する一連の作業を指します。これには、欠損値の処理、データの正規化、特徴量の選択、外れ値の除去などが含まれ、データの品質を高め、モデルの性能を向上させるために不可欠な工程です。
Data preprocessing is a crucial step in machine learning. (データ前処理は機械学習における重要なステップです。)