データクレンジングとは、データをきれいにする取り組みを指します。データを活用する際に実施するのが一般的です。 データを活用するには、データを使える状態にしておかなければなりません。しかし、企業が扱うデータは必ずしも使える状態ではないケースがあります。例えば、電話番号や郵便番号に半角数字と全角数字が混在している、「株式会社」と「(株)」が混在している、「1丁目2番地3号」と「1-2-3」などの住所が混在しているなどさまざまです。データクレンジングは、ルールに基づきこうした混在表記を統一する作業をいいます。データクレンジングを実施することでデータの品質を高め、データを活用しやすくします。 データクレンジングは手作業で1件ずつ表記を統一する手もありますが、時間も手間もかかることからデータが膨大なら専用ツールを使うのが効率的です。
データクレンジングとは、データをきれいにする取り組みを指します。データを活用する際に実施するのが一般的です。
データを活用するには、データを使える状態にしておかなければなりません。しかし、企業が扱うデータは必ずしも使える状態ではないケースがあります。例えば、電話番号や郵便番号に半角数字と全角数字が混在している、「株式会社」と「(株)」が混在している、「1丁目2番地3号」と「1-2-3」などの住所が混在しているなどさまざまです。データクレンジングは、ルールに基づきこうした混在表記を統一する作業をいいます。データクレンジングを実施することでデータの品質を高め、データを活用しやすくします。
データクレンジングは手作業で1件ずつ表記を統一する手もありますが、時間も手間もかかることからデータが膨大なら専用ツールを使うのが効率的です。