การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx
ในการจัดการข้อมูล การทำ Data Cleansing (การทำความสะอาดข้อมูล) นั้น ถือเป็นขั้นตอนที่ใช้ระยะเวลานานที่สุด
19 April, 2021 by
การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx
Chinnawoot Toechamroen (Nic)
| No comments yet

 

 การทำ Data Cleansing โดยใช้เครื่องมือจากโปรแกรม Alteryx
สามารถทำได้ง่าย และช่วยประหยัดเวลาในการทำความสะอาดข้อมูลเครื่องมือที่จะนำมาแนะนำให้บทความนี้คือ Data Cleansing Tool

Data Cleansing Tool
Data Cleansing Tool เป็นเครื่องมือที่ใช้จัดการข้อมูลที่มีค่า null ด้วยการลบทิ้งทั้งแถวหรือแทนค่าด้วย 0 หรือช่องว่าง และยังใช้จัดการช่องว่าง ตัวหนังสือ ตัวเลข เครื่องหมายวรรคตอนต่างๆ รวมถึงรูปแบบตัวอักษรแบบตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็กอีกด้วย

       การนำ Input Data มาเชื่อมต่อกับ Data Cleansing Tool ตัวเลือกต่างๆ ในเครื่องมือ มีดังนี้

       1. ลบแถวที่มีค่าเป็น null ทั้งหมด หรือ ลบคอลัมน์ที่มีค่าเป็น null ทั้งหมดออก
       2. เลือกคอลัมน์ที่จะทำการคลีนข้อมูล ซึ่งจะเลือกทำตัวเลือกในข้อ 3 และ ข้อ 4
       3. เลือกจัดการข้อมูลที่เลือกในข้อ 2 ได้ดังนี้
                 3.1 ลบช่องว่างข้างหน้า และข้างหลังออก
                 3.2 ลบแท็ป บรรทัดคั่นหน้า และช่องเว้นว่างที่เว้นมากกว่าหนึ่งช่องให้เหลือเพียงช่อง                    เดียว
                 3.3 ลบช่องว่างทั้งหมดออก
                 3.4 ลบตัวหนังสือทั้งหมดออก
                 3.5 ลบตัวเลขทั้งหมดออก
                 3.6 ลบเครื่องหมายวรรคตอนออก
       4. ปรับรูปแบบตัวอักษรให้เป็นตัวพิมพ์ใหญทั้งหมด ตัวพิมพ์เล็กทั้งหมด หรือตัวพิมพ์ใหญ่แค่ตัวแรก

       ตัวอย่างการใช้ Data Cleansing Tool       จากรูปด้านบนเป็นตัวอย่างข้อมูลที่จะใช้เป็นตัวอย่าง ข้อมูลจะมีบางช่องที่มีค่า null หรือช่องว่าง ทั้งข้างหน้าหรือข้างหลังของคำ

       ตัวอย่างที่ 1
       ปลี่ยนค่า null ในคอลัมน์ Score ให้เป็นค่า 0

       ตัวอย่างที่ 2

       เปลี่ยนค่า null ในคอลัมน์ที่เลือกเป็นช่องว่าง และลบช่องว่างข้างหน้ากับข้างหลังออก จะเห็นว่าในคอลัมน์ Score จะไม่เปลี่ยนค่า null เป็นช่องว่าง เพราะตัวเลือกนั้นจะทำเฉพาะข้อมูลที่เป็น String

       ตัวอย่างที่ 3

       ในคอลัมน์ Term เปลี่ยนค่า null ในข้อมูล String เป็น ช่องว่าง และในข้อมูลตัวเลขเปลี่ยนเป็น 0, ลบช่องว่างด้านหน้าและด้านหลังออก และลบตัวหนังสือทั้งหมดออก


       ตัวอย่างที่ 4 

                ในคอลัมน์ Region จะจัดการลบช่องว่างข้างหน้ากับข้างหลังออก และเปลี่ยนรูปแบบเป็นอักษรตัวพิมพ์ใหญ่ทั้งหมด


       การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx
       Chinnawoot Toechamroen (Nic) 19 April, 2021
       Share this post
       Archive
       Sign in to leave a comment