Azure Machine Learning

001-What is Microsoft Azure Machine Learning?

What is Microsoft Azure Machine Learning (AzureML)? ในปัจจุบันนี้ข้อมูลมีการเติบโตขึ้นอย่างมหาศาลและมีการใช้ประโยชน์จากข้อมูลเหล่านี้ในทุก ๆ  ด้าน ซึ่งเครื่องมือที่ใช้ในการดึงเอาประโยชน์จากข้อมูลที่มีอยู่อย่างมหาศาลนี้ คือ Machine Learning ที่ถูกนำมาใช้ในชีวิตประจำวันของเรามากมาย เช่น Siri, Face ID, ข้อเสนอที่แฝงตัวบน YouTube, การแนะนำหนังที่น่าสนใจบน Netflix และอื่น ๆ อีกมากมาย เมื่อเรานึกถึง Machine Learning เราคงคิดว่าเราต้องเขียนโคดใช่ไหมค่ะ แต่ในปัจจุบันนี้เรามีเครื่องมือที่ชื่อว่า  Microsoft Azure Machine Learning (AzureML) สามารถช่วยคุณให้สามารถสร้าง Machine Learning ได้โดยไม่ต้องเขียนโคดเลย  เรามาทำความรู้จักกับ Microsoft Azure Machine Learning (AzureML) กันค่ะ Microsoft Azure Machine Learning (AzureML) คือเครื่องมือในการทำ Machine Learning บน Cloud Computing base สามารถใช้งานได้บน Web Browser โดยแค่ drag and drop เอา Module ที่เราต้องการมาประกอบกันเพื่อสร้างโมเดล Machine Learning ที่สมบูรณ์ของเราได้อย่างรวดเร็ว อีกทั้งยังสามารถ deploy โมเดลที่เราสร้างเพื่อใช้ในรูปแบบ Web service ได้อีกด้วย และหากเราต้องการโมเดลหรือฟังก์ชันที่นอกเหนือจาก Module ที่มี เราสามารถเขียนโค้ดเองได้ซึ่งตัว AzureML รองรับทั้งภาษา R และ Python ค่ะ เรามาดูกันว่า 5 เหตุผล ทำไมเราต้องใช้ AzureML สำหรับแก้ปัญหาโดยใช้ Machine Learning เหตุผล คำอธิบาย [...]

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

002-Getting to know the experiment

มาทำความรู้จักกับหน้า Experiment สำหรับทำโมเดลกันเถอะ ก่อนที่เราจะทำความรู้จักกับหน้าตาของ Experiment ที่เราต้องใช้ในการสร้างโมเดลของเรานะคะ เราต้องสร้าง Experiment ของเราขึ้นมาก่อน ซึ่งสามารถทำได้ง่ายๆ ดังนี้ 1. กดที่ NEW บริเวณแถบด้านล่างของหน้า Azure ML 2. กดที่ Experiment จากนั้นกดที่ Blank Experiment เมื่อทำการสร้าง Experiment ใหม่ของเราเรียบร้อยแล้วเราจะได้หน้าตาของ workspace ใหม่ที่เราสร้างโมเดลได้ดังนี้ และเราสามารถเปลี่ยนชื่อ Experiment ของเราได้เลย โดย workspace สามารถแบ่งได้เป็น 3 ส่วนดังนี้ Module มี Module ทั้งหมดให้เราเลือกใช้งานครอบคลุมทั้งการนำข้าข้อมูล, การจัดการกับข้อมูล anomaly detection, classification, regression, clustering และอื่น ๆ อีกมากมาย Canvas คือส่วนที่เราจะลาก Module ของเราไปวางเพื่อสร้างเส้นเชื่อมที่เชื่อไปตามขั้นตอนที่เรากำหนดโดยเราสามารถสร้างโมเดลของเราตั้งแต่ต้นสิ้นสุดสมบูรณ์ได้บริเวณนี้ Properties คือส่วนที่เราสามารถกำหนดค่า Parameter ของ Module ของเราได้บริเวณนี้ซึ่งแต่ละ Module จะมี Parameter ของตนเอง ซึ่งสามารถติดตามได้จากบทความหน้าต่อไปค่ะ Previous Next

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

003-Step of Machine Learning by AzureML

ขั้นตอนสร้าง Machine Learning  ด้วย AzureML  ในการสร้าง Machine Learning  ด้วย AzureML นั้นมีขั้นตอนการสร้างง่าย ๆ คือ Get the data คือการนำข้อมูลเราเรามาเข้าหน้า Experiments ทั้งชุดข้อมูลจากเครื่องของเราเอง ชุดข้อมูลจากแหล่งข้อมูลต่าง ๆ หรือแม้กระทั้งชุดข้อมูลเล็กที่เราสามารถสร้างเองได้จาก Module ที่มี Prepare the data คือการเตรียมข้อมูลให้อยู่ในรูปที่พร้อมจะนำไปวิเคราะห์ต่อได้ ทั้งการจัดการกับ Missing data การจัดการกับคอลัมน์ แถว การจัดการกับชนิดของข้อมูล แยกข้อมูลเพื่อเรียนรู้และทดสอบ เป็นต้น Built-in ML Algorithms คือกระบวนการที่เราสามารถเลือกโมเดลที่เราต้องการหรือโมเดลที่เหมาะสมกับชุดข้อมูลของเราเพื่อนำชุดข้อมูลของเรามา Train โดยโมเดลที่เราเลือก Train and Evaluate the model คือกระบวนการที่เรานำชุดข้อมูลของเรามา Train โดยโมเดลที่เราเลือกจากนั้นเราจะนำโมเดลที่เราได้มาทดสอบประสิทธิภาพของโมเดลของเรา โดยการสร้างโมเดลของเราในหน้า Experiments จะมีหน้าตาดังนี้ Previous Next

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

004-How to import data into Azure ML

วิธีการนำข้อมูลเข้า Azure ML บทความนี้เราจะมาพูดถึงวิธีการ Get the data จากบทความที่แล้วในกระบวนการสร้าง Machine Learning   ซึ่งกระบวนการ Get the data หรือกระบวนการนำข้อมูลเข้า Azure ML นี้มีหลักอยู่ด้วยกัน 3 รูปแบบคือ การนำเข้าจากข้อมูลที่เรามีอยู่ในเครื่อง การนำเข้าจากแหล่งข้อมูลต่าง ๆ เช่น อินเทอร์เน็ต การสร้างข้อมูลขนาดเล็กด้วยตนเอง การนำเข้าข้อมูลจากเครื่อง 1. กด NEW บริเวณแถบด้านล่างของหน้า Azure ML 2. กดตรง DATASET 3. กดตรง From local File เพื่อเลือกข้อมูลที่อยู่ในเครื่องของเราเข้ามา 4. เลือกนามสกุลไฟล์ และเลือกว่าไฟล์ที่เรานำเข้ามาต้องการให้มี header หรือชื่อคอลัมน์ไหมตามที่เราต้องการ และกดตรงเครื่องหมายถูก การนำเข้าจากแหล่งข้อมูลต่าง ๆ เช่น อินเทอร์เน็ต 1. การนำเข้าข้อมูลจากแหล่งข้อมูลต่าง ๆ เราทำได้โดยการลาก module ที่มีชื่อว่า Import data จาก Data input and Output หรือจาก การพิมพ์ค้นหามาวาง 2. จากนั้นจึงเลือกแหล่งข้อมูลที่เราต้องการจาก Data source เช่นหากเราต้องการนำเข้าข้อมูลจากอินเทอร์เน็ตเราจะเลือก Web URL via HTTP จากนั้นนำลิงค์ของแหล่งข้อมูลเรามาวางที่ช่อง Data source URL จากนั้นกด RUN การสร้างข้อมูลขนาดเล็กด้วยตนเอง 1. การสร้างข้อมูลขนาดเล็ก เราทำได้โดยการลาก module ที่มีชื่อว่า Enter Data Manually จาก Data input and Output หรือจากการพิมพ์ค้นหามาวาง [...]

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

005-How to know details of dataset by AzureML

เราสามารถดูรายละเอียดของชุดข้อมูลของเรา โดย Azure ML ได้อย่างไร เมื่อเราต้องการที่จะสร้างโมเดลของเราเองจากชุดข้อมูลที่เรามีอยู่นั้น ก่อนที่เราจะทำการสร้างโมเดลเราจะต้องรายละเอียดของข้อมูลเบื้องต้นก่อน เพื่อที่เราจะได้เลือกวิธีการจัดการกับข้อมูลให้เหมาะสมกับข้อมูลของเรา โดยมีวิธีการดังนี้ 1. ลากข้อมูลที่เราต้องการสร้างโมเดลมาไว้ที่บน Workspace โดยนำข้อมูลที่เรานำเข้ามาจาก Saved Dataset เลือก My Datasets จากนั้นลากชุดข้อมูลที่เราต้องการมาไว้บน Workspace ได้เลย 2. จากนั้นเราจะดูรายละเอียดข้องข้อมูลข้อเราอย่างจำนวน Missing, Mean, Max, Min, SD, ชนิดของข้อมูล และกราฟของข้อมูลแต่ละคอลัมน์โดยการคลิกขวาที่วงกลมเล็ก ๆ ใต้ชุดข้อมูลที่เรานำมาวาง แล้วเลือก Visualize 3. เมื่อเรามาที่หน้า Visualize เราจะเห็นข้อมูลจำนวนแถว จำนวนคอลัมน์ของเรา   รวมถึงข้อมูลในแต่ละคอลัมน์ และเมื่อเรากดไปที่แต่ละคอลัมน์จะปรากฏข้อมูลเบื้องต้นในแต่ละคอลัมน์ที่เราต้องการ อีกทั้งยังสามารถเปรียบเทียบกราฟของข้อมูลแต่ละคอลัมน์ได้อีกด้วย ดังรูป นอกจากนี้เรายงสามารถดูข้อมูลทางสถิติของชุดข้อมูลของเราได้มากกว่านี้ โดยการลาก Module ที่ชื่อว่า Summarize  มาวางบน Workspace แล้วลากเส้นเชื่อมจากชุดข้อมูลของเราจากนั้นกด RUN แล้ว กด Visualize เราจะได้ข้อมูลดังรูป Previous Next

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

006-How to add rows and columns by AzureML

วิธีการเพิ่มแถวและคอลัมน์แบบชิว ๆ ได้ด้วย AzureML เมื่อเราพูดถึงกระบวนการเตรียมข้อมูล (Preprocess) หนึ่งในกระบวนการเตรียมข้อมูลที่เราต้องพูดถึงคือกระบวนการเพิ่มแถวและคอลัมน์ ซึ่งกระบวนการเหล่านี้เกิดมาจากการที่เรามีแหล่งเก็บข้อมูลหลายที่หรือการเก็บหลายรอบทำให้มีไฟล์ข้อมูลแยกกันเราจึงต้องนำข้อมูลเหล่านี้มารวมกันก่อนจะนำข้อมูลไปสร้างโมเดลของเราที่เราต้องการซึ่งการเพิ่มแถวและคอลัมน์นี้ AzureM สามารถช่วยคุณได้ โดยมีวิธีการง่าย ๆ ดังนี้ 1. ลากข้อมูลที่เราต้องการเพิ่มแถวหรือเพิ่มคอลัมน์หรือต้องการสร้างโมเดลมาไว้บน Workspace โดยนำข้อมูลที่เรานำเข้ามาจาก Saved Dataset เลือก My Datasets จากนั้นลากชุดข้อมูลที่เราต้องการทั้งสองข้อมูลมาไว้บน Workspace และหากเราต้องการนำเข้าข้อมูลในรูปแบบอื่นเราก็เลือก module นั้นมาวางได้เลยค่ะ โดยในตัวอย่างของเรา ไฟล์แรกมี 8 แถวและไฟล์ที่สองมี 17 แถว ดังรูป 2. เมื่อเราต้องการจะเพิ่มแถวให้กับไฟล์แรกโดยนำแถวในไฟล์ที่สองมาต่อสามารถทำได้โดยการหา Module ที่ชื่อว่า Add Rows จากนั้นลากมาวางบน Workspace แล้วลากเส้นเชื่อมจากข้อมูลทั้งสองไฟล์มาเชื่อมกับ Module ที่เราลากมาไว้แล้ว ดังรูป 3. กด RUN เมื่อ RUN เสร็จแล้วเรา Visualize ดูจะพบว่าจำนวนแถว Hereกลายเป็น 25 แถวตามรูป หมายเหตุ : เมื่อเราต้องการจะเพิ่มแถวจำนวนคอลัมน์ของไฟล์แถวที่เราจะเอามารวมกันต้องมีจำนวนคอลัมน์เท่ากัน 4. เมื่อเราต้องการจะนำไฟล์ที่มีคอลัมน์แตกต่างกันมารวมกันหรือต้องการเพิ่มคอลัมน์จะทำเหมือนกับการเพิ่มแถวแต่เปลี่ยนมาใช้ Module ที่ชื่อว่า Add columns ค่ะ หมายเหตุ : เมื่อเราต้องการจะเพิ่มคอลัมน์ จำนวนแถวของไฟล์คอลัมน์ที่เราจะเอามารวมกันต้องมีจำนวนแถวเท่ากัน จากวิธีการเพิ่มแถวและคอลัมน์ข้างต้นจะเห็นได้ว่าเราสามารถแก้ปัญหาการเก็บข้อมูลจากหลายแหล่งข้อมูลหรือเก็บข้อมูลในหลายช่วงเวลาได้ง่าย ๆ แค่ใช้ module ใน AzureML ที่มีชื่อว่า Add Rows และ Add Columns เท่านี้ก็เรียบร้อยพร้อมสำหรับกระบวนการถัดไปแล้วล่ะค่ะ Previous Next

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

007-How to change data type and change columns name

วิธีการเปลี่ยนชนิดของข้อมูลและชื่อคอลัมน์โดยใช้ AzureML ในกระบวนการเตรียมข้อมูล (Preprocess) นั้นปัญหาที่เรามักพบและต้องทำการแก้ไขในกระบวนการการเตรียมข้อมูลนี้คือชนิดของข้อมูลในแต่ละคอลัมน์ไม่ตรงกับที่เราต้องการเช่น เราต้องการข้อมูลแบบ category แต่ข้อมูลของเราดันเป็น numeric หรือการที่เรานำเข้าข้อมูลมา หรือมีการเปลี่ยนแปลข้อมูลในกระบวนการก่อนหน้าทำให้เราต้องแก้ไขชื่อคอลัมน์เหล่านั้นซึ่งสิ่งเหล่านี้สามารถทำได้โดยใช้ module ที่ชื่อว่า Edit Metadata ซึ่งมีขั้นตอนใน AzureML ดังนี้ 1. ลากข้อมูลที่เราต้องการเปลี่ยนชนิดของข้อมูลหรือเปลี่ยนชื่อคอลัมน์มาไว้บน Workspace โดยนำข้อมูลที่เรานำเข้ามาจาก Saved Dataset เลือก My Datasets จากนั้นลากชุดข้อมูลที่เราต้องการมาไว้บน Workspace และหากเราต้องการนำเข้าข้อมูลในรูปแบบอื่น เช่น นำเข้าข้อมูลจากเว็บ เราก็เลือก module นั้นมาวางได้เลย 2. จากนั้นเราจะดูรายละเอียดของชนิดของข้อมูลโดยการคลิกขวาที่วงกลมเล็ก ๆ ใต้ชุดข้อมูลที่เรานำมาวาง แล้วเลือก Visualize เพื่อดูว่ามีคอลัมน์ไหนที่ชนิดของข้อมูลไม่ตรงหรือมีคอลัมน์ที่ต้องการเปลี่ยนชื่อหรือไม่ เช่นในตัวอย่างเราต้องการเปลี่ยนคอลัมน์ Income จาก string เป็น category เพื่อทำการ classification ต่อดังรูป 3. เมื่อเราพบว่ามีคอลัมน์ที่มีชนิดของข้อมูลไม่ตรงเราจะทำการเปลี่ยนชนิดของข้อมูลโดยค้นหา Module ที่มีชื่อว่า Edit Metadata แล้วลากมาวางบน Workspace จากนั้นลากเส้นเชื่อมจากชุดข้อมูลของเรามาเชื่อมกับ Module นี้ 4. เลือกคอลัมน์ที่เราต้องการจะเปลี่ยนชนิดของข้อมูลโดยกด Launch column selector จากนั้นกดเลือกคอลัมน์ที่เราต้องการมาไว้ทาง  Selected  Columns แล้วคลิกเครื่อง 5. หลังจากนั้นเราจะเลือกชนิดของข้อมูลที่เราต้องการจะเปลี่ยนจาก parameter โดยเลือกจาก Data Type หรือหากเราต้องการจะเปลี่ยนเป็น category เราสามารถเลือกจากตัวเลือก Categorical ได้เลย หรือหาเราต้องการเปลี่ยน Fields ของข้อมูลเราสามารถทำการเปลี่ยนจาก parameter ที่ชื่อว่า Fields ได้เช่นเดียวกัน ส่วน parameter ตัวสุดท้ายเราจะใช้สำหรับการเปลี่ยนชื่อคอลัมน์นั้นเองค่ะ โดยเราสามารถปรับ parameter ได้ตามที่เราต้องการ และตามความเหมาะสมของข้อมูลของเราได้เลยค่ะ [...]

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

008-How to remove duplicate by AzureML

วิธีการลบข้อมูลที่ซ้ำกันง่าย ๆ ด้วย AzureML กระบวนการเตรียมข้อมูลก่อนนำไปสร้างโมเดลนั้นเป็นกระบวนการที่ใช้เวลานานที่สุดเนื่องจากชุดข้อมูลที่เราได้มานั้นไม่ได้อยู่ในรูปแบบที่สมบูรณ์และหนึ่งในปัญหาของกระบวนการเตรียมข้อมูลคือ การที่มีข้อมูลซ้ำกันหรือที่เรียกว่า Duplication ซึ่งมีส่งผลกับกระบวนการผลของ Train ของโมเดล ทำให้เราต้องจัดการกับข้อมูลที่ซ้ำกันหล่านี้ก่อนการสร้าง โมเดลนั้นเองค่ะ โดยมีตัวอย่างของข้อมูลที่ซ้ำกัน ดังรูป โดยเราสามารถจัดการกับข้อมูลที่ Duplication ได้ง่าย ๆ โดยใช้ AzureML  ดังนี้ 1. ลากข้อมูลที่เราต้องการลบแถวที่ซ้ำกันหรือต้องการสร้างโมเดลมาไว้บน Workspace โดยนำข้อมูลที่เรานำเข้ามาจาก Saved Dataset เลือก My Datasets หรือจากนั้นลากชุดข้อมูลที่เราต้องการมาไว้บน Workspace และหากเราต้องการนำเข้าข้อมูลในรูปแบบอื่น เช่น นำเข้าข้อมูลจากเว็บ เราก็เลือก module นั้นมาวางได้เลย 2. หา Module ที่ชื่อว่า Remove Duplicate row แล้วลากมาวางบน Workspace จากนั้นลากเส้นเชื่อม Module กับชุดข้อมูลของเรา   3. กด Launch column selector แล้วเลือกคอลัมน์ที่มีข้อมูลซ้ำกันหรือเลือกทุกคอลัมน์จะดีที่สุดเพราะระบบจะเลือกลบแถวที่มีข้อมูลเหมือนกันทุกตัวออก โดยเลือกทุกคอลัมน์มาไว้ที่  Selected  column แล้วกดเครื่องหมายถูก ข้อควรระวังหากเราเลือกบางคอลัมน์ระบบจะทำการลบแถวที่มีข้อมูลคอลัมน์นั้นซ้ำกันออกซึ่งข้อมูลอาจถูกลบมากกว่า ที่เราต้องการออกไปด้วยค่ะ 4. เมื่อเราเลือกคอลัมน์เรียบร้อยแล้วจึงกด RUN และเมื่อเรา Visualize ดูจะพบว่าข้อมูลแถวที่ซ้ำกันเหล่านั้นถูกลบให้เหลือแถวเดียวที่เราจะนำไปใช้วิเคราะห์ต่อ สังเกตจากจำนวนแถวที่ลดลงเหมือนใน ตัวอย่างที่เดิมมี 25 แถวแต่เมื่อเรา RUN แล้วเหลือ 23 แถว เท่านี้ก็เรียบร้อยแล้วค่ะ   เมื่อเราทำตามขั้นตอนเหล่านี้ครบแล้วข้อมูลเราก็จะไม่มีแถวที่ซ้ำกันและพร้อมสำหรับกระบวนการถัดไปแล้วค่ะ Previous Next

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

009-How to clean missing data by AzureML

วิธีการ Clean Missing Data โดยใช้ AzureML เมื่อเราทำงานกับข้อมูลปัญหาที่เรามักพบบ่อย ๆ ในกระบวนการจัดการกับข้อมูลคือ มีข้อมูลบางส่วนขาดหายไปนั้นคือ missing data นั้นเอง แล้วเราจะมีวิธีจัดการกับปัญหานี้อย่างไร บทความนี้จะมาไขข้อสงสัยนี้ค่ะ การที่เราจะทำการ clean missing data นั้นเราต้องรู้ก่อนว่าข้อมูลอะไรที่หายไปบ้าง หายไปจำนวนเท่าไหร่ และชนิดของข้อมูลที่หายไปคือข้อมูลชนิดไหน สามารถทำได้ง่าย ๆ ดังนี้เลยค่ะ 1. ลากข้อมูลที่เราต้องการ Clean หรือต้องการสร้างโมเดลมาไว้บน Workspace โดยนำข้อมูลที่เรานำเข้ามาจาก Saved Dataset เลือก My Datasets จากนั้นลากชุดข้อมูลที่เราต้องการมาไว้บน Workspace และหากเราต้องการนำเข้าข้อมูลในรูปแบบอื่น เช่น นำเข้าข้อมูลจากเว็บ เราก็เลือก module นั้นมาวางได้เลย 2. จากนั้นเราจะดูรายละเอียดของจำนวน Missing และชนิดของแต่ละคอลัมน์โดยการคลิกขวาที่วงกลมเล็ก ๆ ใต้ชุดข้อมูลที่เรานำมาวาง แล้วเลือก Visualize เพื่อดูว่ามี missing data ไหม และดูชนิดของข้อมูลที่หายไป 3. เมื่อเราพบว่ามี Missing Data เราจะทำการ Clean missing โดยค้นหา Module ที่มีชื่อว่า Clean Missing Data แล้วลากมาวางบน Workspace จากนั้นลากเส้นเชื่อมจากชุดข้อมูลของเรามาเชื่อมกับ Module นี้ 4. เลือกคอลัมน์ที่เราต้องการจะ Clean โดยกด Launch column selector จากนั้นกดเลือกคอลัมน์ที่เราต้องการมาไว้ทาง  Selected  Columns แล้วคลิกเครื่องหมายถูก 5. จากนั้นเลือกวิธีการ Clean โดยเลือกวิธีการจากชนิดของข้อมูลและจำนวนข้อมูลที่หายไปโดยเลือกที่ Parameter ที่ชื่อว่า Cleaning mode ซึ่งมีวิธีการเลือกวิธีการดังนี้ [...]

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments

010-How to reduce dimension with PCA

การลด Dimension ของข้อมูลด้วยการทำ PCA ใน AzureML ในการจัดการกับข้อมูลขนาดใหญ่มาก ๆ นั้นสิ่งที่เกิดขึ้นเป็นประจำคือข้อมูลเหล่านั้นมีจำนวน Feature หรือจำนวน dimension เป็นจำนวนมากอาจจะมีจำนวนเป็นหลักร้อยหรือหลักพัน ซึ่งหากเรานำข้อมูลที่มีจำนวน dimension มาวิเคราะห์อาจทำให้ผลลัพธ์ที่ได้มีความแม่นยำน้อยลง ใช้เวลาในการ RUN ข้อมูลที่นานและอาจทำให้เกิดการ Overfitting ได้ ดังนั้นเราจึงต้องทำการลด dimension ของข้อมูลก่อนที่จะนำข้อมูลของเราไปวิเคราะห์หรือสร้างโมเดลโดยการใช้วิธีที่ชื่อว่า Principal Component Analysis (PCA) Principal Component Analysis (PCA) สร้าง coordinates สำหรับข้อมูลใหม่ แสดงโครงสร้างภายในของข้อมูลที่อธิบาย variance ของข้อมูลได้ดีที่สุด ลดจำนวน dimension ของข้อมูล ซึ่งการทำ PCA ใน AzureML เราจะใช้ module ที่ชื่อว่า Principal Component Analysis ซึ่งมาวิธีการดังนี้ 1. ลากข้อมูล dataset ที่เราต้องการจะลดจำนวน dimension มาวางบน Workspace ซึ่งข้อมูลที่เราต้องการลดจำนวน dimension ในวันนี้คือข้อมูล Bank Telemarketing ซึ่งต้องการ classification ว่าลูกค้าจะสมัครรับสินค้าหรือไม่ โดยมีจำนวน 41188 แถว และ 21 คอลัมน์ 2. ค้นหา module ที่ชื่อว่า Principal Component Analysis  ลากมาวางบน Workspace และเชื่อมต่อกับ dataset ของเรา 3. คลิก Launch column selector เลือกทุกคอลัมน์ยกเว้นคอลัมน์ Y ที่เป็น target ของเรา จากนั้นเราจะทำการตั้งค่าจำนวนคอลัมน์ที่เราต้องการหลังจากลด dimension [...]

By |October 25, 2020|Categories: Azure Machine Learning|0 Comments
Go to Top