หลักการและเหตุผล



        สำนักงานสภาพัฒนาการเศรษฐกิจและสังคมแห่งชาติ (สศช.) ร่วมกับหน่วยงานที่เกี่ยวข้องขับเคลื่อนการพัฒนาตามแผนยุทธศาสตร์การพัฒนาระบบโลจิสติกส์ของประเทศไทยมาอย่างต่อเนื่อง โดยมีตัวชี้วัด ที่สำคัญ ได้แก่ สัดส่วนต้นทุนโลจิสติกส์ต่อผลิตภัณฑ์มวลรวมในประเทศ (GDP) ซึ่ง สศช. ได้จัดทำข้อมูลดังกล่าวมาตั้งแต่ปี 2547 โดยอาศัยข้อมูลทุติยภูมิจากตารางปัจจัยการผลิตและผลผลิตเป็นหลัก และต่อมาในปี พ.ศ. 2561 ได้มีการปรับปรุงนิยามและจัดเก็บข้อมูลเพิ่มเติมเพื่อให้การคำนวณมีความถูกต้องและสอดคล้องกับข้อเท็จจริงในปัจจุบัน รวมทั้งเป็นประโยชน์ให้หน่วยงานที่เกี่ยวข้องใช้เป็นเครื่องมือในการติดตามและประเมินผลการพัฒนาระบบโลจิสติกส์ในภาพรวมของประเทศ รวมทั้งเป็นข้อมูลประกอบการวางแผนและกำหนดยุทธศาสตร์การพัฒนาที่สามารถสนับสนุนการเพิ่มขีดความสามารถในการแข่งขันของประเทศ

        แบบจำลองการคำนวณต้นทุนโลจิสติกส์ของประเทศไทย อ้างอิงวิธีการคำนวณต้นทุนโลจิสติกส์ของ Robert V. Delaney แห่งบริษัท Cass Information System ของสหรัฐอเมริกาเป็นหลัก อย่างไรก็ตาม ยังมีข้อจำกัดบางประการ เนื่องจากข้อมูลบางส่วนมีองค์ประกอบของตัวแปรที่ยังไม่มีระบบการจัดเก็บชัดเจนขาดการสำรวจและรวบรวมข้อมูลในระดับประเทศ และการจัดเก็บข้อมูลในหลายกิจกรรมทำได้ยากในทางปฏิบัติ ทำให้ต้องอาศัยวิธีการประมาณค่าตัวแปรมาประยุกต์ใช้ตามมาตรฐานวิธีการทางสถิติและวิธีการคิดของต่างประเทศ นอกจากนี้ การประมาณการสัดส่วนต้นทุนโลจิสติกส์ต่อ GDP ของประเทศไทยในปัจจุบันเป็นการประมาณการ โดยใช้ข้อมูลนำเข้า (Input data) จากข้อมูลทุติยภูมิ จากหน่วยงานที่เกี่ยวข้องที่มีการจัดทำข้อมูลเป็นประจำทุกปี ทั้งจากการติดต่อประสานโดยตรงกับหน่วยงานนั้น ๆ หรือจากรายงานประจำปีที่มีการเผยแพร่และมีระยะเวลาในการรอข้อมูลนำเข้า จึงทำให้ข้อมูลสัดส่วนต้นทุนโลจิสติกส์ต่อ GDP เป็นตัวชี้วัดตาม (Lagging indicator)

        ดังนั้น สศช. ในฐานะหน่วยงานรับผิดชอบหลักในการจัดทำข้อมูลต้นทุนโลจิสติกส์ต่อผลิตภัณฑ์มวลรวมในประเทศ (GDP) จึงมีความจำเป็นต้องดำเนินการจ้างที่ปรึกษาเพื่อเป็นค่าใช้จ่ายในการพัฒนาแบบจำลองการคำนวณต้นทุนโลจิสติกส์ของประเทศไทยแบบล่วงหน้า (Predictive Model) เพื่อศึกษา สำรวจ และพัฒนาแบบจำลองการคำนวณต้นทุนโลจิสติกส์ที่สามารถประมาณการข้อมูลที่มีความเป็นปัจจุบันและสามารถประมาณการข้อมูลล่วงหน้า (Leading indicator) สำหรับใช้เป็นเครื่องมือในการวิเคราะห์และประเมินผลแผนงานโครงการและมาตรการที่เกี่ยวข้องกับการพัฒนาระบบโลจิสติกส์ รวมทั้งใช้เป็นข้อมูลประกอบการตัดสินใจวางแผน กำหนดนโยบาย และขับเคลื่อนการพัฒนาระบบโลจิสติกส์ประเทศให้มีประสิทธิภาพ



วัตถุประสงค์ของโครงการ



         1) เพื่อพัฒนาแบบจำลองการคำนวณต้นทุนโลจิสติกส์แบบล่วงหน้า (Predictive Model) ที่มีความสอดคล้องกับการเปลี่ยนแปลงสภาวการณ์การพัฒนาระบบโลจิสติกส์ของประเทศไทยและเป็นไปตามมาตรฐานในระดับสากล

         2) เพื่อใช้เป็นข้อมูลประกอบการตัดสินใจในการวางแผนเชิงนโยบายและขับเคลื่อนการพัฒนาระบบโลจิสติกส์ของประเทศไทย


กรอบแนวคิดทางการศึกษา




รูปที่ 1. กรอบแนวคิดทางการศึกษา



แนวคิดการพัฒนาแบบจำลอง



        แนวคิด (Concept) ของแบบจำลองการคาดการณ์ล่วงหน้า คือ การให้แบบจำลองทำหน้าที่หาความสัมพันธ์ระหว่างตัวแปรหรือรูปแบบที่ซ่อนอยู่ในชุดข้อในอดีต และใช้ความสัมพันธ์นั้นหรือรูปแบบที่ค้นพบนั้นพยากรณ์ข้อมูลในอนาคต การศึกษานี้ประยุกต์แนวคิดการเรียนรู้ของเครื่อง (Machine Learning) ซึ่งเป็นวิธีการขั้นสูงในการวิเคราะห์ข้อมูลที่ให้เครื่องคอมพิวเตอร์เรียนรู้ด้วยตนเองโดยการใช้ข้อมูลในอดีตป้อนเข้าไปซ้ำ ๆ สำหรับประเภทแบบจำลองที่ใช้วิธีการที่สองนี้ก็มีหลากหลาย อาทิ Neural Network, Support Vector Machine และ Naïve Bayes นอกจากนี้ รูปแบบการเรียนรู้ของเครื่องจะมีอยู่ 2 แบบ คือแบบควบคุม (Supervised) ซึ่งเครื่องจะเรียนรู้และทำนายผลลัพธ์ได้จากการช่วยเหลือของผู้ป้อนข้อมูล และการเรียนรู้แบบไม่มีการควบคุม (Unsupervised) ซึ่งเป็นการเรียนรู้และทำนายผลได้จากการจำแนกและสร้างรูปแบบของเครื่องเองบนพื้นฐานของข้อมูลที่ได้รับ โดยเมื่อเครื่องสามารถทำนายผลลัพธ์จากชุดข้อมูลจำนวนมากได้มากเท่าไร ก็จะยิ่งแสดงความสามารถในการเรียนรู้เชิงลึก (Deep Learning) มากเท่านั้น สำหรับการศึกษานี้ จะนำโครงข่ายประสาทเทียมประดิษฐ์ (Artificial Neural Networks: ANN) มาใช้ในการพัฒนาแบบจำลองการคำนวณต้นทุนโลจิสติกส์ของประเทศไทยแบบล่วงหน้า ด้วยเหตุผลที่ว่า ANN เคยถูกใช้ในการพยากรณ์ต้นทุนโลจิสติกส์มาแล้ว

        โครงข่ายประสาทเทียมประดิษฐ์ (Artificial Neural Networks: ANN) หรืออีกชื่อเรียกว่า การเรียนรู้เชิงลึก (Deep Learning: DL) เป็นแขนงย่อยของ การเรียนรู้ของเครื่องจักร (Machine Learning: ML) โดยโครงสร้างของ ANN นั้นถูกแบ่งออกเป็นข่ายงานประสาทเทียมหลาย ๆ ชั้น (Multilayer Perceptron: MLP) ที่ทำงานประสานกันเป็นโครงข่าย กล่าวอีกนัยหนึ่ง ANN ก็คือการรวมกันของหลาย ๆ Classifier ในโมเดล ML เพื่อนำมาใช้ในแก้ปัญหาแบบไม่เชิงเส้นตรง (Non-linear) โดย ANN นั้นสามารถใช้ได้ทั้งกับปัญหาแบบ Classification และ Regression โครงสร้างสถาปัตยกรรมของ ANN นั้นมีหลายชั้น โดยแต่ละชั้นนั้นประกอบไปด้วยหน่วยประสาท (Neuron) หรือ Node โดยชั้นของ ANN นั้นแบ่งออกเป็น Input / Hidden / Output Layers ชั้นนำเข้า (Input Layer) เป็นด่านแรกในการรับข้อมูลเข้า ชั้นนำออก (Output Layer) เป็นด่านสุดท้ายในส่งออกผลลัพธ์ โดยมีชั้น Hidden Layer อยู่ระหว่างการทำงานเป็นโครงข่ายเชื่อมโยงกันแบบสมบูรณ์ (Fully Connected)



รูปที่ 2. สถาปัตยกรรมของ ANN


        ในการใช้งาน ANN นั้นจะต้องทำการฝึก (Training) ตัวโมเดลเหมือนกับโมเดล ML อื่น ๆ โดยการกำหนดค่าน้ำหนัก (Weight) และความเอนเอียง (Bias) เริ่มต้น จากนั้นก็ทำการกำหนดฟังก์ชั่นสูญเสีย (Loss Function) เพื่อวัดประสิทธิภาพของ ANN และทำการวนซ้ำในการปรับแต่งค่าน้ำหนักและความเอนเอียงเพื่อลด Loss Function โดยในการปรับค่านั้นจะเป็นแบบละเอียดจนกว่าค่าน้ำหนักจะเหมาะสม (Fit) กับตัวข้อมูลที่ใช้ฝึกโมเดล โดยก่อนที่จะทำการเริ่มฝึก ANN นั้น จะต้องทำการกำหนดค่าไฮเปอร์พารามิเตอร์ (Hyperparameters) คือ อัตราการเรียนรู้ (Learning rate) จำนวนรอบในการฝึก (Epochs) ลักษณะในการในการฝึก (Batch / Mini-batch / Stochastic Gradient Descent) ตัวโครงสร้าง (จำนวนชั้น (Layer) จำนวนหน่วยประสาท (Node per layer) ฟังก์ชั่นที่ใช้ในแต่ละหน่วย (Activate Function) พารามิเตอร์ในกับปรับค่า Regularization และค่า Dropout เพื่อการเกิดปัญหา Overfitting หรือการที่โมเดลทำนายแม่นแต่ข้อมูลที่ใช้ในการฝึกและไม่สามารถนำไปใช้ทำนายข้อมูลใหม่ ๆ ได้

        ภายหลังจากนำเสนอแบบจำลองการคำนวณต้นทุนโลจิสติกส์ของประเทศไทยแบบล่วงหน้า ที่ปรึกษาจะดำเนินการพัฒนาระบบการจัดเก็บข้อมูลในการนำเข้าและแสดงผลข้อมูลต้นทุนโลจิสติกส์ของประเทศไทยแบบล่วงหน้าในระบบฐานข้อมูลด้านโลจิสติกส์ของ สศช. ทั้งนี้ ในการศึกษาและพัฒนาแบบจำลองดังกล่าวจะต้องมีการตรวจสอบความถูกต้องของแบบจำลองให้เป็นที่ยอมรับและเป็นไปตามหลักวิชาการ โดยในการประเมินประสิทธิภาพของ ANN นั้นทำได้โดยการปรับค่าไฮเปอร์พารามิเตอร์ และคำนวณค่าสูญเสียในการฝึก (Training Loss) ค่าความแม่นยำในการฝึก (Training Accuracy) ค่าเฉลี่ยการสูญเสียในการประเมิน (Validation Loss) ค่าความแม่นยำในการประเมิน (Validation Accuracy) โดยสังเกตได้ว่า ค่าสูญเสียนั้นลดลงเรื่อยตามจำนวนรอบในการฝึก ในขณะที่ค่าความแม่นยำนั้นเพิ่มขึ้น



รูปที่ 3. ANN Learning Curve


        ในการฝึกโมเดลในแต่ละรอบหากตรวจสอบ Learning Curve แล้วยังไม่เป็นที่น่าพอใจ ยังสามารถที่จะปรับแต่งไฮเปอร์พารามิเตอร์ต่าง ๆ ไม่ว่าจะเป็น อัตราการเรียนรู้ (Learning rate) จำนวนรอบในการฝึก (Epochs) เป็นต้น เพื่อเปรียบเทียบ Learning Curve ว่าชุดไฮเปอร์พารามิเตอร์ไหนมีประสิทธิภาพกว่ากัน