การเปรียบเทียบประสิทธิภาพตัวแบบการถดถอยเชิงเส้น ภายใต้วิธีบูตสแทร็ปแบบไม่อิงพารามิเตอร์
คำสำคัญ:
วิธีบูตสแทร็ป , ช่วงความเชื่อมั่น , เทคนิคมอนติคาร์โล , การวิเคราะห์การถดถอย , การแจกแจงเบ้ปรกติบทคัดย่อ
วัตถุประสงค์และที่มา : การวิเคราะห์การถดถอยเป็นวิธีการทางสถิติที่ใช้กันอย่างแพร่หลายในการทำนายหรือพยากรณ์ค่าของตัวแปรตามจากค่าที่กำหนดให้ของตัวแปรอิสระ โดยการวิเคราะห์การถดถอยเชิงเส้นนั้นมีข้อสมมติเบื้องต้นเกี่ยวกับความคลาดเคลื่อนหลายประการ ซึ่งในบางสถานการณ์ข้อมูลที่นำมาใช้อาจไม่เป็นไปตามข้อสมมติเบื้องต้นทำให้เกิดความคลาดเคลื่อนหรือความผิดพลาดในการพยากรณ์ได้ เพื่อแก้ปัญหาดังกล่าว นักวิจัยจึงได้พัฒนาตัวแบบการถดถอยแบบไม่อิงพารามิเตอร์ขึ้นมา ซึ่งไม่ต้องคำนึงถึงข้อสมมติเบื้องต้นดังกล่าว ทำให้มีความยืดหยุ่นมากขึ้น การศึกษาครั้งนี้มีวัตถุประสงค์เพื่อศึกษาและเปรียบเทียบประสิทธิภาพของตัวแบบการถดถอยเชิงเส้นภายใต้วิธีบูตสแทร็ปแบบไม่อิงพารามิเตอร์ 2 วิธี ได้แก่ วิธีบูตสแทร็ปแบบเปอร์เซ็นไทล์ หรือที่รู้จักกันในชื่อวิธีบูตสแทร็ปพี และวิธีบูตสแทร็ปแบบสติวเดนต์หรือวิธีบูตสแทร็ปที ซึ่งวิธีบูตสแทร็ปพีเป็นเทคนิคที่ได้รับการยอมรับอย่างกว้างขวางเนื่องจากมีรูปแบบของการสุ่มข้อมูลที่ไม่ซับซ้อน โดยการสุ่มตัวอย่างข้อมูลซ้ำด้วยการแทนที่คืนเพื่อสร้างตัวอย่างบูตสแทร็ปหลาย ๆ ตัวอย่าง จากนั้นทำการคำนวณการแจกแจงของตัวประมาณ วิธีนี้มีประโยชน์อย่างยิ่งเมื่อตัวอย่างมีขนาดเล็กและการแจกแจงของข้อมูลไม่เป็นที่รู้จัก ในทางกลับกัน วิธีบูตสแทร็ปที เป็นการปรับปรุงวิธีบูตสแทร็ปพีโดยการนำแนวคิดของการสติวเดนท์มาใช้ซึ่งเกี่ยวข้องกับการปรับตัวอย่างบูตสแทร็ปตามค่าความคลาดเคลื่อนมาตรฐานของตัวประมาณ ทำให้ได้ช่วงความเชื่อมั่นที่แม่นยำมากขึ้นและลดความเอนเอียง
วิธีดำเนินการวิจัย : งานวิจัยนี้ทำการจำลองข้อมูลด้วยเทคนิคมอนติคาร์โลภายใต้ค่าความคลาดเคลื่อน ( )มีการแจกแจงเบ้ปรกติ (Skew-Normal Distributions : SN) 3 ลักษณะ คือ เบ้ซ้าย เบ้ขวา และสมมาตร ซึ่งเป็นการแจกแจงที่พบได้บ่อยในข้อมูลจริง โดยมีพารามิเตอร์ 3 ตัว ได้แก่ พารามิเตอร์บ่งตำแหน่ง (Location Parameter :
) พารามิเตอร์บ่งขนาด (Scale Parameter :
2 ) และพารามิเตอร์บ่งรูปร่าง (Shape Parameter :
) โดยพารามิเตอร์สำหรับการจำลองข้อมูลถูกเลือกเพื่อสะท้อนถึงระดับความเบ้และความแปรปรวนที่แตกต่างกัน ทำให้การประเมินประสิทธิภาพในการวิเคราะห์การถดถอยภายใต้วิธีบูตสแทร็ปมีความครอบคลุมกับลักษณะการแจกแจงทั้งสามรูปแบบ กำหนดให้
=0 ,
2 =1,2,5,10 และ
=-1,0,1 นั่นคือ
SN(0,
2,
)และจำลองข้อมูลสำหรับตัวแปรอิสระภายใต้การแจกแจงปรกติ โดยมีพารามิเตอร์ 2 ตัว ได้แก่ ค่าเฉลี่ย (
x) และค่าความแปรปรวน (
2x) กำหนดให้
x=3 และ
2x=2.25 นั่นคือ X
N(3,2.25) ขนาดตัวอย่างที่ใช้ในจำลอง คือ 20, 30, 50 และ 100 ทำการสร้างช่วงความเชื่อมั่นของสัมประสิทธิ์การถดถอยและสมการถดถอยด้วยวิธีบูตสแทร็ปทั้งสองวิธี ที่ระดับความเชื่อมั่น 95% โดยกระทำซ้ำ 1,000 รอบในแต่ละสถานการณ์ จากนั้นทำการเปรียบเทียบประสิทธิภาพในการประมาณค่าสัมประสิทธิ์การถดถอย โดยใช้ค่าสัมประสิทธิ์การถดถอยเฉลี่ย ค่าส่วนเบี่ยงเบนมาตรฐานของสัมประสิทธิ์การถดถอย และค่ารากที่สองของคลาดเคลื่อนกำลังสองเฉลี่ยของสัมประสิทธิ์การถดถอย เป็นค่าเกณฑ์ในการเปรียบเทียบตัวประมาณแบบจุด และประสิทธิภาพของตัวประมาณแบบช่วงถูกเปรียบเทียบโดยใช้ค่าความน่าจะเป็นคุ้มรวม ค่าความกว้างเฉลี่ยของช่วง และค่าส่วนเบี่ยงเบนมาตรฐานของความกว้างของช่วง อีกทั้ง การศึกษาครั้งนี้ได้ประยุกต์ใช้ตัวแบบการถดถอยบูตสแทร็ปทั้งสองวิธีกับข้อมูลจริง 2 ชุด ได้แก่ ชุดข้อมูลน้ำหนักทารกแรกเกิด และชุดข้อมูลเกรดเฉลี่ย โดยเปรียบเทียบประสิทธิภาพของสมการถดถอยที่ดีที่สุดจากเกณฑ์ค่าสัมประสิทธิ์การกำหนด เกณฑ์สารสนเทศของอะกะอิเกะ เกณฑ์สารสนเทศของเบส์ และค่าคลาดเคลื่อนกำลังสองเฉลี่ย
ผลการวิจัย : จากการศึกษาจำลองข้อมูลเชิงสถิติเพื่อเปรียบเทียบประสิทธิภาพของช่วงความเชื่อมั่นสำหรับสัมประสิทธิ์การถดถอย พบว่าเมื่อขนาดตัวอย่างเพิ่มขึ้นค่าความน่าจะเป็นคุ้มรวมมีค่าเพิ่มขึ้น ยกเว้นกรณีที่ค่าคลาดเคลื่อนมีการ แจกแจงแบบเบ้สำหรับพารามิเตอร์ค่าคงที่ ค่าความกว้างเฉลี่ยของช่วง และค่าส่วนเบี่ยงเบนมาตรฐานของความกว้างของช่วงมีแนวโน้มลดลงในทุกเซตพารามิเตอร์ โดยส่วนมากวิธีบูตสแทร็ปทีมีค่าความน่าจะเป็นคุ้มรวมมากที่สุด และผลการเปรียบเทียบประสิทธิภาพของสมการถดถอยบูตสแทร็ปในการประมาณค่าพารามิเตอร์ พบว่าในทุกขนาดตัวอย่างค่าสัมประสิทธิ์การถดถอยเฉลี่ยซึ่งเป็นค่าประมาณสัมประสิทธิ์การถดถอยด้วยวิธีบูตสแทร็ปมีค่าใกล้เคียงค่าพารามิเตอร์ และเมื่อขนาดตัวอย่างเพิ่มขึ้นค่าส่วนเบี่ยงเบนมาตรฐานของสัมประสิทธิ์การถดถอย และค่ารากที่สองของค่าคลาดเคลื่อนกำลังสองเฉลี่ยลดลงในทุกกรณี นั่นคือสมการถดถอยจะมีประสิทธิภาพเพิ่มขึ้นเมื่อขนาดตัวอย่างเพิ่มขึ้น นอกจากนี้ในทุกขนาดตัวอย่างสมการถดถอยบูตสแทร็ปทีให้ค่ารากที่สองของค่าคลาดเคลื่อนกำลังสองเฉลี่ยน้อยกว่าสมการถดถอย บูตสแทร็ปพี ซึ่งบ่งชี้ถึงประสิทธิภาพที่ดีกว่า ยกเว้นกรณีที่ค่าความคลาดเคลื่อนสุ่มมีการแจกแจงแบบสมมาตรและขนาดตัวอย่างเล็ก จะพบว่าวิธีบูตสแทร็ปพีมีประสิทธิภาพในการประมาณค่าสัมประสิทธิ์การถดถอยสูงกว่า
สรุปผลการวิจัย : การเปรียบเทียบสมการถดถอยบูตสแทร็ปเผยให้เห็นว่าวิธีทั้งสองให้ค่าประมาณที่ใกล้เคียงกับพารามิเตอร์จริง ซึ่งบ่งชี้ถึงประสิทธิภาพในการจัดการกับการแจกแจงความคลาดเคลื่อนที่แตกต่างกัน อย่างไรก็ตาม วิธีบูตสแทร็ปทีแสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าวิธีบูตสแทร็ปพีอย่างต่อเนื่อง โดยเฉพาะในแง่ของค่าความน่าจะเป็นคุ้มรวมและค่ารากที่สองของค่าคลาดเคลื่อนกำลังสองเฉลี่ย ซึ่งเป็นมาตรวัดสำคัญของความแม่นยำในการประมาณค่าสัมประสิทธิ์การถดถอย บ่งชี้ว่าวิธีบูตสแทร็ปทีมีความน่าเชื่อถือมากกว่า ทำให้เป็นทางเลือกที่น่าเชื่อถือในการสร้างช่วงความเชื่อมั่นและการประมาณค่าสัมประสิทธิ์การถดถอย และเมื่อขนาดตัวอย่างเพิ่มขึ้นความแม่นยำและความน่าเชื่อถือของวิธีบูตสแทร็ปจะดีขึ้น ทำให้ช่วงความเชื่อมั่นแคบลงและการประมาณค่าสัมประสิทธิ์การถดถอยแม่นยำมากขึ้น นอกจากนี้ ผลลัพธ์ที่ได้จากการประยุกต์ใช้กับข้อมูลจริงนั้นสอดคล้องกับการจำลองข้อมูลเชิงสถิติภายใต้การแจกแจงแบบเบ้ปรกติ ดังนั้น วิธีบูตสแทร็ปจึงเป็นวิธีทางเลือกในการประมาณค่าช่วงความเชื่อมั่นและการประมาณค่าสัมประสิทธิ์การถดถอยที่ทำให้สมการถดถอยที่ได้นั้นมีประสิทธิภาพในการพยากรณ์ โดยเฉพาะเมื่อข้อสมมติของวิธีอิงพารามิเตอร์ไม่เป็นจริง ผลการศึกษานี้มีความสำคัญและประโยชน์ต่อทั้งนักวิจัยและผู้ปฏิบัติงาน ซึ่งเน้นถึงการพิจารณาขนาดตัวอย่างและการแจกแจงความคลาดเคลื่อนอย่างรอบคอบเพื่อเลือกวิธีการถดถอยที่เหมาะสม
References
Davison, A.C., & Kuonen, D. (2002). An Introduction to the Bootstrap with Applications in R. Statistical Computing & Statistical Graphics Newsletter, 13(1), 6-11.
Dikta, G., & Scheer, M. (2021). Bootstrap methods: with applications in R. Springer Nature.
Eck, D. J. (2018). Bootstrapping for multivariate linear regression models. Statistics & Probability Letters, 134, 141-149.
Efron, B. (1979). Bootstrap Methods: Another Look at the Jackknife. The Annals of Statistic, 7(1), 1-26.
Efron, B. (1982). The Jackknife, The Bootstrap and Other Resampling Plans. Society for industrial and applied mathematics.
Efron, B., & Tibshirani, R. J. (1994). An Introduction to the Bootstrap. (1st ed.). New York: Chapman & Hall/CRC.
Figueiredo, F., & Gomes, M.I. (2012). The Skew-Normal Distribution in SPC. REVSTAT-Statistical Journal, 11(1), 83-104.
Hall, P. (1988). Theoretical Comparison of Bootstrap Confidence Intervals. The Annals of Statistics, 16(3), 927-953.
Kashif, M., Aslam, M., Rao, G. S., AL-Marshadi, A. H., & Jun, C. H. (2017). Bootstrap Confidence Intervals of the Modified Process Capability Index for Weibull Distribution. Arabian Journal for Science and Engineering, 42, 4565-4573.
Kokaew, A., Thaithanan, J., Bodhisuwan, W., & Volodin, A. (2021). Confidence Estimation of a Ratio of Binomial Proportions for Dependent Populations. Lobachevskii Journal of Mathematics, 42(2), 394-403.
Mokhtar, S. F., Yusof, Z. M., & Sapiri, H. (2023). Confidence intervals by bootstrapping approach: a significance review. Malaysian Journal of Fundamental and Applied Sciences, 19(1), 30-42.
R Core Team. (2022). R: A Language and Environment for Statistical Computing. Vienna, Austria, Retrieved from https://www.r-project.org/.
Saha, M., Dey, S., & Maiti, S. S. (2018). Parametric and non-parametric bootstrap confidence intervals of CNpk for exponential power distribution. Journal of Industrial and Production Engineering, 35(3), 160-169.
Thiuthad, P. (2021). The Univariate Skew-Normal Distribution. The Jornal of Applied Science, 20(2), 293-304. (in Thai)
Wilcox, R. R. (2017). Introduction to Robust Estimation and Hypothesis Testing. (4th ed.). San Diego, CA: Academic Press.

Downloads
เผยแพร่แล้ว
How to Cite
ฉบับ
บท
License
Copyright (c) 2025 คณะวิทยาศาสตร์ มหาวิทยาลัยบูรพา

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Burapha Science Journal is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) licence, unless otherwise stated. Please read our Policies page for more information