بررسی عملکرد روش‌های گزینش متغیر در مدلسازی توان تولید رویشگاه راش شرقی

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد جنگلداری، دانشکدۀ منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس، نور

2 استادیار گروه جنگلداری، دانشکدۀ منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس، نور

3 استاد گروه جنگلداری، دانشکدۀ منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس، نور

چکیده

توان تولیدی رویشگاه، معیاری مهم برای مدیران جنگل در خصوص پیش‌بینی مقدار تولید، بهره‌برداری مجاز سالانه، رویش و انتخاب مناسب‌ترین گونه‌های درختی برای یک رویشگاه است. در مطالعۀ حاضر قابلیت پیش‌بینی مدل‌های آماری با به‌کارگیری روش‌های مختلف گزینش متغیر برای ارتفاع غالب گونۀ راش به‌عنوان شاخصی از توان تولید رویشگاه نسبت به متغیرهای خاک و فیزیوگرافی بررسی شده است. به این منظور، 127 قطعه نمونه دایره‌ای به مساحت 1000 متر مربع در جنگل دانشگاه تربیت مدرس پیاده و در هر یک از آنها ارتفاع غالب گونة راش اندازه‌گیری شد. عملکرد پنج روش گزینش متغیر در رگرسیون خطی چندگانه (انتخاب گام‌به‌گام متغیر با آزمون F و معیارهای اطلاعاتی آکائیک و بیزین، بهترین زیرمجموعه‌ها با استفاده از معیارهای اطلاعاتی آکائیک و بیزین) و روش رگرسیون درختی بررسی شد. به‌منظور مقایسۀ کارایی روش‌های یادشده، اعتبارسنجی متقابل با 2500 تکرار استفاده شد. نتایج نشان داد که در بین پنج روش مبتنی بر رگرسیون خطی چندگانه، اختلاف اندکی در قابلیت پیش‌بینی وجود دارد. عملکرد روش‌های گام‌به‌گام مشابه الگوریتم‌های بهترین زیرمجموعه است و انتخاب معیارهای مقایسۀ مدل‌ها (شامل معیار اطلاعاتی آکائیک، معیار اطلاعاتی بیزین یا آمارۀ F) تأثیر اندکی بر قابلیت پیش‌بینی دارد. در تحقیق حاضر، روش مبتنی بر درخت رگرسیون، قابلیت پیش‌بینی کمتری داشت. استدلال این است که بهترین روش انتخاب متغیر وجود ندارد و هر یک از روش‌های مبتنی بر رگرسیون که در این تحقیق استفاده شده، می‌تواند مدل‌های پیش‌بینی مفید را ایجاد کند..

کلیدواژه‌ها


عنوان مقاله [English]

Evaluating the performance of variable selection methods in modeling the site productivity of Oriental Beech (Fagus Orientalis Lipsky)

نویسندگان [English]

  • S. Dehghaninejad 1
  • S.J. Alavi 2
  • S.M. Hosseini 3
1 M.Sc. Student in Forestry, Faculty of Natural Resources, Tarbiat Modares University, Nour, I.R. Iran
2 Assist. Prof., Faculty of Natural Resources, Tarbiat Modares University, Nour, I.R. Iran.
3 Prof., Faculty of Natural Resources, Tarbiat Modares University, Nour, I.R. Iran
چکیده [English]

Forest site productivity is an important criterion for forest managers. In this study, the predictability of statistical models was studied by applying various methods of variable selection for beech dominant height as an indicator of forest site quality in relation to edaphic and physiographic factors. For this purpose, 127 0.1 ha circular sample plots were established in the forests of Tarbiat Modares University and within each plot, the dominant height of beech trees was calculated. The performance of five variable selection methods was evaluated in multiple linear regression, and regression trees. In order to compare the performance of the above methods, Cross-validation, involving repeated splits of the dataset into training and validation subsets (2500 times) was used to obtain honest estimates of predictive ability. The results showed that there is little differences in the predictive ability of five methods based on multiple linear regression. Stepwise methods performed similarly to exhaustive algorithms for subset selection, and the choice of criterion for comparing models (Akaike’s information criterion, Schwarz’s Bayesian information criterion or F statistics) had little effect on predictive ability. In this study method based on regression trees yielded with substantially lower predictive ability. It is concluded that there is no best method of variable selection and that any of the regression-based approaches discussed here is capable of yielding useful predictive models.

کلیدواژه‌ها [English]

  • Subset selection
  • Site quality
  • Stepwise method
  • Variable Selection
  • Akaike’s information criterion (AIC)
  • Schwarz’s Bayesian information criterion (BIC)