تحلیل رگرسیون یکی از محبوب ترین روشهای تحقیق آماری است. با کمک آن می توان میزان تأثیر مقادیر مستقل بر متغیر وابسته را تعیین کرد. قابلیت Microsoft Excel دارای ابزاری است که برای انجام این نوع تحلیل طراحی شده است. بیایید ببینیم که آنها چه هستند و نحوه استفاده از آنها.
بسته تجزیه و تحلیل اتصال
اما ، برای استفاده از عملکردی که به شما امکان می دهد تجزیه و تحلیل رگرسیون را انجام دهید ، اول از همه ، باید بسته تحلیل را فعال کنید. فقط در این صورت ابزارهای لازم برای این روش روی نوار اکسل ظاهر می شوند.
- به برگه بروید پرونده.
- به بخش بروید "گزینه ها".
- پنجره گزینه های اکسل باز می شود. به قسمت فرعی بروید "افزودنیها".
- در قسمت پایین پنجره باز شده ، سوئیچ را در بلوک مجددا تنظیم کنید "مدیریت" در موقعیت افزودنیهای اکسلاگر او در موقعیت دیگری قرار داشته باشد روی دکمه کلیک کنید برو به.
- پنجره ای از افزودنیهای موجود در اکسل باز می شود. کادر کنار را علامت بزنید بسته تحلیل. بر روی دکمه "OK" کلیک کنید.
حالا وقتی به زبانه می رویم "داده"روی نوار جعبه ابزار "تحلیل" ما یک دکمه جدید خواهیم دید - "تجزیه و تحلیل داده ها".
انواع آنالیز رگرسیون
انواع مختلفی از رگرسیون وجود دارد:
- پارابولیک؛
- نمایی
- لگاریتمی؛
- نمایی
- نشانگر؛
- هایپربولیک
- رگرسیون خطی
ما بیشتر در مورد اجرای آخرین نوع تحلیل رگرسیون در اکسل صحبت خواهیم کرد.
رگرسیون خطی در اکسل
در زیر ، به عنوان نمونه ، یک جدول ارائه شده است که میانگین دمای روزانه هوا در خیابان و تعداد خریداران برای روز کاری مربوطه را نشان می دهد. بیایید با استفاده از تجزیه و تحلیل رگرسیون دریابیم که دقیقاً چگونه شرایط آب و هوایی به شکل دمای هوا می تواند در حضور یک مرکز تجاری تأثیر بگذارد.
معادله رگرسیون خطی کلی به شرح زیر است:Y = a0 + a1x1 + ... + akhk
. در این فرمول Y به معنای متغیر ، تأثیر عواملی است که ما سعی در مطالعه آن داریم. در مورد ما ، این تعداد خریداران است. ارزش x عوامل مختلفی هستند که بر متغیر تأثیر می گذارند. پارامترها یک ضرایب رگرسیون هستند. یعنی اینها هستند که اهمیت یک یا عامل دیگر را تعیین می کنند. فهرست ک تعداد کل همین عوامل را مشخص می کند.
- روی دکمه کلیک کنید "تجزیه و تحلیل داده ها". در برگه قرار می گیرد. "خانه" در جعبه ابزار "تحلیل".
- یک پنجره کوچک باز می شود. در آن ، مورد را انتخاب کنید "رگرسیون". روی دکمه کلیک کنید "خوب".
- پنجره تنظیمات رگرسیون باز می شود. زمینه های مورد نیاز در آن وجود دارد "فاصله ورودی Y" و "فاصله ورودی X". همه تنظیمات دیگر می توانند بصورت پیش فرض باقی بمانند.
در زمینه "فاصله ورودی Y" آدرس طیف وسیعی از سلولها را که داده های متغیر در آن قرار دارند ، تأثیر عواملی را که ما در تلاش برای ایجاد آنها هستند ، مشخص کنید در مورد ما ، این سلول های ستون "تعداد مشتری" خواهد بود. آدرس را می توان به صورت دستی از صفحه کلید وارد کرد ، یا می توانید ستون مورد نظر را به سادگی انتخاب کنید. گزینه دوم بسیار ساده تر و راحت تر است.
در زمینه "فاصله ورودی X" ما آدرس محدوده سلولی را وارد می کنیم که داده های عاملی که تأثیر آن بر متغیری است که می خواهیم تنظیم کنیم قرار دارد. همانطور که در بالا گفته شد ، ما باید تأثیر دما را بر روی تعداد مشتریان فروشگاه مشخص کنیم و بنابراین آدرس سلول ها را در ستون "دما" وارد کنید. این کار می تواند به همان روش هایی انجام شود که در قسمت "تعداد مشتری" وجود دارد.
با استفاده از تنظیمات دیگر ، می توانید برچسب ها ، سطح قابلیت اطمینان ، صفر ثابت را تنظیم کنید ، گرافیکی با احتمال عادی نمایش دهید و سایر اقدامات را انجام دهید. اما ، در بیشتر موارد ، این تنظیمات نیازی به تغییر ندارند. تنها چیزی که باید به آن توجه کنید پارامترهای خروجی است. به طور پیش فرض ، نتایج آنالیز در یک برگه دیگر نمایش داده می شود ، اما با حرکت سوئیچ می توانید خروجی را در محدوده مشخص شده در همان برگه با جدول با داده های منبع تنظیم کنید ، یا در یک کتاب جداگانه ، یعنی در یک پرونده جدید.
پس از تنظیم تمام تنظیمات ، روی دکمه کلیک کنید "خوب".
تجزیه و تحلیل تجزیه و تحلیل
نتایج آنالیز رگرسیون به صورت جدول در محلی که در تنظیمات مشخص شده است نمایش داده می شود.
یکی از شاخص های اصلی این است مربع R-. این نشان دهنده کیفیت مدل است. در مورد ما ، این ضریب 0.705 یا حدود 70.5٪ است. این یک سطح قابل قبول از کیفیت است. وابستگی کمتر از 0.5 بد است.
شاخص مهم دیگر در سلول در محل تقاطع خط قرار دارد. تقاطع Y و ستون شانس. این نشان می دهد که Y چه ارزشی خواهد داشت و در مورد ما ، این تعداد مشتری است ، با تمام عوامل دیگر برابر صفر است. در این جدول این مقدار 58.04 است.
مقدار در تقاطع نمودار متغیر X1 و شانس میزان وابستگی Y به X را نشان می دهد. در مورد ما ، این میزان وابستگی تعداد مشتریان فروشگاه به دما است. ضریب 1.31 یک شاخص نسبتاً بالای تأثیر در نظر گرفته شده است.
همانطور که مشاهده می کنید ، با استفاده از برنامه Microsoft Excel ، تهیه جدول تجزیه و تحلیل رگرسیون بسیار ساده است. اما فقط یک فرد آموزش دیده می تواند با داده های دریافت شده در خروجی کار کند و جوهر آنها را بفهمد.