دانشگاه الزهرا
حمید کردبچه
محمد شرافتیان
همهی ما از پیشبینی آینده، لذت میبریم. دوست داریم بفهمیم آیندهی فلان کشور، فلان اقتصاد و فلان سهام چطور میشود. این شناخت آینده نیاز به پارامترهایی برای پیشبینی و تخمین دارد. رگرسیون یکی از مفاهیمی است که در این حوزه کاربرد خواهد داشت. رگرسیون یکی از پارامترهای مهم آماری است. با استفاده از رگرسیون خطی، میتوان رابطهی متغیرها را شناسایی و تحلیل کرد. رگرسیون در واقعیت کاربردهای بسیار زیادی دارد. برای حل مسئله رگرسیون خطی شما باید با انواع رگرسیون، شیوهی تحلیل و کاربردهای آن آشنایی لازم را داشته باشید. همین امر سبب میشود تا آموزش رگرسیون یکی از مهمترین موضوعات برای مدیران باشد.
رگرسیون یک تکنیک آماری است. رگرسیون برای بررسی و تحلیل رابطهی متغیر وابسته و متغیرهای مستقل بهکار میرود. در حقیقت این پارامتر، وضعیت متغیر وابسته را براساس متغیر مستقل، توصیف میکند. رگرسیون انواع مختلفی دارد. رگرسیون نوع خطی یا Liner regression، رگرسیون غیر خطی، رگرسیون منطقی و غیره برخی از انواع آن هستند.
رگرسیون از آن پارامترهای بسیار مهم برای تحلیل مسائل است. این پارامتر، هم رابطهی معنادار میان متغیرها را ذکر میکند و هم میتواند قدرت تأثیر متغیرهای مختلف روی متغیر وابسته را تخمین بزند. به عنوان مثال، فرض کنید مدیر فروش یک فروشگاه بزرگ هستید. «میزان فروش» شما یک متغیر وابسته است. متغیرهای دیگری مثل «قیمت»، «آب و هوا»، «رقیبان» و غیره نیز وجود دارند که روی «میزان فروش» تأثیرگذار خواهند بود. با محاسبات رگرسیون، شما متوجه میشوید که با تغییر هر یک از این پارامترها («قیمت»، «آب و هوا»، «رقیبان»)، چه تأثیری روی متغیر میزان فروش حاصل خواهد شد.
رگرسیون برای تحلیل و پیشبینی در کسب و کارهای زیادی کاربرد دارد. برخی از مهمترین کاربردهای این پارامتر آماری در ادامه لیست شدهاند. کسب و کارهای مختلف میتوانند از رگرسیون برای تجزیه و تحلیل استفاده کنند. در زیر برخی از مهمترین کاربردهای این حوزه آورده شده است.
• پیشبینی فروش
• تخمین درآمد آینده
• بررسی و تحلیل عوامل بازاریابی (تبلیغات تلویزیونی، تخفیفها و غیره)
• پیشبینی موجودب
• بررسی نیازمندیها
• تحلیل متغیرهای محیطی
• تحلیل عوامل مؤثر در کسب و کار
یکی از الگوریتمهای مهم و پرکاربرد در یادگیری ماشین، رگرسیون است. رگرسیون در یادگیری ماشین یک در نقش یک الگوریتم نظارتی ظاهر میشود. برخی از کاربردهای این پارامتر در یادگیری ماشین در ادامه آورده شده است.
• پیشبینی مقادیر عددی متغیر وابسته
• بررسی تأثیر عوامل گوناگون روی متغیر وابسته
• تحلیل روابط پیچیده میان متغیرها
• پیشبینی مخاطرات و احتمالات
ضریب همبستگی برای سنجش میزان رابطه و وابستگی میان متغیرهای مستقل و وابسته کاربرد دارد. هرچقدر که مقدار ضریب همبستگی به اعداد ۱ و ۱- نزدیکتر باشد، به معنای شدت رابطهی قویتر میان متغیرها است. توجه داشته باشید که ضریب همبستگی تنها شدت رابطه را نشان میدهد و مدل رابطه توسط این پارامتر تعیین نخواهد شد.
در آموزشهای مربوط به رگرسیون، شما با انواع این پارامتر آشنا میشوید. جهت درک بهتر، مثالهایی از هر نوع زده میشود تا مطالب در ذهن تثبیت شوند. هر مدل رگرسیون کاربرد و ویژگیهای خاص خود را دارد.
سادهترین مدل رگرسیون، رگرسیون نوع خطی است که میتواند بهصورت خطی ساده یا خطی چندگانه تعریف شود. معادله رگرسیون خطی به صورت y=mx+c+e است. در فرمول رگرسیون خطی، m شیب خط رگرسیون، c نقطهی شروع و e نشاندهندهی خطا است.
لجستیک نیز از انواع تحلیلهای رگرسیون است. این رگرسیون زمانی استفاده میشود که متغیر وابسته از نوع گسسته باشد. معادلهی رگرسیون لجستیک بهصورت logit(p)= ln(p/(1-p))=b0+b1X1+b2X2+…+bkXk است که در آن p احتمال وقوع ویژگی است.
رگرسیون خطی چندگانه یک تکنیک آماری است که از چند متغیر مستقل برای پیشبینی نتیجهی یک متغیر وابسته استفاده میکند. در این روش گسترش رگرسیون، حداقل مربعات معمولی است. چرا که بیشتر از یک متغیر مستقل در آن وجود دارد.
این رگرسیون زمانی کاربرد دارد که متغیرهای وابسته بهصورت ترتیبی (و نه پیوسته) سنجیده شده باشند. در این حالت رگرسیون خطی ساده کاربردی نخواهد داشت.
این مدل رگرسیون برای یادگیری ماشین کاربرد دارد. معمولاً زمانی که همبستگی بین متغیرهای مستقل زیاد باشد (مقدار نزدیک به ۱ یا ۱-) از این رگرسیون استفاده خواهد شد.
این مدل رگرسیون نیز در یادگیری ماشین و تحلیلهای آماری پرکاربرد است. در این رگرسیون، بهغیر از مدلسازی متغیرهای وابسته، ویژگیهای مهم آن برای اهمیتسنجی نیز بررسی و تحلیل خواهند شد.
شما میتوانید مسائل مربوط به رگرسیون را با زبان پایتون برنامهنویسی کنید. در دوره آموزش رگرسیون در پایتون، به این موارد پرداخته میشود. در پایتون، یکسری کتابخانه وجود دارد که با فراخوانی آن در برنامه، قادر خواهید بود تا مدل رگرسیون (برای انواع مختلف آن) را بهدست آورید.
تحلیل رگرسیون در ۵ مرحلهی مجزا انجام میشود.
۱- جمعآوری دادهها (متغیرهای مستقل و متغیرهای وابسته)
۲- ساخت مدل رگرسیون (ساخت تابع ریاضی برای ایجاد ارتباط میان متغیرها)
۳- تخمین پارامترها (محاسبهی ضریب همبستگی در رگرسیون نوع خطی)
۴- ارزیابی مدل رگرسیون ایجاد شده (با استفاده از معیارهایی نظیر معیار مربعات خطا)
۵- استفاده از مدل رگرسیون خطی برای پیش بینی دادههای جدید در آینده
استفاده از نرم افزار محاسبات را سادهتر و سریعتر ساخته و امکان خطا و اشتباه را در آن کاهش میدهد. نرم افزار spss یکی از برنامههای پرکاربرد برای محاسبات رگرسیون است. در این نرمافزار شما میتوانید دادهها را وارد کرده و سپس رگرسیون آن را محاسبه کنید.
همچنین شما میتوانید خط رگرسیون را در نرم افزار اکسل ترسیم کنید. برنامهی اکسل، یک نرم افزار فوقالعاده برای محاسبات عددی و آماری است. برای ترسیم خط رگرسیون در اکسل میبایست از منوی chart tools استفاده کنید.
شما میتوانید مفاهیم پایهی رگرسیون را در منابع رایگان مطالعه کنید. مقالات متعددی در مجلات معتبر اینترنتی منتشر شده است که برای آموزش انواع رگرسیون، مدل رگرسیون و دیگر مفاهیم مرتبط قابل استفاده خواهد بود. در نظر داشته باشید که از منابع رایگان با اعتبار خوب و بهروزرسانی شده استفاده کنید تا دانش صحیح و جامعی از رگرسیون خطی کسب کنید.
شما میتوانید مباحث آماری مهم و پرکاربرد را در وب سایت مکتب خونه دنبال کنید. برخی از آموزشها در قالب مقالات علمی در سایت قرار گرفته و برخی از آموزشهای مهم بهصورت دورههای آنلاین و مجازی در اختیار کاربران قرار میگیرد. آموزش تحلیل رگرسیون در مکتب خونه به زبان ساده و با ذکر نمونه سوال رگرسیون خطی و همبستگی است.