فرض کنید شما به رابطه بین دو متغیر نگاه می کنید و نمودار پراکندگی را قبلاً ترسیم کرده اید. نمودار مانند ابر نقاط به نظر می رسد. چگونه می توان آن را به صورت عددی خلاصه کرد؟این همان کاری است که ضریب همبستگی انجام می دهد.
- میانگین GPA 2. 90 است
- انحراف استاندارد (میزان گسترش در اطراف میانگین) 0. 5 است.
- با فرض اینکه توزیع نمرات GPA در جمعیت به شکل زنگ ("به طور معمول توزیع شده") است ، بنابراین این بدان معنی است که حدود 65 ٪ از کل دانش آموزان دارای یک معدل هستند که در فاصله زمانی قرار می گیرد [2. 40 ، 3. 40] و حدود 95 ٪ ازهمه دانش آموزان دارای GPA هستند که در درون [1. 90 ، 3. 90] قرار می گیرند
بنابراین ، در نمودار زیر (شکل 4a) ، اولین قدم برای نشان دادن نقطه ای است که نشان می دهد میانگین مقادیر X و میانگین مقادیر y است. این نقطه میانگین است. این مرکز ابر را پیدا می کند. مرحله بعدی اندازه گیری گسترش ابر از یک طرف به طرف دیگر خواهد بود. این کار با استفاده از SD از مقادیر X انجام می شود. بیشتر نقاط (95 ٪) در هر دو طرف از نقطه میانگین در 2 SD افقی خواهند بود (شکل 4B). به همین ترتیب ، از SD از مقادیر y می توان برای اندازه گیری گسترش ابر از بالا به پایین استفاده کرد. بیشتر نقاط در 2 SD عمودی بالاتر یا پایین تر از میانگین ها قرار خواهند گرفت (شکل 4C).
شکل 4. خلاصه نمودار پراکندگی.
- میانگین مقادیر X ، SD از مقادیر X ؛
- میانگین مقادیر y ، SD از مقادیر y.
این آمار مرکز ابر را به ما می گوید ، و چقدر گسترش یافته است ، چه به صورت افقی و چه به صورت عمودی. اما ما هنوز هم باید ارتباط بین دو متغیر را خلاصه کنیم. به نمودارهای پراکنده در شکل 5 نگاه کنید. هر دو ابر دارای یک مرکز هستند و همان گسترش ، افقی و عمودی را نشان می دهند.
شکل 5. خلاصه نمودار پراکندگی. ضریب همبستگی در اطراف یک خط خوشه بندی می کند.
با این حال ، نقاط موجود در ابر اول کاملاً در اطراف یک خط جمع شده اند: یک ارتباط خطی قوی بین دو متغیر وجود دارد. این همبستگی بسیار زیاد است (بالاترین حد ممکن 1. 0 است ، این شاید در حدود 0. 8 باشد). در ابر دوم ، خوشه بندی بسیار سست تر است. هنگامی که خوشه بندی بیشتر از یک فوتبال به یک دایره به نظر می رسد ، همبستگی نزدیک به صفر است. قدرت ارتباط در دو نمودار متفاوت است. برای اندازه گیری ارتباط ، یک آمار خلاصه دیگر مورد نیاز است: ضریب همبستگی. این ضریب معمولاً مشخص شده است.
- میانگین مقادیر X ، SD از مقادیر X
- میانگین مقادیر y ، SD از مقادیر y
- ضریب همبستگی r.
فرمول محاسبات R بعداً ارائه می شود. در حال حاضر ما می خواهیم روی تفسیر گرافیکی تمرکز کنیم.
در پی این پاراگراف تعدادی از نمودارهای پراکنده تولید شده توسط رایانه با استفاده از 200 نقطه داده فرضی وجود دارد. رایانه مقدار ضریب همبستگی را در بالای هر نمودار چاپ کرده است. نمودار اول (در زیر) ابر بی شکل و دایره ای مانند را نشان می دهد. همبستگی بین این دو متغیر تقریباً صفر است. می بینید که مقادیر کوچک x دارای انواع مقادیر y - کوچک ، متوسط و بزرگ است. مقادیر متوسط x را انجام دهید ، و به طور خلاصه مقادیر بزرگ X را نیز انجام دهید. به طور خلاصه ، مقادیر Y مربوط به مقادیر X نیست. دانستن مقدار X برای یک نقطه معین برای پیش بینی مقدار y کمک نمی کند.

نمودار پراکندگی بعدی کمی بیشتر از شکل بیضوی است. میانگین y برای نقاط با مقادیر X کوچک کمتر از میانگین y برای نقاط با مقادیر X بزرگ است. همبستگی R = 0. 28 است.

نمودار بعدی (در زیر) همبستگی حدود 0. 48 را نشان می دهد. این فقط کمی بالاتر از همبستگی بین درآمد و آموزش در ایالات متحده است. این بدان معناست که ، به طور متوسط ، افراد با تحصیلات بیشتر درآمد بیشتری کسب می کنند.

نمودار بعدی همبستگی بسیار قوی تری را نشان می دهد (72/0 = r). این گروه کاملاً باریک می شود و مقادیر بزرگ X مقادیر Y بسیار بالاتری را نسبت به مقادیر X کوچک نشان می دهد.

سپس نمودار بعدی همبستگی بسیار بالایی از 0. 89 دارد. این فقط کمی کمتر از همبستگی واقعی بین ارتفاعات دوقلوهای یکسان در هر سنی است. توجه داشته باشید که حتی با همبستگی 0. 89 ، شما واقعاً انتظار ندارید که دوقلوها دقیقاً همان ارتفاع را داشته باشند: تقریباً همیشه تفاوت وجود دارد. همه اینها واقعاً می گوید این است که به طور متوسط ، تفاوت اندک است. با این حال ، گاهی اوقات تفاوت های بزرگی وجود خواهد داشت.

تصویر آخر همبستگی 0. 99 را نشان می دهد. احتمالاً هرگز همبستگی واقعی آن را مشاهده نخواهید کرد. این عملاً یک خط مستقیم است. دانستن ارزش X یک شخص به شما ارزش y خود را در چند مکان اعشاری از دقت می گوید. به عبارت دیگر ، تقریباً هر شخص با مقدار X خاص (مثلاً 0. 5) ، تقریباً همان مقدار Y را دارد (حدود 0. 8).

- هرچه نقاط محکم تر در یک خط قرار بگیرند ، رابطه بین متغیرها قوی تر می شود و R نزدیکتر به 1. 0 است.
- هنگامی که همبستگی نزدیک به 1. 0 است ، دانستن مقدار X یک نقطه به شما امکان می دهد مقدار Y آن را با خطای بسیار کمی پیش بینی کنید.
- اما این بدان معنا نیست که مقدار Y یکسان است یا تقریباً برابر با مقدار X است ، زیرا متغیر Y ممکن است در واحدهای کاملاً متفاوت بیان شود. این فقط بدان معنی است که از مقدار X قابل پیش بینی است. به عنوان مثال ، اگر X سطح تحصیلات باشد ، در سالها ، y می تواند به دلار درآمد داشته باشد. حتی اگر آموزش و پرورش درآمد را کاملاً پیش بینی کند ، این بدان معنا نیست که ارزش Y مرتبط با 16 سال آموزش چیزی شبیه به 16 است - احتمالاً بیشتر شبیه 35000 دلار است.
تاکنون فقط در مورد ارتباط مثبت مورد بحث قرار گرفته است. در ایالات متحده ، زنان دارای تحصیلات بیشتر تمایل به فرزندان کمتری دارند. این ارتباط منفی است. افزایش آموزش با کل با کاهش تعداد کودکان همراه است.(آنها در مدرسه چه می آموزند ؟!) ارتباط منفی با یک علامت منفی در ضریب همبستگی نشان داده شده است. به عنوان مثال ، همبستگ ی-0. 90 ، همان درجه خوشه بندی را به عنوان یکی از 0. 90 نشان می دهد. با علامت منفی ، خوشه بندی در اطراف خطی است که به پایین می رود. با یک علامت مثبت ، خط به بالا می رود. برای زنان در سن فرزندآوری در ایالات متحده ، همبستگی بین آموزش و تعداد کودکان حدو د-0. 2 است. قوی نیست ، اما آنجا.
همبستگی ها همیشه بی ن-1 و 1+ است ، اما می تواند هر مقدار را در بین قرار دهد. یک همبستگی مثبت بدان معنی است که ابر به بالا می رود. با افزایش یک متغیر ، دیگری نیز انجام می شود. یک همبستگی منفی بدان معنی است که ابر به پایین می رود. با افزایش یک متغیر ، دیگری کاهش می یابد.
تفسیر ضریب همبستگی
همبستگی ، مثلاً 80/0 = r به معنای این نیست که 80 ٪ از نقاط محکم در اطراف یک خط جمع شده اند ، و همچنین نشانگر خطی بودن خطی به میزان R = 0. 40 نیست. این همبستگی میزان آگاهی از مقدار x را به شما کمک می کند تا ارزش Y را پیش بینی کنید.
فرض کنید شما می خواستید GPA یک دانش آموز تصادفی BC را پیش بینی کنید ، و می دانستید که میانگین معدل برای همه دانشجویان قبل از میلاد 2. 9 است. سپس شما فقط 2. 9 را حدس می زنید. چرا؟از آنجا که میانگین لیستی از اعداد مقداری است که حداقل با سایر موارد متفاوت است. به جدول زیر نگاه کنید. ستون با برچسب X مجموعه ای از 10 مقدار دارد. مبلغ 140 و میانگین آن 14 است. ستون بعدی بیش از (مربع) اختلاف هر مقدار در x از 14 را محاسبه می کند. میانگین اختلاف 115. 8 است. سه ستون بعدی تفاوت هر یک در X را از مقادیر مختلف ، مانند 12 ، 11 و 17 محاسبه می کند. توجه داشته باشید که میانگین اختلاف مربعات برای 14 ، میانگین کوچکترین است. همیشه از این طریق است: میانگین آن مقدار است که حداقل متفاوت است (از نظر اختلاف مربعات) از تمام اعداد موجود در یک لیست. بنابراین میانگین بهترین حدس شما از GPA یک دانش آموز تصادفی است.
استراتژیهای اسکالپ...
ما را در سایت استراتژیهای اسکالپ دنبال می کنید
برچسب : نویسنده : ناصر تقوایی بازدید : 78 تاريخ : جمعه 6 مرداد 1402 ساعت: 23:28