ScatterPlot رابطه بین دو مجموعه داده را نشان می دهد. یک پراکندگی را نیز می توان به عنوان یک پراکندگی یا نمودار پراکنده نامید.
در یک پراکندگی ، یک نقطه یک نقطه داده واحد را نشان می دهد. با استفاده از چندین نقطه داده ، توزیع بصری داده ها قابل مشاهده است.
بسته به اینکه چقدر خوشه نقاط با هم محکم است ، ممکن است بتوانید روند روشنی را در داده ها تشخیص دهید.
هرچه نقاط داده نزدیکتر به شکل گیری یک خط مستقیم در صورت ترسیم باشد ، همبستگی بین دو متغیر یا رابطه قوی تر می شود.
اگر نقاط داده خط مستقیم را از نزدیک به مبدأ به مقادیر y بالا تبدیل کنند ، گفته می شود که متغیرها دارای همبستگی مثبت هستند. اگر نقاط داده از مقادیر y بالا در y-axis شروع شود و به مقادیر پایین برسد ، متغیرها دارای همبستگی منفی هستند.

نمونه ای از وضعیتی که ممکن است یک همبستگی مثبت کامل پیدا کنید ، مانند نمودار سمت چپ بالا ، اگر هر یک میله های آب نبات را با قیمت 1 دلار خریداری می کردید. با افزایش تعداد میله های آب نبات ، میزان کل هزینه افزایش می یابد.
نکته: اگر نمودار را مانند خواندن کتاب از چپ به راست می خوانید ، می توانید روند را به عنوان افزایش (مثبت) یا کاهش (منفی) بخوانید.
در شرایطی که شما ممکن است همبستگی مثبت (اما نه کامل) پیدا کنید ، اگر تعداد ساعاتی را که دانش آموزان صرف تحصیل در امتحان در مقابل نمره دریافت کرده اند ، بررسی کنید. این یک همبستگی کامل نخواهد بود زیرا دو نفر می توانند همان زمان را صرف مطالعه کنند و نمرات مختلفی کسب کنند. اما به طور کلی ، این قانون صحیح خواهد بود که با افزایش زمان مطالعه نیز درجه دریافت می شود.

توجه کنید که نقاط داده در این نمودارها حتی بیشتر پخش می شوند. هرچه نقاط داده نزدیک تر برای ایجاد یک خط قرار بگیرند ، همبستگی بیشتر می شود.
در این نمودارها ، هنوز یک روند در داده ها وجود دارد ، بنابراین می گوییم که داده ها دارای همبستگی ضعیف یا پایین تر هستند.
به نمودار زیر نگاهی بیندازید. به چه چیزی توجه می کنید؟

نقاط داده در این نمودار حتی بیشتر پخش می شوند. این بدان معنی است که T در اینجا هیچ روندی برای داده ها وجود ندارد. T HUS ، هیچ ارتباطی وجود ندارد.
مثالهای 1 تا 3 همبستگی در زندگی واقعی
بیایید به برخی از نمونه های واقعی همبستگی داده ها نگاه کنیم.
مثال 1

این نمودار نشان می دهد که چگونه وزن یک شخص بسته به میزان عملکرد آنها در یک هفته ممکن است تغییر کند. این تغییر وزن را برای گروهی از مردم ثبت می کند ، که همه آنها وزن 90 کیلوگرم را شروع کردند. هر شخص هر هفته تعداد متفاوتی از کیلومتر را برای یک دوره زمانی نامشخص طی می کند.
می توانید از نمودار نتیجه بگیرید که با افزایش تعداد کیلومتر هر هفته ، وزن فرد کاهش می یابد.

هنگامی که نقاط بر روی یک پراکندگی پراکنده قرار می گیرند ، می توان خطی از بهترین تناسب را پیدا کرد - یک خط مستقیم که به بهترین وجه داده ها را در یک پراکنده نشان می دهد. در اینجا همان نمودار با خط بهترین تناسب کشیده شده آورده شده است. دوباره توجه کنید که امتیاز فقط "نوع" خط است. به همین دلیل همبستگی منفی ضعیف است.
اما همچنین نکته ای را در سمت راست بالایی نمودار (فلش قرمز) قرار دهید. این عنصر داده یک ناهنجاری است. این به الگوی نقاط دیگر متناسب نیست و ما هنگام ترسیم خط بهترین تناسب از آن استفاده نکردیم. ما آن را یک خط مستقیم می نامیم - یک خط مستقیم که به بهترین وجه داده های موجود در یک پراکندگی را نشان می دهد.
اما ما هنوز باید آن را توضیح دهیم. چرا آنجا است؟
این نقطه مهم نشان دهنده یک نفر است که هر هفته 7 کیلومتر دوید ، اما وزن آن در 90 کیلوگرم ماند. ما ممکن است توضیحی را جستجو کنیم ، شاید حتی با آن شخص مصاحبه کنیم و دریابیم که تنها غذایی که شخص تا به حال می خورد ، فست فود چرب است. بشربشربنابراین توضیح کمبود وزن خود را توضیح می دهد!
مثال 2
امیلی رکوردی از تعداد ساعاتی که درس مورد مطالعه قرار داده و نمرات آزمون دریافت کرده است. نمودار این رابطه را بررسی کرده و مشخص کنید که آیا همبستگی مثبت ، یک همبستگی منفی یا همبستگی نشان می دهد. اگر همبستگی مثبت یا منفی وجود دارد ، معنای آن را در وضعیت شرح دهید.

پاسخ های خود را در زیر بررسی کنید.
استراتژیهای اسکالپ...
ما را در سایت استراتژیهای اسکالپ دنبال می کنید
برچسب : نویسنده : ناصر تقوایی بازدید : 27 تاريخ : دوشنبه 23 مرداد 1402 ساعت: 13:54