نمودار جعبه ای چیست

نمودار جعبه ای چیست



مهدی

بچه ها کسی جواب رو میدونه ؟

نمودار جعبه ای چیست را از این سایت دریافت کنید.

نمودار جعبه‌ای

نمودار جعبه‌ای

از ویکی‌پدیا، دانشنامهٔ آزاد

نمودار جعبه‌ای برای توصیف داده آزمایش مایکلسون-مورلی.

بخشی از مجموعهٔ آمار

نمایش داده نهفتن اندازه‌های اصلی

Exploratory data analysis • طراحی اطلاعات

آمار توصیفی • استنباط آماری

نمودارهای آماری • Plot

تحلیل داده‌ها • اینفوگرافیک

علم داده‌ها نهفتن افکار پیشرو

جان توکی • ادوارد تافتی

نهفتن

انواع گراف‌های اطلاعات

نمودار خطی • نمودار میله‌ای

بافت‌نگار • نمودار نقطه‌ای

نمودار جعبه‌ای • نمودار پارتو

نمودار دایره‌ای • Area chart

نمودار کنترل • نمودار توالی

نمودار ساقه و برگ • کارتوگرام

Small multiple • Sparkline

جدول (اطلاعات) نهفتن مباحث مرتبط داده • اطلاعات

داده‌های عظیم • پایگاه داده‌ها

Chartjunk • بینایی

تحلیل رگرسیون • مدل آماری

Misleading graph نبو

در آمار توصیفی نمودار جعبه‌ای (به انگلیسی: Box plot) یا نمودار جعبه و خط (به انگلیسی: Box and whisker plot) نموداری است که برای توصیف تغییرات داده به کار می‌رود.[۱] در این نمودار از جعبه‌ای برای نمایش فاصله بین چارک اول و سوم استفاده می‌شود و خطی در داخل جعبه میانه (چارک دوم) را مشخص می‌کند. خارج از جعبه حداقل و حداکثر مقدار داده را نیز مشخص می‌نمایند. گهگاه نمونه‌های خارج از محدوده نیز به صورت نقاطی نشان داده می‌شوند. هر چه این نمودار مایل به پایین محور باشد نشان از این است که داده های آماری بیشتر از اعداد کوچکتر یا پایین تر است.

منابع[ویرایش]

↑ "Box plot". (به انگلیسی). 2021-10-15.

"Box Plot" (به انگلیسی). موسسه ملی فناوری و استانداردها. Retrieved 03/04/2012. {{cite web}}: Check date values in: |بازبینی= (help)

"Box Plot" (به انگلیسی). دانشگاه ییل. Retrieved 03/04/2012. {{cite web}}: Check date values in: |بازبینی= (help)

در ویکی‌انبار پرونده‌هایی دربارهٔ نمودار جعبه‌ای موجود است.

نهفتن نبو آمار نهفتن آمار توصیفی توزیع احتمال پارامتر مکان

میانگین (میانگین حسابی، میانگین هندسی، میانگین همساز) میانه مد

سنجش‌های پراکندگی

دامنه انحراف معیار ضریب تغییرات صدک دامنه بین چارکی

شکل توزیع‌ها

واریانس چولگی کشیدگی گشتاور ال-گشتاور

توزیع احتمال شاخص پراکندگی جدول‌های خلاصه

داده‌های گروه‌بندی‌شده توزیع فراوانی جدول پیشایندی

ضریب همبستگی

ضریب همبستگی حاصل‌ضرب-گشتاور پیرسون ضریب همبستگی رتبه‌ای (ضریب همبستگی رتبه‌ای اسپیرمن، تای کندال) همبستگی جزئی نمودار نقطه‌ای

نمودارهای آماری

نمودار میله‌ای دونموداره نمودار جعبه‌ای نمودار کنترل همبستگی‌نگار نمودار جنگلی بافت‌نگار نمودار Q-Q نمودار احتمال-احتمال نمودار توالی نمودار پراکنش نمودار ساقه و برگ نمودار راداری

گسترش گردآوری داده گسترش استنباط آماری گسترش

ضریب همبستگی و تحلیل رگرسیون

گسترش

داده‌های رسته‌ای، آمار چندمتغیره، تحلیل سری زمانی یا تحلیل بقا

گسترش کاربردهای آمار

رده درگاه ریاضیات انبار ویکی‌پروژه

رده‌ها: آمار توصیفیجدول‌ها و نمودارهای آماریداده پرت آماری

برای دیدن کل مطلب کلیک کنید

منبع مطلب : fa.wikipedia.org

نمودار جعبه ای (Boxplot) و رسم آن در پایتون

یکی از معروف‌ترین نمودارها که بسیاری از شاخص‌های آمار توصیفی مربوط به داده‌ها را نشان می‌دهد، «نمودار جعبه‌ای» (Boxplot) است. این نمودار توسط آمارشناس مشهور...

نمودار جعبه ای (Boxplot) و رسم آن در پایتون – به زبان ساده

آخرین به‌روزرسانی: ۲۸ خرداد ۱۴۰۱ زمان مطالعه: ۹ دقیقه

آمار، داده کاوی ۴۷۶۴۳ بازدید

یکی از معروف‌ترین نمودارها که بسیاری از شاخص‌های آمار توصیفی مربوط به داده‌ها را نشان می‌دهد، «نمودار جعبه‌ای» (Boxplot) است. این نمودار توسط آمارشناس مشهور آمریکایی «جان توکی» (John Wilder Tukey) در سال 1969 معرفی شد. در این متن به بررسی این نمودار می‌پردازیم و با شیوه ترسیم آن را در زبان برنامه نویسی پایتون آشنا می‌شویم. ذکر این نکته نیز ضروری است که گاهی به نمودار جعبه‌ای، «نمودار جعبه و خط» (Box and Whisker) نیز می‌گویند. برای درک بهتر این نوشتار بهتر است ابتدا مطالب مربوط به شاخص‌های آماری تمرکز و پراکندگی را مطالعه کرده باشید. البته مطالعه نوشتار نمایش و رسم نمودار برای داده‌ها — معرفی و کاربردها خالی از لطف نیست.

فهرست مطالب این نوشته

نمودار جعبه‌ای

نمودار جعبه‌ای

تصویر زیر بیانگر یک نمودار جعبه‌ای است. همانطور که در ادامه دیده خواهد شد برای رسم این نمودار از  چندین شاخص‌ مرکزی و پراکندگی آماری استفاده شده است.

نمودار جعبه‌ای یک روش استاندارد برای نمایش توزیع داده‌ها است که براساس شاخص‌های آماری «کوچکترین مقدار» (Minimum)، «چارک اول» (First Quartile -Q1)، «میانه» (Median)، «چارک سوم» (Third Quartile- Q3) و «بزرگترین مقدار» (Maximum) ساخته شده است. همچنین این نمودار می‌تواند در مورد وجود داده‌های دورافتاده (Outlier) یا پرت، اطلاعاتی به شما بدهد و مقدار آن‌ها را تعیین کند. همچنین نشان دادن تقارن در داده‌ها از کارهایی این نمودار است. شایان ذکر است که میزان تمرکز و حتی چولگی داده‌ها نیز در این نمودار دیده می‌شود. در این نوشتار به مطالب زیر اشاره خواهد داشت:

نمودار جعبه‌ای چیست؟

ساختار و اجزای یک نمودار جعبه‌ای و ارتباط آن با منحنی توزیع نرمال

ایجاد و ترسیم نمودارهای جعبه‌ای بوسیله زبان برنامه نویسی پایتون

نمودار جعبه‌ای چیست؟

به نظر می‌رسد تکیه کردن به شاخص‌های تمرکز مانند میانگین، میانه و نما به تنهایی کافی نیست. فرض کنید قرار است که کارایی team1 و team2 با یکدیگر مقایسه شود. شاخص‌های تمرکز برای این کار استفاده و مقدارشان برای هر دو تیم محاسبه شده است.

همانطور که در تصویر بالا دیده می‌شود، برای مقایسه دو تیم فقط از معیارهای تمرکز استفاده شده است. نتیجه بسیار عجیب است! اگر چه معیارهای تمرکز برای تیم ا و ۲ با هم برابر است ولی به وضوح دیده می‌شود که تیم ۱ یکدست‌تر از تیم ۲ است. به همین علت استفاده از معیارهای پراکندگی و تمرکز همزمان ضروری به نظر می‌رسد. نمودار جعبه‌ای از عهده این کار یعنی نمایش معیارهای تمرکز و پراکندگی همزمان به خوبی برمی‌آید. البته برای چنین کاری می‌توان از «نمودار توزیع فراوانی» (Histogram) یا «نمودار احتمال- چگالی» (Probability-Density Plot) نیز کمک گرفت. ولی از طرفی استفاده از نمودار جعبه‌ای برتری‌هایی نیز نسبت به رسم «نمودار چگالی» (Density Plot) و «بافت‌نگار» (Histogram) دارد زیرا فضای کمتری اشغال می‌کند در نتیجه امکان مقایسه بین چند گروه مختلف را همزمان می‌دهد. این گونه نمودارهای جعبه‌ای که به منظور مقایسه بین چندین گروه ترسیم می‌شوند را در ادامه خواهید دید. در تصویر زیر یک نمونه از نمودار جعبه‌ای مشاهده می‌شود. همانطور که قابل مشاهده است، اجزای این نمودار در ترسیم آن نقش مهمی دارند. بنابراین بهتر است با این قسمت‌ها بیشتر آشنا شویم.

میانه (Median): این شاخص آماری مقداری را نشان می‌دهد که در وسط داده‌ها قرار دارد. این محل در نمودار بوسیله خطی زرد رنگ به نام Median دیده می‌شود. مشخص است که ۵۰٪ داده‌ها از این مقدار کوچکتر یا بزرگتر هستند. این شاخص توسط یک خط عمودی درون جعبه ترسیم می‌شود.چارک اول (Q1): این شاخص، مقداری را نشان می‌دهد که ۲۵٪ داده‌ها از آن کوچکتر هستند. از طرفی می‌توان این مقدار را میانه داده‌هایی دانست که بین کوچکترین مقدار (با توجه به داده‌های پرت) و میانه قرار گرفته‌اند. این مقدار توسط یک خطی عمودی بدنه سمت چپ جعبه را می‌سازد.چارک سوم (Q3): این شاخص، مقداری را نشان می‌دهد که ۷۵٪ داده‌ها از آن کوچکتر هستند. از طرفی می‌توان این مقدار را میانه داده‌هایی داسنت که بین بزرگترین مقدار (با توجه به داده‌های پرت) و میانه قرار گرفته‌اند. این شاخص نیز برای نمایش ضلع سمت راست جعبه به کار گرفته می‌شود.دامنه میان چارکی (IQR): فاصله بین چارک اول و سوم توسط این شاخص نشان داده می‌شود. طول اضلاع دیگر جعبه توسط این شاخص تعیین می‌شود.خطوط (Whikers): این خطوط فاصله بین چارک اول تا کمترین مقدار و همچنین بیشترین مقدار را پر می‌کنند. در تصویر بالا این خطوط به رنگ آبی نشان داده شده‌اند.حداکثر- بزرگترین مقدار (Maximum): در این نمودار بزرگترین مقدار، بیشترین مقداری است که حداکثر 1.5 برابر دامنه میان چارکی از چارک سوم فاصله دارد. به بیان ریاضی می‌توان نوشت:

Maximum={Max(x) ,Max(x)≤Q3+1.5×IQR

Q3+1.5×IQR ,Max(x)>Q3+1.5×IQR

حداقل- کوچکترین مقدار (Minimum): در این نمودار کوچکترین مقدار، کمترین مقداری است که حداکثر 1.5 برابر دامنه میان چارکی از چارک اول فاصله دارد. به بیان ریاضی می‌توان نوشت:

Minimum={Min(x) ,Min(x)>Q1−1.5×IQR

Q1−1.5×IQR ,Min(x)≤Q1−1.5×IQR

داده‌های دورافتاده- پرت (Outlier): مقدارهایی که به شکل دایره سبز رنگ در نمودار مشاهده می‌شوند، داده‌هایی پرت هستند. در اینجا داده‌هایی که از Minimum کوچکتر و یا از Maximum بزرگتر هستند، داده پرت محسوب می‌شوند.

مقایسه نمودار جعبه‌ای با منحنی احتمال نرمال

در تصویر زیر مقایسه بین منحنی «چگالی احتمال» (Probability Density) نرمال و نمودار جعبه‌ای صورت گرفته است. این کار برای درک بهتر از نمودار جعبه‌ای و نشان دادن خصوصیات آن ضروری به نظر می‌رسد. به این ترتیب خواهید فهمید که مزیت‌های یک نمودار جعبه‌ای در مقایسه با نمودار احتمال در چیست! همچنین، این مقایسه به درک شاخص‌های کوچکترین و بزرگترین مقدار و همچنین داده‌های پرت کمک خواهد کرد.

برای دیدن کل مطلب کلیک کنید

منبع مطلب : blog.faradars.org

نظر خود را بنویسید

آخرین مطالب