نمودار های جعبه ای (box plot) که نام دیگر آن ها (box and whisker به معنی جعبه و خطوط عمودی) می باشد می توانند اطلاعات سودمندی را در زمینه ی نحوه ی توزیع و پراکندگی و همچنین داده های دور از مرکز یک متغیر کمی به ما بدهند و همچنین می توانند توزیع یک متعیر کمی بر اساس متغیر های کیفی را نشان دهند. در نمودار های جعبه ای طول جعبه مهم است و عرض مفهومی ندارد.
وقتی از پایین به سمت بالا می رویم اولین مقدار در نمودار همان مقدار کمینه (Min) داده هاست بعد از آن به جعبه می رسیم که اولین مقدار، چارک (quartile) اول داده هاست یا همان صدک 25. بعد به خطی می رسیم در جعبه که میانه ی داده ها یا چارک دوم یا صدک 50 را نشان می دهد این خط اگر در و سط جعبه باشد به این معناست که توزیع داده نرمال است بعد از آن به خط بالای جعبه می رسیم که چارک سوم یا صدک 75 را نشان می دهد. در نمودار جعبه ای به چارک اول ودوم پاشنه یا لولاهای توکی (tukey's Hings) می گویند.
داده هایی که بین دو چارک قرار می گیرند یعن طول جعبه، برابر با 50% داده ها هستند و به آن ها داده های بین چارکی می گویند (inter quartile range) اگر خط وسط جعبه یعنی میانه به چارک اول نزدیک باشد یعنی داده ها توزیع نرمال ندارند و چولگی مثبت دارند و اگر به چارک سوم نزدیک باشد یعنی چولگی منفی دارند. خط آخر نیز مقدار بیشینه ی (max) داده ها می باشد پس به ترتیب از پایین به بالا داریم مقدار کمینه، چارک اول، میانه یا چارک دوم، چارک سوم، مقدار بیشینه داده ها،
دقت داشته باشیم که خطوط به اندازه ی حد اکثر یک ونیم برابر طول جعبه پیش می روند اگر داده ای بین یک ونیم تا سه برابر طول جعبه باشد داده ی دور از مرکز (outlier) نامیده می شود و با علامت o خارج از قسمت اصلی نمودار نشان داده می شود. اگر داده ای حتی از 3 برابر طول جعبه هم بیشتر باشد به آن داده ی بسیار دور از مرکز (extreme outlier) می گویند که با ستاره نشان داده می شود در این دو حالت بهتر است دیتاهایی که وارد کرده ایم را مجددا چک کنیم که اشتباهی رخ نداده باشد. عدد کنار ستاره ما را در یافتن آن در spss کمک می کند.
دوستان اگه نظری دارند و یا مطلب ایرادی داره ممنون میشم راهنمایی کنید.