|
داده هاي پرت يا مقادير فرين
و تأثير آنها روي ميانگين:
بعضاً مجموعه اي از داده ها ممكن است شامل چند عدد خيلي كوچك و يا چند عدد حقيقي بزرگ باشد،
كــــه آنها را ” دادة پرت” مي گويند. به طور كلي اندازه هائي كه مقدار آنها در ميقايسه با
اكثر داده ها بسيار كوچك و يا بسيار بزرگ مي باشد را داده پرت و يا مقادير فرين مي گويند.
بهترين راه تشخيص داده هاي پرت، استفاده از نمودار ”باكس” مي باشد. يك از معايب ميانگين به
عنوان اندازه مركزي حساسيت آن به داده هاي پرت است كه براي رفع اين مشكل معيار ميانه به كار
برده مي شود.
ميانه
يكي از اندازه هاي مهم
مركزي مي باشد كه به صورت زير تعريف مي شود. ميانه مجموعه اي از داده ها، كه آن را با نشان
مي دهند، اندازه اي است كه حداقل نيمي از داده ها از آن عدد كمتر باشند.
محاسبه میانه برای
داده های گسسته: براي محاسبه ميانه با استفاده از داده هاي خام به ترتيب زير عمل مي كنيم.
١- داده ها را به ترتيب صعودي يا نزولي
مرتب مي كنيم
٢- به داده هاي مرتب شده رتبه اختصاص
مي دهيم به طوريكه به اولين عدد رتبه 1 ، و
به آخرين عدد رتبه n يا تعلق
مي گيرد. جايگشتي مرتب
شده از مقادير داده
هاي اصلي هستند.
٣- چنانچه n فرد باشد ميانه عددي است
كه رتبه را دارد و
چنانچه n زوج باشد ميانه ميانگين دو عددي است كه رتبه هاي و را
اخيتار كرده اند، يعني

مثال1: میانه داده های زیر را بدست آورید:
77, 79, 80, 86, 87, 87, 94, 99
حل:تعداد داده ها برابر با 8 است. با توجه به اینکه داده ها مرتب شده هستند،بنابراین میانه داده ها عبارت است از:

مثال2: میانه داده های زیر را بدست آورید:
80, 75, 90, 95, 65, 65, 85, 70, 100
حل: ابتدا داده ها را از کوچک به بزرگ مرتب می نماییم.
65, 65, 70, 75, 80, 85, 90, 95, 100
تعداد داده ها برابر با 9 است. ،بنابراین میانه داده ها عبارت است از:

محاسبه میانه برای داده های پیوسته: مقدار ميانه را نيز مي توان با استفاده از جدول فراواني
محاسبه نمود
براي بدست آوردن ميانه با استفاده از جدول فراواني قرمهاي زير را بر ميداريم
١- مقدار را
محاسبه نموده با ستون فراواني تجمعي جدول مقايسه و اولين طبقه يا رده اي كه فراواني تجمعي
آن بزرگتر يا مساوي است را تعيين
و آن را طبقه يا رده ميانه مي ناميم.
٢- چنانچه از جدول فراواني رده بندي
شده استفاده مي كنيم اندازه ميانه همان رده ميانه است و چنانچه از جدول فراواني
طبقه بندي استفاده مي شود ميانه تقريبي از رابطه زير بدست مي آيد.

كه در اين رابطه
حد طبقه پايين طبقه ميانه=
فراواني تجمعي طبقه قبل از طبقه ميانه= 
فراواني طبقه ميانه= 
طول طبقه = 
فرمول فوق با فرض يكنواختي در داخل هر طبقه و بر اساس يك تناسب ساده به دست مي آيد.
ميانه نيز مركز هيستوگرام را تعيين مي كند به طوريكه معمولاً نصف داده ها در طرف راست و نصف
ديگر در طرف چپ آن قرار مي گيرند.
مزيت ميانه به عنوان يك اندازه مركزي بر ميانگين در اين است كه ميانه تحت تأثير داده هاي پرت
قرار نمي گيرد، اما از طرف ديگر با توجه به اينکه ميانه از اندازه همه داده ها به دست نمي
آيد معيار قابل قبولي براي بسياري از بررسي هاي آماري نيست.
نما -
نما ترجمه كلمه
مد است، كه يك لغت فرانسوي و به معناي ” متداول ترين”
است. نما، براي مجموعه اي از دادهها عبارتست از اندازه اي كه بيشترين فراواني
را دارا مي باشد. برخلاف ميانگين و ميانه كه براي مجموعه اي از دادهها وجود داشته
و يكتا است، نما، لزوماً چنين خاصيتي را ندارد. اگر فراواني داده ها يكسان باشد،
توزيع آنها نما ندارد. به عبارت دیگر داده ها بدون نما هستند.
اگر دو اندازه از داده ها فراواني يكسان و بيشترين فراواني را داشته باشند توزع آنها دو نمائي
است. به همين ترتيب ممكن است توزيع چند نمائي براي مجموعه اي از داده ها داشته باشيم. نما
را با حرف M یا Mo نمایش می دهیم.
شکل منحنی های یک نمایی و دو نمایی

محاسبه نما برای داده های گسسته:
١- پیدا کردن فراوانی داده ها
٢- داده ای که فراوانی آن بیشتر باشد را به عنوان
نما انتخاب می کنیم.
توضیح: اگر دو داده دارای فراوانی مساوی باشند،بیشتر از سایر
فراوانی ها، هر دو را به عنوان نما انتخاب می کنیم. مشروط بر اینکه این دو داده کنار هم نباشند.
اگر کنار هم بودند، نصف مجموع آنها را نما می خوانیم.
مثال: برای داده های 3،1،3،1،3،1،3،2،4،5،3،3،1 نما برابر
است با M=3 .
مثال: برای داده های 1،1،3،2،1،4،3،3،5 دو داده 1 و 3 که
کنار هم نیستند و فراوانی مشترک آنها بیش از سایر فراوانی هاست، هر دو به عنوان نما اختیار
می شوند.
مثال: برای داده های1،3،1،1،2،1،3،2،2،4،5،2 نصف دو داده
1 و 2 که کنار هم نیستند و دارای فراوانی 4 (بیش از سایر فراوانی ها) هستند به عنوان نما اختیار
می شود. یعنیM=5/1
محاسبه نما برای داده های پیوسته:
١- خلاصه کردن داده ها در یک جدول فراوانی
٢- نماینده رده ای را که دارای فراوانی بیشتر می
باشد و رده نمایی نامیده می شود را به عنوان نما اختیار می کنیم.
برای دقت بیشتر می توان نما را از فرمول

بدست آورد. در این فرمول نما، مرز پایین رده نمایی، اختلاف فراوانی های نسبی رده نمایی و رده
بلافاصله قبل از آن، اختلاف فراوانی های نسبی رده نمایی و رده بلافاصله بعد از آن و طول رده
می باشد.
|