جملات آماری

 

جمله سازی زیبا با کلمات آماری

·        بیاییم با احتمال 1 خدا را بپرستیم!

·        توزیع زندگیمون نرمال باشه ولی یکنواخت نباشه!

·        بیاییم فصل اطمینان ها را زیاد کنیم!

·        واریانس ها را کم کنیم!

·        سعی کنیم کواریانسمون صفر نشه!

·        قانون قوی را تو رابطه هامون راه ندیم!

·        یک نمونه خوب از رفیقامون انتخاب کنیم!

·        یک برآورد نااریب از آینده داشته باشیم!

·        آمار کارهامون از دستمون خارج نشه!

·        و در آخر بیاییم همگی مثل یک خط رگرسیون کمترین خطا را داشته باشیم!

کنترل کیفیت آماری

کاربرد نمودار پارتو

این مساله ازآنجا ناشی می شود که کتابهای درسی تدوین شده در رابطه با آمار کاربردی باتوجه به تعداد نسبتا زیاد آنها، کمتر به کاربرد علم آمار و مسائل عملی آن پرداخته اند. به طور مثال می توان به این نکته توجه کرد که در بیشتر کتابهای درسی تحت عنوان آمار کاربردی به نمودار پارتو که یکی از مهم ترین و کاربردی ترین نمودارهای آماری است و امروزه در فرآیندهای تولیدی و غیرتولیدی مورد استفاده قرار می گیرد اشاره نشده و یا تنها به معرفی کوتاهی از آن اکتفا شده است 


تاریخچه 

در سال 1897 ویلفرد پارتو ''اقتصاددان ایتالیای1848-1923 فرمولی ارائه کرد که نشان می داد توزیع درآمد ناهموار است . او درآمد فردی را روی محور افقی و جمعیت رابر روی محور عمودی نشان داد و دریافت که تعداد اندکی از مردم دارای درآمد زیاد و اکثرافراد جامعه دارای درآمد اندکی هستند، نمودار زیر بیانگر این فرمول است .
براساس اصلی که وی در اقتصاد اجتماعی بیان کرد، حدود 80 درصد نتایج از20درصد علل ناشی می شود. به عبارت دیگر اگرچه برای مسائل موجود، علل بسیار زیادی وجود دارد ولی تعداد کمی حائز اهمیت است . آن چه پارتو روی این نکته توجه کرد، که اگر شما یک ، دو یا سه عامل اصلی را درنظر بگیرید درباره اکثریت عاملها فکر کرده اید،بدین طریق نمودار پارتو در سا1897 به وجود آمد، یک تئوری مشابه به صورت نموداری توسط لورنز ''اقتصاددان آمریکایی '' در سال 1907 ارائه شد. هردو محقق اشاره داشتند که بیشترین سهم درآمد یا ثروت توسط افراد بسیار کمی از مردم نگهداری می شود، بعدها در زمینه کیفیت دکتر ژوزف جوران در سال1954 روش نموداری لورنز رابه عنوان فرمولی برای تقسیم بندی مسائل کیفی به مشکلات اساسی معدود و مشکلات جزیی بسیار به کار گرفت و این روش را تجزیه و تحلیل پارتو نامید.

کاربرد نمودار پارتو


نمودار پارتو یک نمودار میله ای است که علل مشکلات به وجود آمده را با فراوانی آن مقایسه می کند، در نمودار پارتو از زوایای مختلف می توان به یک مساله نگاه کرد و سپس به حل آن پرداخت از جمله :
کیفیت : نواقص ، عیوب ، خرابیها، شکایات ، موارد برگشتی و تعمیرات ;
هزینه : مقدار زیان ، گرانی ;
خرید وفروش :انبارداری ، اشکال در پرداخت ، تاخیر در تحویل ;
ایمنی : حوادث ، اشتباهات ، شکستگی در حمل و نقل ;
اپراتور: شیفت ، گروه ، سن ، تجربه و مهارت ، اشخاص ;
ماشین : ماشینها، تجهیزات ، ابزار، ساختار، مدل ، اسبابها;
مواد خام : سازنده ، طرح ، مقدار و نوع ;
روش ساخت : شرایط، دستورالعمل ، ترتیب و روشها.
چگونگی رسم نمودار پارتو:
برای رسم نمودار پارتو انجام مراحل زیر ضروری است :
مرحله اول : ابتدا مشخص کنید که کدام مسائل برای رسیدگی هستند و چطور اطلاعات وداده ها را باید جمع آوری کرد.
الف - تصمیم بگیرید کدام مسائل را می خواهید رسیدگی و برطرف کنید، مثال مواردنقص ، زیانهای پولی ، حوادث قابل اتفاق .
ب - مشخص کنید که چه داده هایی لازم است جمع آوری شود و چطور آنها را طبقه بندی کنید، مثال باتوجه به موارد نقص ، فرآیند کار، ماشین ، کارگر و روش ، موارد غیرمهم وجزیی را تحت عنوان سایر طبقه بندی کنید.
ج - روش جمع آوری داده هاو دوره زمانی جمع آوری آن را مشخص کنید.
مرحله دوم : یک برگه کنترل ''برگه ثبت اطلاعات '' مناسب طراحی کنید.
مرحله سوم : بعد از علامت گذاری و ثبت موارد مشاهده شده در برگه کنترل فراوانی آنها رابه دست آورید.
مرحله چهارم : یک جدول توزیع فراوانی شامل تمام موارد فهرست شده ، ستونهای فراوانی ، فراوانی تجمعی ، درصد فراوانی و درصد فراوانی تجمعی تهیه کنید.
مرحله پنجم : جدول توزیع فراوانی را برحسب تعداد به ترتیب غیرنزولی مرتب کنید. لازم به ذکر است که مورد سایر، یا غیرو را در آخرین سطر جدول قرار دهید. مورد فوق نبایدخیلی بزرگتر از سایر موارد باشد.
مرحله ششم : یک محور افقی و دو محور عمودی رسم کنید:
الف - محور افقی : این محور را به تعدادی فواصل یکسان شامل تمام موارد، تقسیم بندی کنید.
ب - محور عمودی سمت چپ : این محور را از صفر تا n ''جمع کل داده ها'' مدرج کنید.
ج - محور عمودی سمت راست : این محور را از صفر ت100 ''درصد کل '' مدرج کنید.
مرحله هفتم : یک نمودار ستونی رسم کنید.
مرحله هشتم : منحنی فراوانی تجمعی ، منحنی پارتو را رسم کنید، برای این کار ارزشهای تجمعی را در بالای سمت راست ستون مربوط به هر طبقه با نقطه ای مشخص کرده وسپس این نقاط را به یکدیگر وصل کنید.
مرحله نهم : تمام اطلاعات ضروری را روی نمودار ثبت کنید:
الف - اطلاعات مربوط به نمودار شامل عنوان ، واحد، نام رسم کننده نمودار، موارد بامعنی و...
ب - اطلاعات مربوط به داده ها شامل دوره زمانی ، محل جمع آوری داده ها، موضوع ،جمع کل داده ها و...

محاسبات آماری

 

نرم افزار رایگان و کم حجم برای تجزیه عاملی

یکی از مهمترین مباحث چندمتغیره، تجزیه عاملی متغیرهای پیوسته می باشد. اکثر نرم افزارهای آماری توان  تحلیل عاملی داده های چندمتغیره را دارند و حتی برخی از آنها مانند SAS ، پکیج های ویژه ای مخصوص این کار دارند اما نرم افزاری که امروز معرفی می کنیم صرفاً مخصوص موضوع است و با حجمی بسیار کم کاملاً رایگان در اختیار شما قرار می گیرد.

نرم افزار Factor با گرفتن داده هایی با فرمت txt موارد زیر را در اختیار شما قرار می دهد.

1- انجام آمار توصیفی برای داده های یک یا چند متغیره (میانگین، واریانس،چولگی، کشیدگی و....)

2- نمودار واریانس برای داده های ترتیبی

3- ماتریس کوواریانس و همبستگی با برآورد ریدج اختیاری

4- تعیین مولفه های اصلی که منجر به تجزیه عاملی مناسب می شود.

همچنین تحلیل های دیگر چون آزمون ماتریس همبستگی، نیکویی برازش (کای دو)، شاخص برازش غیرنرمال، GFI و خطای RMS روش به کار رفته و..... را در اختیار شما می گذارد

 اندازه فایل: ۲۵۴ کیلو بایت

دانلود

محاسبات آماری

 

اکسل خود را تبدیل به یک نرم افزار کاملا آماری کنید

وارد کردن داده در نرم افزارهای آماری امری مشکل است و اصولاً این نرم افزارها در حفظ داده ها چندان قابل اعتماد نیستند. برای همین منظور اکثر دوستان آماری از نرم افزار Excel برای وارد کردن داده هایشان استفاده می کنند که از کیفیت و دقت بالایی در ورود اعداد و حروف برخوردار و روی اکثر سیستم ها نیز نصب می باشد. امّا مشکل این نرم افزار هم نداشتن منوهای آماری است که باعث می شود بعد از پرکردن ستونها، داده ها را در یک نرم افزار آماری مانند SPSS، S-Plus، SAS، Minitab و... وارد کنیم و سپس تحلیل آماری مورد نظر را انجام دهیم.

ما پیشنهاد جالبی برای حل مشکل شما داریم و آن ترکیب نرم افزار Winstat با Excel است. برای این منظور ابتدا  Winstat را از لینک زیر دانلود کنید.

حجم فایل: 7.17 مگابایت

دانلود فایل

سپس با اطمینان از وجود نرم افزار Excel (ورژن 97 به بعد) Winstat را نصب کنید. نرم افزار به طور خودکار روی Excel نصب می شود. بعد از نصب Excel خود را باز کنید. در قسمت Toolbars گزینه ای به نام Winstat اضافه شده که شامل 4 منوی اصلی و 4 منوی فرعی است.

منوهای اصلی به ترتیب عبارتند از:

1- Statistics (شامل مقایسه دو گروه، مقایسه N گروه، انواع ضرایب همبستگی، رگرسیون، تجزیه عاملی و ...)

2- Graphics (هیستوگرام، دایره ای، میله ای، پراکندگی و...)

3- Data

4- Help Winstat

تذکر: از آنجایی که این نرم افزار یک برنامه ترکیبی است برای شناخته شدن آن توسط Excel یکبار باید روی تمام آیکون های آن کلیک کنید. در این صورت از شما می خواهد که او را در شناخت داده ها همراهی کنید. برای بار دوم که وارد شوید دیگر با این مشکل روبرو نخواهید بود. ضمناً با نصب این برنامه، قسمتی در منوی all program ویندوز تحت عنوان Winstat for Excel نیز نصب می شود که در آن یک راهنما به شکل Winstat Manual با فرمت pdf شامل 137 صفحه وجود دارد که Help شما را تکمیل می کند.

دانلود رایگان کتاب

 

برای دانلود کتاب رایگان، ساده ترین راه مراجعه به آدرس زیر است.

                                         http://gigapedia.com

کافی است وارد قسمت register شوید و یک نام کاربری و پسورد بری خود انتخاب کنید.

 ایمیلتان را وارد کنید و پس از وارد کردن دو کلمه مشخص در Captcha دکمهregister را انتخاب کنید. به ایمیل شما لینکی وارد می شود که می توانید از طریق آن در سایت login کنید.

 


مقدمه ای در مورد آمار فضایی


استقلال و يکسانی – مدل داده های توزيع شده:

تکنيک هاي آماري استاندارد به کار برده مي شوند تا يک مدل آماري را بسازند و پارامترهاي مدل را برآورد کنند. به عنوان مثال Heyl and Cook در ۱۹۳۶آزمايشات انجام شده بين مي ۱۹۳۴ و ژولاي ۱۹۳۵ را براي تعيين شتاب جاذبه زمين در يک آزمايشگاه از واشنگتن توصيف کرده اند. روش استفاده شده، استفاده از آونگ متحرک بوده و ترکيب هاي متفاوت قطر لوله آونگ و نوع لبه تيغه آن، بکار گرفته شده بود. يک ترکيب خاص که بعد از مي و قبل از ژوئن 1934 بدست آمده ( بعد از تعديلات مناسب براي خميدگي و سرعت ساعت) بصورت زير می باشد:

76،82،83،54،35،46،87،68

اين که اين داده ها را می توان به عنوان رويدادی از يک نمونه تصادفي مدل بندي کرد احتمالاً يک فرض روشن و بي عيب است. اما آزمايش بعدي انجام شده تحت يک ترکيب و شکل متفاوت، انحرافات را به ما مي دهد. ( بعد از تعديلات مناسب به دست آمده است)

76،76،78،79،72،68،75،78

دوباره اين ها مي توانند به عنوان يک نمونه تصادفي مدل بندي شوند. اما براي اينکه هر آزمايش سعي بر آن دارد که ثابت فيزيکي مشابه را اندازه بگيرد، داده ها بطور واضح بايد به چندين روش ترکيب شوند.

سوالی که مطرح می شود اين است که آيا عيبی ندارد که ۱۶ عدد قبلي را به عنوان مشاهدات يک نمونه تصادفي مدل بندي کنيم؟

مدل داده هاي ناهمگن:

عدم همگني در داده ها معمولاً در مدل هاي آماري با فرض داشتن ميانگين غيرثابت محاسبه مي شود، معمولاً ميانگين ، يک ترکيب خطي از چندين متغير توصيفي مي باشد. با اين وجود، حتي بعد از اين که تغييرات با مقياس محاسبه مي شوند دلايلی براي مظنون شدن به تغييرات کوچک ناممکن وجود دارد.

Cressie در ۱۹۸۲ فرض مي کند که داده هاي آزمايش فقط  تحقق های مستقل از توزيع هاي آماري که ميانگين هايشان ثابت ولي واريانس هايشان بطور محسوس متفاوت هستند، توصيف می کنند. تئوري يک نمونه استاندارد کاربرد زيادي ندارد. اما هنوز ساختن يک فاصله اطمينان براي ميانگين بر پايه آماره t وزني امکان پذير است.

فرض استقلال يک راه روشنتر براي تعميم مدل هاي آماري مي باشد. اما آيا مدل هاي کليتری براي هر مقدار علمي وجود دارد؟  اميدوارم که خواننده را متقاعد سازم که به اين سوال بطور قاطع پاسخ بلي دهد.

مدل داده هاي وابسته:

استقلال يک فرض خيلي راحت و مناسب است که بسياري از تئوري هاي آماري- رياضي را قابل فهم   مي کند. با اين وجود مدل هايی که وابستگی آماری را شامل می شوند اغلب واقعی تر هستند. دو دسته از مدل هايي که به طور مشترک مورد استفاده قرار مي گيرند شامل ساختارهاي همبستگي درون گروهی و ساختارهاي همبستگي جزء به جزء مي باشند. اين ها ميدان کوچکي براي داده هاي فضايي پيشنهاد  مي کنند که وابستگي در همه جهات از خودشان نشان می دهند.

ما تا کنون قادر به گريز از جهان سه بعدي که در آن زندگي مي کنيم نبوده ايم. مفهوم اينکه داده ها در زمان يا فضا به يکديگر نزديک باشند که به معنای همبستگی است، يک امر طبيعي است و بطور موفقيت آميزی توسط آماردانان مورد استفاده قرار گرفته است و توانسته اند پديده هاي فيزيکي و اجتماعي را مدل بندي کنند. مدل هاي  زمانی يا مدل هاي سري هاي زماني، از جمله مدلهاي مشهوری هستند که تاکنون شناخته  شده اند و معمولاً بر اساس هم توزيع بودن مشاهدات که وابسته به يکديگر و با يک وقفه زماني يکسان رخ مي دهند استوار هستند.

مدل هاي فضايي اخيراً به ادبيات آمار اضافه شده است. زمين شناسي، علم خاک، فرآيندهاي تصويري، اپيدميولوژي( علم بيماري هاي همه گير)، علم کشاورزي، زيست شناسی، علم جنگل، نجوم، هواشناسي يا هر رشته اي که با داده هاي جمع آوري شده از موقعيت هاي فضايي متفاوت کار مي کنند، نياز به گسترش مدل هايی دارند که نشان دهنده وجود وابستگی بين اندازه ها در موقعيت های مختلف می باشند. با اين وجود مدل هايي نياز است که تغييرپذيري بيشتري نسبت به همتاهاي زماني اشان داشته باشند. براي اينکه در گذشته و حال و آينده هيچ قياس و شباهتي در فضا نداشته ايم و علاوه بر اين منطقي نيست که فرض کنيم که موقعيت هاي فضايي داده ها به طور منظم رخ مي دهد (مانند اکثر مدل هاي سري زماني).

وقتي با داده هاي مربوط به فضا يا زمان سروکار داريم که نوع  وابستگي هايشان مشابه است، دو روش مي توان در نظر گرفت. ساختارهايي که از نمونه هاي مستقل مي توانند مدل بندي شوند.

مجموعه هاي داده هاي زمان- مکان هواشناسي به منظور بررسي مطالعات اثرات آلودگي هوايي جمع آوري شده اند، مثلاً باران اسيدي . مجموعه داده هاي روزانه يک تعداد از سال ها در موقعيت هاي متفاوت مثلاً شمالي ترين منطقه آمريکا، يک مجموعه داده ها ي چگال را بدست مي دهد. اما بيشتر آنها وابسته به زمانند، به زبان فضايي: داده ها هنوز نسبتاً  تنک و پراکنده اند. با اين وجود پيش بيني فضايي از لحاظ اهميت مشابه پيش بيني زماني است.

داده های فضايی و مدلهای فضايی:

اولين ظهور آمار در زمينه داده هاي فضايي با ايجاد فرمي از ترسيم داده ها پديد آمد. به عنوان مثال، Halley در ۱۶۸۶ ، براي يك ترسيم از فرم بادهاي زميني و تلاش براي ايجاد يك علامت فيزيكي براي جهت مسير بادها و بادهاي موسمي در بين و نزديك مدار راس السرطان روي هم گذاري کرده است.

مدلهاي فضايي بعدها بوجود آمدند. به عنوان مثال، Student در ۱۹۰۷ ، توزيع همه ذرات يك مايع  را بررسی کرده است. به جاي تحليل در مورد موقعيت فضايي آنها، او تراكم داده ها را بصورت تعداد ذرات در هر واحد مساحت حساب كرد. يک hemocytometer ( وسيله اندازه گيري تعداد گلبول هاي خون) که ۱mm2 را به ۴۰۰ مربع تقسيم می کند، براي شمارش گلبول ها مورد استفاده قرار گرفت.Student متوجه شد که توزيع تعداد گلبول ها در هر مربع از توزيع پواسن پيروي مي کند.

فيشر از وابستگي فضايي در آزمايش هاي ميداني در کشاورزي کاملاً آگاه بود، چون او از مدت ها قبل بدنبال اصلاح آن بود. او در دهه ۱۹۲۰ و ۱۹۳۰ در ايستگاه آزمايشي Rothamsted در انگلستان، اصولي از تصادف،‌ بلوکي و تکرار را ايجاد کرد. به هر حال بايد قبول کرد که تصادفي کردن، همبستگي فضايي را در مقياس هاي بزرگتر يا کوچکتر از بعد نمودارها از بين نمي برد.

Fairfield Smith در ارتباط با انتخاب بعد نمودارها  بود که هر افزايشي در بعد نمودارها بايد حاصل اندک کاهش در واريانس باشد. اگرچه تحليل او تجربي بود، اما خيلي از فرمول هاي مسائل حضور همبستگي فضايي در آزمايش هاي ميداني را تصديق مي کردند.

روشهاي نزديکترين همسايگي براي تحليل آزمايش هاي ميداني در کشاورزي تلاش هايي را براي گرفتن وابستگي فضايي بطور غيرمستقيم در تخمين ها دنبال مي کند، که بوسيله استفاده از باقيمانده ها براي نمودارهاي همسايگي به عنوان متغير کمکي، يا بوسيله اختلافشان انجام مي گيرد.

مدل فضايي کلي:

آمار در همه زمينه هايش برای تحليل داده هاي اکتشافي در کنار توزيع مجانبی  قضيه برآوردگرهای پارامتر روي چندين مدل تصادفي تکيه مي کند. بايد مدلي براي داده هاي فضايي ارائه کنيم که ساختار ساده آن به اندازه کافي تغييرپذيري را براي بکار بردن يک گروه بسيار بزرگ از مسائل  داشته باشد.  داده ها بايد گسسته يا پيوسته باشند.

آنها بايد تراکم هاي فضايي يا مشاهدات نقاطي در فضا باشند،  مکان هاي فضايي آنها بايد منظم يا غير منظم باشند، و آن مکان ها بايد بر يک مجموعه گسسته يا زنجيره فضايي باشند. در موارد نادر مدل هاي تصادفي براي خلاصه اي از داده هاي موجود يا پيش بيني داده هاي مشاهده نشده استفاده مي شوند. مدل بايد  بيان کند که چرا يک حادثه خاص اتفاق افتاده است، و همچنين بايد براي بيشتر پذيره هاي معمول استفاده از کلمه "مدل" را تشخيص دهيم.


منبع: وبلاگ statblue1