تکنيک هاي آماري استاندارد به کار برده مي شوند تا يک مدل آماري را بسازند و پارامترهاي مدل را برآورد کنند. به عنوان مثال Heyl and Cook در ۱۹۳۶آزمايشات انجام شده بين مي ۱۹۳۴ و ژولاي ۱۹۳۵ را براي تعيين شتاب جاذبه زمين در يک آزمايشگاه از واشنگتن توصيف کرده اند. روش استفاده شده، استفاده از آونگ متحرک بوده و ترکيب هاي متفاوت قطر لوله آونگ و نوع لبه تيغه آن، بکار گرفته شده بود. يک ترکيب خاص که بعد از مي و قبل از ژوئن 1934 بدست آمده ( بعد از تعديلات مناسب براي خميدگي و سرعت ساعت) بصورت زير می باشد:
76،82،83،54،35،46،87،68
اين که اين داده ها را می توان به عنوان رويدادی از يک نمونه تصادفي مدل بندي کرد احتمالاً يک فرض روشن و بي عيب است. اما آزمايش بعدي انجام شده تحت يک ترکيب و شکل متفاوت، انحرافات را به ما مي دهد. ( بعد از تعديلات مناسب به دست آمده است)
76،76،78،79،72،68،75،78
دوباره اين ها مي توانند به عنوان يک نمونه تصادفي مدل بندي شوند. اما براي اينکه هر آزمايش سعي بر آن دارد که ثابت فيزيکي مشابه را اندازه بگيرد، داده ها بطور واضح بايد به چندين روش ترکيب شوند.
سوالی که مطرح می شود اين است که آيا عيبی ندارد که ۱۶ عدد قبلي را به عنوان مشاهدات يک نمونه تصادفي مدل بندي کنيم؟
مدل داده هاي ناهمگن:
عدم همگني در داده ها معمولاً در مدل هاي آماري با فرض داشتن ميانگين غيرثابت محاسبه مي شود، معمولاً ميانگين ، يک ترکيب خطي از چندين متغير توصيفي مي باشد. با اين وجود، حتي بعد از اين که تغييرات با مقياس محاسبه مي شوند دلايلی براي مظنون شدن به تغييرات کوچک ناممکن وجود دارد.
Cressie در ۱۹۸۲ فرض مي کند که داده هاي آزمايش فقط تحقق های مستقل از توزيع هاي آماري که ميانگين هايشان ثابت ولي واريانس هايشان بطور محسوس متفاوت هستند، توصيف می کنند. تئوري يک نمونه استاندارد کاربرد زيادي ندارد. اما هنوز ساختن يک فاصله اطمينان براي ميانگين بر پايه آماره t وزني امکان پذير است.
فرض استقلال يک راه روشنتر براي تعميم مدل هاي آماري مي باشد. اما آيا مدل هاي کليتری براي هر مقدار علمي وجود دارد؟ اميدوارم که خواننده را متقاعد سازم که به اين سوال بطور قاطع پاسخ بلي دهد.
مدل داده هاي وابسته:
استقلال يک فرض خيلي راحت و مناسب است که بسياري از تئوري هاي آماري- رياضي را قابل فهم مي کند. با اين وجود مدل هايی که وابستگی آماری را شامل می شوند اغلب واقعی تر هستند. دو دسته از مدل هايي که به طور مشترک مورد استفاده قرار مي گيرند شامل ساختارهاي همبستگي درون گروهی و ساختارهاي همبستگي جزء به جزء مي باشند. اين ها ميدان کوچکي براي داده هاي فضايي پيشنهاد مي کنند که وابستگي در همه جهات از خودشان نشان می دهند.
ما تا کنون قادر به گريز از جهان سه بعدي که در آن زندگي مي کنيم نبوده ايم. مفهوم اينکه داده ها در زمان يا فضا به يکديگر نزديک باشند که به معنای همبستگی است، يک امر طبيعي است و بطور موفقيت آميزی توسط آماردانان مورد استفاده قرار گرفته است و توانسته اند پديده هاي فيزيکي و اجتماعي را مدل بندي کنند. مدل هاي زمانی يا مدل هاي سري هاي زماني، از جمله مدلهاي مشهوری هستند که تاکنون شناخته شده اند و معمولاً بر اساس هم توزيع بودن مشاهدات که وابسته به يکديگر و با يک وقفه زماني يکسان رخ مي دهند استوار هستند.
مدل هاي فضايي اخيراً به ادبيات آمار اضافه شده است. زمين شناسي، علم خاک، فرآيندهاي تصويري، اپيدميولوژي( علم بيماري هاي همه گير)، علم کشاورزي، زيست شناسی، علم جنگل، نجوم، هواشناسي يا هر رشته اي که با داده هاي جمع آوري شده از موقعيت هاي فضايي متفاوت کار مي کنند، نياز به گسترش مدل هايی دارند که نشان دهنده وجود وابستگی بين اندازه ها در موقعيت های مختلف می باشند. با اين وجود مدل هايي نياز است که تغييرپذيري بيشتري نسبت به همتاهاي زماني اشان داشته باشند. براي اينکه در گذشته و حال و آينده هيچ قياس و شباهتي در فضا نداشته ايم و علاوه بر اين منطقي نيست که فرض کنيم که موقعيت هاي فضايي داده ها به طور منظم رخ مي دهد (مانند اکثر مدل هاي سري زماني).
وقتي با داده هاي مربوط به فضا يا زمان سروکار داريم که نوع وابستگي هايشان مشابه است، دو روش مي توان در نظر گرفت. ساختارهايي که از نمونه هاي مستقل مي توانند مدل بندي شوند.
مجموعه هاي داده هاي زمان- مکان هواشناسي به منظور بررسي مطالعات اثرات آلودگي هوايي جمع آوري شده اند، مثلاً باران اسيدي . مجموعه داده هاي روزانه يک تعداد از سال ها در موقعيت هاي متفاوت مثلاً شمالي ترين منطقه آمريکا، يک مجموعه داده ها ي چگال را بدست مي دهد. اما بيشتر آنها وابسته به زمانند، به زبان فضايي: داده ها هنوز نسبتاً تنک و پراکنده اند. با اين وجود پيش بيني فضايي از لحاظ اهميت مشابه پيش بيني زماني است.
داده های فضايی و مدلهای فضايی:
اولين ظهور آمار در زمينه داده هاي فضايي با ايجاد فرمي از ترسيم داده ها پديد آمد. به عنوان مثال، Halley در ۱۶۸۶ ، براي يك ترسيم از فرم بادهاي زميني و تلاش براي ايجاد يك علامت فيزيكي براي جهت مسير بادها و بادهاي موسمي در بين و نزديك مدار راس السرطان روي هم گذاري کرده است.
مدلهاي فضايي بعدها بوجود آمدند. به عنوان مثال، Student در ۱۹۰۷ ، توزيع همه ذرات يك مايع را بررسی کرده است. به جاي تحليل در مورد موقعيت فضايي آنها، او تراكم داده ها را بصورت تعداد ذرات در هر واحد مساحت حساب كرد. يک hemocytometer ( وسيله اندازه گيري تعداد گلبول هاي خون) که ۱mm2 را به ۴۰۰ مربع تقسيم می کند، براي شمارش گلبول ها مورد استفاده قرار گرفت.Student متوجه شد که توزيع تعداد گلبول ها در هر مربع از توزيع پواسن پيروي مي کند.
فيشر از وابستگي فضايي در آزمايش هاي ميداني در کشاورزي کاملاً آگاه بود، چون او از مدت ها قبل بدنبال اصلاح آن بود. او در دهه ۱۹۲۰ و ۱۹۳۰ در ايستگاه آزمايشي Rothamsted در انگلستان، اصولي از تصادف، بلوکي و تکرار را ايجاد کرد. به هر حال بايد قبول کرد که تصادفي کردن، همبستگي فضايي را در مقياس هاي بزرگتر يا کوچکتر از بعد نمودارها از بين نمي برد.
Fairfield Smith در ارتباط با انتخاب بعد نمودارها بود که هر افزايشي در بعد نمودارها بايد حاصل اندک کاهش در واريانس باشد. اگرچه تحليل او تجربي بود، اما خيلي از فرمول هاي مسائل حضور همبستگي فضايي در آزمايش هاي ميداني را تصديق مي کردند.
روشهاي نزديکترين همسايگي براي تحليل آزمايش هاي ميداني در کشاورزي تلاش هايي را براي گرفتن وابستگي فضايي بطور غيرمستقيم در تخمين ها دنبال مي کند، که بوسيله استفاده از باقيمانده ها براي نمودارهاي همسايگي به عنوان متغير کمکي، يا بوسيله اختلافشان انجام مي گيرد.
مدل فضايي کلي:
آمار در همه زمينه هايش برای تحليل داده هاي اکتشافي در کنار توزيع مجانبی قضيه برآوردگرهای پارامتر روي چندين مدل تصادفي تکيه مي کند. بايد مدلي براي داده هاي فضايي ارائه کنيم که ساختار ساده آن به اندازه کافي تغييرپذيري را براي بکار بردن يک گروه بسيار بزرگ از مسائل داشته باشد. داده ها بايد گسسته يا پيوسته باشند.
آنها بايد تراکم هاي فضايي يا مشاهدات نقاطي در فضا باشند، مکان هاي فضايي آنها بايد منظم يا غير منظم باشند، و آن مکان ها بايد بر يک مجموعه گسسته يا زنجيره فضايي باشند. در موارد نادر مدل هاي تصادفي براي خلاصه اي از داده هاي موجود يا پيش بيني داده هاي مشاهده نشده استفاده مي شوند. مدل بايد بيان کند که چرا يک حادثه خاص اتفاق افتاده است، و همچنين بايد براي بيشتر پذيره هاي معمول استفاده از کلمه "مدل" را تشخيص دهيم.
منبع: وبلاگ statblue1