دادههای مقطعی صرف و سری زمانی صرف، ناهمسانیهای فردی[۴۵] را لحاظ نمیکنند لذا ممکن است که تخمین های تورشداری به دست دهند، در حالی که در دادههای تابلویی میتوان با لحاظ کردن متغیرهای ویژه فردی[۴۶] این ناهمسانیها را لحاظ نمود.
دادههای تابلویی دارای اطلاعات بیشتر، تغییرپذیری بیشتر، همخطی کمتر، درجه آزادی بالاتر و کارآیی بالاتر نسبت به سری زمانی و دادههای مقطعی میباشند. به خصوص این که یکی از روشهای کاهش همخطی، ترکیب دادههای مقطعی و زمانی به صورت داده های تابلویی میباشد.
در محاسبه واریانس جامعه با توجه به مشاهدات مربوط به سری زمانی، واریانس به دست آمده از مشاهدات بر تعداد داده ها منهای تعداد پارامترها تقسیم می شود.
(۹٫۳)
در حالی که در داده های تلفیقی داریم:
(۱۰٫۳)
که معمولاً در این حالت مخرج بزرگ تر است و بنابراین واریانس محاسبه شده کوچکتر از واریانس به دست آمده از داده های سری زمانی صرف می باشد و بنابراین کارآیی تخمین افزایش می یابد.
به همین دلیل چنانچه آزمون (آزمون معنی دار بودن کل رگرسیون) را در دو حالت، یعنی سری زمانی و تلفیقی مقایسه کنیم خواهیم داشت:
در الگو سری زمانی تنها:
(۱۱٫۳)
در صورتی که در الگو تلفیقی به صورت زیر محاسبه می گردد:
(۱۲٫۳)
به وضوح مشخص است که مقدار در الگو تلفیقی می تواند بزرگ تر از الگو سری زمانی باشد، لذا احتمال معنی دار بودن کل رگرسیون یعنی وجود متغیرهایی توضیحی در الگو تلفیقی بیشتر خواهد بود.
مطالعه مشاهدات به صورت داده های تابلویی ، وضعیت بهتری برای مطالعه و بررسی پویایی تغییرات نسبت به سری زمانی و دادههای مقطعی دارد.
الگو های داده های تابلویی میتواند اثراتی که به سادگی توسط سری زمانی و دادههای مقطعی آشکار نمیشوند را اندازهگیری کند.
الگو های داده های تابلویی ما را قادر میسازد تا مشکلترین الگو های رفتاری پیچیده را مطالعه کنیم. به طور مثال صرفههای اقتصادی و تغییرات تکنیکی بهتر میتواند توسط داده های تابلویی بررسی و آزمون شوند.
۲٫۴٫۳٫ فرم کلی دادههای تابلویی
در این قسمت با ارائه یک مثال کلی به توضیح داده های تابلویی می پردازیم، فرض کنیم که واحد تصمیم مجزا وجود دارد که با شاخص i از ۱ تا شمارهگذاری میشوند همچنین دوره زمانی متوالی که با شاخص از ۱ تا شمارهگذاری میشوند وجود دارد. بنابراین، مجموع مشاهده خواهیم داشت. متغیرها عبارتند از:
: ارزش متغیر وابسته برای واحدi ام در دوره t ام.
: ارزش متغیر توضیحی j ام برای واحد i ام در دوره t ام.
رگرسیون خطی این داده های تابلویی ، عبارت است از:
( ۱۳٫۳)
در این رگرسیون دستگاه عمومی پارامترهای تمام واحدها در تمام زمانها بیان گردیده است. یکی از معمولیترین اشکال سازماندهی دادهها در رابطه (۴-۱۳) براساس واحدهای تصمیمگیری است. بنابراین داریم:
(۱۴٫۳)
همچنین دادهها میتوانند به شکل انباشته به صورت زیر بیان گردند:
(۱۵٫۳)
به طوری که Y دارای رتبه ۱×n، X دارای رتبه k×n و e دارای رتبه ۱×n میباشد. همچنین ممکن است رابطه (۴-۹) به صورت زیر بیان گردد:
(۱۶٫۳)
به طوری که i یک بردار ۱×n از واحدها، اسکالر و میباشند. اختلاف بین مقاطع (بنگاهها، کشورها، مسیرها، استانها و …) در نشان داده میشود و در طول زمان ثابت فرض میگردد. اگر فرض ما این باشد که برای تمام بنگاهها ثابت است، روش OLS تخمینهای کارا و سازگاری از به دست خواهد داد. ولی اگر فرض کنیم که در بین مقاطع مختلف اختلاف وجود دارد، باید از روشهای دیگری برای تخمین استفاده شود.
اگر مشاهدات مربوط به تک تک مقاطع در دورههای یکسان و ثابت قرار داشته باشد (یعنی تعداد مشاهدات هریک از آنها با هم برابر باشند) در این حالت میگوییم که الگوی داده های تابلویی تعادلی است. ولی اگر مشاهدات مربوط به تک تک مقاطع با هم متفاوت و در دورههای مختلفی نیز باشند، هرچند ممکن است تعداد مشاهدات یکسان باشد، اما چون در دورههای متفاوت هستند به این حالت الگوی داده های تابلویی غیرتعادلی میگویند[۴۷].
۳٫۴٫۳٫ الگو اثرات ثابت و تصادفی
برآورد روابطی که در آنها از دادههای تابلویی (مقطعی ـ سری زمانی) استفاده میشود، غالباً با پیچیدگیهایی مواجه است. فرض میشود جمله اختلال دارای میانگین صفر و واریانس ثابت است. پارامترهای مجهول الگو هستند که واکنش متغیر وابسته نسبت به تغییرات k امین متغیر مستقل در i امین مقطع را در زمان t اندازهگیری میکند. در حالت کلی فرض میشود که این ضرایب در میان تمامی واحدهای مقطعی و زمانی مختلف متفاوت است، ولی در بسیاری از مطالعات پژوهشی متغیر بودن این ضرایب، هم برای تمامی مقاطع و هم برای تمامی زمانها محدود کننده است و پژوهشگر خود باید نسبت به ماهیت موضوع مورد مطالعه و سایر شرایط، فرضهای مقتضی را در خصوص پارامترها تعیین کند.
الگوی خطی داده های تابلویی (۴-۶) را میتوان به پنج حالت تقسیم کرد:
تمامی ضرایب ثابتند و فرض میشود که جمله اخلال قادر است تمام تفاوتهای میان واحدهای مقطعی و زمان را دریافت کند و توضیح دهد.
(۱۷٫۳)
ضرایب مربوط به متغیرها (شیبها) ثابتند و تنها عرض از مبدأ برای واحدهای مختلف مقطعی متفاوت است.
(۱۸٫۳)
ضرایب مربوط به متغیرها (شیبها) ثابتند و تنها عرض از مبدأ در زمانها و واحدهای مختلف مقطعی تغییر میکند.
(۱۹٫۳)
همه ضرایب برای تمام واحدهای مقطعی متفاوت است.
(۲۰٫۳)
تمام ضرایب هم نسبت به زمان هم نسبت به واحدهای مقطعی متفاوت است.
(۲۱٫۳)
این پنج مورد در دو قالب کلی الگو های اثرات ثابت[۴۸] و اثرات تصادفی[۴۹] قابل بیان و بررسی میباشند. به طور کلی در الگو های نوع اول (اثرات ثابت) فرض میشود که اختلاف میان واحدها میتواند در عرض از مبدأ خود را نشان دهد. بنابراین هر واحد میتواند دارای یک جزء عرض از مبدأ باشد که تخمین زده میشود. اما در الگو های نوع دوم (اثرات تصادفی) برخلاف الگو های نوع اول که فرض میکنند تفاوت میان واحدها سبب انتقال تابع رگرسیون میشود و به عناصر خارج از الگو توجهی نمینمایند، جزء عرض از مبدأ را دارای توزیع تصادفی میداند. طبعاً باید حجم نمونه به اندازه کافی بزرگ باشد تا بتوان چنین فرضی را در نظر گرفت. لذا جزء عرض از مبدأ در این الگو دارای یک قسمت ثابت و یک قسمت تصادفی میباشد و فروض حاکم بر این جزء تصادفی شبیه فروض حاکم بر جزء اخلال بوده و این دو، جزء اخلال جدیدی به وجود میآورند.
۴٫۴٫۳٫ آزمون F (حداکثر درست نمایی)
آنچه به طور کلی در الگو های داده های تابلویی مطرح میگردد این است که فرضاً واحد تصمیم مجزا وجود دارند که با شاخص i از ۱ تا شمارهگذاری میشوند و همچنین دوره زمانی متوالی وجود دارد که در مجموع مشاهده خواهیم داشت. اگر رگرسیون خطی داده های تابلویی ، به صورت زیر باشد:
(۲۲٫۳)
متغیرها عبارتند از:
فرم در حال بارگذاری ...