МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
Федеральное государственное бюджетное
образовательное учреждение высшего
образования
«ДАГЕСТАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Факультет Управления
ЛАБОРАТОРНЫЙ ПРАКТИКУМ
по дисциплине
ЭКОНОМЕТРИКА
Кафедра Математического моделирования, эконометрики и
статистики
Разработчик:
ст.преп. кафедры Османова
М.М.
Оглавление
Лабораторная работа №1. Парная
регрессия и корреляция.
1.2
Реализация типовых задач на компьютере.
Лабораторная
работа №2. Множественная регрессия и
корреляция.
2.2.Технология
решения задач корреляционного и регрессионного анализа с помощью пакета
анализа.
Лабораторная
работа № 3. «Анализ и прогнозирование временных рядов в среде Excel»
1. Основные понятия и определения.
2. Анализ
временных рядов с помощью инструмента Excel-Мастер Диаграмм
Парная регрессия - уравнение связи двух
переменных у
и х:
где y - зависимая переменная (результативный признак);
x - независимая, объясняющая
переменная (признак-фактор).
Различают
линейные и нелинейные регрессии.
Линейная
регрессия: y=a+b×x+ε.
Нелинейные
регрессии делятся на два класса: регрессии, нелинейные относительно включенных
в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и
регрессии, нелинейные по оцениваемым параметрам.
Регрессии,
нелинейные по объясняющим переменным:
·
полиномы разных степеней y=a+b1×x+b2×x2+b3× x3+ε
·
равносторонняя гипербола
Регрессии, нелинейные по оцениваемым параметрам:
·
степенная y=a× xb×ε
·
показательная y=a× bx×ε
·
экспоненциальная y=ea+b×x×ε
Построение уравнения
регрессии сводится к оценке ее параметров. Для оценки параметров регрессий,
линейных по параметрам, используют метод наименьших квадратов (МНК). МНК
позволяет получить такие оценки параметров, при которых сумма квадратов
отклонений фактических значений результативного признака у
от теоретических минимальна, т.е.
Для линейных и нелинейных
уравнений, приводимых к линейным, решается следующая
система относительно а и Ь:
Можно
воспользоваться готовыми формулами, которые вытекают из этой системы:
Тесноту связи изучаемых
явлений оценивает линейный коэффициент
парной корреляции rxy, для линейной
регрессии (-1£ rxy£1):
и индекс корреляции ρxy для нелинейной регрессии (0£ ρxy£1):
Оценку качества
построенной модели даст коэффициент (индекс) детерминации, а также средняя
ошибка аппроксимации.
Средняя ошибка
аппроксимации - среднее отклонение
расчетных значений от фактических:
Допустимый предел
значений - не более 8 - 10%.
Средний
коэффициент эластичности показывает, на сколько
процентов в среднем по совокупности изменится результат у
от своей средней величины при изменении фактора х на 1% от своего среднего значения:
Задача дисперсионного анализа состоит в анализе
дисперсии зависимой переменной:
где - общая сумма квадратов отклонений;
- сумма квадратов отклонений, обусловленная регрессией
(«объясненная» или
«факторная»);
- остаточная сумма квадратов
отклонений.
Долю дисперсии, объясняемую
регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R2:
.
Коэффициент детерминации - квадрат коэффициента или индекса
корреляции.
F-mecm - оценивание качества уравнения регрессии - состоит в проверке гипотезы Но статистической не
значимости уравнения регрессии и показателя тесноты связи. Для этого
выполняется сравнение фактического Fфакг и критического (табличного)
Fтабл значений F-критерия Фишера. Fфакт
определяется из соотношения значений факторной и остаточной дисперсий,
рассчитанных на одну степень свободы:
где п —
число единиц совокупности;
m - число параметров при переменных
x..
Fтабл - это максимально возможное значение критерия под влиянием случайных
факторов при данных степенях свободы и уровне значимости а. Уровень значимости а - вероятность отвергнуть правильную
гипотезу при условии, что она верна. Обычно а принимается равной 0,05 или 0,01.
Если Fтабл <
Fфакг,
то Hо - гипотеза о случайной природе оцениваемых
характеристик отклоняется и признается их статистическая значимость и
надежность. Если Fтабл >
Fфакг,
то гипотеза Hо не отклоняется и
признается статистическая не значимость, ненадежность y уравнения регрессии.
Для оценки статистической значимости коэффициентов регрессии
и корреляции рассчитываются t-критерий Стьюдента и доверительные
интервалы каждого из показателей. Выдвигается гипотеза Но о случайной природе показателей, т.е. о незначимом их отличии от
нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью
меритерия Стьюдента проводится путем сопоставления их значений с величиной
случайной ошибки:
Случайные ошибки параметров
линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и
критическое (табличное) значения t-статистики –
t-табл и tфакг - принимаем или отвергаем гипотезу Hо
Связь между F-критерием Фишера и f-статистикой Стьюдента выражается равенством
Если tтабл <
tфакг,
то Но отклоняется, т.е. a, b и rxy не случайно отличаются от нуля и
сформировались под влиянием систематически действующего фактора х. Если tтабл >
tфакт.
то гипотеза Но не отклоняется и признается случайная природа формирования а, b или rxy
Для расчета
доверительного интервала определяем предельную
ошибку Δ для каждого показателя:
Δa=tтаблmа, Δb=tтаблmb,
Формулы для расчета доверительных интервалов имеют следующий
вид:
Если в границы
доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а
верхняя положительна, то оцениваемый параметр принимается нулевым,
так как он не может одновременно принимать и положительное, и отрицательное
значения.
Прогнозное значение yp определяется путем подстановки в уравнение
регрессии соответствующего
(прогнозного) значения Хр. Вычисляется
средняя стандартная ошибка прогноза
где
и строится доверительный
интервал прогноза:
где
Решение с помощью ППП Excel
1. Встроенная статистическая функция
ЛИНЕЙН определяет параметры линейной регрессии y=a+b×x.
Порядок вычисления следующий:
1. введите исходные данные или
откройте существующий файл, содержащий анализируемые данные;
2. выделите область пустых
ячеек 5х2 (5 строк, 2 столбца) для вывода результатов
регрессионной статистики или область 1х2 -
для получения только оценок коэффициентов регрессии;
3. активизируйте Мастер функций
любым из способов:
а) в главном меню выберите
Вставка/Функция;
б) на панели инструментов Стандартная
щелкните по кнопке
Вставка/Функция;
4. окне Категория (рис. 1.1) выберите Статистические, в окне- ЛИНЕЙН.
Щелкните по кнопке ОК;
5. заполните аргументы функции
(рис. 1.2):
Рис. 1.1. Диалоговое окно
«Мастер функций»
Известные_значения_у - диапазон, содержащий данные
результативного признака;
Рис. 1.2. Диалоговое окно ввода аргументов функции ЛИНЕЙН
Известные_значения_х - диапазон, содержащий данные
факторов независимого признака;
Константа - логическое значение, которое указывает на
наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным
образом, если Константа = 0, то
свободный член равен 0;
Статистика - логическое значение, которое указывает, выводить
дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится,
если Статистика = 0, то выводятся только оценки параметров
уравнения.
Щелкните по кнопке ОК;
6. в левой верхней ячейке
выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть
всю таблицу, нажмите на клавишу <F2>, а затем - на комбинацию клавиш <CTRL>+<SHIFT>+<ENTER>.
Дополнительная регрессионная
статистика будет выводиться в порядке, указанном в следующей схеме:
Значение коэффициента b |
Значение коэффициента а |
Среднеквадратическое отклонение b |
Среднеквадратическое отклонение а |
Коэффициент детерминации R2 |
Среднеквадратическое отклонение у |
F-статистика |
Число степеней свободы |
Регрессионная сумма квадратов |
Остаточная сумма квадратов |
Для вычисления
параметров экспоненциальной кривой y=α×βx в MS Excel применяется встроенная
статистическая функция ЛГРФПРИБЛ.
Порядок вычисления аналогичен применению функции ЛИНЕЙН.
Для данных из примера 2 результат вычисления функции ЛИНЕЙН представлен на рис. 1.3, функции ЛГРФПРИБЛ - на рис.1.4.
Рис. 1.3. Результат вычисления функции ЛИНЕЙН
Рис. 1.4. Результат вычисления функции ЛГФПРИБЛ
2.С помощью инструмента анализа данных Регрессия, помимо результатов регрессионной статистики,
дисперсионного анализа и доверительных интервалов, можно получить остатки и
графики подбора линии регрессии, остатков и нормальной вероятности. Порядок
действий следующий:
1)
проверьте доступ к
пакету анализа. В главном меню последовательно выберите Сервис /Надстройки. Установите флажок Пакет анализа (рис. 1.5);
Рис. 1.5. Подключение надстройки Пакет анализа.
2) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;
3) заполните диалоговое окно ввода данных и параметров
вывода (рис. 1.6):
Входной интервал Y - диапазон, содержащий данные результативного признака;
Входной интервал Х - диапазон, содержащий данные факторов
независимого признака;
Метки - флажок, который указывает, содержит ли первая строка названия
столбцов или нет;
Константа - ноль -
флажок, указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал - достаточно указать левую верхнюю ячейку
будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового листа.
Если необходимо получить информацию и графики остатков, установите
соответствующие флажки в диалоговом окне. Щелкните по кнопке OK.
Рис. 1.6. Диалоговое окно ввода
параметров инструмента Регрессия.
Рис. 1.7. Результат применения
инструмента Регрессия.
В задачах 1-8 выполните:
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о
форме связи
2. Рассчитайте параметры
уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной,
гиперболической регрессии.
3. Оцените тесноту связи с помощью показателей
корреляции и детерминации
4. "Дайте с помощью
среднего (общего) коэффициента эластичности сравнительную оценку силы связи
фактора с результатом.
5. Оцените с помощью средней
ошибки аппроксимации качество уравнений.
6. Оцените с помощью F-критерия Фишера статистическую надежность
результатов регрессионного моделирования. По значениям характеристик,
рассчитанных в пп. 4,
5 и данном пункте, выберите лучшее уравнение регрессии и дайте его
обоснование.
7. Рассчитайте прогнозное
значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите
доверительный интервал прогноза для уровня значимости =0,05.
8. Оцените полученные результаты, выводы оформите в аналитической
записке.
Задача 1. По территориям Центрального
района известны данные за
Таблица 1.1
Район |
Доля денежных
доходов, направленных на прирост сбережений во вкладах.
займах. сертификатах и на покупку валюты, в общей
сумме среднедушевого денежного дохода, %,
у |
Среднемесячная
начисленная заработная плата, тыс. руб., х |
Брянская обл. |
6,9 |
289 |
Владимирская обл. |
8,7 |
334 |
Ивановская обл. |
6,4 |
300 |
Калужская обл. |
8,4 |
343 |
Костромская обл. |
6,1 |
356 |
Орловская обл. |
9,4 |
289 |
Рязанская
обл. |
11,0 |
341 |
Смоленская обл. |
6,4 |
327 |
Тверская
обл. |
9,3 |
357 |
Тульская обл. |
8,2 |
352 |
Ярославская обл. |
8,6 |
381 |
Задача 2.
По территориям Центрального
района известны данные за
Таблица 1.2
Район |
Средний размер
назначенных ежемесячных пенсий, тыс. руб., у |
Прожиточный
минимум в среднем на одного пенсионера в месяц, тыс. руб., х |
Брянская обл. |
240 |
178 |
Владимирская обл. |
226 |
202 |
Ивановская обл. |
221 |
197 |
Калужская обл. |
226 |
201 |
Костромская обл. |
220 |
189 |
г. Москва |
250 |
302 |
Московская обл. |
237 |
215 |
Орловская обл. |
232 |
166 |
Рязанская обл. |
215 |
199 |
Смоленская обл. |
220 |
180 |
Тверская обл. |
222 |
181 |
Тульская обл. |
231 |
186 |
Ярославская обл. |
229 |
250 |
Задача 3.
По территориям Центрального и
Волго-Вятского районов известны данные за ноябрь
Таблица 1.3
Район |
Средняя
заработная плата и выплаты социального характера, тыс. руб., у |
Прожиточный
минимум в среднем на душу населения, тыс. руб., х |
Центральный |
|
|
Брянская обл. |
615 |
289 |
Владимирская обл. |
727 |
338 |
Ивановская обл. |
584 |
287 |
Калужская обл. |
753 |
324 |
Костромская обл. |
707 |
307 |
Орловская обл. |
653 |
304 |
Рязанская обл. |
654 |
307 |
Смоленская обл. |
693 |
290 |
Тверская обл. |
704 |
314 |
Тульская обл. |
780 |
304 |
Ярославская обл. |
830 |
341 |
Волго-Вятский район |
|
|
Респ. Марий Эл |
554 |
364 |
Респ. Мордовия |
560 |
342 |
Чувашская Респ. |
545 |
310 |
Кировская обл. |
672 |
411 |
Нижегородская обл. |
796 |
304 |
Задача 4.
По территориям
Волго-Вятского, Центрально-Черноземного и Поволжского районов известны данные
за ноябрь
Таблица 1.4
Район |
Потребительские
расходы в расчете на душу населения, тыс. руб., у |
Средняя
заработная плата и выплаты социального характера, тыс. руб., х |
Волго-Вятский |
|
|
Респ. Марий Эл |
302 |
554 |
Респ. Мордовия |
360 |
560 |
Чувашская Респ. |
310 |
545 |
Кировская обл. |
415 |
672 |
Нижегородская обл. - |
452 |
796 |
Центрально-Черноземный |
|
|
Белгородская обл. |
502 |
777 |
Воронежская обл. |
355 |
632 |
Курская обл. |
416 |
688 |
Липецкая обл. |
501 |
833 |
Тамбовская обл. |
403 |
577 |
Поволжский |
|
|
Респ. Калмыкия |
208 |
584 |
Респ. Татарстан |
462 |
949 |
Астраханская
обл. |
368 |
888 |
Волгоградская обл. |
399 |
831 |
Пензенская обл. |
342 |
562 |
Саратовская обл. |
354 |
665 |
Ульяновская обл. |
558 |
705 |
Задача 5.
По территориям Северного,
Северо-западного и Центрального районов известны данные за ноябрь
Таблица 1.5
Район |
Потребительские
расходы на душу населения, тыс. руб., у |
Денежные доходы
на душу населения, тыс. руб., х |
Северный |
|
|
Респ. Карелия |
596 |
913 |
Респ. Коми |
417 |
1095 |
Архангельская обл. |
354 |
606 |
Вологодски обл. |
526 |
876 |
Мурманская обл. |
934 |
1314 |
Сеаеро-Западный |
|
|
Ленинградская обл. |
412 |
593 |
Новгородская обл. |
525 |
754 |
Псковская обл. |
367 |
528 |
Центральный |
|
|
Брянская обл. |
364 |
520 |
Владимирская обл. |
336 |
539 |
Ивановская обл. |
409 |
540 |
Калужская обл. |
452 |
682 |
Костромская обл. |
367 |
537 |
Московская обл. |
328 |
589 |
Орловская обл. |
460 |
626 |
Рязанская обл. |
380 |
521 |
Смоленская обл. |
439 |
626 |
Тверская обл. |
344 |
521 |
Тульская обл. |
401 |
658 |
Ярославская обл. |
514 |
746 |
Задача 6.
По территориям
Восточно-Сибирского и Дальневосточного районов известны данные за ноябрь
Таблица 1.6
Район |
Потребительские
расходы на душу населения, тыс. руб., у |
Денежные доходы
на душу населения, тыс. руб., х |
Восточно-Сибирский |
|
|
"Респ. Бурятия |
408 |
524 |
Рссп. Тыва |
249 |
371 |
Респ. Хакасия |
253 |
453 |
Красноярский край |
580 |
1006 |
Иркутская обл. |
651 |
997 |
Усть-Ордынский Бурятский авт. округ. |
139 |
217 |
Читинская обл. |
322 |
486 |
Респ. Саха (Якутия) |
899 |
1989 |
Еврейская
авт. обл. |
330 |
595 |
Чукотский
авт. округ |
446 |
1550 |
Приморский край |
642 |
937 |
Хабаровский край |
542 |
761 |
Амурская
обл. |
504 |
767 |
Камчатская
обл. |
861 |
1720 |
Магаданская
обл. |
707 |
1735 |
Сахалинская
обл. |
557 |
1052 |
Задача 7
По территориям
Уральского и Западно-Сибирского районов известны данные за ноябрь
Таблица 1.7
Район |
Потребительские
расходы на душу населения, тыс. руб., у |
Денежные доходы
на душу населения, тыс. руб., х |
Уральский |
|
|
Респ. Башкортостан |
461 |
632 |
Удмуртская Респ. |
524 |
738 |
Курганская обл. |
298 |
515 |
Оренбургская обл. |
351 |
640 |
Пермская обл. |
624 |
942 |
Свердловская обл. |
584 |
888 |
Челябинская обл. |
425 |
704 |
Западносибирский район |
|
|
Респ. Алтай |
277 |
603 |
Алтайский край |
321 |
439 |
Кемеровская обл. |
573 |
985 |
Новосибирская обл. |
576 |
737 |
Омская обл. |
588 |
760 |
Томская обл. |
497 |
830 |
Тюменская обл. |
863 |
2093 |
Задача 8.
По территориям Уральского и
Западно-Сибирского районов известны данные за ноябрь
Таблица 1.8
Район |
Потребительские
расходы на душу населения, тыс. руб., у |
Средняя
заработная плата и выплаты социального характера, тыс. руб., х |
Уральский |
|
|
Респ. Башкортостан |
461 |
912 |
Удмуртская Респ. |
524 |
809 |
Курганская обл. |
298 |
748 |
Оренбургская обл. |
351 |
847 |
Пермская обл. |
624 |
1087 |
Свердловская обл. |
584 |
1074 |
Челябинская обл. |
425 |
1008 |
Западно-Сибирский |
|
|
Респ. Алтай |
277 |
682 |
Алтайский край |
321 |
697 |
Кемеровская обл. |
573 |
1251 |
Новосибирская обл. |
576 |
967 |
Омская обл. |
588 |
898 |
Томская обл. |
497 |
1263 |
Тюменская обл. |
863 |
3027 |
Задача 9.
По 20 регионам страны изучается зависимость
уровня безработицы у (%) от индекса
потребительских цен x (% к предыдущему году). Информация о логарифмах исходных показателей
представлена в табл. 1.9.
Таблица 1.9
Показатель |
In x; |
In у |
Среднее значение |
0,6 |
1,0 |
Среднее квадратическое
отклонение |
0,4 |
0,2 |
Известно также,
что коэффициент корреляции между логарифмами исходных показателей составил rlnx lny = 0,8.
Задание
1. Постройте уравнение
регрессии зависимости уровня безработицы от индекса потребительских цен в
степенной форме.
2. Дайте интерпретацию коэффициента эластичности данной модели регрессии.
3. Определите значение коэффициента детерминации и поясните его смысл.
Задача 10.
Изучается
зависимость материалоемкости продукции от размера предприятия по 10 однородным заводам (табл. 1.10).
Таблица 1.10
Показатель |
Материалоемкость
продукции по заводам |
|||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Потреблено материалов на единицу продукции, кг |
9 |
6 |
5 |
4 |
3,7 |
3,6 |
3,5 |
6 |
7 |
3,5 |
Выпуск продукции, тыс. ед. |
100 |
200 |
300 |
400 |
500 |
600 |
700 |
150 |
120 |
250 |
Задание
1. Найдите параметры уравнения
2. Оцените тесноту связи с помощью индекса корреляции.
3. Охарактеризуйте эластичность изменения материалоемкости
продукции.
4. Сделайте вывод о значимости уравнения регрессии.
Оцените полученные результаты, выводы оформите в аналитической
записке.
Множественная
регрессия – уравнение связи с несколькими независимыми переменными:
Y=f(x1, x2,…..,xp),
где у - зависимая переменная
(результативный признак);
x1, x2,…..,xp), - независимые переменные (факторы).
Основными этапами
построения модели множественной регрессии являются:
1. Построение системы
показателей (факторов). Сбор и предварительный анализ исходных данных.
Построение матрицы коэффициентов парной корреляции.
2. Выбор вида модели и
численная оценка ее параметров.
3. Проверка качества модели.
4. Оценка влияния отдельных
факторов на основе модели.
5. Прогнозирование на основе
модели регрессии.
Построение системы показателей (факторов). Анализ
матрицы коэффициентов парной корреляции
Выбор факторов, влияющих на
исследуемый показатель, производится, прежде всего, исходя из содержательного
экономического анализа. Для получения надежных оценок в модель не следует
включать слишком много факторов. Их число не должно превышать одной трети
объема имеющихся данных (т.е. m ≤n/3)* . Для определения наиболее существенных
факторов могут быть использованы коэффициенты линейной и множественной
корреляции, детерминации частных коэффициентов корреляции.
Отбор факторов для построения многофакторных моделей производится на
основе качественного и количественного анализа социально-экономических явлений
с использованием статистических и математических критериев.
Формирование базы исходных данных. Сначала на основании содержательного
анализа составляется перечень показателей, которые предполагается включить в
модель. Затем производится сбор статистической информации и предварительный
анализ данных.
Значения переменных Y и X, содержащиеся в наблюдаемой совокупности, записываются в
таблицу исходных данных (табл. 4.1.1).
На второй стадии производятся сравнительная оценка и отсев части
факторов. Это достигается анализом парных коэффициентов корреляции и оценкой (4.1.1) их значимости (4.1.2). Для этого составляется матрица парных коэффициентов
корреляции, измеряющих тесноту связи каждого из факторов-признаков с
результативным фактором и между собой (табл.
4.1.2).
Таблица 2.1
№ п/п |
Y |
X1 |
X2 |
….. |
Xm |
1 |
Y |
X11 |
X21 |
….. |
Xm1 |
….. |
… |
… |
….. |
….. |
….. |
n |
Yn |
X1n |
X2n |
….. |
Xmn |
Определение значения коэффициента корреляции. Коэффициент корреляции
определяется по формуле:
где
факторы |
Y |
X1 |
X2 |
…….. |
Xm |
Y |
1 |
Xyx1 |
Xyx2 |
…….. |
Xyxm |
X1 |
Xyx1 |
1 |
Xx1x2 |
…….. |
Xx1xm |
X2 |
Xyx2 |
Xx1x2 |
1 |
…….. |
Xx2xm |
…….. |
…….. |
…….. |
…….. |
…….. |
…….. |
Xm |
Xyx |
Xx1xm |
Xx2xm |
…….. |
1 |
Интерпретация полученной
оценки коэффициента корреляции. Значение коэффициентов парной корреляции лежит
в интервале от -1 до +1. Его положительное значение свидетельствует
о прямой связи, отрицательное - об обратной, т.е. когда растет одна переменная, другая уменьшается.
Чем ближе его значение к 1, тем теснее
связь. Связь считается достаточно сильной, если коэффициент корреляции по
абсолютной величине превышает 0.7. и
слабой, если меньше 0.4. При равенстве
его нулю связь полностью отсутствует. Этот коэффициент дает объективную оценку
тесноты связи лишь при линейной зависимости переменных.
Диаграмма, на которой
изображается совокупность значений двух признаков, называется корреляционным
полем. Каждая точка этой диаграммы имеет координаты X, и У,. По мере того, как возрастает сила линейной связи, точки
на графике будут лежать более близко к прямой линии, а величина г будет ближе к
Проверка значимости линейного
коэффициента корреляции. Для оценки значимости коэффициента корреляции
применяется t- критерий Стьюдента. При этом фактическое значение этого критерия
определяется по формуле:
(2.1.2)
Вычисленное по этой формуле значение tнабл сравнивается с критическим значением
t-критерия, которое берется из таблицы значений t Стьюдента с учетом
заданного уровня значимости (а = 0,05) и
числа степеней свободы (n-2).
Если tнабл >t кр, то полученное значение
коэффициента корреляции
признается значимым (т.е. нулевая гипотеза,
утверждающая равенство
нулю коэффициента корреляции, отвергается). Таким образом
делается вывод о том, что между исследуемыми переменными есть тесная
статистическая взаимосвязь.
В модель включают те факторы, связь которых с зависимой переменной
наиболее сильная.
В качестве критерия мультиколлинеарности
может быть принято соблюдение следующих неравенств:
Если приведенные неравенства (или хотя бы одно из них) не выполняются,
то в модель включают тот фактор, который наиболее тесно связан с Y.
Мулътиколлинеарность. Одним из условий
регрессионной модели является предположение о линейной независимости
объясняющих переменных, т.е. решение задачи возможно лишь тогда, когда столбцы
и строки матрицы исходных данных линейно независимы. Для экономических
показателей это условие выполняется не всегда. Линейная или близкая к ней связь
между факторами называется мультиколлинеарностью и
приводит к линейной зависимости нормальных уравнений, что делает вычисление
параметров либо невозможным, либо затрудняет содержательную интерпретацию
параметров модели. Мультиколлинеар-ность может
возникать в силу разных причин. Например, несколько независимых переменных
могут иметь общий временной тренд, относительно которого они совершают малые
колебания. В частности, так может случиться, когда значения одной независимой
переменной являются лагированными значениями другой.
Считают явление мультиколлинеарности в исходных
данных установленным, если коэффициент парной корреляции между двумя
переменными больше 0.8. Чтобы избавиться
от мультиколлинеарности, в модель включают лишь один
из линейно связанных между собой факторов, причем тот, который в большей
степени связан с зависимой переменной.
На третьей, заключительной стадии производят окончательный отбор
факторов путем анализа значимости вектора оценок параметров уравнении
множественной регрессии с использованием критерия Стьюдента (k -
количество факторов, включенных в модель после исключения незначимых факторов, k = т, если включены все анализируемые
факторы).
Выбор вида модели и оценка ее параметров
Для отображения зависимости переменных могут использоваться
показательная, параболическая и многие другие функции. Однако в практической
работе наибольшее распространение получили модели линейной взаимосвязи, т.е.
когда факторы входят в модель линейно.
Линейная модель множественной регрессии имеет вид:
Yi= а0
+ a1xi1 + а2хiа + ... +
аmхim + εi . (2.1.3)
Анализ уравнения (4.1.3) и методика определения параметров
становятся более наглядными, а расчетные процедуры существенно упрощаются,
если воспользоваться матричной формой записи уравнения (2.1.4):
Y=Xα+ε. (2.1.4)
Здесь У - вектор зависимой переменной размерности nx1,
представляющий собой n наблюдений значений уi,
Х - матрица независимых переменных,
элементы которой суть n х m наблюдения значений т независимых
переменных Х1 X2, Х3, ..., Хm размерность матрицы Х равна
m х 1; -
α - подлежащий оцениванию вектор неизвестных параметров размерности т х 1; ε -
вектор случайных отклонений (возмущений) размерности n х 1. Таким образом,
Уравнение (4.1.4) содержит
значения неизвестных параметров α1, α 2, α m . Эти величины оцениваются на основе выборочных
наблюдений, поэтому полученные расчетные показатели не являются истинными, а
представляют собой лишь их статистические оценки. Модель линейной регрессии, в
которой вместо истинных значений параметров подставлены их оценки (а именно
такие регрессии и применяются на практике), имеет вид
Y=X α +e=+e,
(2.1.5)
где α - вектор оценок параметров; е - вектор «оцененных» отклонений регрессии,
остатки регрессии е = y - Х α; - оценка значений Y равная Х α.
Для оценивания неизвестного вектора параметров к
воспользуемся методом наименьших квадратов (МНК). Формула для вычисления
параметров регрессионного уравнения имеет вид:
Α=(XTX)-1XTY. (2.1.6)
Рассмотрим случай
зависимости переменной Y от одного
фактора X. Мы хотим подобрать уравнения.
Используя (4.1.6), можно получить следующие выражения
для вычисления α1 и α0:
(2.1.8)
Проверка
качества модели
Качество модели оценивается стандартным для математических моделей
образом: по адекватности и точности на основе анализа остатков регрессии е.
Расчетные значения получаются путем подстановки в модель фактических значений
всех включенных факторов.
Анализ остатков. Анализ остатков позволяет получить представление,
насколько хорошо подобрана сама модель и насколько правильно выбран метод
оценки коэффициентов. Согласно общим предположениям регрессионного анализа,
остатки должны вести себя как независимые (в действительности почти
независимые), одинаково распределенные случайные величины. В классических
методах регрессионного анализа предполагается также нормальный закон
распределения остатков.
Независимость остатков проверяется с помощью критерия Дарбина-
Уотсона [2].
Исследование остатков полезно начинать с изучения их графика. Он может
показать наличие какой-то зависимости, не учтенной в модели. Скажем, при
подборе простой линейной зависимости между Y и X график остатков может показать необходимость перехода к
нелинейной модели (квадратичной, полиномиальной, экспоненциальной) или
включения в модель периодических компонент.
Выбросы. График остатков хорошо показывает и резко отклоняющиеся от
модели наблюдения - выбросы. Подобным
аномальным наблюдениям надо уделять особо пристальное внимание, так как их
присутствие может грубо искажать значения оценок. Устранение эффектов выбросов
может проводиться либо с помощью удаления этих точек из анализируемых данных
(эта процедура называется цензурированием), либо с
помощью применения методов оценивания параметров, устойчивых к подобным грубым
отклонениям.
Кроме рассмотренных выше
характеристик, целесообразно использовать коэффициент множественной корреляции
(индекс корреляции) R, а
также характеристики существенности модели в целом и отдельных ее
коэффициентов:
(2.1.9)
где - сумма квадратов уравнений остаточной компоненты;
- сумма квадратов
отклонений исходного ряда от его среднего значения.
Данный коэффициент является универсальным, так как отражает тесноту
связи и точность модели, а также может использоваться при любой форме связи
переменных. При построении однофакторной корреляционной модели коэффициент
множественной корреляции равен коэффициенту парной корреляции.
Коэффициент множественной корреляции (индекс корреляции), возведенный в
квадрат (R2), называется коэффициентом детерминации.
(2.1.10)
Он показывает долю вариации результативного признака, находящегося под
воздействием изучаемых факторов, т.е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на
него факторов.
В многофакторной регрессии добавление дополнительных объясняющих
переменных увеличивает коэффициент детерминации. Следовательно, коэффициент
детерминации должен быть скорректирован с учетом числа независимых переменных.
Скорректированный R2, или , рассчитывается так:
где n - число наблюдения; k - число независимых
переменных.
В качестве меры точности применяют несмещенную оценку дисперсии
остаточной компоненты, которая представляет собой отношение суммы квадратов
уровней остаточной компоненты к величине (n-k- 1), где k - количество
факторов, включенных в модель. Квадратный корень из этой величины (Se)
называется стандартной ошибкой оценки.
Для проверки значимости модели регрессии используется F-значение, вычисляемое как отношение
дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если
расчетное значение с Vi = (n - 1) и v2 =
(n - k - 1) степенями свободы больше табличного при заданном уровне
значимости, то модель считается значимой:
(2.1.11)
Если существует k независимых
переменных, то будет k + 1 коэффициентов регрессии (включая постоянную),
отсюда число степеней свободы составит n -
(k + 1) или n - k - 1.
Целесообразно проанализировать также значимость отдельных коэффициентов
регрессии. Это осуществляется по t-статистике путем проверки гипотезы о
равенстве нулю j-го параметра уравнения
(кроме свободного члена):
(2.1.12)
где Sαj, - это стандартное (среднее квадратическое)
отклонение коэффициента уравнения регрессии αj.
Величина Sαj представляет собой квадратный корень из произведения несмещенной
оценки дисперсии Se и j-го
диагонального элемента матрицы, обратной матрице системы нормальных уравнений.
(2.1.13)
где bjj – диагональный элемент матрицы (XTX)-1.
Если расчетное значение
г-критерия с (n- k - 1) степенями свободы
превосходит его табличное значение при заданном уровне значимости, коэффициент
регрессии считается значимым. В противном случае фактор, соответствующий этому
коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).
Оценка влияния отдельных
факторов на основе модели на зависимую переменную (коэффициенты эластичности и
β-коэффициенты)
Важную роль при оценке
влияния факторов играют коэффициенты регрессионной модели. Однако
непосредственно с их помощью нельзя сопоставить факторы по степени их влияния
на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при
интерпретации применяются средние частные коэффициенты эластичности Э(j) и
β -коэффициенты β(t), которые рассчитываются соответственно по
формулам:
Э(j)=α(j)×Xср/Yср (2.1.14)
β (j)=α(j)×Sij/Sy (2.1.15)
где Sij - среднее квадратическое
отклонение фактора j.
Коэффициент эластичности показывает, на сколько процентов изменяется
зависимая переменная при изменении фактора. j
на 1%. Однако он не учитывает
степень колеблемости факторов.
Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy,
изменится зависимая переменная Y с изменением
соответствующей независимой переменной Xj
на величину своего среднего квадратического отклонения
при фиксированном на постоянном уровне значении остальных независимых
переменных.
Указанные коэффициенты позволяют проранжировать
факторы по степени влияния факторов на зависимую переменную.
Долю влияния фактора в суммарном влиянии всех факторов можно оценить по
величине дельта-коэффициентов Δ(j):
Δ(j)=ryj β(j)/R2,
где ryj - коэффициент парной корреляции между фактором j (j = 1, .... m) и зависимой переменной.
Использование многофакторных моделей для анализа и
прогнозирования развития экономических систем
Одна из важнейших целей моделирования заключается в прогнозировании
поведения исследуемого объекта. Обычно термин «прогнозирование» используется в
тех ситуациях, когда требуется предсказать состояние системы в будущем. Для
регрессионных моделей он имеет, однако, более широкое значение. Как уже
отмечалось, данные могут не иметь временной структуры, но и в этих случаях
вполне может возникнуть задача оценить значение
зависимой переменной для некоторого набора независимых, объясняющих переменных,
которых нет в исходных наблюдениях. Именно в этом смысле - как построение оценки зависимой переменной - и следует понимать прогнозирование в
эконометрике.
Проблема прогнозирования имеет много различных аспектов. Можно
различать точечное и интервальное прогнозирование. В первом случае оценка - это конкретное число, во втором - интервал, в котором истинное значение
переменной находится с заданным уровнем доверия. Кроме того, для временных
рядов при нахождении прогноза существенно наличие или отсутствие корреляции по
времени между ошибками.
При использовании построенной модели для прогнозирования делается
предположение о сохранении в период прогнозирования существовавших ранее
взаимосвязей переменных.
Для прогнозирования зависимой переменной на l шагов вперед необходимо знать прогнозные значения всех входящих
в нее факторов. Их оценки могут быть получены на основе временных экстраполяционных моделей или заданы пользователем. Эти
оценки подставляются в модель, и получаются прогнозные оценки.
Построение точечных и интервальных прогнозов на основе регрессионной
модели. Какие факторы влияют на ширину доверительного интервала? Для того, чтобы определить область возможных значений
результативного показателя, при рассчитанных значениях факторов следует
учитывать два возможных источника ошибок: рассеивание наблюдений относительно
линии регрессии и ошибки, обусловленные математическим аппаратом построения
самой линии регрессии. Ошибки первого рода измеряются с помощью характеристик
точности, в частности, величиной .
Ошибки второго рода обусловлены фиксацией численного
значения коэффициентов регрессии, в то время как они в действительности
являются случайными, нормально распределенными.
Для линейной модели доверительный интервал рассчитывается следующим
образом. Оценивается величина отклонения от линии регрессии (обозначим ее
буквой U):
(2.1.16)
(2.1.17)
Для модели парной регрессии формула (4.1.16)
принимает вид:
(2.1.18)
Коэффициент tα является табличным
значением t-статистики Стьюдента при заданном уровне значимости а и числа
наблюдений, l - период прогнозирования.
Если исследователь задает вероятность попадания прогнозируемой величины внутрь
доверительного интервала, равную 70%, то tα = 1.05. Если вероятность составляет 95%, то tα = 1.96, а при 99% tα =2.65.
Как видно из формулы (4.1.18).
величина U прямо пропорционально зависит
от точности модели ( ), коэффициента
доверительной вероятности (tα), степени удаления прогнозной оценки фактора Х от среднего значения и
обратно пропорциональна объему наблюдений.
В свою очередь
.
(2.1.19)
В результате получаем следующий интервал прогноза для шага
прогнозирования l:
-
верхняя граница прогноза равна Y(n + l) + U(l),
-
нижняя граница прогноза равна Y(n + l) + U(l).
Если построенная регрессионная модель адекватна и прогнозные оценки факторов
достаточно надежны, то с выбранной пользователем вероятностью можно утверждать,
что при сохранении сложившихся закономерностей развития прогнозируемая
величина попадет в интервал, образованный нижней и верхней границами.
Пакет анализа - это надстройка, которая представляет
широкие возможности для проведения статистического анализа.
Установка средств Пакет анализа.
В стандартной конфигурации программы EXCEL вы не найдете средства
Пакет анализа. Даже если установить их с компакт-диска EXCEL'97 (или Office'97),
они не появятся в меню до тех пор, пока вы не установите их в качестве
надстройки Excel. Для этого выполните следующие действия:
1. Выберите команду Сервис=>Надстройки.
2. В диалоговом окне Надстройки установите флажок Пакет анализа.
3. Щелкните на кнопке ОК.
После этого в нижней части меню Сервис появится новая команда Анализ
данных. Эта команда предоставляет доступ к средствам анализа, которые есть в EXCEL.
Пример 2.2.1. Задача состоит в построении модели для предсказания
объема реализации одного из продуктов фирмы.
Объем реализации - это зависимая
переменная Y. В качестве независимых, объясняющих переменных
выбраны: время – Х1,
расходы на рекламу Х2, цена товара Х3, средняя цена
конкурентов X4, индекс
потребительских расходовX5.
1. Построение системы показателей (факторов). Анализ матрицы
коэффициентов парной корреляции
Статистические данные по всем переменным приведены в табл. 2.2.1. В этом примере n =
Таблица 2.2.1
Y |
XI |
XI |
X3 |
Х4 |
Х5 |
объем
реализации |
время |
реклама |
цена |
цена конкурента |
индекс
потребительских расходов |
126 |
|
4 |
15 |
17 |
100 |
137 |
1 |
4,8 |
14.8 |
17.3 |
98.4 |
148 |
2 |
3.8 |
15.2 |
16.8 |
101.2 |
191 |
3 |
8.7 |
15.5 |
16.2 |
103.5 |
274 |
4 |
8.2 |
15.5 |
16 |
104.1 |
370 |
5 |
9.7 |
16 |
18 |
107 |
432 |
6 |
14.7 |
18.1 |
20.2 |
107.4 |
445 |
7 |
18.7 |
13 |
15.8 |
108.5 |
367 |
8 |
19.8 |
15.8 |
18.2 |
108.3 |
367 |
9 |
10.6 |
16.9 |
16.8 |
109.2 |
321 |
10 |
8.6 |
16.3 |
17 |
110.1 |
307 |
11 |
6.5 |
16.1 |
18.3 |
110.7 |
331 |
12 |
12.6 |
15.4 |
16.4 |
110.3 |
345 |
13 |
6.5 |
15.7 |
16.2 |
111.8 |
364 |
14 |
5.8 |
16 |
17.7 |
112.3 |
384 |
15 |
5.7 |
15.1 |
16.2 |
112.9 |
Использование инструмента Корреляция. Для проведения
корреляционного анализа выполните следующие действия:
1) данные для корреляционного
анализа должны располагаться в смежных диапазонах ячеек;
2) выберите команду Сервис
=>Анализ данных;
3) в диалоговом окне Анализ
данных выберите инструмент Корреляция (рис.
4.2.1). а затем щелкните на кнопке ОК;
4) в диалоговом окне
Корреляция в поле «Входной интервал» необходимо ввести диапазон ячеек,
содержащих исходные данные. Если выделены и заголовки столбцов, то установить
флажок «Метки в первой строке» (рис. 4.2.2);
5) выберите параметры вывода.
В данном примере - установите
переключатель «Новый рабочий лист»;
6) ОК.
В табл. 2.2.2 приведены промежуточные результаты при
вычислении коэффициента корреляции по формуле (2.1.1)
Таблица 2.2.2
t |
Y |
X2 |
) |
)2 |
) |
)2 |
)×) |
1 2 |
126 137 |
4 4.8 |
-180.813 -169.813 |
32693.16 28836.29 |
-5.29375 -4.49375 |
28.02379 20.19379 |
957.1762 763.0949 |
3 |
148 |
3.8 |
-158.813 |
25221.41 |
-5.49375 |
30.18129 |
872.4762 |
4 |
191 |
8.7 |
-115.813 |
13412.54 |
-0.59375 |
0.352539 |
68.76367 |
5 |
274 |
8.2 |
-32.8125 |
1076.66 |
-1.09375 |
1.196289 |
35.88867 |
6 |
370 |
9.7 |
63.1875 |
3992.66 |
0.40625 |
0.165039 |
25.66992 |
7 |
432 |
14.7 |
125.1875 |
15671.91 |
5.40625 |
29.22754 |
676.7949 |
8 |
445 |
18.7 |
138.1875 |
19095.79 |
9.40625 |
88.47754 |
1299.826 |
9 |
367 |
19.8 |
60.1875 |
3622.535 |
10.50625 |
110.3813 |
632.3449 |
10 |
367 |
10.6 |
60.1875 |
3622.535 |
1.30625 |
1.706289 |
78.61992 |
11 |
321 |
8.6 |
14.1875 |
201.2852 |
-0.69375 |
0.481289 |
-9.84258 |
12 |
307 |
6.5 |
0.1875 |
0.035156 |
-2.79375 |
7.805039 |
-0.52383 |
13 |
331 |
12.6 |
24.1875 |
585.0352 |
3.30625 |
10.93129 |
79.96992 |
14 |
345 |
6.5 |
38.1875 |
1458.285 |
-2.79375 |
7.805039 |
-106.686 |
15 |
364 |
5.8 |
57.1875 |
3270.41 |
-3.49375 |
12.20629 |
-199.799 |
16 |
384 |
5.7 |
77.1875 |
5957.91 |
-3.59375 |
12.91504 |
-277.393 |
Сумма |
4909 |
148.7 |
0 |
158718.4 |
0 |
362.0494 |
4896.381 |
Среднее
значение |
306.8125 |
9.29375 |
0 |
|
|
|
|
Таблица 2.2.3
|
Объем реализации |
Время |
Реклама |
Цена |
Цена конкурента |
Индекс потребительских расходов |
Столбец 1 |
Столбец 2 |
Столбец З |
Столбец 4 |
Столбец 5 |
Столбец 6 |
|
Объем реализации |
1 |
|
|
|
|
|
Время Реклама |
0.678 0.646 |
1 0.106 |
1 |
|
|
|
Цена |
0.233 |
0.174 |
-0.003 |
1 |
|
|
Цена конкурента |
0.226 |
-0.051 |
0.204 |
0.698 |
1 |
|
Индекс отребительских расходов |
0.816 |
0.960 |
0.273 |
0.235 |
0.030 |
1 |
Анализ матрицы коэффициентов
парной корреляции (табл. 2.2.3) показывает,
что зависимая переменная, т.е. объем реализации, имеет тесную связь с индексом
потребительских расходов (ryx5 = 0.816), с расходами на рекламу (ryx5=0.646) и со временем (ryx1 =0.678). Однако факторы X2;
и X5
тесно связаны между собой (ryx5= 0.96), что свидетельствует о
наличии мультиколлинеарности. Из этих двух переменных
оставим в модели X5 - индекс потребительских расходов. В этом примере n=
2. Выбор вида модели и оценка
ее параметров
Оценка параметров регрессии осуществляется по методу наименьших
квадратов по формуле (2.1.6), с
использованием данных, приведенных в табл.
2.2.4.
Таблица 2.2.4
y |
X0 |
X1 |
X2 |
объем
реализации |
|
реклама |
индекс
потребительских расходов |
126 |
1 |
4 |
100 |
137 |
1 |
4.8 |
98.4 |
148 |
1 |
3.8 |
101.2 |
191 |
1 |
8.7 |
103.5 |
274 |
1 |
8.2 |
104.1 |
370 |
1 |
9.7 |
107 |
432 |
1 |
14.7 |
107.4 |
445 |
1 |
18.7 |
108.5 |
367 |
1 |
19.8 |
108.3 |
367 |
1 |
10.6 |
109.2 |
321 |
1 |
8.6 |
110.1 |
307 |
1 |
6.5 |
110.7 |
331 |
1 |
12.6 |
110.3 |
345 |
1 |
6.5 |
111.8 |
364 |
1 |
5.8 |
112.3 |
384 |
1 |
5.7 |
112.9 |
Уравнение регрессии зависимости объема реализации от затрат на рекламу
и индекса потребительских расходов можно записать в следующем виде:
Y= -1471.314 + 9.568Х1 + 15.754Х2.
Расчетные значения Y
определяются путем последовательной подстановки в эту модель значений факторов,
взятых для каждого момента времени t.
Применение инструмента Регрессия. Для проведения регрессионного анализа
выполните следующие действия:
1) выберите команду
Сервис ÞАнализ данных;
2) в диалоговом окне Анализ данных выберите инструмент Регрессия, а затем щелкните на кнопке ОК;
3) в диалоговом окне Регрессия в поле «Входной интервал Y» введите
адрес одного диапазона ячеек, который представляет зависимую переменную. В поле
«Входной интервал X» введите адреса
одного или нескольких диапазонов, которые содержат значения независимых переменных;
4) если выделены и заголовки столбцов, то установить флажок Метки в
первой строке;
5) выберите параметры вывода. В данном примере - установите переключатель «Новая рабочая книга»',
6) в поле «Остатки» поставьте
необходимые флажки;
7) ОК.
Таблица 2.2.5
Регрессионная
статистика |
|
Множественный
R R- квадрат Нормированный R-квадрат Стандартная ошибка Наблюдения |
0.927 0.859 0.837 41.473 16.000 |
Пояснения к табл. 2.2.5.
Регрессионная
статистика |
|||
№ |
Наименование в отчете EXCEL |
Принятые наименования |
Формула |
1 |
Множественный R |
Коэффициент множественной корреляции, индекс
корреляции |
|
2 |
R-квадрат |
Коэффициент детерминации, R2 |
|
3 |
Нормированный R-квадрат |
Скорректированный R2 |
|
4 |
Стандартная ошибка |
Стандартная ошибка оценки |
|
5 |
Наблюдения |
Количество наблюдений, n |
n |
Таблица 2.2.6
Дисперсионный
анализ |
||||
|
Df |
SS |
MS |
F |
Регрессия Остаток Итого |
2 13 15 |
136358.334 22360.104 158718.438 |
68179.167 1720.008 |
39.639 |
Пояснения к табл. 2.2.6.
|
Df- число степеней свободы |
SS - сумма квадратов |
MS |
F - критерий Фишера |
Регрессия |
k=2 |
|
/k |
|
Остаток |
n-k-1=l3 |
|
/(n-k-1) |
|
Итого |
n-1 =15 |
|
|
|
Таблица 2.2.7
|
Коэффициенты |
Стандартная
ошибка |
t-статистика |
Y-пересечение Реклама Индекс потребительских
расходов |
-1471.3143 9.5684 15,7529 |
• 259.7660 2.2659 2.4669 |
-5.6640 4.2227 6.3858 |
Во втором столбце табл. 2.2.7
содержатся коэффициенты уравнения регрессии a0, a1, a2. В третьем столбце содержатся
стандартные ошибки коэффициентов уравнения регрессии (2.1.12), а в четвертом -
г-статистика (2.1.11), используемая
для проверки значимости коэффициентов уравнения регрессии.
Уравнение регрессии зависимости объема реализации от затрат на рекламу
и индекса потребительских расходов, полученное с помощью EXCEL,
как было указано ранее, имеет вид:
Y =-1471.314+9.568Х1.+15.754Х2.
Таблица 2.2.8
ВЫВОД ОСТАТКА |
||||
Наблюдение |
Предсказанное Y |
Остатки |
||
1 |
142.247 |
-16.247 |
||
2 |
124.697 |
12.303 |
||
3 |
159.237 |
-11.237 |
||
4 |
242.353 |
-51.353 |
||
5 |
247.021 |
26.979 |
||
6 |
307.057 |
62.943 |
||
7 |
361.200 |
70.800 |
||
8 |
416.802 |
28.198 |
||
9 |
424.177 |
-57.177 |
||
10 |
350.325 |
16.675 |
||
11 |
345.365 |
-24.365 |
||
12 |
334.724 |
-27.724 |
||
13 |
386.790 |
-55.790 |
||
14 |
352.052 |
-7.052 |
||
15 |
353.230 |
10.770 |
||
16 |
361.725 |
22.275 |
||
3. Оценка качества модели
В табл. 2.2.8 приведены вычисленные по модели значения Y и значения остаточной компоненты.
Проверку независимости
проведем с помощью rf-критерия Дарбина-Уотсона.
В качестве критических
табличных уровней при N = 16, двух объясняющих
факторах при уровне значимости 5% возьмем
величины d1 =0,98 и d2 = 1,54.
Так как расчетное значение попало в интервал от d1 до d2, то нельзя
сделать окончательный вывод по этому критерию. Для определения степени
автокорреляции вычислим коэффициент автокорреляции и проверим его значимость
при помощи критерия стандартной ошибки.
Стандартная ошибка коэффициента корреляции рассчитывается следующим
образом:
Коэффициенты автокорреляции случайных данных обладают выборочным
распределением, приближающимся к нормальному с нулевым
математическим ожиданием и средним квадратическим
отклонением, равным
Если r1находится в интервале:
-0,96×0.25£r1
£1.96×0.25,
то можно считать, что данные не показывают наличие автокорреляции
первого порядка, так как
-0.49£ r1 =0.305£0.49,
и свойство независимости выполняется.
Вычислить для модели коэффициент детерминации
=
=1-22360.104/158718.44=136358.3/158718.44=0.859.
Он показывает долю вариации
результативного признака под воздействием изучаемых факторов. Следовательно,
около 86% вариации зависимой переменной
учтено в модели и обусловлено влиянием включенных факторов.
Проверку значимости
уравнения регрессии произведем на основе вычисления F-критерия Фишера:
Табличное значение F-критерия при
доверительной вероятности 0,95v1=k=2 и v2 =n-k- 1 =
16-2- 1 = 13
составляет 4.81.
Поскольку Fрас > Fтабл. уравнение регрессии следует признать адекватным.
Значимость коэффициентов уравнения регрессии a1, a2 оценим с использованием t-критерия
Стьюдента.
b22=0.00299,
b33=0.00354,
Табличное значение /-критерия при уровне
значимости 5% и степенях свободы (16-2-1=13) составляет 1,77. Так как tpac> tтабл, то коэффициенты a1, a2 существенны (значимы).
4. Проанализировать влияние факторов на зависимую переменную по модели
(для каждого коэффициента регрессии вычислить коэффициент эластичности, b-коэффициент)
Учитывая, что коэффициент регрессии невозможно использовать для
непосредственной оценки влияния факторов на зависимую переменную из-за различия
единиц измерения, используем коэффициент эластичности (Э) и b -коэффициент,
которые соответственно рассчитываются по формулам:
Эi = аi × Xср: Ycр;
Э1 =9.568-9.294/306.813= 0.2898;
Э2=15.7529- 107.231 /306.813=5.506;
bi; = , ai× Sxi : Sy,
где
b1=9.568-4.913/ 102.865=0.457;
b2= 15.7529-4.5128/ 102.865=0.691.
Коэффициент эластичности показывает, на сколько процентов изменяется
зависимая переменная при изменении фактора на
1%.
Бета-коэффициент с математической точки зрения показывает, на какую
часть величины среднего квадратического отклонения
меняется среднее значение зависимой переменной с изменением независимой
переменной на одно среднее квадратическое отклонение
при фиксированном на постоянном уровне значении остальных независимых
переменных. Это означает, что при увеличении затрат на рекламу в нашем примере
на 4.91 тыс. руб. объем реализации
увеличится на 47 тыс. руб. (0.457-102.865).
5. Определить точечные и интервальные прогнозные оценки объема
реализации на два квартала вперед (t0.7=1.12)
Прогнозные значения X1np(17), X2пр(18) и
Х1np(17), X2пр(18) можно определить или
вычислить на основе экстраполяционных методов.
Для фактора Х\ Затраты на
рекламу выбрана модель
X1 = 12.83 - 11.616t + 4.319t2 - 0.552t3 + 0.020t4 - О.ООО6t5, по которой получен прогноз на два месяца вперед'. Графики модели временного
ряда Затраты на рекламу приведены на рис. 2.2.6.
Упреждение |
Прогноз |
1 |
5,75 |
2 |
4,85 |
Для временного ряда Индекс потребительских расходов в качестве
аппроксимирующей функции выбран полином второй степени (парабола), по которой
построен прогноз на два шага вперед. Индекс потребительских расходов
Х2 = 97.008 +1.739 t- 0.0488 t2.
Упреждение |
Прогноз |
1 |
112.468 |
2 |
112.488 |
Для получения прогнозных оценок зависимостей переменной по модели Y = -1471.438 + 9.568Х1 + 15.754 Х2 подставим в нее найденные прогнозные значения
факторов Х1 и Х2.
Y1=17 = -1471.438 +
9.568 • 5.75 + 15.754 • 112.468 = 355.399,
Yt=18„i8=-1471.438+9.568-4.85 + 15.754- 112.488=344.179.
Доверительный интервал прогноза
будет иметь следующие границы:
Верхняя граница прогноза: Yпр
(N + 1) + U(l),
Нижняя граница прогноза: Ynp(N+ 1) - U(l),
Se=41.473, tкр=2,16*,
l=1, U(2)=45.749.
Результаты прогнозных оценок
модели регрессии представим в таблице прогнозов (р =95%), табл.
2.2.9.
Таблица 2.2.9
Упреждение |
Прогноз |
Нижняя граница |
Верхняя граница |
1 |
355.399 |
312.368 |
398.367 |
2 |
344.179 |
298.43 |
389 928 |
Задача 1.
Имеются
данные о деятельности крупнейших
компаний США в (2.2.10).
Таблица 2.2.10
№ п\п |
Чистый доход,
млрд. долл. США., у |
Оборот капитала, млрд.
долл. США,Х1 |
Использованный капитал,
млрд. долл. США, x2 |
Численность служащих,
тыс. чел., x3 |
Рыночная капитализация
компании, млрд. долл. США,Х4 |
1 |
0,9 |
31,3 |
18,9 |
43,0 |
40,9 |
2 |
1,7 |
13,4 |
13,7 |
64,7 |
40,5 |
3 |
0,7 |
4,5 |
18,5 |
24,0 |
38,9 |
4 |
1,7 |
10,0 |
4,8 |
50,2 |
38,5 |
5 |
2,6 |
20,0 |
21,8 |
106,0 |
37,3 |
6 |
1,3 |
15,0 |
5,8 |
96,6 |
26,5 |
7 |
4,1 |
137,1 |
99,0 |
347,0 |
37,0 |
8 |
1,6 |
17,9 |
20,1 |
85,6 |
36,8 |
9 |
6,9 |
165,4 |
60,6 |
745,0 |
36,3 |
10 |
0,4 |
2,0 |
1,4 |
4,1 |
35,3 |
11 |
1,3 |
6,8 |
8,0 |
26,8 |
35,3 |
12 |
1,9 |
27,1 |
18,9 |
42,7 |
35,0 |
13 |
1,9 |
13,4 |
13,2 |
61,8 |
26,2 |
14 |
1,4 |
9,8 |
12,6 |
212,0 |
33,1 |
15 |
0,4 |
19,5 |
12,2 |
105,0 |
32,7 |
16 |
0,8 |
6,8 |
3,2 |
33,5 |
32,1 |
17 |
1,8 |
27,0 |
13,0 |
142,0 |
30,5 |
18 |
0,9 |
12,4 |
6,9 |
96,0 |
29,8 |
19 |
1,1 |
17,7 |
15,0 |
140,0 |
25,4 |
20 |
1,9 |
12,7 |
11,9 |
59,3 |
29,3 |
21 |
-0,9 |
21,4 |
1,6 |
131,0 |
29,2 |
22 |
1,3 |
13,5 |
8,6 |
70,7 |
29,2 |
23 |
2,0 |
13,4 |
11,5 |
65,4 |
29,1 |
24 |
0,6 |
4,2 |
1,9 |
23,1 |
27,9 |
25 |
0,7 |
15,5 |
5,8 |
80,8 |
27,2 |
Задание
1. Рассчитайте параметры линейного уравнения множественной регрессии с
полным перечнем факторов.
2. Дайте сравнительную оценку силы связи факторов с результатом с помощью
средних (общих) коэффициентов эластичности.
3. Оцените статистическую значимость параметров регрессионной модели с
помощью г-критерия; нулевую гипотезу о значимости уравнения и показателей
тесноты связи проверьте с помощью F-критерия.
4. Оцените качество уравнения через среднюю ошибку аппроксимации.
5. Рассчитайте матрицы парных и частных коэффициентов корреляции и на их
основе и по г-критерию для коэффициентов регрессии отберите информативные
факторы в модель. Постройте модель только с информативными факторами и оцените
ее параметры.
6. Рассчитайте прогнозное значение результата, если прогнозные значения
факторов составляют 80% от их
максимальных значений.
7. Рассчитайте ошибки и доверительный интервал прогноза для уровня
значимости 5 или 10% (а = 0,05; а = 0,10).
8. Оцените полученные результаты, выводы оформите в аналитической
записке.
Задача
2.
Имеются данные о деятельности крупнейших компаний США в
Таблица 2.2.11
№ п/п |
Чистый доход,
млрд. долл. США, у |
Оборот капитала,
млрд. долл. США, хi |
Использованный
капитал, млрд. долл. США, xi |
Численность
служащих, тыс. чел., х3 |
1 |
6,6 |
6,9 |
83,6 |
222,0 |
2 |
3,0 |
18,0 |
6,5 |
32,0 |
3 |
6,5 |
107,9 |
50,4 |
82,0 |
4 |
3,3 |
16,7 |
15,4 |
45,2 |
5 |
0,1 |
79,6 |
29,0 |
299,3 |
6 |
3,6 |
16,2 |
13,3 |
41,6 |
7 |
1,5 |
5,9 |
5.9 |
17,8 |
8 |
5,5 |
53,1 |
27,1 |
151,0 |
9 |
2,4 |
18,8 |
11,2 |
82,3 |
10 |
3,0 |
35,3 |
16,4 |
103,0, |
11 |
4,2 |
71,9 |
32,5 |
225,4 |
12 |
2,7 |
93,6 |
25,4 |
675,0- |
13 14 |
1,6 |
10,0 |
6,4 |
43,8 |
2,4 |
31,5 |
12,5 |
102,3 |
|
15 |
3,3 |
36,7 |
14,3 |
1б5,0 |
16 |
1,8 |
13,8 |
6,5 |
49,1 |
17 |
2,4 |
64,8 |
22,7 |
50,4 |
18 |
1,5 |
30,4 |
15,8 |
480,0 |
19 |
1,4 |
12,1 |
9,3 |
71,0 |
20 |
0,9 |
31,3 |
18,9 |
43,0 |
1. Расчитайте параметры линейного уравнения
множественной регрессии с полным перечнем факторов.
2. Дайте сравнительную оценку
силы связи факторов с результатом с > средних (общих) коэффициентов
эластичности.
3. Оцените статистическую значимость параметров
регрессионной помощью г-критерия; нулевую гипотезу о значимости 1 и показателей тесноты связи проверьте с
помощью F-критерия
4. Оцените качество уравнения через среднюю ошибку
аппроксимации.
5. Рассчитайте матрицы парных и
частных коэффициентов корреляции и на их
основе и по t-критерию для коэффициентов регрессии отберите
информативные факторы в модель. Постройте модель,
информативными факторами и оцените ее параметры.
6. Рассчитайте прогнозное
значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
7. Рассчитайте ошибки и
доверительный интервал прогноза для уравнения значимости 5 или 10% (а = 0,05; а =
0,10).
8. Оцените полученные результаты,
выводы оформите в аналитической.
Задача 3
В табл. 2.2.12 представлены данные о рынке строящегося
жилья в Санкт-Петербурге (по состоянию на декабрь
№ п/п |
X1 |
X2 |
X3 |
Х4 |
X5 |
X6 |
X7 |
X8 |
У |
1 |
1 |
1 |
39,0 |
20,0 |
8,2 |
0 |
1 |
0 |
15,9 |
2 |
3 |
1 |
68,4 |
40,5 |
10,7 |
0 |
1 |
0 |
27,0 |
3 |
1 |
1 |
34,8 |
16,0 |
10,7 |
0 |
1 |
12 |
13,5 |
4 |
1 |
1 |
39,0 |
20,0 |
8,5 |
0 |
1 |
12 |
15,1 |
5 |
2 |
1 |
54,7 |
28,0 |
10,7 |
0 |
1 |
12 |
21,1 |
6 |
3 |
1 |
74,7 |
46,3 |
10,7 |
0 |
1 |
12 |
28,7 |
7 |
3 |
1 |
71,7 |
45,9 |
10,7 |
0 |
3 |
0 |
27,2 |
8 |
3 |
1 |
74,5 |
47,5 |
10,4 |
0 |
3 |
0 |
28,3 |
9 |
4 |
1 |
137,7 |
87,2 |
14,6 |
0 |
1 |
0 |
52,3 |
10 |
1 |
1 |
40,0 |
17,7 |
11,0 |
1 |
1 |
8 |
22,0 |
11 |
2 |
1 |
53,0 |
31,1 |
10,0 |
1 |
1 |
8 |
28,0 |
12 |
3 |
1 |
86,0 |
48,7 |
14,0 |
1 |
1 |
8 |
45,0 |
13 |
4 |
1 |
98,0 |
65,8 |
13,0 |
1 |
1 |
8 |
51,0 |
14 |
2 |
1 |
62,6 |
21,4 |
11,0 |
1 |
1 |
0 |
34,4 |
15 |
1 |
1 |
45,3 |
20,6 |
10,4 |
1 |
1 |
8 |
24,7 |
16 |
2 |
1 |
56,4 |
29,7 |
9,4 |
1 |
1 |
8 |
30,8 |
17 |
1 |
1 |
37,0 |
17,8 |
8,3 |
0 |
1 |
0 |
15,9 |
18 |
3 |
1 |
67,5 |
43,5 |
8,3 |
0 |
1 |
0 |
29,0 |
19 |
1 |
1 |
37,0 |
17,8 |
8,3 |
0 |
1 |
3 |
15,4 |
20 |
3 |
1 |
69,0 |
42,4 |
8,3 |
0 |
1 |
3 |
28,6 |
21 |
1 |
1 |
40,0 |
20,0 |
8,3 |
0 |
0 |
0 |
15,6 |
22 |
3 |
1 |
69,1 |
41,3 |
8,3 |
0 |
1 |
0 |
27,7 |
23 |
2 |
1 |
68,1 |
35,4 |
13,0 |
1 |
1 |
20 |
34,1 |
24 |
2 |
1 |
75,3 |
41,4 |
12,1 |
1 |
1 |
20 |
37,7 |
25 |
3 |
1 |
83,7 |
48,5 |
12,1 |
1 |
1 |
20 |
41,9 |
26 |
1 |
1 |
48,7 |
22,3 |
12,4 |
1 |
1 |
20 |
24,4 |
27 |
1 |
1 |
39,9 |
18,0 |
8,1 |
1 |
0 |
0 |
21,3 |
28 |
2 |
1 |
68,6 |
35,5 |
17,0 |
1 |
1 |
12 |
36,7 |
29 |
1 |
1 |
39,0 |
20,0 |
9,2 |
1 |
0 |
0 |
21,5 |
30 |
2 |
1 |
48,6 |
31,0 |
8,0 |
1 |
0 |
0 |
26,4 |
31 |
3 |
1 |
98,0 |
56,0 |
22,0 |
1 |
0 |
0 |
53,9 |
32 |
2 |
1 |
68,5 |
30,7 |
8,3 |
1 |
1 |
6 |
34,2 |
33 |
2 |
1 |
71,1 |
36,2 |
13,3 |
1 |
1 |
6 |
35,6 |
34 |
3 |
1 |
68,0 |
41,0 |
8,0 |
1 |
1 |
12 |
34,0 |
35 |
1 |
1 |
38,0 |
19,0 |
7,4 |
1 |
1 |
12 |
19,0 |
36 |
2 |
1 |
93,2 |
49,5 |
14,0 |
1 |
1 |
12 |
46,6 |
37 |
3 |
1 |
117,0 |
55,2 |
25,0 |
1 |
1 |
12 |
58,5 |
38 |
1 |
2 |
42,0 |
21,0 |
10,2 |
1 |
0 |
12 |
24,2 |
39 |
2 |
2 |
62,0 |
35,0 |
11,0 |
1 |
0 |
12 |
35,7 |
40 |
3 |
2 |
89,0 |
52,3 |
11,5 |
1 |
1 |
12 |
51,2 |
41 |
4 |
2 |
132,0 |
89,6 |
11,0 |
1 |
1 |
12 |
75,9 |
42 |
1 |
2 |
40,8 |
19,2 |
10,1 |
1 |
1 |
6 |
21,2 |
43 |
2 |
2 |
59,2 |
31,9 |
11,2 |
1 |
1 |
6 |
30,8 |
44 |
3 |
2 |
65,4 |
38,9 |
9,3 |
1 |
1 |
6 |
34,0 |
45 |
2 |
2 |
60,2 |
36,3 |
10,9 |
1 |
1 |
12 |
31,9 |
46 |
3 |
2 |
82,2 |
49,7 |
13,8 |
1 |
1 |
12 |
43,6 |
47 |
3 |
2 |
98,4 |
52,3 |
15,3 |
1 |
1 |
12 |
52,2 |
48 |
3 |
3 |
76,7 |
44,7 |
8,0 |
1 |
1 |
0 |
43,1 |
49 |
1 |
3 |
38,7 |
20,0 |
10,2 |
1 |
1 |
6 |
25,0 |
50 |
2 |
3 |
56,4 |
32,7 |
10,1 |
1 |
1 |
6 |
35,2 |
51 |
3 |
3 |
76,7 |
44,7 |
8,0 |
1 |
1 |
6 |
40,8 |
52 |
1 |
3 |
38,7 |
20,0 |
10,2 |
1 |
0 |
0 |
18,2 |
53 |
1 |
3 |
41,5 |
20,0 |
10,2 |
1 |
1 |
0 |
20,1 |
54 |
2 |
3 |
48,8 |
28,5 |
8,0 |
1 |
0 |
0 |
22,7 |
55 |
2 |
3 |
57,4 |
33,5 |
10,1 |
1 |
1 |
0 |
27,6 |
56 |
3 |
3 |
76,7 |
44,7 |
8,0 |
1 |
1 |
0 |
36,0 |
57 |
1 |
4 |
37,0 |
17,5 |
8,3 |
1 |
1 |
7 |
17,8 |
58 |
2 |
4 |
54,0 |
30,5 |
8,3 |
0 |
1 |
7 |
25,9 |
59 |
3 |
4 |
68,0 |
42,5 |
8,3 |
0 |
1 |
7 |
32,6 |
60 |
1 |
4 |
40,5 |
16,0 |
11,0 |
0 |
1 |
3 |
19,8 |
61 |
2 |
4 |
61,0 |
31,0 |
11,0 |
0 |
1 |
3 |
29,9 |
62 |
3 |
4 |
80,0 |
45,6 |
11,0 |
0 |
1 |
3 |
39,2 |
63 |
1 |
3 |
52,0 |
21,2 |
11,2 |
1 |
1 |
18 |
22,4 |
64 |
2 |
3 |
78,1 |
40,0 |
11,6 |
1 |
1 |
18 |
35,2 |
65 |
3 |
3 |
91,6 |
53,8 |
16,0 |
1 |
0 |
18 |
41,2 |
66 |
1 |
4 |
39,9 |
19,3 |
8,4 |
0 |
1 |
6 |
17,8 |
67 |
2 |
4 |
56,2 |
31,4 |
11,1 |
0 |
1 |
6 |
25,0 |
68 |
3 |
4 |
79,1 |
42,4 |
15,5 |
0 |
1 |
6 |
35,2 |
69 |
4 |
4 |
91,6 |
55,2 |
9,4 |
0 |
1 |
6 |
40,8 |
Принятые в таблице
обозначения: y-цена квартиры, тыс.долл.; x1 - число комнат в квартире; x2 – район города (1 –
Приморский, Шувалово – Озерки, 2 – Гражданка, 3 –
Юго-Запад, 4 – Красносельский); x3 - общая площадь квартиры (м2); x4 – жилая площадь квартиры
(м2); x5 - площадь кухни (м2); x6 – тип дома (1- кирпичный,
0 – другой); x7 – наличие балкона (1 –
есть, 0 – нет); x8 – число месяцев до окончания
срока строительства. |
Задание
1. Определите факторы,
формировавшие цену квартир в строящихся |Санкт-Петербурге в
2.
Составьте матрицу парных коэффициентов корреляции:
а) исходных переменных;
б) логарифмов исходных переменных (кроме фиктивных переменных). Вместо
переменной х2 используйте фиктивную
переменную г
3. Постройте уравнение регрессии, характеризующее зависимость цены от
всех факторов, в линейной и степенной форме. Установите
какие факторы мультиколлинеарны. В какой модели мультиколлинеарность проявляется сильнее?
4. Постройте модель у = f (x3, x6, x7, x8, z) в линейной и степенной
форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой
модели?
5. Существует ли разница в ценах квартир, расположенных в северной и
южной частях Санкт-Петербурга? Является ли наличие балкона или лоджии
преимуществом квартиры на рынке? Как вы объясните этот факт?
Задача 4.
По данным, представленным в
табл. 2.2.13, изучается зависимость
индекса человеческого развития у от переменных:
X1
- ВВП
X2
- расходы на конечное потребление в текущих ценах, % к ВВП;
хз - расходы домашних хозяйств, % к ВВП;
Xt - валовое накопление, % к ВВП;
Х5 - суточная калорийность питания населения, ккал на душу населения;
Х6- ожидаемая продолжительность жизни при рождении
1997г.
число лет.
Таблица 2.2.13
Страна |
у |
Xi |
Xi |
Хз |
Х4 |
Xs |
Х6 |
Австрия |
0,904 |
115,0 |
75,5 |
56,1 |
25,2 |
3343 |
77,0 |
Австралия |
0,922 |
123,0 |
78,5 |
61,8 |
21,8 |
3001 |
78,2 |
Белоруссия |
0,763 |
74,0 |
78,4 |
59,1 |
25,7 |
3101 |
68,0 |
Бельгия |
0,923 |
111,0 |
77,7 |
63,3 |
17,8 |
3543 |
77,2 |
Великобритания |
0,918 |
113,0 |
84,4 |
64,1 |
15,9 |
3237 |
77,2 |
Германия |
0,906 |
110,0 |
75,9 |
57,0 |
22,4 |
3330 |
77,2 |
Дания |
0,905 |
119,0 |
76,0 |
50,7 |
20,6 |
3808 |
75,7 |
Индия |
0,545 |
146,0 |
67,5 |
57,1 |
25,2 |
2415 |
62,6 |
Испания |
0,894 |
113,0 |
78,2 |
62,0 |
20,7 |
3295 |
78,8 |
Италия |
0,900 |
108,0 |
78,1 |
61,8 |
17,5 |
3504 |
78,2 |
Швеция |
0,932 |
113,0 |
78,6 |
58,6 |
19,7 |
3056 |
79,0 |
Казахстан |
0,740 |
71,0 |
84,0 |
71,7 |
18,5 |
3007 |
67,6 |
Китай |
0,701 |
210,0 |
59,2 |
48,0 |
42,4 |
2844 |
69,8 |
Латвия |
0,744 |
94,0 |
90,2 |
63,9 |
23,0 |
2861 |
68,4 |
Нидерланды |
0,921 |
118,0 |
72,8 |
59,1 |
20,2 |
3259 |
77,9 |
Норвегия |
0,927 |
130,0 |
67,7 |
47,5 |
25,2 |
3350 |
78,1 |
польша |
0,802 |
127,0 |
82,6 |
65,3 |
22,4 |
3344 |
72,5 |
Россия |
0,747 |
61,0 |
74,4 |
53,2 |
22,7 |
2704 |
66,6 |
США |
0,927 |
117,0 |
83,3 |
67,9 |
18,1 |
3642 |
76,7 |
Украина |
0,721 |
46,0 |
83,7 |
61,7 |
20,1 |
2753 |
68,8 |
Финляндия |
0,913 |
107,0 |
73,8 |
52,9 |
17,3 |
2916 |
76,8 |
Франция |
0,918 |
110,0 |
79,2 |
59,9 |
16,8 |
3551 |
78,1 |
Чехия |
0,833 |
99,2 |
71,5 |
51,5 |
29,9 |
3177 |
73,9 |
Швейцария |
0,914 |
101,0 |
75,3 |
61,2 |
20,3 |
3280 |
78,6 |
Швеция |
0,923 |
105,0 |
79,0 |
53,1 |
14,1 |
3160 |
78,5 |
Задание
1. Постройте матрицу парных коэффициентов корреляции.
Рассчитайте коэффициенты множественной детерминации, используя в качестве зависимой переменной каждый фактор.
Установите, какие факторы мультиколлинеарны.
2. Постройте уравнение множественной регрессии в линейной
форме с полным набором факторов.
3. Оцените статистическую значимость уравнения регрессии
и его параметров с помощью критериев
Фишера и Стьюдента.
4. Отберите информативные факторы по пп.1 и 3. Постройте
уравнение регрессии со статистически
значимыми факторами.
Задание 5.
Имеются данные по странам за
Таблица 2.2.14
Страна |
Индекс человеческого развития, у |
Ожидаемая
продолжительность жизни при рождении в |
Суточная калорийность
питания населения, ккал на душу, X2 |
Австрия |
0,904 |
77,0 |
3343 |
Австралия |
0,922 |
78,2 |
3001 |
Аргентина |
0,827 |
72,9 |
3136 |
Белоруссия |
0,763 |
68,0 |
3101 |
Бельгия |
0,923 |
77,2 |
3543 |
Бразилия |
0,739 |
66,8 |
2938 |
Великобритания |
0,918 |
77,2 |
3237 |
Венгрия |
0,795 |
70,9 |
3402 |
Германия |
0,906 |
77,2 |
3330 |
Греция |
0,867 |
78,1 |
3575 |
Дания |
0,905 |
75,7 |
3808 |
Египет |
0,616 |
66,3 |
3289 |
Израиль |
0,883 |
77,8 |
3272 |
Индия |
0,545 |
62,6 |
2415 |
Испания |
0,894 |
78,0 |
3295 |
Италия |
0,900 |
78,2 |
3504 |
Канада |
0,932 |
79,0 |
3056 |
Казахстан |
0,740 |
67,7 |
3007 |
Китай |
0,701 |
69,8 |
2844 |
Латвия |
0,744 |
68,4 |
2861 |
Нидерланды |
0,921 |
77,9 |
3259 |
Норвегия |
0,927 |
78,1 |
3350 |
Польша |
0,802 |
72,5 |
3344 |
Республика Корея |
0,852 |
72,4 |
3336 |
Россия |
0,747 |
66,6 |
2704 |
Румыния |
0,752 |
69,9 |
2943 |
США |
0,927 |
76,6 |
3642 |
Турция |
0,728 |
69,0 |
3568 |
Украина |
0,721 |
68,8 |
2753 |
Финляндия |
0,913 |
76,8 |
2916. |
Франция |
0,918 |
78,1 |
3551 |
Чехия |
0,833 |
73,9 |
3177 |
Швейцария |
. 0,914 |
78,6 |
3280 |
Швеция |
0,923 |
78,5 |
3160, |
ЮАР |
0,695 |
64,1 |
2933 |
Япония |
0,924 |
80,0 |
2905 |
Задание
1. Постройте матрицу парных коэффициентов корреляции.
2. Постройте парные уравнения регрессии.
3. Оцените статистическую
значимость уравнений и их параметров с помощью критериев Фишера и Стьюдента.
4. Постройте уравнение множественной регрессии.
5. Постройте графики остатков. Сделайте выводы.
6. Проведите тестирование
ошибок уравнения множественной регрессии
на гетероскедастичность, применив тест Гельфельда-Квандта.
7. Оцените статистическую значимость уравнения
множественной регрессии. Определите, какое уравнение лучше использовать для
прогноза:
¨
парную регрессию у на х1
¨
парную регрессию у на х 2;
¨
множественную регрессию.
Задача 6.
Изучается зависимость средней ожидаемой
продолжительности y от нескольких факторов по данным за
Таблица 2.2.15
Страна |
У |
Х1 |
Х2 |
X3 |
X4 |
Мозамбик |
47 |
3,0 |
2,6 |
2,4 |
113 |
Бурунди |
49 |
2,3 |
2,6 |
2,7 |
98 |
Чад |
48 |
2,6 |
2,5 |
2,5 |
117 |
Непал |
55 |
4,3 |
2,5 |
2,4 |
91 |
Буркино-Фасо |
49 |
2,9 |
2,8 |
2,1 |
99 |
Мадагаскар |
52 |
2,4 |
3,1 |
3,1 |
89 |
Бангладеш |
58 |
5,1 |
1,6 |
2,1 |
79 |
Гаити |
57 |
3,4 |
2,0 |
1,7 |
72 |
Нигерия |
53 |
4,5 |
2,9 |
2,8 |
80 |
Мали |
50 |
2,0 |
2,9 |
2,7 |
123 |
Кения |
58 |
5,1 |
2,7 |
2,7 |
58 |
Того |
56 |
4,2 |
3,0 |
2,8 |
88 |
Индия |
62 |
5,2 |
1.8 |
2,0 |
68 |
Бенин |
50 |
6,5 |
2,9 |
2,5 |
95 |
Никарагуа |
68 |
7,4 |
3,1 |
4,0 |
46 |
Гана |
59 |
7,4 |
2,8 |
2,7 |
73 |
Ангола |
47 |
4,9 |
3,1 |
2,8 |
124 |
Пакистан |
60 |
8,3 |
2,9 |
3,3 |
90 |
Мавритания |
51 |
5,7 |
2,5 |
2,7 |
96 |
Зимбабве |
57 |
7,5 |
2,4 |
2,2 |
55 |
Гондурас |
67 |
7,0 |
3,0 |
3,8 |
45 |
Китай |
69 |
10,8 |
1,1 |
1,1 |
34 |
Камерун |
57 |
7,8 |
2.9 |
3,1 |
56 |
Конго |
51 |
7,6 |
2,9 |
2;6 |
90 |
Шри-Ланка |
72 |
12,1 |
1,3 |
2,0 |
16 |
Египет |
63 |
14,2 |
2,0 |
2,7 |
56 |
Индонезия |
64 |
14,1 |
1,6 |
2,5 |
51 |
Филиппины |
66 |
10,6 |
2,2 |
2,7 |
39 |
Марокко |
65 |
12,4 |
2,0 |
2,6 |
55 |
Папуа -
Новая Гвинея |
57 |
9,0 |
2,3 |
2,3 |
64 |
Гватемала |
66 |
12,4 |
2,9 |
3,5 |
44 |
Эквадор |
69 |
15,6 |
2,2 |
3,2 |
36 |
Доминиканская Республика |
71 |
14,3 |
1,9 |
2,6 |
37 |
Ямайка |
74 |
13,1 |
1,0 |
1,8 |
13 |
Алжир |
70 |
19,6 |
2,2 |
4,1 |
34 |
Республика Эль-Сальвадор |
67 |
9,7 |
2,2 |
3,4 |
36 |
Парагвай |
68 |
13,5 |
2,7 |
2,9 |
41 |
Тунис |
69 |
18,5 |
1,9 |
3,0 |
39 |
Белоруссия |
70 |
15,6 |
0,2 |
0,2 |
13 |
Перу |
66 |
14,0 |
2,0 |
3,1 |
47 |
Таиланд |
69 |
28,0 |
0,9 |
1,3 |
35 |
Панама |
73 |
22,2 |
1,7 |
2,4 |
23 |
Турция |
67 |
20,7 |
1,7 |
2,1 |
48 |
Польша |
70 |
20,0 |
0,3 |
0,6 |
14 |
Словакия |
72 |
13,4 |
0,3 |
0,7 |
11 |
Венесуэла |
71 |
29,3 |
2,3 |
3,0 |
23 |
ЮАР |
64 |
18,6 |
2,2 |
2,4 |
50 |
Мексика |
72 |
23,7 |
1,9 |
2,8 |
33 |
Мавритания |
71 |
49,0 |
1,3 |
1,8 |
16 |
Бразилия |
67 |
20,0 |
1,5 |
1,6 |
44 |
Тринидад |
72 |
31,9 |
0,8 |
1,8 |
13 |
Малайзия |
71 |
33,4 |
2,4 |
2,7 |
12 |
Чили |
72 |
35,3 |
1,5 |
2,1 |
12 |
Уругвай |
73 |
24,6 |
0,6 |
1,0 |
18 |
Аргентина |
73 |
30,8 |
1,3 |
2,0 |
22 |
Греция |
78 |
43,4 |
0,6 |
0,9 |
8 |
Республика Корея |
72 |
42,4 |
0,9 |
1,9 |
10 |
Испания |
77 |
53,8 |
0,2 |
1,0 |
7 |
Нов. Зеландия |
76 |
60,6 |
1,4 |
1,5 |
7 |
Ирландия |
77 |
58,1 |
0,5 |
1,7 |
6 |
Израиль |
77 |
61,1 |
3,5 |
3,5 |
8 |
Австрия |
77 |
70,2 |
1,1 |
1,4 |
6 |
Италия |
78 |
73,7 |
0,2 |
0,4 |
7 |
Канада |
78 |
78,3 |
1,3 |
1,0 |
6 |
Финляндия |
76 |
65,8 |
0,5 |
0,1 |
5 |
Гонконг |
79 |
85,1 |
1,6 |
1,3 |
5 |
Швеция |
79 |
68,7 |
0,6 |
0,3 |
4 |
Нидерланды |
78 |
73,9 |
0,7 |
0,6 |
6 |
Бельгия |
77 |
80,3 |
0,4 |
0,5 |
8 |
Франция |
78 |
78,0 |
0,5 |
0,8 |
6 |
Сингапур |
76 |
84,4 |
2,0 |
1,7 |
4 |
Австрия |
77 |
78,8 |
0,8 |
0,5 |
6 |
США |
77 |
100,0 |
1,0 |
1,1 |
8 |
Дания |
75 |
78,7 |
0,3 |
0,1 |
6 |
Япония |
80 |
82,0 |
0,3 |
0,6 |
4 |
Швейцария |
78 |
95,9 |
1,0 |
0,8 |
6 |
Принятые в таблице
обозначения: y – ожидаемая
продолжительность жизни при рождении, лет; x1 - ВВП в паритетах покупательной способности; x2 – темпы прироста
населения по сравнению с предыдущим годом, %; x3 - темп прироста рабочей силы по сравнению с
предыдущим годом, %; x4 – коэффициент
младенческой смертности; |
В современной экономике, в бизнесе
без прогноза не обойтись. Любое серьезное решение, в особенности связанное с
вложением денег требует прогноза, предвидения развития экономической ситуации.
Для того чтобы предвидеть будущее, надо хорошо знать прошлое и присущие
ему закономерности.
Если в течение достаточно продолжительного времени регулярно
фиксировать курсы валют, акций, цены на товары и т.д., то такие данные образуют
временные ряды. Временными рядами являются также данные о выпуске или
потреблении различных товаров и услуг по месяцам, кварталам, годам. В
производстве временные ряды возникают при измерении количества изделий,
выпускаемых подразделениями предприятия за час, смену, декаду, при оценках
количества брака за те же периоды, при наблюдении за изменениями запасов на
складах.
В экономике и бизнесе данные типы временных рядов появляются очень
часто.
Во временном ряде содержится информация об особенностях и закономерностях
протекания процесса, а статистический анализ позволяет выявить и использовать
их для оценки характеристик процесса в будущем, т.е. для прогнозирования.
Временной ряд - набор чисел,
привязанный к последовательным, обычно равноотстоящим моментам времени. Числа,
составляющие ряд и получающиеся как результат наблюдения за ходом некоторого
процесса, называются элементами, а промежуток времени между наблюдениями - шагом квантования по времени (или короче - шагом по времени). Элементы ряда нумеруют в
соответствии с номером момента времени, к которому этот элемент относится (т.е.
обозначают их как Y1,Y2,....,Yn).
Формально задача прогнозирования сводится к получению оценок значений
ряда на некотором периоде будущего, т.е. к получению значения Yp(t), t= N + 1, N+2, .... При
использовании методов экстраполяции исходят из предположения о сохранении
закономерностей прошлого развития на период прогнозирования. Во многих случаях
(но не всегда!) при разработке оперативного (до года) и краткосрочного (до 2 лет) прогноза эти предположения являются
справедливыми.
Прогноз рассчитывается в два этапа. На первом - формальном - выявляют при
помощи статистических методов закономерности прошлого развития и переносят их
(экстраполируют) на некоторый период будущего. На втором - производится корректировка полученного прогноза, с учетом
результатов содержательного анализа текущего состояния.
Статистические методы исследования исходят из предположения о
возможности представления уровней временного ряда в виде суммы нескольких
компонент, отражающих закономерность и случайность развития.
в частности в виде суммы четырех компонент:
Y(t)=f(t)+S(t)+U(t)+E(t),
где f(r) - тренд (долгосрочная
тенденция) развития;
S (t) - сезонная компонента;
U (t) -
циклическая компонента;
Е (t) - остаточная компонента.
Сезонная компонента
характеризует устойчивые внутригодичные колебания
уровней, которые носят периодический или близкий к нему характер. Она
проявляется в некоторых показателях, представленных квартальными или месячными
данными.
В тех случаях, когда период колебаний составляет несколько лет,
говорят, что во временном ряде присутствует циклическая компонента.
Основная цель статистического анализа временных рядов - изучение соотношения между закономерностью
и случайностью в формировании значений уровней ряда, оценка количественной
меры их влияния. Закономерности, объясняющие динамику показателя в прошлом, используются
для прогнозирования его значении в будущем, а учет случайности позволяет
определить вероятность отклонения от закономерного развития и его возможную
величину.
При построении моделей
регрессии по временным рядам для устранения тенденции используются следующие
методы.
Метод отклонений от тренда предполагает вычисление
трендовых значений для каждого временного ряда модели, например , и расчет отклонений от трендов: и .
Для дальнейшего анализа используют не исходные данные, а отклонения от тренда.
Метод последовательных
разностей заключается
в следующем:
Если ряд содержит линейный тренд, тогда исходные данные заменяются
первыми разностями:
если параболический тренд – вторыми разностями:
В случае экспоненциального и степенного тренда метод последовательных
разностей применяется к логарифмам исходных данных.
Модель, включающая фактор времени, имеет вид
Параметры a и b в этой модели определяются
обычным методом МНК.
Автокорреляция в остатках – корреляционная зависимость
между значениями остатков за текущий
и предыдущие моменты времени.
Для определения автокорреляции остатков используют критерий Дарбина-Уотсона и расчет величины:
Коэффициент автокорреляции остатков первого порядка определяется по
формуле
Критерий Дарбина-Уотсона и коэффициент
автокорреляции остатков первого порядка связаны соотношением
Если в остатках существует полная положительная автокорреляция и , то d=0. Если в остатках полная
отрицательная автокорреляция, то и, следовательно, d=4.
Если автокорреляция остатков отсутствует, то и d=2.
Следовательно
.
При анализе временных рядов широко применяются графические методы. Это
объясняется тем, что табличное представление временного ряда и описательные
характеристики чаще всего не позволяют понять характер процесса, а по графику
временного ряда можно сделать определенные выводы, которые потом могут быть
проверены с помощью расчетов.
Визуальный анализ графика временного ряда позволяет сделать выводы о
следующем:
• наличии
тренда и его характере;
• наличии
сезонных и циклических компонент;
• степени плавности или прерывистости изменений последовательных
значений ряда после устранения тренда.
Так графический анализ ряда обычно задает направление его дальнейшего
анализа.
В EXCEL для анализа временных рядов можно использовать средство
Мастер диаграмм.
Для создания диаграммы с помощью средства Мастер диаграмм необходимо
сначала выделить данные, которые будут отображены на диаграмме (это
необязательная операция, однако она позволит сэкономить время при работе с
Мастером). В выделяемые данные следует включить как числовые данные, так и их
подписи. Excel автоматически распознает подписи и использует их
при построении диаграммы. Пример рабочего листа,
соответствующая часть которого (ячейки А5:А17) будет выделена для Мастера
диаграмм, показан на рис. 2.1.
Работа с Мастером диаграмм состоит из четырех основных шагов,
выполнение которых рассмотрим на следующем примере.
Пример 2.1. Построить график временного ряда Индекс потребительских расходов,
выделить тренд этого временного ряда и построить прогноз на два шага вперед.
Исходные данные по этому временному ряду за 16 месяцев приведены в табл. 2.1.
Рис. 2.1. Выделение данных перед
началом работы с Мастером диаграмм.
Таблица 2.1
№п/п |
Индекс потребительских расходов |
№ п/п |
Индекс потребительских расходов |
1 |
100 |
9 |
108.3 |
2 |
98.4 |
10 |
109.2 |
3 |
101.2 |
11 |
110.1 |
4 |
103.5 |
12 |
110.7 |
5 |
104.1 |
13 |
110.3 |
6 |
107 |
14 |
111.8 |
7 |
107.4 |
15 |
112.3 |
8 |
108.5 |
16 |
112.9 |
Шаг 1. Выбор типа и вида диаграммы.
Во вкладке Стандартные можно увидеть основные типы диаграмм. В данном
случае во вкладке Стандартные выделен тип: График.
Выбрав вид: График с маркерами, необходимо щелкнуть на кнопку
Далее (рис. 2.2).
Рис. 2.2. На первом этапе выбирается вид создаваемой
диаграммы.
Шаг 2. Выбор и уточнение ориентации диапазона данных и ряда.
На втором этапе работы мастера диаграмм на экране появится диалоговое
окно, показанное на рис. 2.3. Используя
вкладку Диапазон данных, можно
выполнить следующие операции:
1. Выбрать (или изменить)
диапазон данных листа, используемых для диаграммы, с помощью поля «Диапазон».
Если перед началом работы с Мастером
диаграмм данные не были выделены, то, используя это поле, можете выделить
их сейчас.
2. Уточнить ориентацию
диапазона данных диаграммы с помощью переключателей в строках и столбцах. При
установке первого из них каждая строка рабочего листа будет рассматриваться как
ряд диаграммы. При установке второго переключателя в качестве ряда диаграмм
будут рассматриваться столбцы данных.
Во вкладке Ряд можно
управлять параметрами каждого ряда диаграммы. С ее помощью можно выполнить
следующие операции:
1. добавить и удалить ряды;
2. присвоить рядам имена;
3. выделить (или
переопределить) данные, используемые для построения рядов;
4. изменить подписи категорий.
Рис 2.3. шаг 2.
Вкладка Диапазон данных.
Шаг 3. Настройка диаграммы.
Третий этап работы Мастера диаграмм наиболее сложный. В появившемся
диалоговом окне предлагается
большое количество самых различных параметров
диаграмм (рис.2.4). Если параметры не изменяются, то используются
установленное по умолчанию значение
Шаг 4. Выбор местоположения диаграммы.
На последнем шаге определяется
местоположение созданной
диаграммы (рис. 2.5.)
Рис.3.2.4 Диалоговое окно мастера диаграмм на третьем шаге.
Рис.2.5. диаграмма будет расположена
на одном листе с исходными
данными.
Рис.2.6. результаты Мастера диаграмм. Новая диаграмма внедрена как
объект в рабочий лист
EXCEL предоставляет
дополнительные возможности по работе . Диаграммами.
Наиболее полезной, с точки зрения анализа временных рядов, представляется возможность
создания линий тренда.
Построение линий тренда
Линии тренда строятся для
описания закономерности, содержащейся в исследуемом временном ряду. В табл. 2.2 приведены типы линий тренда, используемые
в EXCEL.
Таблица 2.2
Тип зависимости |
Уравнение |
Линейная Полиномиальная Логарифмическая Экспоненциальная Степенная |
Y = α0
+α1x Y = α0
+α1x+α2x2 +…..+ α6x6 Y αlnx+b Y= αebx Y=αxb |
Для вставки линии тренда в
диаграмму выполните следующие действия:
1. Щелкните правой кнопкой мыши
на одном из рядов диаграммы.
2. Выберите команду Добавить линию тренда из контекстного меню. На экране
появится диалоговое окно Линия тренда (рис.
2.7).
3. Выберите тип регрессии. При
выборе типа Полиномиальная введите значение степени в поле «Степень»' . Если же вы выбрали тип Скользящее среднее
(который не является регрессией), то введите значение в поле «Точки».
4. Убедитесь в том, что ряд,
для которого необходимо построить линию тренда, выделен в списке Построение
линии тренда на ряде. Если нет, то выделите его.
5. Переключитесь на вкладку
Параметры (рис. 2.8).
6. В разделе Название
аппроксимирующей (сглаженной) кривой установите переключатель автоматическое
или другое, после чего введите название в поле. Это название появится в
легенде диаграммы.
7. Если линия тренда создается
с помощью регрессии, т.е. выбран любой тип. кроме скользящего среднего, то в соответствующих полях можно
ввести прогнозируемое количество периодов, которые будут добавлены к линии
тренда впереди или сзади.
8. В случае необходимости можете установить и
остальные параметры (они могут быть доступны или недоступны в зависимости от
выбранного типа регрессии). Так, можно установить пересечение с осью Y,
отображение на диаграмме уравнения или величины достоверности аппроксимации.
9. Щелкните на кнопке ОК для завершения процесса создания линии тренда
Рис. 2.7. Вкладка Тип используется для выбора типа
создаваемой линии тренда.
Рис. 2.8. Установка остальных
параметров линии тренда выполняется с. помощью вкладки Параметры.
На рис. 2.9 приведен результат построения тренда и
прогнозирования по тренду У = 97.008 + 1.739t - 0.0488t2 для временного ряда Индекс потребительских
расходов. В качестве аппроксимирующей функции выбран полином второй степени - парабола, по которой построен прогноз на два
шага вперед.
Рис. 2.9. График
временного ряда.
Таблица 2.3
№ п/п |
Реклама |
№п/п |
Реклама |
1 |
4 |
9 |
19.8 |
2 |
4.8 |
10 |
10.6 |
3 |
3.8 |
11 |
8.6 |
4 |
8.7 |
12 |
6.5 |
5 |
8.2 |
13 |
12.6 |
6 |
9.7 |
14 |
6.5 |
7 |
14.7 |
15 |
5.8 |
8 |
18.7 |
16 |
5 7 |
Для решения поставленной
задачи необходимо выполнить следующую последовательность действий.
1. Выделить ячейки А1:А17,
содержащие наименование временного ряда и исходные данные.
2. Вызвать Мастер диаграмм.
3. Выбрать тип диаграммы:
график; выбрать вид: первый (шаг 1).
4. Шаг 2. Щелкнуть кнопку Далее.
5. Шаг 3. Щелкнуть кнопку Далее.
6. Шаг 4. Щелкнуть кнопку Готово. На экране - построенный график.
7. Щелкнуть правой кнопкой на
линии графика. График выделен метками.
8. Выбрать
тип Линейная в диалоговом окне Линия тренда (потом Логарифмическая и
Полиномиальная третьей степени}.
9. Вкладка Параметры.
Назначаем: показывать уравнение на диаграмме.
10.
Для построения прогноза выбрать модель с наибольшим
R2.(Подробнее
об R2
см. в подразд. первой
работы).
Задания к лабораторной
работе:
В задачах 1-8 выполните:
-
постройте уравнения тренда различных типов;
-
проверьте существование автокорреляции остатков с помощью критерия Дарбина-Уотсона.
-
на основе полученных уравнений выберите наилучшее решение с помощью
скорректированного коэффициента детерминации и сделайте прогноз для 3-х новых
значений t.
Задача 1.
В
таблице приводятся сведения об уровне среднегодовых цен на какао-бобы из Бразилии, амер. центы за
фунт.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
29,4 |
1977 |
183,5 |
1984 |
105,3 |
1991 |
47,5 |
1971 |
23,5 |
1978 |
153,5 |
1985 |
94,9 |
1992 |
45,0 |
1972 |
26,2 |
1979 |
140,7 |
1986 |
92,0 |
1993 |
44,5 |
1973 |
48,5 |
1980 |
107,1 |
1987 |
83,9 |
1994 |
55,9 |
1974 |
73,4 |
1981 |
87,5 |
1988 |
72,7 |
1995 |
60,5 |
1975 |
56,6 |
1982 |
68,3 |
1989 |
56,9 |
1996 |
64,1 |
1976 |
77,0 |
1983 |
83,1 |
1990 |
49,1 |
1997 |
71,0 |
Задача 2.
В таблице приводятся сведения об уровне средне) на
рис из Таиланда на рынках Бангкока, амер. доллары скую тонну.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
143 |
1977 |
272 |
1984 |
252 |
1991 |
287 |
1971 |
130 |
1978 |
369 |
1985 |
217 |
1992 |
291 |
1972 |
150 |
1979 |
334 |
1986 |
210 |
1993 |
237 |
1973 |
296 |
1980 |
434 |
1987 |
229 |
1994 |
269 |
1974 |
542 |
1981 |
483 |
1988 |
302 |
1995 |
321 |
1975 |
363 |
1982 |
293 |
1989 |
320 |
1996 |
338 |
1976 |
254 |
1983 |
277 |
1990 |
270 |
1997 |
303 |
Задача 3.
В таблице
приводятся сведения об уровне среднегодовых цен на
говядину из США на рынках Нью-Йорка, амер. центы за фунт.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
41 |
1977 |
51 |
1984 |
97 |
1991 |
90 |
1971 |
42 |
1978 |
71 |
1985 |
89 |
1992 |
90 |
1972 |
49 |
1979 |
92 |
1986 |
77 |
1993 |
93 |
1973 |
64 |
1980 |
87 |
1987 |
81 |
1994 |
87 |
1974 |
53 |
1981 |
86 |
1988 |
82 |
1995 |
84 |
1975 |
44 |
1982 |
99 |
1989 |
87 |
1996 |
85 |
1976 |
52 |
1983 |
96 |
1990 |
94 |
1997 |
86 |
Задача 4.
В таблице
приводятся сведения об уровне среднегодовых цен на каучук из Малайзии на рынках
Сингапура, амер. центы за фунт.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
18,5 |
1977 |
36,9 |
1984 |
43,4 |
1991 |
37,5 |
1971 |
15,1 |
1978 |
44,7 |
1985 |
34,4 |
1992 |
39,1 |
1972 |
15,1 |
1979 |
57,3 |
1986 |
36,6 |
1993 |
37,7 |
1973 |
30,8 |
1980 |
64,6 |
1987 |
44,7 |
1994 |
51,1 |
1974 |
34,1 |
1981 |
50,9 |
1988 |
53,7 |
1995 |
71,7 |
1975 |
25,4 |
1982 |
38,9 |
1989 |
44,0 |
1996 |
63,6 |
1976 |
35,1 |
1983 |
48,3 |
1990 |
39,2 |
1997 |
46,2 |
Задача 5.
В таблице приводятся сведения об уровне среднегодовых цен на каучук,
поступивший на рынки Нью-Йорка из всех источников, амер. центы за фунт.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
21,1 |
1977 |
41
5 |
1984 |
49,6 |
1991 |
47,6 |
1971 |
18,0 |
1978 |
49,9 |
1985 |
41,8 |
1992 |
46,6 |
1972 |
18,1 |
1979 |
64,2 |
1986 |
41,2 |
1993 |
47,3 |
1973 |
35,1 |
1980 |
73,4 |
1987 |
44,1 |
1994 |
48,9 |
1974 |
39,7 |
1981 |
56,9 |
1988 |
48,8 |
1995 |
56,7 |
1975 |
29,8 |
1982 |
45,3 |
1989 |
48,7 |
1996 |
54,8 |
1976 |
39,5 |
1983 |
56,1 |
1990 |
50,2 |
1997 |
53,5 |
Задача 6.
В таблице приводятся сведения об уровне среднегодовых цен на мировых
рынках на шерсть из Новой Зеландии, амер. центы за килограмм.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
73,8 |
1977 |
256,4 |
1984 |
230,7 |
1991 |
249,3 |
1971 |
72,6 |
1978 |
249,6 |
1985 |
234,9 |
1992 |
242,9 |
1972 |
106,9 |
1979 |
300,4 |
1986 |
248,5 |
1993 |
234,3 |
1973 |
237,5 |
1980 |
316,7 |
1987 |
333,0 |
1994 |
287,9 |
1974 |
214,7 |
1981 |
274,6 |
1988 |
403,2 |
1995 |
356,2 |
1975 |
147,6 |
1982 |
239,7 |
1989 |
386,3 |
1996 |
348,3 |
1976 |
202,9 |
1983 |
221,9 |
1990 |
341,5 |
|
|
Задача 7.
В таблице приводятся сведения об уровне среднегодовых цен на мировых
рынках на немытую шерсть из Австралии, амер. центы за килограмм.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
98,2 |
1977 |
227,0 |
1984 |
282,0 |
1991 |
307,5 |
1971 |
79,7 |
1978 |
234,8 |
1985 |
258,5 |
1992 |
302,6 |
1972 |
117,8 |
1979 |
259,6 |
1986 |
259,5 |
1993 |
240,4 |
1973 |
305,1 |
1980 |
302,5 |
1987 |
343,2 |
1994 |
323,2 |
1974 |
251,9 |
1981 |
328,5 |
1988 |
567,1 |
1995 |
395,8 |
1975 |
182,4 |
1982 |
306,5 |
1989 |
520,9 |
1996 |
325,7 |
1976 |
197,9 |
1983 |
269,3 |
1990 |
446,6 |
1997 |
358,5 |
Задача 8.
В таблице приводятся сведения об уровне
среднегодовых цен на рис из Таиланда на
рынках Бангкока, амер. доллары за тонну.
Год |
Цена |
Год |
Цена |
Год |
Цена |
Год |
Цена |
1970 |
143,0 |
1977 |
272,4 |
1984 |
252.3 |
1991 |
287,1 |
1971 |
130,3 |
1978 |
368,5 |
1985 |
217,4 |
1992 |
291,0 |
1972 |
149,9 |
1979 |
334,3 |
1986 |
210,2 |
1993 |
237,3 |
1973 |
296,6 |
1980 |
433,7 |
1987 |
229,8 |
1994 |
269,5 |
1974 |
541,5 |
1981 |
482,8 |
1988 |
301,5 |
1995 |
320,8 |
1975 |
363,2 |
1982 |
293,4 |
1989 |
320,3 |
1996 |
338,1 |
статистико-математические
таблицы
1. Таблица значений F-критерия Фишера
при уровне значимости α = 0,05
K2\K1 |
1 |
2 |
3 |
4 |
5 |
6 |
8 |
12 |
24 |
¥ |
1 |
161,45 |
199,50 |
215,72 |
224,57 |
230,17 |
233,97 |
238,89 |
243,91 |
249,04 |
254,32 |
2 |
18,51 |
19,00 |
19,16 |
19,25 |
19,30 |
19,33 |
19,37 |
19,41 |
19,45 |
19,50 |
3 |
10,13 |
9,55 |
9,28 |
9,12 |
9,01 |
8,94 |
8,84 |
8,74 |
8,64 |
8,53 |
4 |
7,71 |
6,94 |
6,59 |
6,39 |
6,26 |
6,16 |
6,04 |
5,91 |
5,77 |
5,63 |
5 |
6,61 |
5,79 |
5,41 |
5,19 |
5,05 |
4,95 |
4,82 |
4,68 |
4,53 |
4,36 |
6 |
5,99 |
5,14 |
4,76 |
4,53 |
4,39 |
4,28 |
4,15 |
4,00 |
3,84 |
3,67 |
7 |
5,59 |
4,74 |
4,35 |
4,12 |
3,97 |
3.87 |
3,73 |
3,57 |
3,41 |
3,23 |
8 |
5,32 |
4,46 |
4,07 |
3,84 |
3,69 |
3,58 |
3,44 |
3,28 |
3,12 |
2,93 |
9 |
5,12 |
4.26 |
3,86 |
3,63 |
3,48 |
3,37 |
3,23 |
3,07 |
2,90 |
2,71 |
10 |
4,96 |
4,10 |
3,71 |
3,48 |
3,33 |
3,22 |
3,07 |
2,91 |
2,74 |
2,54 |
11 |
4,84 |
3,98 |
3,59 |
3,36 |
3,20 |
3,09 |
2,95 |
2,79 |
2,61 |
2,40 |
12 |
4,75 |
3,88 |
3,49 |
3,26 |
3,11 |
3,00 |
2,85 |
2,69 |
2,50 |
2,30 |
13 |
4,67 |
3,80 |
3,41 |
3.18 |
3,02 |
2,92 |
2,77 |
2,60 |
2,42 |
2,21 |
14 |
4,60 |
3,74 |
3,34 |
3,11 |
2,96 |
2,85 |
2,70 |
2,53 |
2,35 |
2,13 |
15 |
4,54 |
3,68 |
3,29 |
3,06 |
2,90 |
2,79 |
2,64 |
2,48 |
2,29 |
2,07 |
16 |
4,49 |
3,63 |
3,24 |
3,01 |
2,85 |
2,74 |
2,59 |
2,42 |
2,24 |
2,01 |
17 |
4,45 |
3,59 |
3,20 |
2,96 |
2,81 |
2,70 |
2,55 |
2,38 |
2,19 |
1,96 |
18 |
4,41 |
3,55 |
3,16 |
2,93 |
2,77 |
2,66 |
2,51 |
2,34 |
2,15 |
1,92 |
19 |
4,38 |
3,52 |
3,13 |
2,90 |
2,74 |
2,63 |
2,48 |
2,31 |
2,11 |
1,88 |
20 |
4,35 |
3,49 |
3,10 |
2,87 |
2,71 |
2,60 |
2,45 |
2,28 |
2,08 |
1,84 |
21 |
4,32 |
3,47 |
3,07 |
2,84 |
2,68 |
2,57 |
2,42 |
2,25 |
2,05 |
1,81 |
22 |
4,30 |
3,44 |
3,05 |
2,82 |
2,66 |
2,55 |
2,40 |
2,23 |
2,03 |
1,78 |
23 |
4,28 |
3,42 |
3,03 |
2,80 |
2,64 |
2,53 |
2,38 |
2,20 |
2,00 |
1,76 |
24 |
4,26 |
3,40 |
3,01 |
2,78 |
2,62 |
2,51 |
2,36 |
2,18 |
1,98 |
1,73 |
25 |
4,24 |
3,38 |
2,99 |
2,76 |
2,60 |
2,49 |
2,34 |
2,16 |
1,96 |
1,71 |
26 |
4,22 |
3,37 |
2,98 |
2,74 |
2,59 |
2,47 |
2,32 |
2,15 |
1,95 |
1,69 |
27 |
4,21 |
3,35 |
2,96 |
2,73 |
2,57 |
2,46 |
2,30 |
2,13 |
1,93 |
1,67 |
28 |
4,20 |
3,34 |
2,95 |
2,71 |
2,56 |
2,44 |
2,29 |
2,12 |
1,91 |
1,65 |
29 |
4,18 |
3,33 |
2,93 |
2,70 |
2,54 |
2,43 |
2,28 |
2,10 |
1,90 |
1,64 |
30 |
4,17 |
3,32 |
2,92 |
2,69 |
2,53 |
2,42 |
2,27 |
2,09 |
1,89 |
1,62 |
35 |
4,12 |
3,26 |
2,87 |
2,64 |
2,48 |
2,37 |
2,22 |
2,04 |
1,83 |
1,57 |
40 |
4,08 |
3,23 |
2,84 |
2,61 |
2,45 |
2,34 |
2,18 |
2,00 |
1,79 |
1,51 |
45 |
4,06 |
3,21 |
2,81 |
2,58 |
2,42 |
2,31 |
2,15 |
1,97 |
1,76 |
1,48 |
50 |
4,03 |
3,18 |
2,79 |
2,56 |
2,40 |
2,29 |
2,13 |
1,95 |
1,74 |
1,44 |
60 |
4,00 |
3,15 |
2,76 |
2,52 |
2,37 |
2,25 |
7,10 |
1,92 |
1,70 |
1,39 |
70 |
3,98 |
3,13 |
2,74 |
2,50 |
2,35 |
2,23 |
?П7 |
1,89 |
1,67 |
1,35 |
80 |
3,96 |
3,11 |
2,72 |
2.49 |
2,33 |
2,21 |
7,06 |
1,88 |
1,65 |
1,31 |
90 |
3,95 |
3,10 |
2,71 |
2,47 |
2,32 |
2,20 |
2,04 |
1,86 |
1,64 |
1,28 |
100 |
3,94 |
3,09 |
2,70 |
2,46 |
2,30 |
2,19 |
2,03 |
1,85 |
1,63 |
1,26 |
125 |
3,92 |
3,07 |
2,68 |
2,44 |
2,29 |
2,17 |
2,01 |
1,83 |
1,60 |
1,21 |
150 |
3,90 |
3,06 |
2,66 |
2,43 |
2,27 |
2,16 |
2,00 |
1,82 |
1,59 |
1,18 |
200 |
3,89 |
3,04 |
2,65 |
2,42 |
2,26 |
2,14 |
1,98 |
1,80 |
1,57 |
1,14 |
300 |
3,87 |
3,03 |
2,64 |
2,41 |
2,25 |
2,13 |
1,97 |
1,79 |
1,55 |
1,10 |
400 |
3,86 |
3,02 |
2,63 |
2,40 |
2,24 |
2,12 |
1,96 |
1,78 |
1,54 |
1,07 |
500 |
3,86 |
3,01 |
2,62 |
2,39 |
2,23 |
2,11 |
1,96 |
1,77 |
1,54 |
1,06 |
1000 |
3,85 |
3,00 |
2,61 |
2,38 |
2,22 |
2,10 |
1,95 |
1,76 |
1,53 |
1,03 |
¥ |
3,84 |
2,99 |
2,60 |
2,37 |
2,21 |
2,09 |
,94 |
1,75 |
1,52 |
1,00 |
2.
Критические значения t-критерия
Стьюдента при уровне 0,10,0,05,0,01 (двухсторонний)
Число степеней свободы d.f. |
α |
Число степеней свободы d.f. |
Α |
||||
0,10 |
0,05 |
0,01 |
0,10 |
0,05 |
0,01 |
||
1 |
6,3138 |
12,706 |
63,657 |
18 |
1,7341 |
2,1009 |
2,8784 |
2 |
2,9200 |
4,3027 |
9,9248 |
19 |
1,7291 |
2,0930 |
2,8609 |
3 |
2,3534 |
3,1825 |
5,8409 |
20 |
1,7247 |
2,0860 |
2,8453 |
4 |
2,1318 |
2,7764 |
4,6041 |
21 |
1,7207 |
2,0796 |
2,8314 |
5 |
2,0150 |
2,5706 |
4,0321 |
22 |
1,7171 |
2,0739 |
2,8188 |
6 |
1,9432 |
2,4469 |
3,7074 |
23 |
1,7139 |
2,0687 |
2,8073 |
7 |
1,8946 |
2,3646 |
3,4995 |
24 |
1,7109 |
2,0639 |
2,7969 |
8 |
1,8595 |
2,3060 |
3,3554 |
25 |
1,7081 |
2,0595 |
2,7874 |
9 |
1,8331 |
2,2622 |
3,2498 |
26 |
1,7056 |
2,0555 |
2,7787 |
10 |
1,8125 |
2,2281 |
3,1693 |
27 |
1,7033 |
2,0518 |
2,7707 |
11 |
1,7959 |
2,2010 |
3,1058 |
28 |
1,7011 |
2,0484 |
2,7633 |
12 |
1,7823 |
2,1788 |
3,0545 |
29 |
1,6991 |
2,0452 |
2,7564 |
13 |
1,7709 |
2,1604 |
3,0123 |
30 |
1,6973 |
2,0423 |
2,7500 |
14 |
1,7613 |
2,1448 |
2,9768 |
40 |
1,6839 |
2,0211 |
2,7045 |
15 |
1,7530 |
2,1315 |
2,9467 |
60 |
1,6707 |
2,0003 |
2,6603 |
16 |
1,7459 |
2,1199 |
2,9208 |
120 |
1,6577 |
1,9799 |
2,6174 |
17 |
1,7396 |
2,1098 |
2,8982 |
¥ |
1,6449 |
1,9600 |
2,5758 |
3. Критические значения корреляции для
уровневой значимости 0,05 и 0,01
d.f. |
α
= 0,05 |
α= 0,01 |
d.f. |
α = 0,05 |
α = 0,01 |
1 |
0,996917 |
0,9998766 |
17 |
0,4555 |
0,5751 |
2 |
0,95000 |
0,99000 |
18 |
0,4438 |
0,5614 |
3 |
0,8783 |
0,95873 |
19 |
0,4329 |
0,5487 |
4 |
0,8114 |
0,91720 |
20 |
0,4227 |
0,5368 |
5 |
0,7545 |
0,8745 |
25 |
0,3809 |
0,4869 |
6 |
0,7067 |
0,8343 |
30 |
0,3494 |
0,4487 |
7 |
0,6664 |
0,7977 |
35 |
0,3246 |
0,4182 |
8 |
0,6319 |
0,7646 |
40 |
0,3044 |
0,3932 |
9 |
0,6021 |
0,7348 |
45 |
0,2875 |
0,3721 |
10 |
0,5760 |
0,7079 |
50 |
0,2732 |
0,3541 |
11 |
0,5529 |
0,6835 |
60 |
0,2500 |
0,3248 |
12 |
0,5324 |
0,6614 |
70 |
0,2319 |
0,3017 |
13 |
0,5139 |
0,6411 |
80 |
0,2172 |
0,2830 |
14 |
0,4973 |
0,6226 |
90 |
0,2050 |
0,2673 |
15 |
0,4821 |
0,6055 |
100 |
0,1946 |
0,2540 |
16 |
0,4683 |
0,5897 |
|
|
|
Для простой корреляции d.f. на 2
меньше, чем число пар вариантов; в случае частной корреляции необходимо также
вычесть число исключаемых переменных.
4. Значения статистик Дарбина - Уотсона при
5%-ном уровне значимости
п |
k1=1 |
k1=2 |
k1=3 |
k1=4 |
k1=5 |
|||||
dL |
dU |
dL |
dU |
dL |
dU |
dL |
dU |
dL |
dU |
|
6 |
0,61 |
1,40 |
|
|
|
|
|
|
|
|
7 |
0,70 |
1,36 |
0,47 |
1,90 |
|
|
|
|
|
|
8 |
0,76 |
1,33 |
0,56 |
1,78 |
0,37 |
2,29 |
|
|
|
|
9 |
0,82 |
1,32 |
0,63 |
1,70 |
0,46 |
2,13 |
|
|
|
|
10 |
0,88 |
1,32 |
0,70 |
1,64 |
0,53 |
2,02 |
|
|
|
|
11 |
0,93 |
1,32 |
0,66 |
1,60 |
0,60 |
1,93 |
|
|
|
|
12 |
0,97 |
1,33 |
0,81 |
1,58 |
0,66 |
1,86 |
|
|
|
|
13 |
1,01 |
1,34 |
0,86 |
1,56 |
0,72 |
1,82 |
|
|
|
|
14 |
1,05 |
1,35 |
0,91 |
1,55 |
0,77 |
1,78 |
|
|
|
|
16 |
1,10 |
1,37 |
0,89 |
1,54 |
0,86 |
1,73 |
0,74 |
1,93 |
0,62 |
2,15 |
17 |
1,13 |
1,38 |
1,02 |
1,54 |
0,90 |
1,71 |
0,78 |
1,90 |
0,67 |
2,10 |
18 |
1,16 |
1,39 |
1,05 |
1,53 |
0,93 |
1,69 |
0,82 |
1,87 |
0,71 |
2,06 |
19 |
1,18 |
1,40 |
1,08 |
1,53 |
0,97 |
1,68 |
0,86 |
1,85 |
0,75 |
2,02 |
20 |
1,20 |
1,41 |
1,10 |
1,54 |
1,00 |
1,68 |
0,90 |
1,83 |
0,79 |
1,99 |
21 |
1,22 |
1,42 |
1,13 |
1,54 |
1,03 |
1,67 |
0,93 |
1,81 |
0,83 |
1,96 |
22 |
1,24 |
1,43 |
1,15 |
1,54 |
1,05 |
1,66 |
0,96 |
1,80 |
0,86 |
1,94 |
23 |
1,26 |
1,44 |
1,17 |
1,54 |
1,08 |
1,66 |
0,99 |
1,79 |
0,90 |
1,92 |
34 |
1,27 |
1,45 |
1,19 |
1,55 |
1,10 |
1,66 |
1,01 |
1,78 |
0,93 |
1,90 |
25 |
1,29 |
1,45 |
1,21 |
1,55 |
1,12 |
1,66 |
1,04 |
1,77 |
0,95 |
1,89 |
26 |
1,30 |
1,46 |
1,22 |
1,55 |
1,14 |
1,65 |
1,06 |
1,76 |
0,98 |
1,88 |
27 |
1,32 |
1,47 |
1,24 |
1,56 |
1,16 |
1,65 |
1,08 |
1,76 |
1,01 |
1,86 |
28 |
1,33 |
1,48 |
1,26 |
1,56 |
1,18 |
1,65 |
1,10 |
1,75 |
0,03 |
1,85 |
29 |
1,34 |
1,48 |
1,27 |
1,56 |
1,20 |
1,65 |
1,12 |
1,74 |
10,5 |
1,84 |
30 |
1,35 |
1,49 |
1,28 |
157 |
1,21 |
1,65 |
1,14 |
1,74 |
10,7 |
1,83 |
1.
Джонстон ДЖ.
Эконометрические методы. М.: Статистика, 1980.
2.
Кейн Э.
Экономическая статистика и эконометрия. - М.: Статистика, 1977.
3.
Кулинич Е.И., М.:
«Финансы и статистика», 1999.
4.
Математическая экономика на персональном компьютере.
Перевод с яп. под. М. Кубаниева.
– М.: «Финансы и статистика», 1991.
5.
Практикум по эконометрике. Под.
ред. И.И. Елисеевой. – М.: «Финансы и статистика», 2007.-192с.
6.
Дрейпер Н., Смит
Г. Прикладной регресионный анализ. – М.: «Финансы и
статистика», 1986.
7. Мардас А.Н. Эконометрика, учебное пособие. С-Пб. 2001.