Прогнозирование.Доверительный интервал прогноза

30.09.2019

Если при анализе развития объекта прогноза есть основания принять два базовых допущения экстраполяции, то процесс экстраполяции заключается в подстановке соответствующей величины периода упреждения в формулу, описывающую тренд. Причем, если по каким-либо соображениям при экстраполяции удобнее начало отсчета времени установить на момент, отличающийся от начального момента, принятого при оценивании параметров уравнения, то для этого в соответствующем многочлене достаточно изменить постоянный член. Так в уравнении прямой при сдвиге начала отсчета времени на т лет вперед постоянный член будет равен a + bm, для параболы второй степени он составит величину а + bт + ст2.

Экстраполяция, вообще говоря, дает точечную прогностическую оценку. Интуитивно ощущается недостаточность такой оценки и необходимость получения интервальной оценки с тем, чтобы прогноз, охватывая некоторый интервал значений прогнозируемой переменной, был бы более надежным. Как уже сказано выше, точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, - явления маловероятное. Соответствующая погрешность имеет следующие источники: выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае, часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной или тем более наилучшей для экстраполяции в данных конкретных условиях;

1. оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а, следовательно, и ее положению о пространстве свойственна некоторая неопределенность;
2. тренд характеризует некоторый средний уровень ряда, на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом. Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.

Погрешность, связанная со вторым и третьим ее источником, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный экстраполяционный прогноз преобразуется в интервальный. Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно изменяться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения прогноза. Одна из основных задач, возникающих при экстраполяции тренда, заключается в определении доверительных интервалов прогноза. Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве "уровень - время" и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Следовательно, вопрос о доверительном интервале прогноза следует начать с рассмотрения измерителя колеблемости. Обычно такой измеритель определяют в виде среднего квадратического отклонения (стандартного отклонения) фактических наблюдений от расчетных, полученных при выравнивании динамического ряда. В общем виде среднее квадратическое отклонение от тренда можно выразить как:

В общем виде доверительный интервал для тренда определяется как:

Если t = i + L, то уравнение определит значение доверительного интервала для тренда, продленного на L единиц времени. Доверительный интервал для прогноза, очевидно должен учитывать не только неопределенность, связанную с положением тренда, но возможность отклонения от этого тренда. В практике встречаются случаи, когда более или менее обоснованно для экстраполяции можно применить несколько типов кривых. При этом рассуждения иногда сводятся к следующему. Поскольку каждая из кривых характеризует один из альтернативных трендов, то очевидно, что пространство между экстраполируемыми трендами представляет собой некоторую естественную доверительную область для прогнозируемой величины. С таким утверждением нельзя согласиться.

Прежде всего потому, что каждая на возможных линий тренда отвечает некоторой заранее принятой гипотезе развития. Пространство же между трендами не связано ни с одной из них - через него можно провести неограниченное число трендов. Следует также добавить, что доверительный интервал связан с некоторым уровнем вероятности выхода за его границы. Пространство между трендами не связано ни с каким уровнем вероятности, а зависит от выбора типов кривых. К тому же при достаточно продолжительном периоде упреждения это пространство, как правило, становится настолько значительным, что подобный доверительный интервал теряет всякий смысл.

Рисунок 2 - Поиск максимального интервала корреляции

Анимация: Кадров: 20, Количество повторений: 7, Объем: 55,9 Кб

Для сравнения качества решения задач прогнозирования при традиционном и предлагаемом подходе используются доверительные интервалы прогноза для линейного тренда. В качестве примера анализа влияния качественных характеристик временных рядов на глубину прогноза были взяты три временных ряда размерностью n равной 30 с различными колеблемостями вокруг тренда. В итоге вычислений значений площади участков кривых выборочных автокорреляционных функций получились следующие оценки для оптимальной глубины прогноза: для слабоколеблемого ряда - 9 уровней, для среднеколеблемого - 3 уровня, для сильноколеблемого - 1 уровень (Рисунок

Рисунок 3 - Полученные результаты оценки глубины прогноза

Анализ результатов показывает, что даже при средней колеблемости значений ряда вокруг тренда доверительный интервал оказывается весьма широким (при доверительной вероятности 90%) для периода упреждения, превышающего расчетный предлагаемым способом. Уже для упреждения на 4 уровня доверительный интервал составил почти 25% расчетного уровня. Довольно быстро экстраполяция приводит к неопределенным в статистическом смысле результатам. Это доказывает возможность применения предложенного подхода.

Поскольку выше расчет проводился основываясь на оценках величин, представляется возможным построить зависимость оценки глубины экономического прогноза от значений его базы, задав значения временного лага k и соответствующие им значения глубины экономического прогноза.

Таким образом, предложенный новый подход к оценке глубины экономического прогноза синтезирует количественную и качественную характеристики исходных значений динамического ряда и позволяет обоснованно с математической точки зрения задавать период упреждения для экстраполируемых временных рядов.

прогноз экстраполяция стратегическое планирование

Получение оценок коэффициентов регрессии и проверка их достоверности не являются самоцелью, это лишь необходимый промежуточный этап. Основное – это использовать модель для анализа и прогноза значений изучаемого экономического явления. Прогноз осуществляется подстановкой значения фактора х в полученную формулу регрессии.

Используем полученное в примере 1.1 (прил.4) уравнение регрессии для прогноза объема товарооборота. Если намечается открыть магазин с численностью работников х =140 чел., то обоснованный объем товарооборота устанавливается по уравнению ŷ (х )= –0,974 + 0,01924×140=1,72 млрд. рублей.

Доверительный интервал для прогноза значения у (х )=a 0 +a 1 х определяется по формуле

где t p – критическая граница распределения Стьюдента с n – 2 степенями свободы, соответствующая уровню значимости р . Для получения доверительного интервала воспользуемся выражением (2.2).

Выберем уровень значимости 5%. Количество степеней свободы у нас 8 – 2 = 6, тогда по таблице распределения Стьюдента (приложение 1) находим

t 0.05 (6)=2,447.s= =0,089,

следовательно, с вероятностью 95% истинные значения объемов товарооборота будут лежать в пределах

1,72 – 2,447×0,048<y (x )<1,72+2,447×0,048, или 1,60<y (x )<1,84.

2.8. Практический блок

Пример. Построить уравнение регрессии между заданными переменными, проверить её адекватность, сделать прогноз методом экстраполяции.

1 . Построить диаграмму рассеяния в EXCELи сделать заключение о наличии корреляции.

Таблица 2.6Диаграмма 2.1

Y	x
29,5	2,1
34,2	2,9
30,6	3,3
35,2	3,8
40,7	4,2
44,5	3,9
47,2	5,0
55,2	4,9
51,8	6,3
56,7	5,8

Из диаграммы 2.1 видно, что между переменнымиx и y имеется сильная линейная связь .

Таблица2.7

№			xy
	29,5	2,1	61,95	4,41	870,25	27,91	0,054	1,59
	34,2	2,9	99,18	8,41	1169,64	33,46	0,022	0,74
	30,6	3,3	100,98	10,89	936,36	36,23	0,184	-5,63
	35,2	3,8	133,76	14,44	1239,04	39,69	0,128	-4,49
	40,7	4,2	170,94	17,64	1656,49	42,47	0,043	-1,77
	44,5	3,9	173,55	15,21	1980,25	40,39	0,092	4,11
	47,2	5,0			2227,84	48,01	0,017	-0,81
	55,2	4,9	270,48	24,01	3047,04	47,32	0,143	7,88
	51,8	6,3	326,34	39,69	2683,24	57,02	0,101	-5,22
	56,7	5,8	328,86	33,64	3214,89	53,55	0,056	3,15
ИТОГО:		42,2	1902,04	193,34	19025,04		0,840
Среднее	42,6	4,22	190,204	19,334	1902,504

2.1.Теснота связи между переменными:

;

Вывод: сильная связь.

2.2.Проверим по критерию Стьюдента статистическую значимость:

По критерию Стьюдента: t выб <=t кр

Гипотеза Н о: r=0,t кр =2,31,

t выб =r выб *

Так какt выб =5,84сильную линейную связь.

3. Записать систему нормальных уравнений для коэффициентов линейной регрессии. Используя метод наименьших квадратов, рассчитайте эти коэффициенты.

Подставляя в найденное уравнение регрессии значения (графа (3) табл.2.7), рассчитаем значения (графа (7) табл.2.7).

4. Для полученного уравнения регрессии между Х и У рассчитать среднюю ошибку аппроксимации. Сделать заключение об адекватности полученной модели.

Заполним 8-ю и 9-ю графу табл.2.7.

<Екр=12%

Модель признается удовлетворительной.

5 . Проверить значимость коэффициента a 1 уравнения регрессии, используя критерий Стьюдента.

Решение: Таблица 2.8

№
	29,5	2,1	27,91	214,623	2,5281	170,564
	34,2	2,9	33,46	82,81	0,5476	69,8896
	30,6	3,3	36,23	40,069	31,6969	143,0416
	35,2	3,8	39,69	8,237	20,1601	54,1696
	40,7	4,2	42,47	0,008	3,1329	3,46
	44,5	3,9	40,39	4,709	16,8921	3,7636
	47,2		48,01	29,703	0,6561	21,5296
	55,2	4,9	47,32	22,658	62,0944	159,7696
	51,8	6,3	57,02	209,092	27,2484	85,3776
	56,7	5,8	53,55	120,78	9,9225	199,9396
ИТОГО:	425,6	42,2	426,1	732,687	174,8791	911,504
Среднее	42,56	4,22

Статистическая проверка:

Выводы: С доверительной вероятностью 0.9 коэффициент a 1 является статистически значимым, таким образом, гипотеза отвергается.

6. Проверить адекватность уравнения регрессии в целом, применив F-критерий Фишера-Снедекора.

Статистическая проверка:

:модель не адекватна

Так какF выб >F кр, то отвергается гипотеза (принимается альтернативная)с доверительной вероятностью 0.95. Данная модель адекватна и может использоваться для прогнозирования при принятии управленческих решений.

(таб. 2.8).

Доля вариации.

Таким образом, 80% вариации объясняемой переменной объясняется включенным в модель фактором, а 20% факторами, не включенными в модель.

Тесноту связи между переменными для произвольной связи показывает эмпирическое корреляционное отношение, при линейной связи , и коэффициент корреляции равен коэффициенту детерминации.

9 . Выполнить точечный прогноз для .

Исходные данные,

Точечный прогноз,

Линию регрессии,

90% доверительные интервалы.

Сформулировать общие выводы относительно полученной регрессионной модели.

-математическое ожидание среднего.

Чтобы выполнить интервальный прогноз рассмотрим две области.

а) доверительные границы уравнения регрессии дляy из области значений переменнойx рассчитаем по формуле:

б) для прогнозных значений доверительный интервал для рассчитаем по формуле:

Имеем:n=10, t=2,31(таб. Приложение 1),

19,334-4,22 2)=1,53.

: 27,9; 42,6; 57,0; 66,7

Таблица 2.9

№
1	2,1	-2,12	1,74	3,03	4,49	2,31	4,68	27,9	18,81	9,10	46,72
	4,22	0,00	0,32	0,1	0,00	2,31	4,68	42,6	3,46	39,10	46,02
	6,3	2,08	1,71	2,93	4,33	2,31	4,68	57,0	18,49	38,53	75,51
	7,7	3,48		9,02	12,11	2,31	4,68	66,7	32,43	34,29	99,15

Т.к. 90% точек наблюдения находится в 90% - доверительном интервале, данная модель с ее доверительными границами может использоваться для прогнозирования с доверительной вероятностью 0,9.

Контрольные вопросы

1. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.

2. Виды автокорреляции и их краткая характеристика.

3. Автокорреляция в остатках и порядок её обнаружения.

4. Виды автокорреляции в остатках.

5. Порядок использования критерия Дарбина-Уотсона.

6. Автокорреляция в исходных данных и порядок определения её наличия.

7. Методы устранения влияния автокорреляции на результаты прогнозирования.

8. Обобщенный метод наименьших квадратов (ОМНК).

9. Что понимается под гомоскедастичностью?

10. Как проверяется гипотеза о гомоскедастичности ряда остатков?

11. Оценка качества регрессии. Проверка адекватности и достоверности модели.

12. Значимость коэффициентов регрессии (критерий Стъюдента).

13. Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).

14. Коэффициенты и индексы корреляции. Мультиколлениарность.

15. Оценка значимости корреляции. Детерминация.

16. Средняя ошибка аппроксимации.

17. Принятие решений на основе уравнений регрессии.

18. В каких задачах эконометрики используется распределение Фишера?

19. Таблицы каких распределений используются при оценке качества линейной регрессии?

20. Каковы особенности практического применения регрессионных моделей?

21. Как осуществляется прогнозирование экономических показателей с использованием моделей линейной регрессии?

22. Как можно оценить «естественный» уровень безработицы с использованием модели линейной регрессии?

23. В каких случаях необходимо уточнение линейной регрессионной модели и как оно осуществляется?

24. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?

Задания и задачи

1 . Имеются данные о показателях деятельности компаний США в 2006г.

№ п/п	Чистая прибыль, млрд$,у	Использованный капитал, млрд $,х 1	Оборот капитала, млрд$,х 2	Капитализация компании, млрд$, х 4	Численность сотрудников, тыс.чел., х 3
	0,9	18,9	31,3	40,9	43,0
	1,7	13,7	13,4	40,5	64,7
	0,7	18,5	4,5	38,9	24,0
	1,7	4,8	10,0	38,5	50,2
	2,6	21,8	20,0	37,3	106,0
	1,3	5,8	15,0	26,5	96,6
	4,1	99,0	137,1	37,0	347,0
	1,6	20,1	17,9	36,8	85,6
	6,9	60,6	165,4	36,3	745,0
	0,4	1,4	2,0	35,3	4,1
	1,3	8,0	6,8	35,3	26,8
	1,9	18,9	27,1	35,0	42,7
	1,9	13,2	13,4	26,2	61,8
	1,4	12,6	9,8	33,1	212,0
	0,4	12,2	19,5	32,7	105,0
	0,8	3,2	6,8	32,1	33,5
	1,8	13,0	27,0	30,5	142,0
	0,9	6,9	12,4	29,8	96,0
	1,1	15,0	17,7	25,4	140,0
	1,9	11,9	12,7	29,3	59,3
	-0,9	1,6	21,4	29,2	131,0
	1,3	8,6	13,5	29,2	70,7
	2,0	11,5	13,4	29,1	65,4
	0,6	1,9	4,2	27,9	23,1
	0,7	5.8	15,5	27,2	80,8

2. Имеются данные о показателях деятельности компаний США в 2009г.

№ п/п	Чистая прибыль, млрд $, у	Использованный капитал, млрд $.х 1	Оборот капитала, млрд$, х 2	Численность, тыс. чел., х 3
	6,6	83,6	6,9	222,0
	3,0	6,5	18.0	32,0
	6,5	50,4	107,9	82,0
	3,3	15,4	16,7	45,2
	0,1	29,6	79,6	299,3
	3,6	13,3	16,2	41,6
	1,5	5,9	5,9	17,8
	5,5	27,1	53,1	151,0
	2,4	11,2	18,8	82,3
	3,0	16,4	35,3	103,0
	4,2	32,5	71,9	225,4
	2,7	25,4	93,6	675,0
	1,6	6,4	10,0	43,8
	2,4	12,5	31,5	102,3
	3,3	14,3	36,7	105,0
	1,8	6,5	13,8	49,1
	2,4	22,7	64,8	50,4
	1,6	15,8	30,4	480,0
	1,4	9,3	12,1	71,0
	0,9	18,9	31,3	43,0

КОНТРОЛЬНАЯ РАБОТА

по дисциплине «Планирование и прогнозирование

в условиях рынка»

на тему: Доверительные интервалы прогноза

Оценка адекватности и точности моделей

Глава 1. Теоретическаячасть

Доверительные интервалы прогноза. Оценка адекватности и точности моделей

1.1 Доверительные интервалы прогноза

Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t , соответствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя.

На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать "вилку" возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный.

Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано:

1. субъективной ошибочностью выбора вида кривой;

2. погрешностью оценивания параметров кривых;

3. погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда, и возможность отклонения от этого тренда, определяется в виде:

где n- длина временного ряда;

L -период упреждения;

y n + L -точечный прогноз на момент n+L;

t a - значение t-статистики Стьюдента;

S p - средняя квадратическая ошибка прогноза.

Предположим, что тренд характеризуется прямой:

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность. Погрешность параметра а о приводит к вертикальному сдвигу прямой, погрешность параметра a 1 - к изменению угла наклона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций относительно линий тренда, дисперсию можно представить в виде:

(1.2.),

где - дисперсия отклонений фактических наблюдений от расчетных;

t 1 - время упреждения, для которого делается экстраполяция;

t 1 = n + L ;

t - порядковый номер уровней ряда, t = 1,2,..., n;

Порядковый номер уровня, стоящего в середине ряда,

Тогда доверительный интервал можно представить в виде:

(1.3.),

Обозначим корень в выражении (1.3.) через К. Значение К зависит только от n и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:

(1.4.),

Выражение, аналогичное (1.3.), можно получить для полинома второго порядка:

(1.5.),

(1.6.),

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:

(1.7.),

где y t - фактические значения уровней ряда,

Расчетные значения уровней ряда,

n - длина временного ряда,

k - число оцениваемых параметров выравнивающей кривой.

Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.

Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения

Рисунок 1.1. Доверительные интервалы прогноза для линейного тренда

Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).

В таблице 1.1. приведены значения К* в зависимости от длины временного ряда n и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (n ) значения К* уменьшаются, с ростом периода упреждения L значения К* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n : чем больше длина ряда, тем меньшее влияние оказывает период упреждения L .

Таблица 1.1.

Значения К* для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 (7).

Линейный тренд	Параболический тренд
Длина ряда (п)	Период упреждения (L)	длина ряда (п)	период упреждения (L)
7	2,6380 2,8748 3,1399	7	3,948 5,755 8,152
8	2,4631 2,6391 2,8361	8	3,459 4,754 6,461
9	2,3422 2,4786 2,6310	9	3,144 4,124 5,408
10	2,2524 2,3614 2,4827	10	2,926 3,695 4,698
11	2,1827 2,2718 2,3706	11	2,763 3,384 4,189
12	2,1274 2,2017 2,2836	12	2,636 3,148 3,808
13	2,0837 2,1463 2,2155	13	2,536 2,965 3,516
14	2,0462 2,1000 2,1590	14	2,455 2,830 3,286
15	2,0153 2,0621 2,1131	15	2,386 2,701 3,100
16	1,9883 2,0292 2,0735	16	2,330 2,604 2,950
17	1,9654 2,0015 2,0406	17	2,280 2,521 2,823
18	1,9455 1,9776 2,0124	18	2,238 2,451 2,717
19	1,9280 1,9568 1,9877	19	2,201 2,391 2,627
20	1,9117 1,9375 1,9654	20	2,169 2,339 2,549
21	1,8975 1,9210 1,9461	21	2,139 2,293 2,481
22	1,8854 1,9066 1,9294	22	2,113 2,252 2,422
23	1,8738 1,8932 1,9140	23	2,090 2,217 2,371
24	1,8631 1,8808 1,8998	24	2,069 2,185 2,325
25	1,8538 1,8701 1,8876	25	2,049 2,156 2,284

Глава 2. Практическая часть

Задание 1.5. Использование адаптивных методов в экономическом прогнозировании

1. Рассчитать экспоненциальную среднюю для временного ряда курса акций фирмы ЮМ. В качестве начального значения экспоненциальной средней взять среднее значение из 5 первых уровней ряда. Значение параметра адаптации а принять равным 0,1.

Таблица 1.2.

Курс акций фирмы IBM

t	y t	t	y t	t	y t
1	510	11	494	21	523
2	497	12	499	22	527
3	504	13	502	23	523
4	510	14	509	24	528
5	509	15	525	25	529
6	503	16	512	26	538
7	500	17	510	27	539
8	500	18	506	28	541
9	500	19	515	29	543
10	495	20	522	30	541

2. По данным задания №1 рассчитать экспоненциальную среднюю при значении параметра адаптации а равным 0,5. Сравнить графически исходный временной ряд и ряды экспоненциальных средних, полученные при а =0,1 и а =0,5. Указать, какой ряд носит более гладкий характер.

3. Прогнозирование курса акций фирмы IBM осуществлялось на основе адаптивной полиномиальной модели второго порядка

где - период упреждения.

На последнем шаге получены следующие оценки коэффициентов:

На 1 день вперед (=1);

На 2 дня вперед (=2).

Решение задания 1.5

1. Определим

Найдем значения экспоненциальной средней при а =0,1.

. а =0,1 – по условию;

; S 1 = 0,1 х 510 + 0,9 х 506 = 506,4;

; S 2 = 0,1 х 497 + 0,9 х 506,4 = 505,46;

; S 3 = 0,1 х 504 + 0,9 х 505,46 = 505,31 и т.д.

а =0,5 – по условию.

; S 1 = 0,5 х 510 + 0,5 х 506 = 508;

; S 2 = 0,5 х 497 + 0,5 х 508 = 502,5 и т.д.

Результаты расчетов представлены в таблице 1.3.

Таблица 1.3.

Экспоненциальные средние

t	Экспоненциальная средняя		t	Экспоненциальная средняя
t	а =0,1	а =0,5	t	а =0,1	а =0,5
1	506,4	508	16	505,7	513,3
2	505,5	502,5	17	506,1	511,7
3	505,3	503,2	18	506,1	508,8
4	505,8	506,6	19	507,0	511,9
5	506,1	507,8	20	508,5	517
6	505,8	505,4	21	509,9	520
7	505,2	502,7	22	511,6	523,5
8	504,7	501,4	23	512,8	523,2
9	504,2	500,7	24	514,3	525,6
10	503,4	497,8	25	515,8	527,3
11	502,4	495,9	26	518,0	532,7
12	502,0	497,5	27	520,1	525,8
13	502,0	499,7	28	522,2	538,4
14	502,7	504,4	29	524,3	540,7
15	505,0	514,7	30	525,9	540,9

Рисунок 1.2. Экспоненциальное сглаживание временного ряда курса акций: А – фактические данные; В – экспоненциальная средняя при альфа = 0,1; С – экспоненциальная средняя при альфа = 0,5

При а =0,1 экспоненциальная средняя носит более гладкий характер, т.к. в этом случае в наибольшей степени поглощаются случайные колебания временного ряда.

3. Прогноз по адаптивной полиномиальной модели второго порядка формируется на последнем шаге, путем подстановки в уравнение модели последних значений коэффициентов и значения - времени упреждения.

Прогноз на 1 день вперед (= 1):

Прогноз на 2 дня вперед (= 2):

Список используемой литературы

1. Дуброва Т.А. Статистические методы прогнозирования в экономике: Учебное пособие / Московский государственный университет экономики, статистики и информатики. – М.: МЭСИ, 2003. – 52с.

2. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование М.: Финансы и статистика, 2001.

3. Лукашин Ю.П. Регрессионные и адаптивные методы прогнозирования. Учебное пособие. – М.: МЭСИ, 1997.

Один из наиболее распространенных методов прогнозирования заключается в экстраполяции, т.е. в продлении в будущее тенденции, наблюдавшейся в прошлом. Экстраполяция тенденций динамических рядов сравнительно широко применяется в практических исследованиях в силу ее простоты, возможности осуществления на основе относительно небольшого объема информации, наконец, ясности принимаемых допущений. Отсутствие иной информации помимо отдельно рассматриваемого динамического ряда часто оказывается решающим аргументом при выборе этого метода прогнозирования.

При таком подходе к прогнозированию предполагается, что размер признака, характеризующего явление, формируется под воздействием множества факторов, причем не представляется возможным выделить порознь их влияние. В связи с этим ход развития связывается не с какими-либо конкретными факторами, а с течением времени.

Экстраполяция базируется на следующих допущениях:

1) развитие явления может быть с достаточным основанием охарактеризовано плавной (эволюторной) траекторией - трендом;

2) общие условия, определяющие тенденцию развития в прошлом, не претерпят существенных изменений в будущем.

Таким образом, экстраполяция дает описание некоторого общего будущего развития объекта прогнозирования. Причем если развитие в прошлом носило перманентно скачкообразный характер, то при достаточно продолжительном периоде наблюдений скачки оказываются “зафиксированными” в самом тренде, и последний опять-таки можно применить в прогнозировании.

Выше были сформулированы основные условия, наличие которых дает возможность осуществлять экстраполяцию тренда. В практике прогнозирования может возникнуть вопрос, а как поступить, если условия формирования тренда заметно изменяются и этого следует ожидать и в будущем? В этом случае возможны различные подходы к решению проблем. В частности, в ряде случаев тренд можно “исправить”, сокращая период наблюдения, отсекая члены ряда, сформировавшиеся при явно других условиях и искажающие новую тенденцию. Однако далеко не всегда можно провести четкую границу во времени, разделяющую новые и старые условия развития исследуемого явления. В этом случае подходящим является оценивание параметров, учитывающее устаревание данных. Такой прием возможен тогда, когда переход к новым условиям не имеет резкой границы и в то же время есть, основания считать влияние этого перехода достаточно эффективным. Наконец, возможна корректировка параметров уравнений, характеризующих тренд. Например, изменение постоянного члена в уравнении полинома сдвигает тренд по оси ординат, не изменяя формы кривой. Такой прием применим, когда предполагается, что развитие будет следовать прошлой тенденции, однако есть основание для перехода к какому-либо базовому уровню, отличающемуся от уровня, полученного по уравнению тренда.

Корректированию могут быть подвергнуты и другие параметры (помимо постоянного члена). Такого рода поправки изменяют форму тренда. Например, изменяют угол наклона прямой, растягивают или сжимают кривую и т.д. Подобные деформации тренда, разумеется, должны иметь достаточные основания.

По-видимому, самым правильным было бы рассматривать экстраполяцию не как конечный результат прогнозирования, а как некоторый отправной момент, на основе которого с привлечением дополнительной информации, не содержащейся в самом динамическом ряду, разрабатывают прогноз. Вместе с тем часто ее результат с соответствующей корректировкой или без нее рассматривается и как окончательный прогноз.

Если при анализе развития объекта прогноза есть основания принять два базовых допущения экстраполяции, о которых говорилось выше, то процесс прогнозирования заключается в подстановке соответствующей величины периода упреждения в формулу, описывающую тренд.

Проведем прогнозирование на основе экстраполяции лучшей формы тренда (полином 3-ей степени) для третьего периода исходного динамического ряда:

Для экспорта,

Для импорта.

Соответственно прогноз объем экспорта и импорта на 2006 год (t=13) составит:

Экспорт: млрд.$ US,

Импорт: млрд.$US.

Соответственно прогноз объем экспорта и импорта на 2007 год (t=14) составит:

Экспорт: млрд.$ US,

Импорт: млрд.$US.

Экстраполяция дает возможность получить точечное значение прогноза, что может быть признано удовлетворительным только при наличии функциональной зависимости. Однако для экономических явлений характерна корреляционная зависимость и переменные, как правило, являются непрерывными. Следовательно, указание точечных значений прогноза, строго говоря, лишено содержания, поскольку “попадание” в точку имеет нулевую вероятность. Отсюда следует, что прогноз должен быть дан в виде интервала значений, т.е. необходимо определение доверительного интервала прогноза.

6.1. Доверительные интервалы прогноза

При определении прогностических значений того или иного явления с помощью экстраполяции наибольший интерес представляет, по-видимому, не сама экстраполяция - это более или менее механический прием, а определение доверительных интервалов прогноза.

Доверительные интервалы могут быть определены двояко: формально и неформально. Что касается последнего, то это дело экспертного суждения, которое выносится при качественном осмыслении результатов прогноза, сопоставлении их с другими имеющимися у эксперта данными. При этом, естественно, эксперт должен учитывать не только степень колеблемости фактических уровней вокруг тренда в прошлом, но и возможность деформации тренда в будущем (соответственно могут быть получены различные варианты прогноза).

Формальный доверительный интервал учитывает лишь ту неопределенность, которая связана с ограниченностью числа наблюдений и соответствующей неточностью найденных оценок параметров кривой. Основной вопрос - в какой мере в будущем сохранится найденная тенденция, - естественно, не может быть решен с помощью таких доверительных интервалов. Это дело содержательного экономического анализа и экспертной оценки. Основное внимание в данном учебном пособии уделим оценке формальных доверительных интервалов, базирующихся на статистическом анализе. Заметим, что формальные доверительные интервалы можно получить далеко не во всех случаях. В частности, для сложных кривых, отличающихся от полиномов, если их и можно определить, доверительные интервалы имеют достаточно условный характер.Как было сказано выше, точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, - явление маловероятное. Соответствующая погрешность имеет следующие источники:

1) выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае, часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной, а тем более лучшей для экстраполяции в данных конкретных условиях;

2) оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а, следовательно, и ее положению в пространстве свойственна некоторая неопределенность;

3) тренд характеризует средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом. Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.

Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно измениться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения.

Погрешность, связанная со вторым и третьим источниками, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный прогноз преобразуется в интервальный.

Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве “уровень - время” и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Традиционно в качестве такого измерителя колеблемости используется среднее квадратическое (стандартное) отклонение фактических наблюдений от расчетных, полученных при выравнивании динамического ряда. В общем виде среднее квадратическое отклонение от тренда можно выразить как

где ¾соответственно фактическое и расчетное значения уровня ряда;

f ¾ число степеней свободы, f = n ‑ т, где т ¾ число оцениваемых параметров; n ¾ число наблюдений. Так, если выравнивание производится по прямой, то f = n ‑ 2, для параболы второй степени f = n ‑ 3 и т. д.

Сумму квадратов отклонений от тренда (возьмем для простоты линейный тренд) можно, очевидно, разложить следующим образом:

Это выражение можно упростить. Допустим, что начало отсчета времени находится в середине ряда, тогда St = 0. Параметры а и b, как мы уже убедились ранее, в этом случае равны:

Отсюда после упрощений получаем:

Разность первых двух членов правой стороны этого равенства равна сумме квадратов отклонений от средней арифметической, т. е. . Таким образом,

Выражение показывает, что сумма квадратов отклонений от линейного тренда меньше, чем от средней арифметической. Этим выражением можно воспользоваться в тех случаях, когда характеристика колебаний вокруг тренда определяется до того, как определен сам тренд.

Сумма квадратов отклонений от линий тренда, т. е. , и среднее квадратическое отклонение от тренда S y являются основой при определении средней квадратической ошибки отдельных параметров уравнения тренда и их доверительных интервалов, а также ошибки и доверительных интервалов тренда и прогноза.

Прежде чем приступить к определению доверительного интервала прогноза, необходимо сделать оговорку о некоторой условности рассматриваемого ниже расчета. То, что следует далее, является, в некоторой мере, произвольным перенесением результатов, найденных для регрессии выборочных показателей, на анализ динамических рядов. Дело в том, что предположение регрессионного анализа о нормальности распределения отклонений вокруг линии регрессии не может, по существу, безоговорочно утверждаться при анализе динамических рядов.

Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае, смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.

В общем виде доверительный интервал для тренда определяется как:

где ¾ средняя квадратическая ошибка тренда;

¾расчетное значение y t ;

¾ значение t -статистики Стьюдента.

Доверительный интервал для прогноза, очевидно, должен учитывать не только неопределенность, связанную с положением тренда, но возможность отклонения от этого тренда.

В практике встречаются случаи, когда более или менее обоснованно для экстраполяции можно применить несколько типов кривых. При этом рассуждения иногда сводятся к следующему. Поскольку каждая из кривых характеризует один из альтернативных трендов, то очевидно, что пространство между экстраполируемыми трендами и представляет собой некоторую “естественную доверительную область” для прогнозируемой величины. С таким утверждением нельзя согласиться. Прежде всего потому, что каждая из возможных линий тренда отвечает некоторой заранее принятой гипотезе развития. Пространство же между трендами не связано ни с одной из них - через него можно провести неограниченное число трендов. Следует также добавить, что доверительный интервал связан с некоторым уровнем вероятности выхода за его границы. Пространство между трендами не связано ни с каким уровнем вероятности, а зависит от выбора типов кривых. К тому же при достаточно продолжительном периоде упреждения это пространство, как правило, становится настолько значительным, что подобный “доверительный интервал” теряет всякий смысл.

В STATISTICA при расчете доверительных интервалов прогноза величину среднего квадратического отклонения S y можно определить воспользовавшись таблицей дисперсионного анализа. Рассчитанное в ячейке Residual Mean Squares значение соответствует подкоренному выражению в формуле для S y , то есть остаточной дисперсии.Остается только извлечь из него квадратный корень. Однако, необходимо помнить, о том, что мы пользовались линеаризацией, а соответственно этот показатель также необходимо пересчитать.

Один из наиболее распространенных методов прогнозирования заключается в экстраполяции, т.е. в предсказании будущего на основе данных прошлого.

Экстраполяция базируется на следующих допущениях:

§ развитие явления может быть с достаточным основанием охарактеризовано плавной траекторией - трендом;

§ общие условия, определяющие тенденцию развития в прошлом, не претерпят существенных изменений в будущем.

Таким образом, экстраполяция дает описание некоторого общего будущего развития объекта прогнозирования. Причем если развитие в прошлом носило перманентно скачкообразный характер, то при достаточно продолжительном периоде наблюдений скачки оказываются «зафиксированными» в самом тренде, и последний опять-таки можно применить в прогнозировании.

Проведем прогнозирование на основе экстраполяции лучшей формы тренда (линейной) для экспорта за период 2001-2007 гг:

Напомним, что у текущей переменной 7 уровней ряда, обозначенных натуральными числами. Соответственно прогноз динамики экспорта в 2008 (t=8) составит:

(млрд. долл)

Проведем прогнозирование на основе экстраполяции лучшей формы тренда (линейной) для импорта за период 2001-2007 гг:

Напомним, что у текущей переменной 7 уровней ряда, обозначенных натуральными числами. Соответственно прогноз динамики импорта в 2008 (t=8) составит:

(млрд. долл)

Экстраполяция дает возможность получить точечное значение прогноза, что может быть признано удовлетворительным только при наличии функциональной зависимости. Однако для экономических явлений характерна корреляционная зависимость и переменные, как правило, являются непрерывными. Следовательно, указание точечных значений прогноза, строго говоря, лишено содержания. Отсюда следует, что прогноз должен быть дан в виде интервала значений, т.е. необходимо определение доверительного интервала прогноза.

Доверительные интервалы прогноза

При составлении прогноза погрешность имеет следующие источники:

§ выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае, часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной, а тем более лучшей для экстраполяции в данных конкретных условиях;

§ оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а, следовательно, и ее положению в пространстве свойственна некоторая неопределенность;

§ тренд характеризует средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом.

Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.

Во всяком случае, смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.

В общем виде доверительный интервал для тренда определяется как:

где - средняя квадратическая ошибка тренда;

Расчетное значение y t ;

Значение t-статистики Стьюдента.

В STATISTICA при расчете доверительных интервалов прогноза величину среднего квадратического отклонения S y можно определить, воспользовавшись таблицей дисперсионного анализа. Рассчитанное в ячейке Residual Mean Squares значение соответствует подкоренному выражению в формуле для S y , то есть остаточной дисперсии. Остается только извлечь из него квадратный корень.

Для экспорта (см. таблицу 77), для импорта (см. таблицу 80).

Значит, для экспорта S y = 18,11,для импорта S y = 25,45.

Значение коэффициента доверия t находим по таблице Стьюдента с учетом доверительной вероятности 95%. При использовании линейной и степенной функций число степеней свободы равно 4, соответственно значение критерия равно 2,776.

Таким образом, доверительный интервал прогноза для экспорта на 2008 год определяется как:

Этот прогноз можно интерпретировать следующим образом: количество экспорта Японии в 2008 году с вероятностью 95% будет составлять от 704,542 млрд. долл. до 805,089 млрд. долл.

Доверительный интервал прогноза для импорта на 2008 год определяется как:

Этот прогноз можно интерпретировать следующим образом: количество импорта Японии в 2008 году с вероятностью 95% будет составлять от 596,072 млрд. долл. до 737,371 млрд. долл.

Графическое представление результатов прогнозирования

Завершающим этапом прогнозирования является построение графических изображений, дающих представление о точности прогноза и наглядно демонстрирующих размах доверительных интервалов.

Таблица 89. Данные прогнозирования для экспорта

Рис. 63.

Таблица 90. Данные прогнозирования для экспорта

Рис. 64.

К сожалению, в нашем случае реальные значения вышли за пределы доверительного интервала прогноза, что лишний раз подчёркивает трудности выбора модели тренда.