Расчетные формулы. Средняя ошибка аппроксимации

21.09.2019

В любую аналитическую формулу входят постоянные коэффициенты, величина которых существенно влияет на вид функции и на её значение. Следовательно, в нашем случае коэффициенты, будут переменными параметрами, и функция запишется в общем виде:

где - подбираемые коэффициенты, M i - i-ые значения расхода воздуха, n - число оборотов вала.

Согласно методу наименьших квадратов, наилучшими коэффициентами считаются те, для которых сумма квадратов отклонений найденной теоретической функции от заданных эмпирических значений будет минимальной. Следовательно, задача состоит в определении коэффициентов таким образом (т.е. в выборе одной кривой из множества), чтобы сумма квадратов отклонений была наименьшей.

где - коэффициенты аппроксимации,

Для того чтобы найти набор коэффициентов, при которых достигается минимум функции S, определяемой формулой (1.1), используем необходимое условие экстремума функции нескольких переменных равенство нулю частных производных.

Таким образом, нахождение коэффициентов, сводится к решению системы:

Если коэффициенты входят линейно, то система дифференциальных уравнений в частных производных преобразуется в систему линейных алгебраических уравнений. Эта система может быть решена любым методом: методом Гаусса, матричным методом, по формулам Крамера и т.д.

Конкретный вид системы (1.3) зависит от того, из какого класса эмпирических формул мы ищем зависимость (1.1).

В случае линейной аппроксимации формула (1.2) примет вид:

Возьмем две частные производные первого порядка и приравняем их к нулю. Система уравнений (1.3) примет вид:

Разделим уравнения на 2 и раскроем скобки:

Вынесем неизвестные и за знак суммы, так как они не зависят от индекса «i», и перенесем слагаемые, не содержащие неизвестных, в правую часть. Окончательно получим систему линейных алгебраических уравнений с двумя неизвестными и:

В случае квадратичной аппроксимирующей зависимости, вида (1.1.1), выполнив аналогичные преобразования, получим следующую систему линейных алгебраических уравнений с тремя неизвестными и:

Оценка статистических параметров системы

Напомним некоторые статистические оценки. Наблюдаемые значения величин n i , M i можно рассматривать как выборочные значения двух случайных величин n и M. По выборочным данным можно найти выборочные средние и выборочные квадратичные отклонения n и M, а также выборочный коэффициент корреляции, а именно:

Для вычисления можно применить и более простые формулы, которые выводятся в курсе теории вероятностей с помощью простых алгебраических преобразований:

Здесь - выборочные средние величин n, M; - выборочные квадратичные отклонения величин n, M; r - выборочный коэффициент корреляции.

Известно, что линейное уравнение (1.5), называемое в статистике уравнением линейной регрессии, проходит через точку, а коэффициент a 2 , называемый в статистике коэффициентом регрессии, связан с коэффициентом корреляции r. Имеют место следующие соотношения:

Коэффициент корреляции характеризует меру линейной связи между величинами n, M и может принимать значения в пределах от -1 до 1. Чем ближе к единице | r |, тем теснее линейная связь между n, M. Если | r | = 1, то M линейно зависит от n, т.е. выполнено соотношение:

поэтому ошибка представления эмпирических данных равна 0.

Оценка точности аппроксимации

аппроксимация excel точность формула

Мера ошибки при аппроксимации функции в соответствии с данным выше определением равна:

С целью оценки относительной погрешности при аппроксимации функции рассматривают величину суммарной погрешности по отношению к общему разбросу данных. Общий разброс данных складывается из отклонений теоретических значений от среднего и эмпирических значений от теоретических. Вводятся обозначения:

В случае линейной функции получим:

В случае квадратичной функции:

По аналогии легко написать формулу для вычисления ошибки аппроксимации функцией любого вида.

Отметим, что для аппроксимирующей функции, линейной относительно параметров, верно:

Относительная ошибка аппроксимации есть отношение

Величина

называется коэффициентом детерминированности и характеризует меру точности аппроксимации табличных данных. Если 2 = 1, то ошибка аппроксимации равна 0 и теоретические значения совпадают с эмпирическими.

Преимущество аппроксимации производственных возможностей с помощью одной гиперплоскости заключается в наглядности и простоте недостатки связаны с увеличением погрешности аппроксимации по мере отклонения плана от опорного его значения.  


Ее отличие от первого варианта связано со значением Х0=0, что приводит к существенной погрешности аппроксимации (6). Дело в том, что точность (6) предполагает наличие у функции непрерывной первой производной. В случае задачи с Х0 > 0 искомое решение, как известно, обладает необходимым запасом гладкости. Однако при Х0=0 оно имеет особенность при t=0 типа Jt, что дает в производной бесконечность типа t 4. Это приводит к полному искажению численного решения . В самом деле, рассмотрим сеточную функцию следующего вида  

Эта модель легко интерпретировалась с точки зрения экономического содержания. Действительно, х(1> и х(2) являются ведущими аргументами, увеличение которых положительно сказывается на выработке, а (3) - это производство продукции внутри треста, которое в силу малой мощности предприятий не может быть рентабельным, но без него невозможно строительство. Погрешность аппроксимации в терминах е - среднего абсолютного относительного отклонения и а - стандартного отклонения составила для (10.4)  

При оптимизации для продуктов 12 и 17 получился меньший вклад в покрытие, чем в исходном варианте, что связано с погрешностью аппроксимации данных региональных менеджеров , йом случае рекомендуется выбирать объемы и цены, дающие максимальный вклад в покрытие по данным предприятия.  

Следует отметить, что при всей своей очевидной сложности, вычисление IRR по вышеописанной методике дает лишь приблизительные результаты это связано с тем, что в расчетах взаимосвязь NPV и ставки дисконтирования полагается линейной, в то время как в действительности она таковой не является (как показано на рис. 10.1). Более того, погрешность в данном случае зависит и от разницы выбранных процентных ставок чем она больше, тем менее точной будет наша оценка IRR. Это продемонстрировано на рис. 10.2 линия АВ представляет собой линейную аппроксимацию взаимосвязи NPV и ставки дисконтирования , основанную на значениях ставки 15 и 25 %, а линия АС - линейную аппроксимацию той же взаимосвязи, при значениях ставки 15 и 50 %. Как видно из рис. 10.2, разрыв между двумя ставками увеличивается, и оценка IRR сдвигается вправо (т.е. увеличивается).  

Если шаг в модели затрат достаточно широк, то так называемые пошагово-переменные затраты могут становиться "пошагово-постоянными" или даже постоянными затратами . На рис. 10.6 показаны затраты труда как переменные, при этом допущена небольшая погрешность, вызванная выравниванием функции. На рис. 10.7 затраты на выполнение контрольных функций имеют широкий шаг, такой, что постоянно-затратная аппроксимация будет более точна, чем переменно-затратная в пределах релевантной области.  

Результаты решений по различным интервалам аппроксимации (см. табл. 86) могут быть отнесены в одну группу по значениям функционалов, различающихся не более чем на 2-3%. Если этот процент считать соизмеримым с погрешностью определения нормативов, то в качестве решения нелинейной задачи можно принять оптимальный план любого интервала, отвечающего максимальным значениям функционалов (с принятой точностью). Это позволяет выбрать такой план, реализация которого на месторождении была бы наиболее целесообразна, например вместо пикового разбуривания месторождения - плановое (распределенное по годам периода разбуривания).  

Количество одновременно выполняемых операций колеблется в пределах от 120 (умножение переменной на постоянный коэффициент больше единицы) до 2 (воспроизведение специальных функций). Погрешность вычислений 0-0,8%. Максимальное значение погрешностей приходится на воспроизведение тригонометрических функций и на воспроизведение нелинейных функций методом кусочно-линейной аппроксимации (от 0,5 до 0,8%).  

Подобное соотношение выполняется уже после нескольких первых итераций, однако в целом управление еще не оптимально. Знак ">о W+g"7 () становится на (, а), по существу, случайной величиной , зависящей, в частности, и от погрешностей конечно-разностной аппроксимации дифференциальных уравнений . Следовательно, и u (t) на (tlt t2) становится, в известной мере, случайной. В сочетании с некорректностью задачи эта случайность и приводит  

Этап 7 (анализ точности полученных уравнений связи). Исследователь должен отдавать себе отчет в том, что найденная им в соответствии с (В.24) аппроксимация f (X) неизвестной теоретической функции fT (X) из соотношений типа (В. 14), (В. 16) или (В.21) (называемая эмпирической функцией регрессии , см. гл. 5) является лишь некоторым приближением истинной зависимости fT (X)1. При этом погрешность в описании неизвестной истинной функции fT (X) с помощью f (X) в общем случае состоит из двух составляющих а) ошибки аппроксимации 6F и б) ошибки выборки б (/г). Величина первой зависит от успеха в реализации этапа 4, т. е. от правильности выбора класса допустимых решений F. В частности, если класс F выбран таким образом, что включает в себя и неизвестную истинную функцию f (т. е. fT (X) F), то ошибка аппроксимации 6F = 0. Но даже в этом случае остается случайная составляющая (ошибка выборки) б (/г), обусловленная ограниченностью выборочных данных вида (В.1), па основании которых мы подбираем функцию f (X) (оцениваем ее параметры). Очевидно, уменьшить ошибку выборки мы можем за счет увеличения объема п обрабатываемых выборочных данных, так как при fT (X) F (т. е. при 6F - 0) и правильно выбранных методах статистического оценивания (т. е. при правильном выборе оптимизируемого функционала качества модели Дп (/)) ошибка выборки б (/г) -> 0 (по вероятности) при п - оо (свойство состоятельности используемой процедуры статистического оценивания неизвестной функции fT (X)).  

По рисунку видно, что при использовании неадекватной параметрической модели погрешность наибольшая. Локальная параболическая аппроксимация с использованием полинома второй степени лучше, чем традиционно применяемая аппроксимация полиномом нулевой степени. Первая не только дает наименьшую погрешность, но и значительно устойчивее к выбору величины Ь.  

Погрешность при такой аппроксимации также невелика из-за наличия перегрузки и суперпозиции потоков заявок, проходящих через каждую очередь.  

Для удобства дальнейшего использования (например, при вычислениях интервальных оценок погрешностей) эмпирическую плотность распределения , представленную гистограммой, аппроксимируют непрерывной аналитической функцией . Как правило, при этом для аппроксимации стараются подобрать аналитические выражения, характерные для определенных теоретических (вероятностных) распределений.  

Основные данные установки максимальный порядок решаемых систем дифференциальных уравнений -12-16-й погрешность задания постоянных коэффициентов-0,5% погрешность воспроизведения переменных коэффициентов (без учета погрешности аппроксимации)- 0,5% погрешность интегрирования входного сигнала - 0,5% дрейф усилителя в режиме интегрирования - за 100 сек 40-50 мв фоновая составляющая усилителя при коэффициенте усилителя, равном 1, составляет 20 мв погрешность решения систем дифференциальных уравнений до 12-го порядка - 5-10% с частотой свободных колебаний до 8 гц. Питание - от однофазной сети переменного тока напряжением 220 в, частотой 50 гц потребляемая мощность - 6 ква. При питании от трехфазной сети переменного тока напряжением 380/220 или. 220/127 в, частотой 50 гц по ребляемая мощность -0,8 ква. Габаритные размеры установки (без блоков питания) 5400x500X1230 мм габаритные размеры секций СУ, СОУ-2 и СПК-2 622X476X1230 мм тзес установки - 1246 кг.  

В экономической практике и исследованиях вычислительная привлекательность-и хорошая интерпретируемость линейных моделей (не обязательно оптимизационных, т.е. моделей в широком смысле) делает целесообразным их применение и в случае линейной аппроксимации с приемлемой погрешностью нелинейных закономерностей, если это не мешает экономическому содержанию задачи.  

На рис. ЮЛ показаны значения 6 (/ - О, 1, 2), соответствующие непараметрическому оцениванию с помощью метода локальной параболической (порядка i) аппроксимации (10.2) с весовой функцией w (х, х0) = ехр - (х - х0)2/2Ь2 . Параметрическое оценивание с неадекватно предположенной моделью /пар - (а + сх) 1 в обоих случаях (п - 75 и п = 300) дало значительно большую погрешность 8пар>1.  

Такая аппроксимация позволяет получать дисперсии dqi с погрешностью, находящейся в пределах 15 % даже при эрланговских потоках и постоянных временах обслуживания. Однако при перегрузках (при значениях рД существенно больших 0 и близких к 1) это выражение становится практически точным, и можно показать, что распределение числа заявок в очереди при перегрузке - экспоненциальное, Поэтому дисперсия времени пребывания в очереди равна  

Напомним (см. с. 55), что приведенные на этом графике значения k являются средними для класса усеченных, симметричных и одномодальных распределений погрешности, т.е. в тех случаях, когда о кривой плотности распределения погрешности известно, что она является усеченной, симметричной и одномодальной, и другие данные отсутствуют, использование k p обеспечивает наибольшую точность оценок интервальных характеристик погрешности. Максимальные погрешности значений k, обусловленные отличием реальных законов распределения от принятой (средней) аппроксимации, для которой получены эти (k) коэффициенты, приведены на том же графике (см. рис. 7).  

Хотя сцепленные индексы, построенные на основе почти всех используемых на практике индексных формул, и являются аппроксимациями индексов Дивизиа, скорость сходимости последовательности сцепленных индексов к индексу Дивизиа с уменьшением шага по времени до нуля существенно зависит от выбора индексной формулы. Так, при г- 0 погрешность сцепленного индекса Ласпейреса равна О(т) и аналогично для сцепленного индекса Пааше . Поэтому эти методы являются методами первого порядка, т.е. соответствующие сцепленные индексы достаточно медленно сходятся к индексу Дивизиа. Сцепленные индексы Фишера , Эджворта-Маршалла, Торнквиста являются методами второго порядка, поскольку при уменьшении шага по времени г погрешность этих методов равна О(т), т.е. они, вообще говоря, сходятся к индексу Дивизиа гораздо быстрее, чем сцепленные индексы Ласпейреса и Пааше34.  

Комплексные сценарии, включающие в себя изменения волатильностей и корреляций, используются при стресс-тестировании показателя VaR (stressing VaR), которое иногда выделяют в самостоятельную разновидность стресс-тестирования. Согласно распространенным рекомендациям, при расчете VaR ковариационным методом или методом Монте-Карло стресс-тестирование следует проводить, варьируя в различных комбинациях входные параметры - волатильности и корреляции. Однако не следует забывать, что дельта-нормальный метод расчета VaR основан на линейной аппроксимации чувствительности цен инструментов к относительно небольшим (в пределе - к бесконечно малым) изменениям факторов риска. Для инструментов с нелинейными функциями ценообразования погрешность такого приближения будет тем больше, чем сильнее реальное изменение фактора риска отличается от того, которое предполагалось при оценке чувствительности. В случае стресс-тестирования речь идет именно о внезапных и очень больших по величине скачках факторов риска, поэтому необходимо либо специально оценивать линейную чувствительность к изменениям такого масштаба, либо проводить стресс-тестирование только корреляционной, а не ковариационной матрицы.  

Лабораторная работа № 1

ИНТЕРПОЛЯЦИЯ ФУНКЦИЙ С ПОМОЩЬЮ СПЛАЙНА

Цель работы

Ознакомление студентов с задачей интерполяции функций, с методом прогонки для решения систем линейных алгебраических уравнений с ленточной матрицей, с понятием сплайна, получение навыков решения задач вычислительной математики на ЭВМ.

Задачи работы

Закрепление, углубление и расширение знаний студентов при решении практических вычислительных задач. Овладение вычислительными методами и практическими методами оценки погрешности вычислений. Приобретение умений и навыков при программировании и отладке вычислительных задач на компьютере.

Вводная часть

Известны два способа представления функций: аналитический и табличный. Первый требует сравнительно длительного времени вычисления, но небольшого объема памяти. Второй – наоборот. Существует промежуточный способ - сплайн.

Теоретические основы

Постановка задачи

Пусть отрезок [a , b ] разбит на n частичных отрезков [x i , x i +1 ], где x i <x i +1 , i= 0,1, …, n- 1, x 0 =a , x n =b . Обозначим h i =x i -x i - 1 . В случае равномерного разбиения h= (b-a )/n , x i =a+ih .

Функция f (x ) задана своими значениями в узловых точках x i .

Рис. 2.4.1. Разбиение интервала при интерполяции сплайном

Сплайном называется функция, которая вместе с несколькими производными непрерывна на всём заданном отрезке [a,b ], а на каждом частичном отрезке [x i ,x i +1 ] в отдельности является некоторым алгебраическим многочленом.

Максимальная по всем частичным отрезкам степень многочленов называется степенью сплайна , а разность между степенью сплайна и порядком наивысшей непрерывной на [a , b ] производной – дефектом сплайна .

Например, непрерывная кусочно-линейная функция (ломанная) является сплайном первой степени с дефектом, равным единице, т.к. непрерывна только сама функция (нулевая производная), а первая производная уже разрывна.

На практике наиболее широкое распространение получили сплайны третьей степени, имеющие на [a, b ] непрерывную, по крайней мере, первую производную. Эти сплайны называются кубическими и обозначаются через . На каждом отрезке кубический сплайн имеет вид

S 3 (x )=а i 0 +а i 1 (x - x i )+а i 2 (x - x i ) 2 +а i 3 (x - x i ) 3 , x Î[x i , x i+ 1 ], (2.4.1)

и удовлетворяет условиям

S 3 (x i )=f (x i ), i= 0,...,n . (2.4.2)

Сплайн (2.4.1) на каждом из отрезков [x i , x i + 1 ], i= 0,...,n- 1 определяется четырьмя коэффициентами, и поэтому для его построения на всем промежутке [a,b ] необходимо определить 4n коэффициентов. Для их однозначного определения необходимо задать 4n уравнений.

Условие (2.4.2) дает 2n уравнений, т.к. каждый многочлен должен проходить через две заданные точки: начало и конец отрезка [x i , x i + 1 ]. При этом функция S 3 (x i ), удовлетворяющая этим условиям, будет непрерывна во всех внутренних узлах.

Условие непрерывности производных сплайна , во всех внутренних узлах x i , i= 1,...,n- 1 сетки дает 2(n- 1) равенств.

Вместе получается 4n- 2 уравнений.

Два дополнительных условия обычно задаются в виде ограничений на значение производных сплайна на концах промежутка [a,b ] и называются краевыми условиями.

Выбор краевых условий

Наиболее употребительны следующие типы краевых условий:

д) .

Через краевые условия в конструкцию сплайна включаются параметры, выбирая которые можно управлять его поведением, особенно возле концов отрезка [a,b ].

Если известны f" (x ). f" (x ) или f¢¢¢ (x ) в точках а и b , то естественно воспользоваться краевыми условиями типа а), б) или в).

Если производные неизвестны, то в большинстве случаев наилучшим решением будет применение краевых условий типа г).

Условия типа д) носят названия периодических. Естественно требовать их выполнения в том случае, когда интерполируемая функция периодическая с периодом (b-a ).

Вместо значений производных можно использовать их разностные аналоги. При этом точность интерполяции вблизи концов отрезка [a ,b ] падает.

Погрешность аппроксимации кубическим сплайном

Теорема. Если функция f (x ) при x Î[x 0 , x n ] j раз непрерывно дифференцируема и k =min{j , 4}, то для m £k -1

причем c m не зависит от h i и i .

Примечание 1. Допустим, вторая производная f (x ) непрерывна, а третья и четвертая – кусочно-непрерывны и могут иметь разрывы только первого рода в узлах сетки x i . Тогда оценка (2.4.3) остается в силе, если вместо символа max использовать sup . Дело в том, что рассматриваемый способ построения сплайна позволяет точно строить как любой многочлен третьей степени на всем интервале [x 0 ,x n ] (при этом обеспечивается непрерывность третьей производной), так и любую заданную функцию, составленную из многочленов третьей степени, если эта функция имеет непрерывную вторую производную.

Примечание 2. Если производная f"" (x ) имеет разрывы 1-го рода или граничные значения второй производной заданы с ошибкой, то оценка (2.4.3) остается справедливой при k =2, m £1.


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-11-19

Теоретические основы метода сеток. Построение конечно-разностной схемы. Погрешность аппроксимации, устойчивость. Основная теорема метода сеток

2.3 Погрешность аппроксимации

При построении разностной схемы важно знать, насколько хорошо она аппроксимирует исходную дифференциальную задачу.

При замене дифференциальной задачи разностной допускается ошибка -- погрешность аппроксимации. Она характеризуется величиной невязок/

При замене интеграла приближенной квадратурной формулой вносится погрешность аппроксимации дифференциального уравнения разностным. Она характеризуется величиной невязки, если в конечно-разностном уравнении (5) подставить вместо значение точного решения:

Воспользовавшись соотношением (4), получаем простое выражение для вычисления:

которая зависит от шага сетки.

Говорят, что разностная схема (5) аппроксимирует исходную дифференциальную задачу с порядком p, если при. Из (6) следует, что порядок аппроксимации на 1 меньше, чем порядок погрешности используемой квадратурной формулы на интервале .

Чем больший порядок аппроксимации p , тем выше точность решения:

Для обеспечения близости решений разностной и дифференциальной задач необходимо, чтобы при стремлении шагов сетки к нулю разностная задача в пределе совпадала с дифференциальной. Если это требование выполняется, то говорят, что разностная схема аппроксимирует дифференциальную задачу.

Аппроксимация функции методом наименьших квадратов

Вычислительная математика

Существуют четыре источника погрешностей, возникающих в результате численного решения задачи. 1. Математическая модель. Погрешность математической модели связана с ее приближенным описанием реального объекта. Например...

Клеточные пространства

Теорема. Всякое непрерывное отображение одного клеточного пространства в другое гомотопно клеточному отображению. Мы будем доказывать следующее, более сильное утверждение ("относительный вариант" нашей теоремы). Теорема...

Клеточные пространства

Теорема. Если X - клеточное пространство с единственной вершиной (= нульмерной клеткой), не имеющее других клеток размерности

Линейное и нелинейное программирование

Методы аппроксимации функций

Методы аппроксимации функций

Ошибка приближения функции f(x) интерполяционным полиномом n-й степени Ln(x) в точке x определяется разностью. Можно показать, что погрешность Rn(x) определяется следующим выражением. Здесь - производная (n+1) порядка функции f(x) в некоторой точке...

Построение математической модели, описывающей процесс решения дифференциального уравнения

0 1 2,282894 1,282894 1,645818 0,1 1,470387 1,206049 -0,264338 0,069874 0,2 2,173681 1,146702 -1,026979 1,054685 0,3 3,205241 2,104853 -1,100388 1,210853 0,4 4,709109 4,080502 -0,628607 0,395146 0,5 6,894874 7,073649 0,178775 0,031961 0,6 10,066320 11,084294 1,017974 1,036271 0,7 14,663307 16,112437 1,449130 2,099978 0,8 21...

Практическое применение интерполирования гладких функций

По строению (). Но, в общем, это не так и (,), так как интерполирование предполагает приближенное нахождение: () И в связи с этим необходимо говорить о погрешности интерполирования. Заранее сказав, разность этого выражения нужно найти...

Приближенное решение алгебраических и трансцендентных уравнений. Метод Ньютона

Информация о предыдущих приближениях корня используется для нахождения последующих приближений не только в методе касательных. В качестве примера другого такого метода мы приведём метод...

Численные методы анализа

Погрешность вычисляется по формуле где h -- шаг сетки, а точка о расположена где-то между i-тым и (i + n)-тым узлами. Примером может служить известная формула (n = 2) . При n = 1 формула может быть получена и из определения производной...

Численные методы анализа

Окончательный результат многократного измерения содержит в себе как случайную, так и приборную погрешности. Случайная погрешность уменьшается с увеличением количества отдельных измерений, а приборная погрешность не меняется...

Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Где y x - расчетное значение по уравнению.

Значение средней ошибки аппроксимации до 15% свидетельствует о хорошо подобранной модели уравнения.

По семи территориям Уральского района за 199Х г. известны значения двух признаков.

Требуется:
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
а) линейной;
б) степенной;
в) показательной;
г) равносторонней гиперболы (так же нужно придумать как предварительно линеаризовать данную модель).
2. Оценить каждую модель через среднюю ошибку аппроксимации А ср и F-критерий Фишера.

Решение проводим при помощь онлайн калькулятора Линейное уравнение регрессии .
а) линейное уравнение регрессии;
Использование графического метода .
Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.
Совокупность точек результативного и факторного признаков называется полем корреляции .


На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Здесь ε - случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
3. Неправильное описание структуры модели;
4. Неправильная функциональная спецификация;
5. Ошибки измерения.
Так как отклонения ε i для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям x i и y i можно получить только оценки параметров α и β
2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где e i – наблюдаемые значения (оценки) ошибок ε i , а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Для оценки параметров α и β - используют МНК (метод наименьших квадратов).




Получаем b = -0.35, a = 76.88
Уравнение регрессии:
y = -0.35 x + 76.88

x y x 2 y 2 x y y(x) (y i -y cp) 2 (y-y(x)) 2 |y - y x |:y
45,1 68,8 2034,01 4733,44 3102,88 61,28 119,12 56,61 0,1094
59 61,2 3481 3745,44 3610,8 56,47 10,98 22,4 0,0773
57,2 59,9 3271,84 3588,01 3426,28 57,09 4,06 7,9 0,0469
61,8 56,7 3819,24 3214,89 3504,06 55,5 1,41 1,44 0,0212
58,8 55 3457,44 3025 3234 56,54 8,33 2,36 0,0279
47,2 54,3 2227,84 2948,49 2562,96 60,55 12,86 39,05 0,1151
55,2 49,3 3047,04 2430,49 2721,36 57,78 73,71 71,94 0,172
384,3 405,2 21338,41 23685,76 22162,34 405,2 230,47 201,71 0,5699

Примечание: значения y(x) находятся из полученного уравнения регрессии:
y(45.1) = -0.35*45.1 + 76.88 = 61.28
y(59) = -0.35*59 + 76.88 = 56.47
... ... ...

Ошибка аппроксимации
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.

F-статистики. Критерий Фишера.










3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.

< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

б) степенная регрессия ;
Решение проводится с помощью сервиса Нелинейная регрессия . При выборе укажите Степенная y = ax b
в) показательная регрессия;
г) модель равносторонней гиперболы.
Система нормальных уравнений.

Для наших данных система уравнений имеет вид
7a + 0.1291b = 405.2
0.1291a + 0.0024b = 7.51
Из первого уравнения выражаем а и подставим во второе уравнение
Получаем b = 1054.67, a = 38.44
Уравнение регрессии:
y = 1054.67 / x + 38.44
Ошибка аппроксимации.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.

Критерий Фишера.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H 0: R 2 =0 на уровне значимости α.
2. Далее определяют фактическое значение F-критерия:

где m=1 для парной регрессии.
Табличное значение критерия со степенями свободы k1=1 и k2=5, Fkp = 6.61
Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).



© dagexpo.ru, 2024
Стоматологический сайт