Тест бокса кокса решетчатый поиск прямой компьютерный метод выбора наилучших значений параметров

Тест бокса кокса решетчатый поиск прямой компьютерный метод выбора наилучших значений параметров

286. Сумма квадратов остатков всех наблюдений — __________________ сумма квадратов отклонений.
остаточная

287. Сумма квадратов отклонений величины a + bx от своего выборочного среднего ekonometrika 209— __________________ сумма квадратов отклонений.
объясненная

288. Сумма квадратов отклонений величины y от своего выборочного среднего ekonometrika 134— это __________________ сумма квадратов отклонений.
общая

289. Теоретическая ковариация двух случайных величин определяется как математическое ожидание __________________ отклонений этих величин от их средних значений.
произведения

290. Тест Бокса-Кокса (решетчатый поиск) — прямой компьютерный метод выбора наилучших значений __________________ модели в заданных исследователем пределах с заданным шагом (решеткой).
параметров нелинейной

291. Тест Глейзера устанавливает наличие __________________ связи между стандартным отклонением остаточного члена регрессии и объясняющей переменной.
нелинейной

292. Тест ранговой корреляции Спирмена — тест на:
гетероскедастичность

293. Тест ранговой корреляции Спирмена — тест, устанавливающий, имеет ли стандартное отклонение остаточного члена регрессии нестрогую линейную зависимость с __________________ переменной.
объясняющей

294. Тестовая статистика для теста Спирмена рассчитывается по формуле
rx, e ekonometrika 195

295. Точность оценок по МНК улучшается, если увеличивается:
количество наблюдений

297. Уравнение y = a + bx, где a и b — оценки параметров a и b, полученные в результате оценивания модели y = a + bx + u по данным выборки, называется уравнением
линейной регрессии

298. Условие гомоскедастичности означает, что σ 2 (ui) ekonometrika 231__________________ наблюдений.
одинакова для всех

299. Условие стационарности временного ряда для модели АР (2) имеет вид
ekonometrika 288

300. Условие стационарности ряда случайных остатков в модели АР (1) имеет вид
ekonometrika 270

Источник

Ответы на экзаменационные билеты по эконометрике.

47. Тесты Бокса-Кокса и Зарембеки выбора модели регрессии.

Если в начале эконометрического моделирования перед исследователем стоит выбор между моделью регрессии, внутренне нелинейной и линейной моделью регрессии (или сводящейся к линейному виду), то предпочтение отдаётся линейным формам моделей.

Однако многие модели регрессии различной функциональной формы нельзя сравнивать с помощью стандартных критериев (например, сравнение по множественному коэффициенту детерминации, или суммам квадратов отклонений), которые позволили бы подобрать наиболее подходящую модель регрессии.

Например, если перед исследователем стоит вопрос о выборе линейной или логарифмической моделями регрессии, то использовать при этом критерий суммы квадратов отклонений нельзя, потому что общая сумма квадратов отклонений для логарифмической модели намного меньше, чем для линейной модели регрессии. Это вызвано тем, что значение логарифма результативной переменной lоgу намного меньше, чем соответствующее значение у, поэтому сравнение сумм квадратов отклонений моделей даёт неадекватные результаты.

Если сравнивать данные модели по критерию коэффициента множественной детерминации, то мы вновь получим неадекватные результаты. Коэффициент множественной детерминации для линейной модели регрессии характеризует объяснённую регрессией долю дисперсии результативной переменной у. Индекс детерминации для логарифмической модели регрессии характеризует объяснённую регрессией долю дисперсии переменной lоgу. Если значения данных критериев примерно равны, то сделать выбор между моделями регрессии с их помощью также не представляется возможным.

Одним из методов проверки предположения о возможной линейной зависимости между исследуемыми переменными является метод проверки гипотезы о линейной зависимости между переменными с помощью коэффициента детерминации r2 и индекса детерминации R2.

Другим методом выбора функциональной зависимости между переменными является тест Бокса-Кокса.

Предположим, что перед исследователем стоит задача выбора между линейной и логарифмической моделями регрессии. Рассмотрим применение теста Бокса-Кокса на данном примере.

Тест Бокса-Кокса основывается на утверждении о том, что (у-1) и lоgу являются частными случаями функции вида.

Otvyety na ekzamyenatsionnyye bilyety po ekonomyetrikye 21778

В том случае, если параметр λ равен единице, то данная функция принимает вид F=у-1.

В том случае, если параметр λ стремиться к нулю, то данная функция принимает вид F=lоgу.

Для того чтобы определить оптимальное значение параметра λ, необходимо провести несколько серий экспериментов с множеством значений данного параметра. С помощью такого перебора можно рассчитать такое значение параметра λ, которое даст минимальную величину критерия суммы квадратов отклонений. Подобный метод вычисления оптимального значения параметра называется поиском на решётке или на сетке значений.

П. Зарембеки разработал один из вариантов теста Бокса-Кокса специально для случая выбора между линейной и логарифмической моделями регрессии.

Суть данного теста заключается в том, что к результативной переменной у применяется процедура масштабирования. Подобное преобразование в дальнейшем позволит сравнивать величины сумм квадратов отклонений линейной и логарифмический моделей регрессий.

Тест Зарембеки реализуется в несколько шагов:

1) рассчитывается среднее геометрическое значений результативной переменной у по формуле:

Otvyety na ekzamyenatsionnyye bilyety po ekonomyetrikye 21780

2) все результативные переменные у масштабируются по формуле:

Otvyety na ekzamyenatsionnyye bilyety po ekonomyetrikye 21782

Где ỹi – масштабированное значение результативной переменной у для i-го наблюдения;

3) оценивается линейная модель регрессии с использованием масштабированных значений ỹi результативной переменной вместо у, и логарифмическая модель регрессии с использованием ỹi вместо lоgу. Все факторные переменные и коэффициенты регрессии остаются при этом неизменными. После такого масштабирования результативных переменных значения сумм квадратов отклонений для данных моделей регрессии можно сравнивать между собой. Поэтому выбирается та модель регрессии, для которой данный критерий окажется наименьшим.

Источник

Выбор функции: тесты Бокса—Кокса

1 3702 2 3882 3 2855 4 1910 5 1277 image 10 1

1 1

Выбор функции: тесты Бокса—Кокса

Часто несколько разных нелинейных функций Почти совместимы с наблюдениями, когда в Кри Вой. Людмила Фирмаль

Однако в случае множественного регрессионного анализа Создать расписание. При рассмотрении альтернативных моделей с таким же определением Процедура выбора зависимой переменной очень проста. Самое сердце Оценка регрессии на основе всех возможных функций В полной мере, я могу объяснить, вы можете представить выбор функции Общее изменение зависимой переменной.

В функциональной форме больше проблем с выбором модели Сложно, потому что коэффициент R2 или итог нельзя сравнивать напрямую Квадрат отклонения. Особенно — это самый распространенный пример Проблема, вы не можете сравнить эту статистику в линейной и логарифмической Микальный вариант модели. Например, линейная регрессия расходов на жилье и личного потребления В оценке дохода США был фактор (см. Упражнение 2.2) R2 = 0,985, сумма квадратов отклонений (RMS) составила 385,2.

Для двойной 129 Лог-версия модели, когда журнал берется вдоль обеих осей. (См. Упражнение 4.1), соответствующие значения были 0,9915 и 0,02. в Во втором случае стандартное отклонение намного меньше, но это ничего не решает. значение сюрприз, потому что log y намного меньше соответствующего значения y Однако остатков будет гораздо меньше. Количество / 2 безразмерно, Два уравнения, которые относятся к разным понятиям.

В одном уравнении она Измерьте процент дисперсии y, объясняемый регрессией и Регрессия соотношения логичной дисперсии. Для одной модели коэффициент Вы можете сделать законный выбор гораздо чаще, чем другие Тем не менее, значения R2 двух моделей примерно Если они равны, проблема выбора очень сложна. В этом случае используйте стандартную процедуру, известную ниже Название коробки — тест Кокса (Box, Sox, 1964).

Если вы просто хотите Смоделируйте поток, используя y, записав y в качестве зависимой переменной, Тестовая версия, разработанная Павлом Зарембкой (Zarembka, 1968). Этот тест включает в себя такое преобразование шкалы наблюдения. у, предложить возможность прямого сравнения RMS для линейных и логарифмических моделей. Процедура включает в себя: Порядок действий: 1.

Среднее геометрическое значение выборки y рассчитывается. (И Поскольку оно соответствует показателю среднего арифметического log l, Лог регрессии и регрессионных программ уже оценены Предоставляет распечатку среднего значения зависимой переменной, затем Просто рассчитайте показатель этой величины. )

2. Наблюдаемое значение y пересчитывается и делится на это значение. Это значит у * = ^ / (среднее геометрическое у), Где y * — пересчитанное значение для i-го наблюдения. 3. Расчетная регрессия линейной модели с использованием y * Вместо у в логарифмической модели в качестве зависимой переменной Используйте log (y *) вместо log y. Модель во всех остальных отношениях Не меняйся.

Эта статистика имеет распределение x2 за один шаг Новая свобода. Когда критическое значение y> превышено во время выбора Можно сделать вывод, что существует значительная разница на бессмысленном уровне В качестве оценки. 130 случай Тест проводится как данные о стоимости продуктов питания. Данные по стоимости жилья в США также включены.

Войти Рифмная регрессия В этих двух типах продуктов [Формула (4.18), Упражнение 4.1] Людмила Фирмаль

Средние значения log y составляют 4,8422 и 4,6662 для расходов на питание. Расходы на жилье. Коэффициент масштабирования равен r48422 и eA> b Соответственно. В таблице. 4.4 показывает линейное и двойное стандартное отклонение Логарифмическая регрессия с пересчетом Два типа данных о преимуществах. Линейная регрессия логарифм регрессия Таблица 4.4 Расходы на питание 0,011 9 0,011 9 Расходы на жилье • 0,0341 0,0221 Со стола.

4.4 Относительно возврата затрат на питание, Хорошее наково в обоих случаях. Для расходов на жилье, логарифм Регрессия обеспечивает более точное соответствие. Логарифм стандартного отклонения В случае двух регрессий здесь он равен 0,4337, поэтому после умножения 12,5 тестовая статистика составляет 5,42. 1 критический уровень у>

Наказание за свободу составляет 3,84, существенный уровень 5% и 6,64. На уровне 1 процента (см. Вкладку A.4) это соответствует Только в случае 5%, эффект двух регрессий очень отличается Уровень. Эти результаты могут показаться неожиданными С теоретической точки зрения логарифмическая модель Более совершенным.

Однако, поскольку период выборки очень короткий, кривизна Вероятно, нет времени появляться в функции Энгеля, поэтому линейное веселье Катионы могут обеспечить почти равное согласие с нелинейностью Ная функция *. движение 4,6. Пересмотреть линейную и логарифмическую регрессию Сначала провести повторную агрегацию по методу Заренбука, подтвердить продукт, Есть ли большая разница в качестве.

1 Пересчитанная регрессия по методу Зарембы Решите, какую модель вы хотите расставить по приоритетам. Не нужно обращать внимание на важные факторы Только стандартное значение отклонения. Коэффициенты должны быть определены непосредственно из неучтенных Вариант выбранной модели Приложение 4.1 Более общая коробка — тест Кокса1 Оригинальная процедура Box — Cox является более общей, чем вариант.

Описано в разделе 4.5. Дж. Бокс и Д. Кокс имеют y и log y Частный случай функции (y-1) / X, из которой получается функция y. Если X = 1 и функция log y (случай ограничения), X стремится к нулю. Нет оснований предполагать, что одно из этих значений X является оптимальным. Минимально, но попробуйте много значений, оп Определите, какой из них дает минимальное стандартное отклонение (после Метод преобразования Зарембка).

Эта процедура Решетчатый поиск. Для нее типичный эко не имеет особых возможностей. Неметрическая компьютерная программа, которая все еще работает Это не сложно. Если вы используете 10 значений A, вам необходимо: Вы можете установить 10 новых зависимых переменных в пакете регрессии, используя: После предварительной стадии узнайте функциональную форму X и различные значения Конвертация по методу Зарембы.

Затем найдите регрессию между Независимая переменная для каждого. В таблице. 4.5 Результаты Регрессионные оценки для различных расходов на питание и жилье Значение X Чтобы оценить регрессию, располагаемый доход индивида Он формируется таким же образом, за исключением преобразования методом Зарембки. такой Преобразование не является обязательным.

Это приложение включает в себя материалы повышенной сложности, Пропустить. 132 Результатом является оптимальное значение X для продуктов Pita Около 0,5. Это Линейная и логарифмическая регрессия. Для расходов на жилье На первый взгляд более точная регрессия Соответствие по сравнению с линейной и логарифмической регрессией. один Как вы можете видеть из следующего раздела.

Поскольку эта модель имеет много недостатков, детальное изучение оптики Минимальная математическая форма на этом этапе не гарантируется. Помимо получения балльной оценки для X, вы также можете получить: Однако эта процедура выходит за рамки этого документа. Да (Если вас интересует этот вопрос, Дж. Спитцер [Спитцер, 1982, с. 307-313]. )

1 1

Образовательный сайт для студентов и школьников

Копирование материалов сайта возможно только с указанием активной ссылки «www.lfirmal.com» в качестве источника.

© Фирмаль Людмила Анатольевна — официальный сайт преподавателя математического факультета Дальневосточного государственного физико-технического института

Источник

Тесты Бокса-Кокса и Зарембеки выбора модели регрессии

Если в начале эконометрического моделирования перед исследователем стоит выбор между моделью регрессии, внутренне нелинейной и линейной моделью регрессии (или сводящейся к линейному виду), то предпочтение отдаётся линейным формам моделей.

Однако многие модели регрессии различной функциональной формы нельзя сравнивать с помощью стандартных критериев (например, сравнение по множественному коэффициенту детерминации, или суммам квадратов отклонений), которые позволили бы подобрать наиболее подходящую модель регрессии.

Например, если перед исследователем стоит вопрос о выборе линейной или логарифмической моделями регрессии, то использовать при этом критерий суммы квадратов отклонений нельзя, потому что общая сумма квадратов отклонений для логарифмической модели намного меньше, чем для линейной модели регрессии. Это вызвано тем, что значение логарифма результативной переменной logy намного меньше, чем соответствующее значение у, поэтому сравнение сумм квадратов отклонений моделей даёт неадекватные результаты.

Если сравнивать данные модели по критерию коэффициента множественной детерминации, то мы вновь получим неадекватные результаты. Коэффициент множественной детерминации для линейной модели регрессии характеризует объяснённую регрессией долю дисперсии результативной переменной у. Индекс детерминации для логарифмической модели регрессии характеризует объяснённую регрессией долю дисперсии переменной logy. Если значения данных критериев примерно равны, то сделать выбор между моделями регрессии с их помощью также не представляется возможным.

Другим методом выбора функциональной зависимости между переменными является тест Бокса-Кокса.

Предположим, что перед исследователем стоит задача выбора между линейной и логарифмической моделями регрессии. Рассмотрим применение теста Бокса-Кокса на данном примере.

Тест Бокса-Кокса основывается на утверждении о том, что (у-1) и logy являются частными случаями функции вида

20090523 00130

В том случае, если параметр λ равен единице, то данная функция принимает вид F=y-1.

В том случае, если параметр λ стремиться к нулю, то данная функция принимает вид F=logy.

Для того чтобы определить оптимальное значение параметра λ, необходимо провести несколько серий экспериментов с множеством значений данного параметра. С помощью такого перебора можно рассчитать такое значение параметра λ, которое даст минимальную величину критерия суммы квадратов отклонений. Подобный метод вычисления оптимального значения параметра называется поиском на решётке или на сетке значений.

П. Зарембеки разработал один из вариантов теста Бокса-Кокса специально для случая выбора между линейной и логарифмической моделями регрессии.

Суть данного теста заключается в том, что к результативной переменной у применяется процедура масштабирования. Подобное преобразование в дальнейшем позволит сравнивать величины сумм квадратов отклонений линейной и логарифмический моделей регрессий.

Тест Зарембеки реализуется в несколько шагов:

1) рассчитывается среднее геометрическое значений результативной переменной у по формуле:

20090523 00132

2) все результативные переменные у масштабируются по формуле:

20090523 00133

где y˜i – масштабированное значение результативной переменной у для i-го наблюдения;

3) оценивается линейная модель регрессии с использованием масштабированных значений y˜i результативной переменной вместо у, и логарифмическая модель регрессии с использованием y˜i вместо logy. Все факторные переменные и коэффициенты регрессии остаются при этом неизменными. После такого масштабирования результативных переменных значения сумм квадратов отклонений для данных моделей регрессии можно сравнивать между собой. Поэтому выбирается та модель регрессии, для которой данный критерий окажется наименьшим.

Источник

Лекция № 14. тесты бокса—кокса. средние и точечные коэффициенты эластичности

Лекция № 14. тесты бокса—кокса. средние и точечные коэффициенты эластичности

Если существует выбор между построением линейной и нелинейной регрессионных моделей для изучаемых данных, то предпочтение всегда отдается более простой форме зависимости. Регрессионные модели, имеющие разную функциональную форму, не подлежат сравнению по стандартным критериям (например, сравнению по множественному коэффициенту детерминации или суммам квадратов отклонений), позволяющим выбрать наиболее подходящее уравнение.

При сравнении линейной и логарифмической регрессий оказывается, что общая сумма квадратов отклонений для логарифмической модели намного меньше, чем для линейной модели. Но значение логарифма результативной переменной log у намного меньше, чем соответствующее значение у, поэтому сравнение сумм квадратов отклонений моделей дает неадекватные результаты.

Коэффициент множественной детерминации для линейной регрессии характеризует объясненную регрессией долю дисперсии результативной переменной y. Коэффициент множественной детерминации для логарифмической модели характеризует объясненную регрессией долю дисперсии переменной log y. Если значения коэффициентов множественной детерминации примерно равны, то сделать выбор между моделями на основе данного критерия также не представляется возможным.

Использоваться метод проверки гипотезы о линейной зависимости между переменными с помощью коэффициента и индекса детерминации. Другим эффективным методом выбора функциональной зависимости является тест Бокса—Кокса. Рассмотрим эту процедуру на примере выбора между линейной и логарифмической регрессионными моделями.

В основе теста Бокса—Кокса лежит утверждение о том, что (y— 1) и log y являются частными случаями функции

Если 1 равен единице, то функция равна F = y — 1. Если 1 стремится к нулю, то функция равна F = log y. Для определения оптимального значения параметра 1 проводятся эксперименты с множеством его значений. Эта процедура позволит найти то значение 1, которое дает минимальную величину суммы квадратов отклонений. Метод поиска оптимального значения параметра — поиск на решетке (или на сетке) значений.

Один из вариантов теста для линейной и логарифмической моделей разработан П. Зарембеки. Его идея заключается в применении процедуры масштабирования к зависимой переменной, что в дальнейшем позволит сравнивать величины сумм квадратов отклонений регрессий.

Тест Зарембеки состоит из следующих этапов:

1) определяется среднее геометрическое значений y в выборке

image047

2) наблюдения пересчитываются по формуле:

image048

по формуле:

где y — пересчитанное (масштабированное) значение переменной для /’-го наблюдения; 3) на последнем этапе оценивается регрессионная зависимость для линейной модели с использованием масштабированных значений y вместо y и для логарифмической модели

с использованием yi вместо log y.

Все факторные переменные и регрессионные коэффициенты остаются при этом неизменными. После масштабирования зависимых переменных значения сумм квадратов отклонений для данных регрессионных моделей являются величинами сопоставимыми. Выбор падает на ту модель, для которой данный показатель оказался наименьшим.

Средние и точечные коэффициенты эластичности

Помимо индексов корреляции и детерминации для нелинейных форм связи, для изучения зависимости между результативной переменной и факторными признаками используются также коэффициенты эластичности, которые позволяют оценить степень связи между x и y.

Коэффициент эластичности показывает, на сколько процентов приблизительно изменится результативный показатель y при изменении величины факторного признака на 1\%.

Общая формула коэффициента эластичности:

где y’x — первая производная результативной переменной по

факторному признаку. Коэффициент эластичности может быть рассчитан для среднего значения факторного признака по общей формуле:

где y (x ) — значение функции при среднем значении факторного признака.

Средний коэффициент эластичности характеризует процентное изменение результативного признака y относительно своего среднего значения при изменении факторного признака на 1\% относительного x.

Средние коэффициенты эластичности рассчитываются по индивидуальным формулам для каждой разновидности функции.

Для наиболее простой линейной зависимости вида yi = в0+ft1xj средний коэффициент эластичности рассчитывается как:

Для полинома второго порядка (параболической функции) yi = в0 + Plxj + j32x? + ei средний коэффициент эластичности рассчитывается по формуле:

Для показательной функции вида y = в0 х в х £t средний коэффициент эластичности определяется как:

Основным достоинством степенной функции вида

является то, что средний коэффициент эластичности Э (x) равен

коэффициенту регрессии fiу

Это единственная функция подобного рода.

Помимо средних коэффициентов эластичности, могут быть также рассчитаны точечные коэффициенты эластичности. Общая формула их расчета:

image049

т. е. эластичность зависит от конкретного заданного значения факторного признака x1. Точечный коэффициент эластичности характеризует процентное изменение результативной переменной y относительно уровня функции y(x1) при изменении факторного признака на 1\% относительно заданного уровня x1.

Для линейной зависимости точечный коэффициент эластичности будет рассчитываться по формуле:

image050

Знаменателем данного показателя является значение линейной функции в точке.

Для параболической функции точечный коэффициент эластичности находится как:

image051

Знаменателем данного показателя также является значение параболической функции в точке.

Для показательной функции точечный коэффициент эластичности определяется по формуле:

В случае степенной функции точечный коэффициент эластичности Э^) будет равен коэффициенту регрессии 0Х. Докажем предыдущее утверждение.

Запишем точечный коэффициент эластичности для степенной функции вида yi = 00 X x0j Xet через первую производную результативной переменной по заданной факторной переменной

Э (x ) = 000i xi 1 = 000i xi 1 = 0

Коэффициенты эластичности имеют очень большое значение в анализе производственных функций. Однако их расчет не всегда имеет смысл. В некоторых случаях интерпретация факторных переменных в процентном отношении невозможна или бессмысленна.

линейная ОПФ y = 0О + 01x. Данная функция выражает зависимость объема производимой продукции от величины затрат определенного ресурса. Линейная ОПФ характеризуется следующими особенностями:

а) если величина независимого признака x равна нулю, то

объем производства не будет нулевым, так как y = 0О 0О > 0);

б) объем произведенной продукции неограниченно увеличивается с ростом затрат определенного ресурса x на постоянную величину 01 01 >0). Это свойство линейной ОПФ

выполняется только на практике;

параболическая ОПФ приу.=0 +01x +02×2 при00 > 0, 01 > 0, 02 > 0.

ЛЕКЦИЯ № 15. Производственные функции. Эффект от масштаба производства

Особенностью данной функции является то, что с увеличением затрат ресурса x объем произведенной продукции у вначале возрастает до некоторой максимальной величины, а затем снижается до нуля;

3) степенная ОПФ у = в0 х xв прив0 > 0,в1 > 0. Функция характеризуется тем, что с увеличением затрат ресурса x объем

производства возрастает неограниченно;

4) показательная ОПФ вида у = в0 — k х в при 0 Предмет: Экономика Автор: Ангелина Витальевна Яковлева Год издания: 2009 Язык учебника: русский Рейтинг: 5Просмотров: 656

Источник

Моя дача
Adblock
detector