Автор : Брюков Владимир Георгиевич Название книги: Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews Читать на сайте: https://mir-knigi.org/author/bryukov-vladimir-georgievich/kak-predskazat-kurs-dollara-effektivnye-metody Предисловие ко второму дополненному изданию В 2011 году издательство КНОРУС и Центр Исследований Платежных Систем и Расчетов выпустили книгу Брюков В. Г. «Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews». К сожалению, далеко не все читатели – в том числе и из-за относительно высокой стоимости печатной версии этой книги – сумели ее приобрести, о чем говорят их письма. В связи с этим автор этих строк решил издать эту книгу вторично в электронном виде, включив во второе издание дополнительный параграф о структурных изменениях в динамике курса доллара к рублю, произошедших в 2014-2015 годах. Кроме того, кто хочет подробнее ознакомиться с моими последними наработками по этому поводу, может приобрести недавно вышедшую еще одну мою книгу – с «Как предсказать курс доллара. Расчеты в Excel для снижения риска проигрыша». Владимир Георгиевич Брюков, независимый аналитик Предисловие к первому изданию Каким будет курс американского доллара завтра, послезавтра, через неделю или через месяц? Сколько будут стоить в ближайшем будущем единая европейская валюта, японская йена, британский фунт, швейцарский франк, канадский, австралийский или новозеландский доллар и прочие валюты? Есть ли смысл сегодня (завтра, послезавтра или же через месяц) вкладывать российские рубли в доллары США, евро, фунт, или в йену, либо, напротив, от иностранной валюты нужно поскорее избавляться? Каких рекомендуемых курсов покупки или продажи при этом следует придерживаться?.. Мы живем в такое время, когда ответы на эти животрепещущие вопросы ежедневно приходится искать миллионам рядовых инвесторов и профессиональных трейдеров во всем мире, в том числе и в России. И это вполне понятно, поскольку от правильных ответов на эти актуальные вопросы зависит их будущее благосостояние. По нашему мнению, и хочется надеяться, что читатель с этим согласится: тот, кто возьмет на себя труд внимательно прочитать, а еще лучше – проштудировать эту книгу – сможет давать более компетентные ответы на эти животрепещущие вопросы. Следовательно, наша книга предназначена для всех тех, кто интересуется валютным рынком, кто собирается зарабатывать или уже зарабатывает на этом рынке, и для всех тех, кто хочет научиться делать прогнозы по курсам валют. Впрочем, эта книга будет полезна и интересна не только для валютных инвесторов и трейдеров, но и для студентов, будущая профессия которых, так или иначе, связана с работой в банке, финансовой компании или с операциями на финансовых и товарных рынках. Причем, полученные в этой книге знания пригодятся не только для работы на валютном рынке, но и для работы на других товарных и финансовых рынках, поскольку методика прогнозирования курса валют принципиально не отличается от прогнозирования цен, например, на такие товары как нефть или золото. В книге детально излагается методики построения стационарных и нестационарных статистических моделей по прогнозированию курса доллара США с использованием программ EViews и Excel. При этом особенно большое внимание уделяется разработке моделей прогнозированию по курсу доллара США с упреждением в один месяц. После освоения этого материала в заключительной главе 7 даны статистические модели по прогнозированию курса доллара с упреждением в две недели и упреждением в одну недели, а также по прогнозированию курса евро к доллару с упреждением в один день. В этой же заключительной главе рассказывается о методике составления на основе разработанных статистических моделей рекомендуемых цен покупки и продажи валют. Причем, эффективность этих цен рассматривается на конкретных примерах с учетом последних рыночных данных. Очевидно, что помимо прогнозов по американской валюте и единой европейской валюте многие хотели бы научиться делать прогнозы и по курсам других валют, например, по курсу йены, фунту стерлингов, австралийскому доллару… И этот список интересных для инвестора валют можно расширить, по меньшей мере, на еще два десятка денежных единиц. В связи с чем, необходимо заметить: внимательно прочитав и освоив материал нашей книги, читатель в дальнейшем может справиться с этой задачей вполне самостоятельно. Поскольку, в основе составления прогнозов по курсам различных валют лежит одна и та же методика, основанная на использовании феноменальных технических возможностей таких мощных вычислительных программ как EViews и Excel. Материал в нашей книге, состоящей из семи глав, излагается следующим образом. Во-первых, в каждом параграфе главы сначала дается конкретная проблема, связанная прогнозированием курсов валют. Во-вторых, предлагается определенный алгоритм действий с использованием EViews или Excel. В-третьих, даются некоторые математические подробности, разъясняющие суть данного алгоритма действий. В-четвертых, на конкретном примере показывается, как нужно пользоваться данным алгоритмом действий для решения той или иной проблемы, связанной с прогнозированием курса доллара. И, наконец, в-пятых, в конце каждой главы читателю задаются вопросы, помогающие закрепить пройденный материал. Очевидно, что после того как наш читатель убедится, что он может заниматься прогнозированием самостоятельно, то ничто не помешает ему воспользоваться EViews или Excel для того чтобы составить прогнозы по курсу, например, японской йены или британского фунта, а также по поводу будущей цены на нефть, золото и прочих товаров. Вполне понятно, что в эпоху бурного роста электронно-вычислительной техники и всеобщей автоматизации любой желающий овладеть азами валютного прогнозирования может существенно сэкономить время на расчетах, если он сумеет овладеть компьютерными способами обработки статистических данных. Поэтому необходимым условием для нашей совместной работы является умение читателя работать с компьютером на уровне рядового пользователя, а также наличие определенных навыков работы с программой Microsoft Excel. Желательно также иметь хотя бы самое элементарное представление об основах теории статистики. В процессе работы над книгой читатель сможет расширить свои знания о функциональных возможностях программы Excel, а также научится работать в эконометрической программе EViews. Вполне естественно, что в первую очередь мы будем обращать внимание на обучение тем функциям этих программ, которые потребуются для прогнозирования курса валют. Начинающим пользователям, которые еще недостаточно опытны в работе с Microsoft Excel, можно порекомендовать прочитать книгу Н.И. Макарова, В.Я. Трофимец Статистика в Excel: Учеб. пособие. – М.: Финансы и статистика, 2003, а также другие учебные пособия (их довольно много), рассказывающие о возможностях данной программы. В свою очередь, тем читателям, которые хотят научиться прогнозировать курсы валют с помощью эконометрической программы EViews, можно порекомендовать в качестве пособия следующие книги: Молчанов И.Н., Герасимова И.А. Компьютерный практикум по начальному курсу эконометрики (реализация на EViews): Практикум /Рост. гос. экон. унив. – Ростов-на-Дону, – 2001, и Турунцева М.Ю. Анализ временных рядов / МИЭФ ГУ-ВШЭ. – М., 2003. В заключении хочу сказать еще об одном важном условии, без которого работа с этой книгой будет не очень продуктивной: наличии у читателя желания овладеть приемами прогнозирования курса валют, которые автор постарался изложить максимально доступным языком. С теми моими читателями, кому для лучшего усвоения материала книги потребуются дополнительные консультации, разъяснения или помощь в решении заданий, автор готов пообщаться по скайпу. Узнать об условиях получения консультаций по книге, а также записаться на консультацию можно по следующему адресу электронной почты: [email protected] Владимир Георгиевич Брюков, независимый аналитик Об авторе [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _0.jpg] Брюкoв Владимир Георгиевич, независимый финансовый аналитик, с 2003 года занимается банковской журналистикой. С 2005 года особое место в его публикациях занимают статистические методы анализа валютных и финансовых рынков. Теме валютного прогнозирования, в первую очередь, прогнозу по курсу доллара США, посвящены многие его статьи, опубликованные в журналах «Валютный спекулянт», «Инвестиционный банкинг» и в ряде других изданий. В этих публикациях обобщаются результаты проведенного автором исследования валютного рынка, предлагаются оптимальные методы прогнозирования по курсам валют с учетом последних достижения современной статистической науки. С 2009 по 2015 год В. Г. Брюков ежемесячно публиковал прогнозы на портале Банкир.ру прогнозы по курсам пятнадцати ведущих мировых валют на будущий месяц. Насколько точными при этом были прогнозы, наши читатели могут убедиться сами, посетив на этом сайте рубрику «Валютный рынок». Сотрудничество с этим известным и авторитетным порталом, а также большой интерес, проявленный читателями к книге «Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews», стали для автора важным стимулом, способствовавшим написанию новой книге по валютному прогнозированию. ГЛАВА 1. ПОНЯТИЕ О СТАЦИОНАРНОМ И НЕСТАЦИОНАРНОМ ВРЕМЕННОМ РЯДЕ, ВЫЯВЛЕНИЕ НЕСТАЦИОНАРНОСТИ РЯДА ГРАФИЧЕСКИМ СПОСОБОМ 1.1. Краткая характеристика стационарных и нестационарных случайных процессов Внезапно изменяющиеся тренды на валютном рынке, на первый взгляд, носят настолько причудливый и непредсказуемый характер, что многие инвесторы убеждены, что делать какие-то прогнозы по поводу курса валют – дело абсолютно безнадежное. И действительно, если посмотреть, например, на динамику ежемесячного курса доллара США (как впрочем, и на динамику других свободно конвертируемых валют), то этот временной ряд нельзя назвать стационарным. Чтобы понять, к каким последствиям – с точки зрения прогнозирования курса американской валюты – ведет этот факт, нам придется немного углубиться в теорию стационарных и нестационарных случайных процессов. Как известно, в статистической литературе принято выделять три вида случайных процессов: строго стационарные, слабо стационарные и нестационарные процессы. Случайный процесс, образующий временной ряд X1, X2, X3…Xt (буква X обозначает переменную, содержащую определенную рыночную информацию, например, по динамике курсов валют, а, цифры – 1,2,3…t –моменты времени), называется строго стационарным (или, как еще говорят, стационарным в узком смысле), если совместное распределение вероятностей всех переменных X1,X2, X3…Xt точно такое же, как и для наблюдений X1+T,X2+T, X3+T…X t+T (где t=t2-t1 – временной лаг). Иначе говоря, свойства строго стационарного временного ряда не меняются при изменении начала отсчета времени. Однако в сфере экономики, в том числе в сфере финансовых и валютных рынков, строго стационарные процессы отсутствуют, а потому для нас гораздо больший интерес представляют так называемые, слабые стационарные процессы или стационарные процессы в широком смысле. Под слабым стационарным процессом понимается случайный процесс, у которого среднее и дисперсия – независимо от рассматриваемого периода времени – имеют постоянное значение, а автоковариация зависит только от длины лага между исследуемыми переменными. Напомню нашим читателям, что среднее значение временного ряда можно найти по следующей формуле (1.1): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _1.jpg] где n – количество наблюдений во временном ряде. Дисперсия (мера разброса случайной величины, например, отклонения курса доллара от его среднего значения, или, как еще говорят, от его математического ожидания) временного ряда представляет собой средний квадрат отклонений переменной (случайной величины) от ее среднего значения. Соответственно, дисперсия находится по следующей формуле (1.2): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _2.jpg] Хочу заметить, что в Excel дисперсию можно найти, пользуясь функцией ДИСПР (если исходные данные представляют собой генеральную совокупность) или функцией ДИСП (если данные представляют собой выборку). Для оценки тесноты и направления связи между переменными одного временного ряда с определенным лагом используется автоковариация. В частности, автоковариация между значениями Xt и X t -T отделенными друг от друга интервалом в T единиц времени, называется автоковариацией с лагом (задержкой) T, которая находится по следующей формуле (1.3): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _3.jpg] Автоковариацию, согласно формуле (1.3), в Excel можно найти с помощью функции КОВАР, которая возвращает величину ковариации. Причем, последнюю называют автоковариацией в том случае, когда ее используют для оценки тесноты и направления связи между переменными одного временного ряда с определенным лагом. Например, с лагом минус один месяц. Доказано, что для независимых переменных X и Y ковариация всегда равна нулю, а для зависимых переменных она, как правило, отличается от нуля. Если лаг t = 0, то автоковариация равна дисперсии. Если временной ряд, характеризующий динамику, например, курса валют, является слабо стационарным, то это означает отсутствие: во-первых, тренда; во-вторых, строго периодических колебаний; в-третьих, систематических изменений дисперсии; в-четвертых, каких-либо иных систематических изменений во временном ряде. Таким образом, под стационарным процессом в слабом или в широком смысле понимается случайный процесс, у которого среднее и дисперсия – независимо от периода времени – имеют постоянное значение, а автоковариация зависит от длины лага между рассматриваемыми переменными. Если временной ряд является нестационарным, то с точки зрения теории это предполагает, что он содержит не только случайную компоненту, но и тренд, а его средняя, дисперсия и автоковариация изменяются во времени. В связи с этим делать прогнозы по нестационарному временному ряду более затруднительно (особенно на длительный период, или в период каких-либо резких изменений в его динамике), чем по стационарному ряду. 1.2. Распознавание стационарности временного ряда с помощью построения его графика Существуют различные методы распознавания стационарности временного ряда, однако, пожалуй, самым простым из них является построение графика временного ряда с последующим визуальным определением наличия в нем тренда. С этой целью мы решили построить график ежемесячных колебаний курса доллара к рублю за период с июня 1992 г. до апреля 2010 г. Читатели, которые не умеют строить диаграммы, могут ознакомиться с представленным ниже алгоритмом действий №1 и № 2 Алгоритм действий № 1 «Как строить диаграммы в Microsoft Excel» Шаг 1. Поиск данных, их загрузка и первичная обработка в Excel Во-первых, нужно на сайте Банка России http://www.cbr.ru/ взять необходимые данные по ежедневным курсам доллара за весь интересующий нас период. Во-вторых, после того как мы скопируем рыночную статистику в файл Microsoft Excel, все данные по курсу доллара к рублю с 1 июля 1992 г. по 1 января 1998 г. необходимо разделить на 1000, поскольку на сайте Банка России за этот период они приводятся в неденоминированном виде. В-третьих, для того, чтобы из всего массива данных оставить только необходимые для нас данные, а именно: курс доллара на конец месяца, необходимо их отфильтровать с помощью опций ДАННЫЕ/дополнительно/расширенный фильтр. Шаг 2. Построение графика в Excel Выделим с помощью мышки столбец с ежемесячными данными (на конец месяца) по курсу пары рубль – доллар за период с июня 1992 г. (на конец июня из-за отсутствия на сайте Банка России более ранних данных возьмем курс доллара на 1 июля 1992 г.) по апрель 2010 г. и столбец с соответствующими обозначениями месяцев. Далее выбираем в панели инструментов кнопку Вставка (в Excel 2007 г.), либо кнопку Мастер диаграмм (в Excel 1997-2003 гг.), в которой выбираем опцию График (см. рис.1.1). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _4.jpg] Рис. 1.1. Опция «График» – ВСТАВКА/МАСТЕР ДИАГРАММ В результате у нас получился график (см. рис. 1.2), свидетельствующий о том, что динамику колебаний ежемесячного курса доллара нельзя назвать стационарной. Судя по данному графику, можно прийти к выводу, что во временном ряде наблюдается тенденция к росту, а среднее значение курса доллара в разные периоды времени принимает различные значения. В частности, на графике хорошо видно, что во второй половине 1992 г. курс доллара, хотя и систематически рос, но в целом был лишь немного выше нулевой отметки. В то время как к концу 1998 г. он превысил уровень в размере 20 руб., а в 1999 – 2010 гг. курс американской валюты колебался в пределах от 24 руб. до 35 руб. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _5.jpg] Рис. 1.2. Ежемесячный курс доллара США, в руб. Источник: здесь и далее (если особо не оговорено) даются данные Банка России и расчеты автора Теперь построим аналогичный график в EViews. Однако прежде нам нужно научиться импортировать данные в эту программу из исходного экселевского файла. Умение выполнять эту процедуру потребуется для последующей работы в EViews. С этой целью следует ознакомиться с алгоритмом действий № 2. Алгоритм действий № 2 «Импорт данных и создание рабочего файла в EViews» Шаг 1. Подготовка данных в Excel для их последующего импорта в EViews Прежде чем приступить к созданию диаграммы в EViews нужно сначала импортировать в эту программу из Excel ежемесячные данные по курсу доллара к рублю. При работе в более ранних версиях EViews импортируемые данные необходимо сохранять в формате Excel 5.0/95 поскольку при использовании других экселевских форматов в EViews появится сообщение об ошибке. Однако в последних версиях EViews можно загружать данные из экселевских файлов в любом формате, в том числе и в форматах Excel 2007 и 2010 года. Причем, импортируемые данные следует размещать в виде столбца в самой верхней строке экселевского листа слева. Например, заголовок первого столбца с данными должен быть помещен в ячейке B1, заголовок второго столбца с данными – в ячейке C1 и так далее, в то время как заголовок с соответствующими датами – в ячейке A1. Заголовки столбцов следует обозначать латинскими буквами, поскольку англоязычная программа EViews не понимает кириллицу. В частности, столбец с ежемесячными данными по курсу доллара США мы решили обозначить как USDOLLAR (поместили в ячейку B1), а заголовок (в ячейке А1) с названиями месяцев – Month. И последний важный момент: экселевский лист, на котором мы разместим подготовленные к импорту в EViews данные, нужно также переименовать латинскими буквами. В данном случае мы назвали экселевский лист с импортируемыми данными sheet1. Шаг 2. Создание рабочего файла в EViews Для того чтобы создать рабочий файл, содержащий данные, с которыми мы собираемся работать, необходимо в главном меню EViews выбрать опции File/New/Workfile. В результате откроется следующее диалоговое мини-окно (см. рис. 1.3.): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _6.jpg] Рис. 1.3. Диалоговое окно Workfile create В этом диалоговом окне необходимо задать соответствующую информацию. Так, в мини-окне Workfile structure type (структура рабочего файла) мы задаем опцию Dated-regular frequency (даты с определенной частотой). Соответственно, в мини-окне Frequency (частота данных) ставим опцию Monthly (ежемесячные данные), в Start date (начальная дата) – 92:06 (июнь 1992 г.), в End date(конечная дата) – 2010:03 (март 2010 г.). Хочу заметить, что в мини-окне End date дату года нужно обязательно давать четырехзначной, в то время как в Start date она может быть двузначной. В результате у нас получится (см. рис.1. 4) неполный рабочий файл (Workfile): в нем будут отсутствовать данные, которые еще предстоит импортировать. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _7.jpg] Рис. 1.4. Неполный рабочий файл Workfile Шаг 3. Импорт данных в EViews Перед импортом данных экселевский файл нужно обязательно закрыть, поскольку иначе появится сообщение об ошибке. При работе в последних версиях EViews в командной строке этой программы нужно воспользоваться опцией IMPORT/IMPORT FROM FILE. После открытия экселевского файла появится окошко Excel read‑Step 1 of 3 (см. рис. 1.5), в котором следует выбрать одну из двух опций: Predefined range (предопределенный диапазон) или Custom range (обычный диапазон). В случае выбора Predefined range в EViews загружаются уже выбранные программой данные, а если вы воспользуетесь опцией Custom range, то в этом случае можно самому выбрать требуемый диапазон данных, в том числе внести необходимые правки в опции SHEET (лист), START CELL (начальная ячейка), END CELL (конечная ячейка). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _8.jpg] Рис. 1.5. Окно Excel 97-2003 Read – Step 1 of 3 Если вы работает в более ранних версиях EViews, то при импорте данных в командной строке нужно выбрать опции File/Import/Read Text-Lotus-Excel. После этого появится новое диалоговое окно Excel Spreadsheet Import (импорт листа Excel). В открывшемся диалоговом окне (см. рис. 1.6) нужно отметить в мини-окне Excel5+sheet name – название листа, которое у нас обозначено как sheet1. В мини-окне Names for series or Number if named in file (название для серии данных или номер серии данных, если у нее есть название в файле) – поставим цифру 1, поскольку мы импортируем лишь одну серию данных, которую уже назвали USDOLLAR. В остальных мини-окнах соответствующие опции в EViews устанавливаются по умолчанию. В частности, в мини-окне UPPER-LEFT DATA CELL (верхняя левая ячейка с данными) – по умолчанию указывается ячейка B2. Более подробно обо всех нюансах импорта данных из Excel в EViews можно прочитать, например, в книге Турунцевой М.Ю. Анализ временных рядов / МИЭФ ГУ-ВШЭ. – М., 2003 стр. 4-9. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _9.jpg] Рис. 1.6. Диалоговое окно Excel Spreadsheet Import (импорт листа Excel) Поскольку мы уже создали рабочий файл в EViews, то построить график курса доллара, аналогичный экселевскому (см. рис. 1.2), не представляет особого труда. В рабочем файле (Workfile) EViews открываем файл USDOLLAR, после чего используем для построения диаграммы в виде графика (LINE) опции VIEW/GRAPH/LINE (см. рис. 1.7). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _10.jpg] Рис. 1.7. Использование опции VIEW/GRAPH/LINE для построения в EViews линейного графика LINE В результате у нас получилась диаграмма (рис. 1.8), вполне аналогичная (если не считать различный тип форматирования) диаграмме на рис 1.2, построенной в Excel. Для того чтобы сохранить полученную диаграмму в EViews на отдельном листе следует нажать верхнюю кнопку FREEZE (окончательно принять). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _11.jpg] Рис 1.8. График курса доллара, полученный в EViews Таким образом, построив соответствующие графики в EViews и Excel, нам удалось выяснить, что временной ряд, характеризующий динамику ежемесячного курса доллара, является нестационарным, поскольку в нем наблюдается ярко выраженный тренд. Вместе с тем, как мы уже говорили ранее, нестационарный временной ряд содержит не только тренд, но и случайную компоненту. Следовательно, чтобы сделать адекватный прогноз по курсу доллара необходимо учесть как тренд, так и случайную компоненту, поскольку оба эти фактора существенно влияют на динамику валюты. Схематично, наша дальнейшая работа, которой посвящены последующие главы этой книги, будет заключаться в следующем. Во-первых, нам нужно составить уравнение регрессии, с помощью которого можно будет делать прогнозы с необходимой точностью. Во-вторых, необходимо протестировать данное уравнение регрессии (прогностическую модель) на его адекватность с точки зрения прогностических качеств. В-третьих, надо составить точечные прогнозы по курсу американской валюты, используя полученную математическую модель. В-четвертых, нужно удостовериться в приемлемой точности составленных точечных прогнозов. В-пятых, необходимо убедиться, что получившиеся в результате отклонения фактического курса доллара от его предсказанных (расчетных) значений представляют собой стационарный ряд. В-шестых, надо посмотреть, является ли распределения остатков нормальным, что позволит нам впоследствии составить интервальные прогнозы – с учетом диапазона отклонений точечных прогнозов от фактического курса доллара – с определенным уровнем надежности. В-седьмых, нужно проверить, соответствует ли точность интервальных прогнозов заданному уровню надежности. В-восьмых, научиться применять полученную статистическую модель для составления рекомендуемых цен покупки и продажи валюты, используемых в качестве стоп-приказов при работе на валютном рынке. При этом выполнение всех этих процедур будет сопровождаться подробным рассказом о том, как их можно выполнить в Excel или EViews, что поможет нашим читателям впоследствии самостоятельно решать эти задачи. Контрольные вопросы и задания к главе 1 1. Чем отличается строго стационарные процессы от стационарных процессов в широком смысле? 2. Может ли стационарный процесс иметь тренд или какие-либо строго периодические колебания? 3. Чем нестационарный процесс отличается от стационарного? Может ли у нестационарного процесса быть тренд? 4. Если Вы пришли к выводу о нестационарности данного временного ряда, то, что можно сказать об устойчивости его средней, дисперсии и автоковариации. Дайте определение средней, дисперсии и автоковариации. ГЛАВА 2. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ И РЕШЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ В EXCEL 2.1. Характеристика метода наименьших квадратов и его применение при прогнозировании курса доллара Как мы выяснили в главе 1, динамика курса валют представляет собой временной ряд, имеющий не только тренд, но и случайную компоненту, поэтому в качестве метода оценки параметров прогностической модели, как правило, используется регрессионный анализ. Как известно, задачей регрессионного анализа является определение аналитического выражения (математической формулы), аппроксимирующего связь между зависимой переменной Y (ее называют также результативным признаком) и независимыми (их называют также факторными) переменными X1, X2…Xn. При этом форма связи результативного признака Y с факторами X1, X2…Xn, либо с одним фактором X, получила название уравнения регрессии. В качестве метода аппроксимации (приближения) в уравнении регрессии используется метод наименьших квадратов (МНК), который минимизирует сумму квадратов отклонений фактических значений Y от его предсказываемых значений, рассчитанных по определенной математической формуле. Причем, решение уравнения регрессии относительно интересующих нас переменных у (курс доллара) и х (время или порядковый номер месяца), по сути, заключается в подборе прямой линии к совокупности данных, состоящих из пар данных, характеризующих динамику курса доллара и соответствующие порядковые номера месяцев. При этом линию, которая лучше всего подойдет к этим данным, выбирают так, чтобы сумма квадратов значений вертикальных отклонений зависимой переменной (фактического курса доллара) от линии, рассчитанной по уравнению регрессии (предсказанный курс доллара), была минимальной. Математические подробности оценки параметров уравнения регрессии методом наименьших квадратов В самом общем виде формулу МНК можно представить следующим образом (2.1): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _12.jpg] где Yt и Yрасч. – фактические и расчетные значения зависимой (результативной) переменной для различных моментов времени; [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _13.jpg] – минимальная сумма квадратов отклонений (остатков) фактических значений Y от его расчетных (предсказываемых) значений. Поскольку Yрасч. =a +bX (где а – свободный член уравнения регрессии, а b – коэффициент регрессии), то уравнение (2.1) примет следующий вид (2.1.1): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _14.jpg] Для отыскания параметров a и b, при которых функция f(a,b) принимает минимальное значение, необходимо найти частные производные по каждому из параметров этой функции a и b и приравнять их нулю. Если минимальную сумму квадратов отклонений (остатков) e2 обозначить через S, то в результате мы получим систему нормальных уравнений МНК для прямой (2.1.2): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _15.jpg] Преобразовав систему уравнений (2.1.2) получим (2.1.3): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _16.jpg] Решив систему уравнений (2.1.3) методом последовательного исключения переменных найдем следующие оценки параметров: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _17.jpg] С помощью оцененного таким образом уравнения регрессии можно предсказать, как в среднем изменится признак Y в результате роста факторов X1, X2…Xt (или одного фактора X). В зависимости от того, какая математическая функция используется для прогнозирования результирующей переменной Y, различают линейную и нелинейную регрессию. При этом в основе линейной регрессии лежит уравнение линейного тренда, а в основе нелинейной регрессии – целое семейство уравнений нелинейных трендов (полиномиальный второй, третьей и прочих степеней, степенной, экспоненциальный, логарифмический и другие). В случае если результативный признак Y зависит от одного фактора X, то такое уравнение регрессии называется парным, а если Y зависит от нескольких факторов X1, X2…Xt – то уравнением множественной регрессии. Практически в любом учебнике по общей теории статистики и по эконометрике можно более подробно познакомиться со спецификой уравнений регрессии. (См., например, учебник «Эконометрика» под ред. И.И. Елисеевой. – 2-е изд., пер. и доп. – М,: Финансы и статистика, 2006, стр. 43-132). Существуют формулы, по которым можно самостоятельно найти параметры, как уравнения линейной регрессии, так и различных видов уравнений нелинейной регрессии. Однако с внедрением в широкую практику компьютеров и соответствующих компьютерных программ уже нет необходимости оценивать параметры уравнения регрессии вручную, тем более что этот процесс довольно трудоемкий. 2.2. Решение уравнения регрессии в Excel с учетом фактора времени. Интерпретация и оценка значимости полученных параметров Поэтому далее остановимся на изучении алгоритма решения уравнений регрессии с применением соответствующих вычислительных программ. При этом работу с уравнениями регрессии в компьютерных программах можно разделить на три этапа. На первом, подготовительном этапе необходимо определиться с набором факторов, которые необходимо включить в уравнение регрессии, а также с его аналитической формой, что в ряде случаев требует предварительной обработки данных. Например, в случае выбора степенного уравнения регрессии вместо исходных данных нужно взять их логарифмы. Второй этап состоит из собственно решения уравнения регрессии и нахождения его параметров. На третьем этапе проводится оценка и тестирования общего качества уравнения регрессии, проверка статистической значимости каждого из коэффициентов регрессии, определяются их доверительные интервалы, а также принимается окончательное решение об адекватности или неадекватности полученного уравнения регрессии. Как известно, одним из наиболее распространенных способов определения тренда в динамике курса валюты является построение его зависимости от фактора времени T. Так, если в качестве зависимой переменной Y мы возьмем ежемесячный курс доллара, а в качестве независимой переменной T – время (в данном случае порядковые номера месяцев, начиная с июня 1992 г.=1), то у нас получится следующее уравнение парной линейной регрессии: Y расч. =a + bT (2.2); где a – свободный член уравнения регрессии; b – линейной коэффициент регрессии, показывающий, как изменение величины независимой переменной (фактора) T в среднем способствует изменению зависимой переменной (результативного признака) Y; Y расч. – расчетное значение результативного признака, вычисляемое по формуле (2.2). Минимизируем сумму квадратов отклонений (остатков) Y факт. от Y расч.,то есть от фактических значений курса доллара от его расчетных значений. В результате формулу МНК (2.1.1) для линейной регрессии можно в данном случае представить в виде формулы (2.3): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _18.jpg] Уравнение (2.3) в принципе можно решить самостоятельно, если найти его параметры согласно формулам (2.1.4) и (2.1.5), но в целях ускорения этого процесса мы будем его решать с помощью Пакета анализа Excel. Кстати, желающие лучше усвоить суть МНК могут сначала самостоятельно в «ручном режиме» решить данное уравнение регрессии, а затем сверить свои результаты с теми, что мы получим в Excel. Для того чтобы подготовить исходные данные к решению данного уравнения регрессии разместим в Excel два столбца исходных данных. В первом столбце, который озаглавим Time, поместим порядковые номера месяцев, начиная с июня 1992 г. (с номером =1) и кончая апрелем 2010 г. (с номером =215). Во втором столбце, который озаглавим USDOLLAR, поместим данные по курсу доллара на конец месяца, начиная с июня 1992 г. и заканчивая апрелем 2010 г. (последние данные, имевшиеся на тот момент, когда писались эти строки). Таким образом столбец Time представляет собой независимую переменную, которая в формуле (5) обозначена символом T, а столбец USDOLLAR является зависимой переменной Yфакт. Далее переходим к решению уравнения регрессии в Пакете анализа Excel, о том, как это делается, можно прочитать ниже – в алгоритме действий № 3. Алгоритм действий № 3 «Как решить уравнение регрессии в Excel» Шаг 1. Ввод в уравнение исходных данных Делается это следующим образом: сначала в Microsoft Excel 2007 г. в верхней панели инструментов выбирается опция Данные (в Microsoft Excel 1997-2003 гг. нужно выбрать опцию Сервис), потом в появившемся окне Анализ данных – опция Регрессия. После чего появляется новое окно – Регрессия (см. рис. 2.1), в котором в графе Входной интервал y выделяем (с помощью мышки) столбец данных USDOLLAR (ячейки $C$1:$C$216). Здесь же в графе Входной интервал Х» выделяем столбец данных Time(ячейки $B$1:$B$216), то есть независимую переменную T из нашего уравнения регрессии (5). Шаг 2. Дополнительные опции Если бы мы хотели получить уравнение регрессии без свободного члена, который в формуле (2.2) обозначен символом a, то тогда нам следовало бы выбрать еще и опцию КОНСТАНТА-НОЛЬ. Однако в данном случае в использовании этой опции нет необходимости. Опцию Остатки следует выбирать тогда, когда есть необходимость, чтобы в выходных данных содержалась информация об отклонении расчетных y от их фактических значений. При этом остатки находятся по следующей формуле (2.4): Остатки = Yрасч.– Yфакт. (7); где Yрасч. – расчетные, Yфакт. – фактические значения результативного признака. Опцию МЕТКИ применяют для того, чтобы переменные, включенные в уравнение регрессии, в выводе итогов были обозначены в виде заголовков соответствующих столбцов. По умолчанию оценка в Excel параметров уравнения регрессии делается с 95% уровнем надежности. Однако в случае необходимости в опции Уровень надежности можно поставить цифру 99, что означает задание для программы оценить коэффициенты регрессии с 99% уровнем надежности. В результате в выводе итогов мы получим данные, характеризующие как в целом уравнение регрессии, так и верхние и нижние интервальные оценки коэффициентов данного уравнения с 95% и 99 % уровнями надежности. При 95% уровне надежности существует риск, что в 5 % случаях оценки коэффициентов уравнения регрессии могут оказаться неточными, а при 99% уровне надежности этот риск равен 1%. Шаг 3. Вывод итогов На заключительном этапе выбираем в параметрах вывода (окно РЕГРЕСССИЯ) опцию выходной интервал, в которой указываем соответствующую ячейку Excel ($H$2), далее щелкаем по надписи ОК и получаем ВЫВОД ИТОГОВ (см. рис 2.1, где можно увидеть все заданные нами параметры уравнения регрессии). В случае необходимости вывод итогов можно получить на отдельном листе (см. опцию НОВЫЙ РАБОЧИЙ ЛИСТ) или в новой книге Excel (см. опцию НОВАЯ РАБОЧАЯ КНИГА). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _19.jpg] Рис. 2.1. Диалоговое окно РЕГРЕССИЯ для вывода итогов при решении в Excel уравнения регрессии Результаты решения уравнения регрессии, которые в программе Excel выдаются в виде единой таблицы под заголовком ВЫВОД ИТОГОВ, у нас представлены в виде трех блоков (см. табл. 2.2-2.4). Так, в табл. 2.2 сгенерированы результаты по регрессионной статистике, в табл. 2.3 дается дисперсионный анализ, а в табл. 2.4 оценивается статистическая значимость коэффициентов регрессии . Параметры, представленные в табл. 2.2, оценивают уровень аппроксимации фактических данных, полученный с помощью данного уравнения регрессии. Так, параметр Множественный R обозначает множественный коэффициент корреляции R, который характеризует тесноту связи между результативным признаком Y и факторами переменными X1, X2…Xn. Данный коэффициент изменяется в пределах от 0 до 1, причем, чем ближе к 1, тем теснее корреляционная связь между переменными, включенными в уравнение регрессии. Множественный коэффициент корреляции равен квадратному корню, извлеченному из коэффициента детерминации R2, который у нас также приводится в регрессионной статистике. Множественный коэффициент R также находят по формуле (2.5): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _20.jpg] где Y факт. – фактическое, а Y расч. – расчетное (предсказанное по уравнению регрессии) значение результативного признака. Зная величину коэффициента корреляции R, можно дать качественную оценку силы связи между зависимой и независимыми переменными, включенными в данное уравнение. С целью классификации силы связи обычно используют шкалу Чеддока (см. табл. 2.1). Таблица 2.1. Шкала Чеддока для классификации силы связи [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _21.jpg] В случае между переменными существует функциональная связь, то R=1, а если корреляционная связь отсутствует, то R=0. Поскольку в таблице 2.2 множественный коэффициент корреляции R равен 0,8456, то согласно таблице Чеддока, связь между переменными, включенными в уравнение регрессии можно считать высокой. Следует также заметить, что если коэффициент множественной корреляции меньше 0,7, то это означает, что величина коэффициента детерминации R2 (о нем мы расскажем ниже) будет меньше 50%, а потому регрессионные модели с таким коэффициентом детерминации не имеют большого практического значения. Однако самым важным является другой параметр регрессионной статистики – R-квадрат (его мы выделили жирным шрифтом), обозначающий коэффициент детерминации R2. Коэффициент детерминации R2 характеризует долю дисперсии результативного признака Y, объясняемую уравнением регрессии, в общей дисперсии результативного признака. Коэффициент детерминации R2 находится по формуле (2.6): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _22.jpg] где Y i – фактическое, а Y расч. – расчетное (по уравнению регрессии) значение результативного признака (зависимой переменной), D объясн. – объясненная дисперсия, а D общ. – общая дисперсия результативного признака Y. Коэффициент детерминации R2, как и множественный коэффициент корреляции R, изменяется в пределах от 0 до 1. Если R2 равен 1, то доля объясненной дисперсии составляет 100%, а, следовательно, связь между зависимой переменной Y и независимой переменными X 1, X 2…X t носит функциональный характер. В том случае, когда R2равен 0, то какая-либо связь между переменными в данном уравнении регрессии отсутствует. Величина коэффициента детерминации R2 является одним из важнейших критериев при оценке качества уравнения регрессии. Так, при выборе из нескольких уравнений регрессии предпочтение (при прочих равных условиях) отдается тому, у которого коэффициент детерминации R2 ближе к 1. И это вполне понятно: чем выше коэффициент детерминации у данного уравнения регрессии, тем выше у него уровень аппроксимации и соответственно ниже доля необъясненной дисперсии. В нашем случае коэффициент детерминации R2 = 0,7151, а потому можно сделать вывод, что в период с июня 1992 года по апрель 2010 г. 71,51% ежемесячных колебаний курса доллара (зависимая переменная Y), согласно данному уравнению регрессии, объяснялись изменением порядкового номера месяца (независимая переменная Т). Другой параметр регрессионной статистики – Нормированный R-квадрат. Дело в том, что при добавлении в уравнении регрессии дополнительных факторов (независимых переменных) величина коэффициента детерминации R2 соответственно растет. Поэтому для того чтобы сделать сравнения коэффициентов детерминации между уравнениями регрессии с разным числом факторов более сопоставимыми, используется нормированный R2, величина которого корректируется в сторону уменьшения при добавлении в уравнение дополнительных факторов. Пакете анализа EXcel нормированный R2 вычисляют по формуле (2.7): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _23.jpg] где n – количество наблюдений; k – количество переменных в уравнении регрессии. В нашем случае расчет по этой формуле будет следующим: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _24.jpg] Еще один параметр регрессионной статистики Стандартная ошибка или остаточное стандартное отклонение, которое можно найти по формуле (2.8): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _25.jpg] где n – количество наблюдений; k – количество переменных в уравнении регрессии. Наблюдения – этот параметр регрессионной статистике показывает число наблюдений n, которых у нас в данном случае 215 (то есть равен числу месяцев с июня 1992 г. по апрель 2010 г., по которым у нас есть данные) Таблица 2.2. Регрессионная статистика [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _26.jpg] В таблице 2.3 дается дисперсионный анализ, то есть анализ изменения результативного признака под воздействием включенных в уравнение регрессии факторов. При этом столбцы данной таблицы имеют следующую интерпретацию. Столбец df (degrees of freedom) сообщает число степеней свободы. Причем, для строки Регрессия число степеней свободы равно количеству факторов kфакт., включенных в уравнение регрессии. В нашем случае dfрегр.=k =1. Для строки Остаток число степеней свободы определяется число наблюдений и количеством факторов, включенных в уравнении регрессии. При этом dfост. находится по следующей формуле: df ост. = n-(k +1) (2.9); где n – число наблюдений, k – количество факторов. В нашем случае df ост. = 215-(1 +1)=213. Для строки ИТОГО число степеней свободы находится по следующей формуле: df итого = df регр. + df ост (2.10) В нашем случае df итого = 1 +213=214 Столбец SS означает сумму квадратов отклонений. Для строки РЕГРЕССИЯ данный столбец обозначает сумму квадратов отклонений рассчитанных (предсказанных) значений результативного признака от его среднего, рассчитанного по фактическим данным (2.11): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _27.jpg] Для строки ОСТАТОК cтолбец SS обозначает сумму квадратов отклонений фактических данных от их расчетных значений (2.12): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _28.jpg] Для строки ИТОГО cтолбец SS обозначает сумму квадратов отклонений фактических данных от их среднего (2.13): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _29.jpg] SS2итого можно также найти, сложив SS2регр. с SS2ост. =21779,45+8676,619=30456,07 Столбец MS означает дисперсию на одну степень свободы, которая находится по формуле (2.14): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _30.jpg] Для строки РЕГРЕССИЯ – это факторная или объясненная дисперсия D факт.= MS факт.=21779,45/1=21779,45 Для строки ОСТАТОК – это остаточная дисперсия D ост.= MS ост.= 8676,619/213=40,7353 В столбце F дается фактический F-критерий Фишера, который находится путем сопоставления факторной и остаточной дисперсии на одну степень свободы. При этом F-критерий Фишера рассчитывается по формуле (2.15): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _31.jpg] Если нулевая гипотеза (об отсутствии связи между переменными, включенными в уравнение регрессии) справедлива, то факторная и остаточная дисперсия не отличаются друг от друга. Поэтому для того чтобы уравнение регрессии было признано значимым, для нулевой гипотезы требуется опровержение, а для этого необходимо, чтобы факторная дисперсия превышала остаточную дисперсию в несколько раз. Статистиками разработаны соответствующие таблицы критических значений F-критерия при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. При этом следует иметь в виду, что табличное значение F-критерия – это максимальная величина отношения факторной дисперсии к остаточной дисперсии, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Если фактический (то есть рассчитанный для этого уравнения регрессии) F-критерий больше его табличного значения, то нулевая гипотеза об отсутствии связи между результативном признаком и факторами отклоняется. И в этом случае делается вывод о существенности этой связи. 5.В столбце значимость F показывается уровень значимости, который соответствует величине фактического F-критерия Фишера, вычисленного для данного уравнения регрессии. В нашем случае значимость F факт. практически равна нулю, то есть F факт. больше F табл. (значения F-критерия Фишера при уровне значимости 0,05 или 5% можно найти в любом учебнике по статистике) при 1% и 5 % уровне значимости. Отсюда можно сделать вывод, о статистической значимости уравнения регрессии, поскольку связь между включенными в него факторами в данном случае доказана. В тех случаях, когда значимость F бывает больше, например, 0,01, но меньше 0,05, то тогда делается вывод, что F факт. меньше F табл. при 1% уровне значимости, но больше F табл при 5 % уровне значимости. Следовательно, в этой ситуации нулевая гипотеза об отсутствии связи между результативным признаком и факторами, включенными в уравнение регрессии, на 1% уровне значимости не отклоняется, но отклоняется на 5 % уровне значимости. Таким образом, в этом случае каждый исследователь должен сам решить, считать ли 5% уровень значимости F-критерия достаточным для того чтобы сделать вывод о статистической значимости данного уравнения регрессии. При этом следует иметь в виду, что если значимость F-критерия выше 0,05, то есть F факт. меньше F табл. при 5% уровне значимости, то в этой ситуации уравнение регрессии, как правило, считается статистически незначимым. Таблица 2.3 «Дисперсионный анализ» [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _32.jpg] В таблице 2. 4 сгенерированы коэффициенты уравнения регрессии и оценки их статистической значимости. 1. При этом в столбце Коэффициенты представлены коэффициенты уравнения регрессии. На пересечении этого столбца со строкой Y-пересечение дан свободный член, который в формуле линейного уравнения регрессии (6) обозначен символом а =1,995805. Во второй строке данного столбца, обозначенной как Time (независимая переменная – порядковый номер месяца), сгенерирован коэффициент уравнения регрессии, который в формуле (6) представлен символом b =0,162166. Таким образом, данные, представленные в столбце Коэффициенты, дают нам возможность составить – путем подстановки соответствующих цифр в формулу (2.2) – следующее уравнение линейной парной регрессии: y = 0,1622x + 1,9958; где независимая переменная x означает порядковый номер месяца (июнь 1992 г. =1, а апрель 2010 г. = 215), а зависимая переменная y – ежемесячное значение курса доллара. При этом экономическая интерпретация данного линейного уравнения следующая: в период с июня 1992 по апрель 2010 г. курс доллара к рублю ежемесячно рос со средней скоростью 16,22 коп. при исходном уровне временного ряда в размере одного рубля и 99,58 коп. В свою очередь, геометрическая интерпретация данного линейного уравнения следующая: свободный член уравнения =1,9958 показывает точку пересечения линии тренда с осью Y, а коэффициент уравнения 0,1622x равен углу наклона линии тренда к оси X. Таблица 2.4. Коэффициенты уравнения регрессии и их статистическая значимость [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _33.jpg] 2. В столбце СТАНДАРТНАЯ ОШИБКА сгенерированы стандартные ошибки свободного члена и коэффициента регрессии, значения которых даны в предыдущем столбце табл. 4. При этом стандартная ошибка свободного члена уравнения регрессии находится по формуле (2.16): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _34.jpg] где MS ост.= D ост. – остаточная дисперсия на одну степень свободы. Для нашего случая стандартная ошибка свободного члена уравнения регрессии вычисляется следующим образом: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _35.jpg] В свою очередь, стандартная ошибка коэффициента регрессии оценивается по формуле (2.17): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _36.jpg] Для нашего случая стандартная ошибка коэффициента регрессии рассчитывается таким образом: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _37.jpg] 3. В столбце t-СТАТИСТИКА даны расчетные значения t-критерия. При этом для свободного члена t-статистика вычисляется по формуле (2.18): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _38.jpg] где a – коэффициент свободного члена уравнения. В нашем случае t-статистика находится следующим образом: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _39.jpg] Для коэффициента регрессии t-статистика рассчитывается по формуле (2.19): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _40.jpg] где b – коэффициент регрессии В нашем случае t-статистика находится следующим образом: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _41.jpg] 4. В столбце Р-ЗНАЧЕНИЕ сгенерированы уровни значимости, соответствующие вычисленным в предыдущем столбце значениям t-статистики. В Excel Р-значение находится с помощью следующей функции: СТЬЮДРАСП (Х=tст.;df=n-k-1;хвосты=2); где в опции Х дается t-статистика, для которой нужно вычислить двустороннее распределение; в опции df – число степеней свободы; в опции хвосты – цифра 2 для двустороннего распределения. В данном случае для свободного члена уравнения эта функция приобретает следующий вид: СТЬЮДРАСП (2,284573;215-1-1=213;2)= 0,023323 Следовательно, Р-значение коэффициента свободного члена уравнения показывает, что данный коэффициент значим лишь при 5% уровне значимости, но не значим при 1% уровне значимости. Для коэффициента регрессии Р-значение в Excel находится следующим образом: СТЬЮДРАСП (23,12267;215-1-1=213;2)= 5,4E-60=0,0 Следовательно, Р-значение коэффициента регрессии показывает, что данный коэффициент значим не только при 5% уровне значимости, но и при 1% уровне значимости. 5. Столбцы Нижние 95% и Верхние 95% показывают соответственно нижние и верхние интервалы значений коэффициентов при 95 % уровне значимости. Для расчета доверительных интервалов сначала находится критическое значение t-критерия, которое в Excel находится с помощью функции СТЬЮДРАСПОБР (α =0,05 ;df=n-k-1); где в опции α – величина риска, коэффициент регрессии (или свободный член) не окажутся в рамках установленных доверительных интервалов); в опции df – число степеней свободы. Таким образом для 95% уровня надежности t-критерий = СТЬЮДРАСПОБР (α =0,05 ;df=215-1-1)= 1,9712 Далее для свободного члена уравнения находим: Значение столбца Нижние 95%=Коэффициент – Стандартная ошибка* t-критерий=1,995805– (0,873601*1,9712)= 0,273794. Значение столбца ВЕРХНИЕ 95%=Коэффициент + Стандартная ошибка* t-критерий=1,995805 + (0,873601*1,9712)= 3,717815. Для коэффициента регрессии Time находим: Значение столбца Нижние 95%=Коэффициент – Стандартная ошибка* t-критерий=0,162166– (0,007013*1,9712)= 0,148342. Значение столбца ВЕРХНИЕ 95%=Коэффициент + Стандартная ошибка* t-критерий=0,162166+ (0,007013*1,9712)= 0,175991. 6. Столбцы Нижние 99% и Верхние 99% показывают соответственно нижние и верхние интервалы значений коэффициентов при 99 % уровне значимости. При этом значения столбца Нижние 99% и Верхние 99% находятся аналогичным образом, как и значения столбцов Нижние 95% и Верхние 95%. Единственное отличие, это расчет t-критерия для 99% уровня надежности. При этом t-критерий = СТЬЮДРАСПОБР (α =0,01 ;df=215-1-1)= 3,3368. Найденный t-критерий используют при нахождении 99% доверительных интервалов для свободного члена и коэффициента регрессии. Правда, с коэффициентом свободного члена у нас возникает довольно серьезная проблема. Дело в том, что при 99% уровне надежности у коэффициента свободного члена при переходе от столбца Нижние 99% к столбцу Верхние 99% происходит смена знака от минуса к плюсу. Вполне очевидно, что в практических расчетах столь неоднозначно изменяющийся коэффициент уравнения (он может быть как положительным, так и отрицательным, также равным 0) невозможно использовать. Поэтому для 99 % уровня надежности коэффициент свободного члена уравнения считается статистически незначимым, в то время как для 95 % уровня надежности данный коэффициент считается статистически значимым, поскольку в последнем случае при переходе от столбца Нижние 95% к столбцу Верхние 95% смена знака происходит от минуса к плюсу Алгоритм действий № 4 «Оценка статистической значимости уравнения регрессии и его коэффициентов» Суммируя вышесказанное, приведем краткий алгоритм принятия решения о статистической значимости уравнения регрессии на основе ВЫВОДА ИТОГОВ в Excel. Шаг 1. Принятие решения о значимости уравнения регрессии 1.1 Чем ближе R-квадрат к 1, тем лучше, что дает отличный критерий для выбора одного из нескольких уравнений регрессии. Значимость F должна быть меньше 0,05 – при 95% уровне надежности; при 99% должна быть меньше 0,01 ‑ при 99% уровне надежности уровне. Шаг 2. Принятие решения о значимости коэффициентов уравнения регрессии P-Значение должно быть меньше 0,05 – при 95% уровне надежности; при 99% P-Значение должно быть меньше 0,01 ‑ при 99% уровне надежности уровне. Коэффициенты регрессии и свободного члена при переходе от столбца Нижние и Верхние (при заданном уровне надежности) не должны менять свой знак. Если смена знака происходит, то коэффициенты данного уравнения признаются статистически незначимыми. Исходя из этого краткого алгоритма, мы отметили жирным шрифтом в ВЫВОДЕ ИТОГОВ (см. табл. 2.5) именно те пункты, на которые следует обратить внимание. При этом те пункты, которые не являются статистически значимыми при данном уровне надежности, мы не только выделили жирным шрифтом, но еще и подчеркнули. Таблица 2.5. ВЫВОД ИТОГОВ и принятие решения о статистической значимости уравнения регрессии и значимости его коэффициентов [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _42.jpg] Таким образом, взяв за основу данные из таблицы 2.5 и действуя по алгоритму № 4, мы дадим ответы на все четыре пункта последнего: 1.1. Поскольку коэффициент детерминации R2 для данного уравнения регрессии оказался равен 0,71511, то отсюда можно сделать вывод, что оно в 71,51% случаях в состоянии объяснить ежемесячные колебания курса доллара. 1.2. Значимость F равна 5,4E-60 или =0, а, следовательно, уравнение регрессии статистически значимо как при 95% уровне надежности, так и при 99% уровне надежности. 2.1. P-Значение для коэффициента свободного члена уравнения равно 0,023323, а следовательно этот коэффициент статистически значим лишь при 95% уровне надежности, но не значим при 99% уровне надежности, поскольку он больше 0,01. P-Значение для коэффициента регрессии равно 0, а, следовательно, этот коэффициент статистически значим как при 95% уровне надежности, так и при 99% уровне надежности . 2.2. Коэффициент свободного члена (константа) уравнения при переходе от столбца Нижние 99,0% к столбцу Верхние 99,0% меняет знак с минуса на плюс, а потому статистически не значим при 99% уровне надежности. При 95% уровне надежности смены знаков не происходит, а потому свободный член уравнения при данном уровне надежности статистически значим. Коэффициент регрессии статистически значим как при 95%, так и при 99% уровне надежности, поскольку и в том и другом случае смены знака у данного коэффициента не происходит. Следовательно, на основании таблицы 5 можно сделать вывод, что в целом уравнение регрессии и все его коэффициенты статистически значимы при 95% уровне надежности. Как мы уже говорили ранее, уравнение регрессии – в отличие от обычных уравнений, оценивающих функциональную, то есть жестко детерминированную связь между переменными – дает прогноз зависимой переменной с учетом воздействия случайного фактора. Поэтому фактические значения результативного признака практически всегда отличаются от его расчетных (теоретических) значений. При этом случайная компонента (остаток) находится следующим образом. Сначала находится прогнозируемый курс доллара, например, на апрель 2010 г. С учетом того, что порядковый номер апреля 2010 равен 215 (при июне 1992 г. =1), предсказываемый на этот месяц курс доллара может быть найден следующим образом: Y расч.=0,1622*215++ 1,9958=36,8616 e = Y факт. – Y расч.= -7,573 Следовательно, прогноз, сделанный по данному уравнению регрессии, в апреле 2010 г. оказался выше фактического курса доллара на 7 руб. 57,3 коп. Вполне очевидно, что это слишком большая величина отклонения, чтобы данное уравнение регрессии можно было бы использовать для прогноза валютного курса. В свою очередь, чем ближе теоретические значения подходят к фактическим данным, тем лучше качество прогностической модели. Поскольку разница между фактическим и предсказываемым значением курса доллара (yфакт. – yрасч.) может быть как величиной положительной, так и отрицательной, то ошибка аппроксимации (подгонки модели к фактическим данным) следует определять как в абсолютных цифрах по модулю, так и в процентах модулю. При этом среднюю абсолютную ошибку по модулю находят по формуле (2.20): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _43.jpg] Для нашего уравнения регрессии средняя абсолютная ошибка по модулю по данной формуле была рассчитана таким образом: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _44.jpg] Иначе говоря, прогноз по данной статистической модели в среднем по каждому наблюдению отклонялся от фактического значения курса доллара на 5 руб. 62,3 коп. по модулю. Среднюю относительную ошибку по модулю в процентах вычисляют по формуле (2.21): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _45.jpg] При этом средняя относительная ошибка по модулю в процентах находится в нашем случае таким образом: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _46.jpg] Следовательно, прогноз по данной статистической модели в среднем по каждому наблюдению отклонялся от фактического значения курса доллара на 38,98 %. В то время как о хорошем качестве уравнения регрессии можно говорить лишь в том случае, если средняя относительная ошибка по модулю составит не более 5-7%. (См. учебник «Эконометрика» под ред. И.И. Елисеевой. ‑ 2-е изд., пер. и доп. ‑ М,: Финансы и статистика, 2006, стр. 107). Для того чтобы окончательно убедиться в непригодности для прогноза данного уравнения регрессии, построим таблицу 2.6, в которой дадим прогнозы и фактический курс доллара за период с января 2009 г. по апрель 2010 г. Таблица 2.6. Прогноз, фактический курс доллара и остатки с января 2009 г. по апрель 2010 г. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _47.jpg] Судя по табл. 2.6, с января 2009 г. по апрелю 2010 г. отклонения от прогноза (остатки), сделанного по уравнению регрессии Y расч.=0,1622*215++ 1,9958, колебались в диапазоне от 98,5 коп. до 7 руб. 57,3 коп., что свидетельствует о невысокой точности данной прогностической модели. Более того, если построить график остатков по линейной прогностической модели, то легко обнаружить, что на нем наблюдается несколько локальных трендов (см. рис. 2.2). А это признак – как мы об этом уже говорили – нестационарности полученных остатков. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _48.jpg] Рис. 2.2. Нестационарность остатков, полученных в линейной статистической модели Источник: по данным Банка России 2.3. Решение уравнений регрессии в Excel графическим способом Попробуем повысить точность нашего прогноза, используя алгоритм действий № 1 «Как строить диаграммы в Microsoft Excel». С этой целью обведем с помощью мышки столбец с ежемесячными данными (на конец месяца) по курсу пары рубль – доллар за период с июня 1992 г. по апрель 2010 г. и столбец с соответствующими обозначениями месяцев. Выбрав опцию График, строим соответствующую диаграмму, а затем щелкаем с помощью мышки по линии графика и выбираем в появившемся окне опцию ДОБАВИТЬ ЛИНИЮ ТРЕНДА (см. рис. 2.3). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _49.jpg] Рис. 2.3. Построение линии тренда на основе графика динамики курса доллара Далее появляется мини-окно ФОРМАТ ЛИНИИ ТРЕНДА, в котором мы можем выбрать соответствующие ПАРАМЕТРЫ ЛИНИИ ТРЕНДА (рис. 2.3), необходимые для построения прогностических моделей. При этом воспользуемся всеми имеющимися в Excel форматами тренда за одним единственным исключением: из полиномиальных трендов возьмем тренды не выше третьей степени. В научной литературе обычно не рекомендуют использовать для аппроксимации фактических данных более сложные полиномы, поскольку они плохо поддаются интерпретации и ‑ несмотря на высокий коэффициент детерминации (по включенной в статистическую модель базе данных) ‑ обладают низкой прогностической ценностью. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _50.jpg] Рис. 2.4. Определение характера и параметров линии тренда Сначала построим самый простой линейный тренд. С этой целью выберем в мини-окне ФОРМАТ ЛИНИИ ТРЕНДА в опции ПАРАМЕТРЫ ЛИНИИ ТРЕНДА формат тренда ‑ ЛИНЕЙНАЯ. При этом поставим галочку в опциях ПОКАЗЫВАТЬ УРАВНЕНИЕ НА ДИАГРАМММЕ, ПОМЕСТИТЬ НА ДИАГРАММУ ВЕЛИЧИНУ ДОСТОВЕРНОСТИ АППРОКСИМАЦИИ (R^2). В результате получим диаграмму на рис. 2.5, показывающую линейный тренд, то есть линейную зависимость роста курса доллара от времени (от порядкового номера месяца, при июне 1992 год =1). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _51.jpg] Рис. 2.5. Ежемесячный курс доллара и его тренд: по оси абсцисс вместо названий месяцев даны их порядковые номера (июнь 1992 г. =1, июль 1992 г. =2 … апрель 2010 г. =215) Поочередно, задавая различные параметры тренда и сравнивая коэффициенты детерминации, составим таблицу 2.7, в которой разместим – по мере роста коэффициента детерминации ‑ прогностические модели с различным форматом тренда. Причем, наиболее высокий коэффициент детерминации у нас получился у уравнения регрессии, полученного путем аппроксимации по степенному тренду. В этом случае R² оказался равен 0,919136, то есть данное уравнение регрессии объясняет 91,91 % всех ежемесячных колебаний курса доллара. Соответственно, доля случайной компоненты оказалась равна = 100% -91,91 %=8,09%. Для того чтобы правильно интерпретировать уравнения регрессии, полученные графическим способом, необходимо иметь в виду, что в процессе построения тренда программа Excel автоматически задает в качестве зависимой переменной y – ежемесячный курс доллара, а в качестве независимой х – порядковый номер месяца. Например, экономическая интерпретация уравнения регрессии со степенной функцией y = 0,0443609x1,2807295 следующая: курс доллара в период с июня 1992 г. по апрель 2010 г. ежемесячно рос со средней скоростью 28,07 % при исходном уровне 4,44 коп. Таблица 2.7 «Параметры тренда и величина коэффициента детерминации R2» [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _52.jpg] Как мы уже убедились, графический способ решения уравнения регрессии в программе Excel позволяет довольно существенно экономить время. Однако у этого способа есть и один весьма существенный недостаток, обусловленный тем, что в данном случае не проводится оценка статистической значимости, как в целом уравнения регрессии, так и его коэффициентов. Таким образом, графический способ решения уравнения регрессии целесообразно использовать на этапе предварительного отбора уравнений регрессии, имеющих наиболее высокий коэффициент детерминации. После отбора уравнения регрессии с высоким коэффициентом детерминации, в Excel его нужно решить, используя в Пакете анализа опцию РЕГРЕССИЯ – см. алгоритм действий № 3. Однако решение уравнение регрессии, аппроксимирующего фактические данные степенным трендом, имеет определенную специфику. В отличие от линейного тренда уравнение регрессии решается не относительно имеющихся исходных данных, а по отношению к их логарифмам. Объясняется это тем, что уравнение регрессии со степенным трендом относится по оцениваемым параметрам к нелинейным моделям, но его можно привести к линейному виду. В результате уравнение регрессии для степенного тренда (см. табл. 2.7) приобретет следующий вид (2.22): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _53.jpg] Следует иметь в виду, что приведение нелинейной функции к линейному виду с помощью логарифмирования используется очень часто, хотя это и приводит к некоторым коллизиям. Вот что пишут по этому поводу Е. М. Четыркин и И.Л. Калихман: «Однако такое преобразование приводит к тому, что оценка параметров базируется не на минимизации суммы квадратов отклонений, а на минимизации суммы квадратов отклонений в логарифмах. …Следствием этого является некоторое смещение оценок параметров, получаемых обычным (линейным) МНК». (см. Четыркин Е. М., Калихман И.Л. Вероятность и статистика. – М.: Финансы и статистика, 1982, стр. 255). Далее параметры этого уравнения регрессии находятся согласно формулам (2.1.4) и (2.1.5), либо решаются с помощью соответствующей компьютерной программы. Поэтому прежде чем приступить к выполнению алгоритма действий № 3 «Как решить уравнение регрессии в Excel», нужно взять натуральные логарифмы (логарифмы, основанием которых служит число e= 2,71828), как от независимой переменной х – порядковый номер месяца, так и от зависимой переменной у – курс доллара. В Excel для этих целей можно воспользоваться функцией LN. Далее поступаем в полном соответствии с алгоритмом действий № 3, а данные, полученные после решения уравнения регрессии, занесем в таблицу 2.8. Таблица 2.8. ВЫВОД ИТОГОВ уравнения регрессии, полученного после логарифмирования исходных данных [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _54.jpg] Согласно алгоритму действий № 4 «Оценка статистической значимости уравнения регрессии и его коэффициентов», проведем проверку статистической значимости данного уравнения регрессии. При этом выделим в таблице 2.8 все важнейшие пункты жирным шрифтом. В результате мы пришли к выводу, что у нас получилось статистически значимым как уравнение регрессии, так и его коэффициенты, как при 95% , так и 99% уровнях надежностях. Правда, поскольку данное уравнение регрессии мы решили относительно натуральных логарифмов, взятых от исходных данных, то в результате оно приобрело следующий вид: Ln Y=-3,1154+1,28073 lnX Согласно последнему уравнению регрессии, прогноз курса доллара рассчитывается на основе логарифмов, взятых от исходных данных. Например, прогноз относительно апреля 2010 г. вычисляется следующим образом: Ln Y=-3,1154+1,28073* 5,370638= 3,762939; где 5,370638=ln(215) – натуральному логарифму от порядкового номера апреля 2010 г. =215. Отсюда находим (в Excel потенцирование натуральных логарифмов производится с помощью функции EXP), прогноз курса доллара на апрель 2010 равен: Y=EXP(3,762939)= 43,07482 После проведения соответствующих преобразований, вышеуказанное уравнение регрессии приобретет следующий вид: Y=EXP(-3,1154 + 1,28073 lnX)= 0,044361*X^1,28073 С помощью последнего уравнения регрессии можно делать расчет прогнозов непосредственно от исходных данных, а не от их натуральных логарифмов. В результате прогноз курса на доллара на апрель 2010 г. можно вычислить следующим образом: Y=0,044361*215^1,28073; где 215 – порядковый номер апреля 2010 г. (при июне 1992 г. =1). Несмотря на то, что коэффициент детерминации у степенного уравнения регрессии выше, чем у линейного, однако, например, относительно апреля 2010 г. прогноз по данному уравнению регрессии весьма сильно отклоняется от фактического курса доллара, как впрочем, и во многих других случаях. Судя по таблице 2.9, с января 2009 г. по апреля 2010 г. отклонения от прогноза (остатки), сделанного по уравнению регрессии yрасч.= 0,044361*X^1,28073, колебались в диапазоне от -3,7954 руб. до -13,7862 руб., что свидетельствует о невысокой точности данной прогностической модели. Таблица 2.9. Прогноз по степенному уравнению регрессии, фактический курс доллара и остатки с января 2009 г. по апрель 2010 г. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _55.jpg] При этом средняя абсолютная ошибка прогноза по модулю для степенной статистической модели – см. формулу (2.20) – оказалась равна 5 рублям 92, 4 копейкам. Следовательно, этот показатель у данной модели оказался на 30 коп. выше, чем у линейной модели. В свою очередь, средняя относительная ошибка по модулю в процентах ‑ см. формулу (2.21) – для степенной модели оказалась равна 31,10 процентам, то есть на 7,78 процентных пункта ниже, чем у линейной модели. Более того, если построить график остатков по степенной прогностической модели (см. рис. 2.3), то легко обнаружить, что на нем наблюдается несколько локальных трендов. А это – как мы говорили ранее – наглядно свидетельствует о нестационарности остатков. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _56.jpg] Рис. 2.6. Нестационарность остатков, полученных по степенной прогностической модели Отсюда можно сделать вывод, что не только линейная модель, но и степенная модель, в которой в качестве независимой переменной использовался фактор времени (порядковый номер месяца), оказались непригодны для прогнозирования курса доллара. Все это заставляет нас продолжить поиск адекватной прогностической модели. Контрольные вопросы и задания к главе 2 1. В чем суть метода наименьших квадратов, как этот метод можно представить графически? 2. Перечислите все пункты алгоритма действий, которые необходимо выполнить при решении уравнения регрессии в Microsoft Excel. 3. Какое уравнение регрессии (при прочих равных условиях) точнее: то, которое имеет коэффициент детерминации (R-квадрат)=0,757, либо то, у которого (R-квадрат) равен 0,978. Объясните почему? 4. Скажите, можно ли признать статистически значимым уравнение регрессии в том случае если значимость его F-критерия =009? И если можно, то с каким уровнем надежности? 5. В каком случае делается вывод о статистической значимости коэффициентов уравнения регрессии? Скажите, при каком Р-значении коэффициенты уравнения регрессии являются статистически значимыми с 95% уровнем надежности и с 99% уровнем надежности? 6. Перечислите формат трендов, используемых в Excel при решении уравнений регрессии графическим способом. Чем эти форматы трендов отличаются друг от друга. ГЛАВА 3. УРАВНЕНИЯ АВТОРЕГРЕССИИ И АВТОРЕГРЕССИИ СО СКОЛЬЗЯЩИМ СРЕДНИМ 3.1. Специфика уравнений авторегрессии (AR) В главе 2 мы убедились, что использование фактора времени для прогноза курса доллара не дает достаточно точного результата. Поэтому необходимо найти более подходящую независимую переменную (или переменные). Как известно, согласно теории эффективного рынка, наиболее полную информацию для прогноза будущей стоимости какого-либо финансового актива в момент времени t можно извлечь из его цены в момент времени t-1. Причем, точность прогноза уменьшается по мере того как прогноз делается в моменты времени t-2, t-3 … и т.д. Исходя из этого вполне очевидного постулата, можно прийти к выводу, что наиболее полную информацию о курсе доллара на момент времени t содержит его курс на момент времени t-1. Следовательно, наиболее точный прогноз курса американской валюты можно рассчитать на основе уравнения регрессии, включив в него в качестве независимой переменной курс доллара с лагом t-1. Такого рода уравнения регрессии, в которых значения результативного признака прогнозируются на основе его предыдущих значений, в статистической литературе называют уравнениями авторегрессии. Правда, в отличие от прогностической модели, в которой в качестве независимой переменной используется фактор времени, а потому горизонт для прогноза практически безграничен, прогноз по авторегрессионной модели имеет небольшой временной горизонт для прогноза, равный длине лага. В частности, модель авторегрессии с лагом в один месяц способна давать прогноз с упреждением в один месяц. Помимо относительно небольшого временного горизонта для прогноза, в процессе построения моделей авторегрессии возникают еще одна серьезная проблема. Дело в том, что наличие лаговых значений зависимой переменной в правой части уравнения приводит к нарушению одной из важнейших предпосылок метода наименьших квадратов (МНК) об отсутствии связи между зависимой (результативной) и независимой (факторной) переменной. Математически эта проблема может быть изложена следующим образом – см. формулу (3.1): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _57.jpg] Где: с – свободный член (константа) уравнения, Yt – зависимая (результативная) переменная, Y t-1 – независимая (факторная) переменная с лагом в один месяц, b – соответствующий коэффициент при Y t-1, et – отклонение прогноза от фактического курса доллара (остаток) в текущем месяце t. Таким образом из формулы (3.1) следует, что в уравнении авторегрессии может иметь место: во-первых, зависимость между et и e t-1, то есть может быть нарушена предпосылка МНК об отсутствии автокорреляция в остатках; во-вторых, может появиться зависимость между факторной переменной Y t-1 и остатками et, то есть будет нарушена предпосылка МНК о гомоскедастичности остатков. Наличие автокорреляции в остатках означает определенную связь (корреляцию) между остатками текущих и предыдущих наблюдений. При наличии такой зависимости остатки могут, либо содержат определенную тенденцию, либо какие-то циклические колебания. В этом случае делается вывод, что отклонения от прогноза не носят случайный характер. При наличии автокорреляции в остатках оценки коэффициентов уравнения регрессии нельзя назвать состоятельными и эффективными. Гомоскедастичность остатков означает, что дисперсия остатков Et не изменяется в зависимости от величины факторной переменной Yt-1. Если это не так, то возникает гетероскедастичность остатков, что также ‑ как и в случае автокорреляции в остатках ‑ влияет на состоятельность оценки коэффициентов уравнения регрессии. Для справки заметим, что состоятельными оценками называются такие оценки, чья точность повышается по мере роста объема выборки, объема данных, на основе которых строится уравнение регрессии. В свою очередь, эффективными оценками называются такие оценки, которые имеют наименьшую дисперсию. Несмотря на вышеуказанные опасения, многие авторитетные специалисты полагают, что в случае больших выборок уравнения авторегрессии позволяют получать состоятельные и эффективные оценки. Вот как, например, оценивает авторегрессионные модели профессор статистики Стэнфордского университета Т. Андерсон: «Модель авторегрессии обладает рядом преимуществ по сравнению с моделью скользящего среднего и процессом авторегрессии с остатками в виде скользящего среднего, хотя последние в определенных случаях могут хорошо описывать образование наблюдаемых временных рядов. Оценки коэффициентов процесса авторегрессии легко вычисляются. Статистические процедуры для такого процесса, основывающиеся на теории больших выборок, легко выполнимы, поскольку они соответствуют обычной технике наименьших квадратов. Во многих случаях коэффициенты процесса авторегрессии допускают непосредственную интерпретацию, а линейные функции от запаздывающих переменных могут быть использованы для прогнозирования (см. Т. Андерсон. Статистический анализ временных рядов. Пер. под ред. Ю.К. Беляева. Издательство «Мир», М., 1976 стр. 276). Следует заметить, что в зависимости от того, сколько предыдущих значений временного ряда будет включено в уравнение авторегрессии в качестве лаговых (факторных) переменных, принято различать авторегрессионный процесс разного порядка. Так, в формуле 3.1. представлен авторегрессионный процесс первого порядка, который в англоязычной литературе обычно называется словосочетанием Auto Regressive и кратко обозначается как AR(1). В том случае, когда в авторегрессию первого порядка добавляются лаговые переменные Yt-2 и Yt-3, то его принято обозначать как AR(3), то есть как авторегрессионный процесс третьего порядка. При этом уравнение для AR(3) примет вид (3.2): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _58.jpg] где Y t-1, Y t-2 и Y t-3– независимые (факторные) переменные с лагом в один, два и три месяц; b1,b2 и b3 – соответствующие коэффициенты регрессии при лаговых переменных. 3.2. Специфика уравнений авторегрессии со скользящим средним (ARMA) Помимо авторегрессионных моделей, нам необходимо также познакомиться и с моделями со скользящим средним в остатках, которые в англоязычной литературе обычно называется словосочетанием Moving Average. Полезность моделей со скользящим средним в остатках обусловлена тем, что для стационарного ряда предсказываемую переменную Yt можно представить в виде линейной функции прошлых ошибок (отклонений прогнозов от их фактических значений). Следует иметь в виду, что термин «скользящая средняя» в данном случае не является синонимом скользящей средней, применяемой, например, для сезонного сглаживания уровней динамического ряда. При этом модель со скользящими средними в остатках первого порядка кратко обозначается как МА(1), а ее формула имеет следующий вид: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _59.jpg] Объединение в одной модели авторегрессионного процесса AR и модели со скользящим средним в остатках МА приводит к созданию более экономичной модели с точки зрения количества используемых параметров. Эту объединенную модель в англоязычной литературе кратко называют ARMA. Данная аббревиатура произошла от словосочетания ‑ Auto Regressive ‑ Moving Average, что в переводе означает авторегрессионный процесс со скользящими средними в остатках. Порядок в этой модели в буквенной форме принято обозначать как ARMA(p,q), где p ‑ величина порядка авторегрессионного процесса, а q – величина порядка процесса со скользящим средним в остатках. Например, модель ARMA (2;1) фактически представляет собой комбинацию модели AR (2) с моделью MA(1), то есть в одной модели объединена авторегрессионная модель второго порядка с моделью со скользящим средним в остатках первого порядка. В результате модель ARMA (2;1) приобретает вид (3.4): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _60.jpg] Для того, чтобы объединенная модель ARMA(2;1) была нашим читателям более понятна, ее можно задать в виде двух уравнений. Так, для AR(2) формула будет иметь вид (3.5) [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _61.jpg] В то время как уравнения для MA(1) можно представить так (3.6): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _62.jpg] Следовательно, формулу (3.4) модели ARMA(2; 1) можно получить путем вычитания из левой части формулы (3.5) левой части уравнения (3.6). 3.3. Коррелограмма и идентификация лаговых переменных в уравнениях AR и ARMA При практическом построении модели ARMA(p,q) наиболее трудным является определение параметров p и q, то есть определение оптимального количества лагов. При этом инструментами для нахождения соответствующих лаговых переменных являются автокорреляционная функция и частная автокорреляционная функция, о которых мы расскажем ниже. Программа EViews позволяет довольно быстро найти оптимальные параметры p и q для модели ARMA. Для этого используется коррелограмма зависимости между различными лагами временного ряда с ежемесячными курсами американского доллара к российскому рублю. Алгоритм действий № 5 «Как построить коррелограмму в EViews» Шаг 1. Выбор основных опций для построения коррелограммы С этой целью загрузим в EViews ежемесячные данные по курс доллара (столбец с данными обозначим как USDOLLAR) в соответствии с алгоритмом действий № 2 «Импорт данных и создание рабочего файла в EViews». Далее строим коррелограмму, тем более что в EViews это сделать довольно просто. С этой целью в Workfile (рабочем файле) данной программы открываем файл USDOLLAR. После чего в файле USDOLLAR нам необходимо выбрать опции View/Correlogram, а в появившемся окне (см. рис. 3.1) Correlogram Specification (спецификация коррелограммы) оставить заданные по умолчанию опцию Level (исходный уровень) и опцию LAGS TO INCLUDE (максимальную величину лага, включенного в коррелограмму). В результате у нас получится коррелограмма исходных уровней (фактических значений курса доллара) временного ряда USDOLLAR с величиной лага от 1 до 36. Шаг 2. Дополнительные возможности, которые можно использовать для построения коррелограммы В том случае, если бы мы выбрали, например, опцию 1st difference (разница исходных уровней первого порядка) или 2nd difference (разница исходных уровней второго порядка), то тогда бы была построена коррелограмма не исходных уровней временного ряда, а соответственно, их первых и вторых разностей. Например, исходный уровень для курса доллара по состоянию на апрель 2010 г. был равен 29,2886 рублям. В то время как разница исходных уровней первого порядка на эту же дату оказалась равна -0,0752 рубля (то есть по сравнению с прошлым месяцем курс доллара снизился на 7,52 коп.), а разница исходных уровней второго порядка составила 0,5094 рубля (то есть падение курса доллара по сравнению с предыдущим месяцем уменьшилось на 50,94 коп.). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _63.jpg] Рис. 3.1. Использование опций Level и Lags to include для построения кореллограммы В полученной коррелограмме (см. табл. 3.1) можно увидеть, как меняется коэффициенты автокорреляции (Autocorrelation или АС) и частной автокорреляции (Partial Correlation или РАС) в зависимости от изменения величины лага. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Так, коэффициент автокорреляции уровней первого порядка измеряет корреляционную зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-1, то есть в нашем случае измеряется коэффициент автокорреляции при лаге в один месяц. В свою очередь, коэффициент автокорреляции уровней второго порядка измеряет зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-2, то есть при лаге в два месяца. И так далее, вплоть до коэффициента автокорреляции уровней 36 порядка, измеряющего зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-36, то есть с лагом в 36 месяцев. При этом коэффициент автокорреляции уровней k-ого (то есть первого, второго… тридцать шестого) порядка находится в EViews по формуле (3.7): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _64.jpg] где n – количество наблюдений во временном ряде; k – величина лага; Yt – динамика курса доллара временного ряда t;Y t-k – динамика курса доллара временного ряда t-k; Y – с черточкой сверху средняя для всей выборки. Следует заметить, что коэффициент автокорреляции, рассчитываемый в EViews, несколько отличается от обычно вычисляемого коэффициента автокорреляции. Дело в том, что в EViews с целью упрощения вычислений в качестве Y ‑ взята средняя для всей выборки, в то время как обычно для рядов Y t и Y t – k берутся свои средние. Частной автокорреляционной функцией называют серию частных коэффициентов автокорреляции г, измеряющих связь между текущим лагом временного ряда Y t и предыдущими лагами временного ряда Y t-1 , Y t – 2 …., Y t– k – 1 с устранением влияния других промежуточных временных лагов. Вполне естественно, что при нулевом лаге коэффициент частной корреляции ρ0 = 1, а при лаге k = 1 ρ1 = r 1 , т. е. коэффициент частной корреляции равен коэффициенту автокорреляции. Для лага k больше 1 EViews рекурсивно вычисляет частную автокорреляцию по следующей формуле (3.8): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _65.jpg] где r k – коэффициент автокорреляции для лага k. Этот алгоритм вычисления коэффициента частной корреляции, предложенный Боксом и Дженкинсом в 1976 г., представляет собой аппроксимацию. Чтобы найти его более точную оценку, следует решить следующее уравнение регрессии (3.9), с помощью которого мы найдем коэффициент частной корреляции ρ k для лага k: [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _66.jpg] где е t – остатки. Судя по полученной коррелограмме (см. табл. 3.1), уровень автокорреляции (AC) между исходными уровнями временного ряда USDOLLAR, постоянно убывает, начиная с первого лага. В свою очередь, уровень частной корреляции (PAC) резко снижается уже после первого лага, а после второго лага осциллирующим образом стремится к нулю (то есть колеблется вокруг нуля). Таблица 3.1 «Коррелограмма исходных уровней временного ряда USDOLLAR с величиной лага от 1 до 36» [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _67.jpg] [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _68.jpg] В том случае, когда мы хотим построить модель авторегрессионного процесса AR(p), то для определения оптимального числа p мы должны использовать частную автокорреляционную функцию. При этом следует исходить из следующего критерия: оптимальное число p в уравнении авторегрессии должно быть меньше лага, в котором частная автокорреляционная функция начинает стремиться к нулю. Судя по коррелограмме, помещенной в таблице 3.1, коэффициент частной автокорреляции для лага один месяц (или лага первого порядка) равен 0.990, а для лага два месяца (или лага второго порядка) =-0.250. Однако, для третьего порядка коэффициент частной автокорреляции равен-0,014, причем, начиная с этого лага величина данного коэффициента колеблется вокруг нулевого уровня. Следовательно, можно сделать вывод, что для прогнозирования курса доллара с помощью модели авторегрессии необходимо использовать модель AR(2), которая у нас примет следующий вид (3.10): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _69.jpg] В свою очередь, при идентификации модели ARMA(p,q) в качестве лага p выбирается лаг, после которого начинает убывать частная автокорреляционная функция, а в качестве лага q выбирается лаг, после которого начинает убывать автокорреляционная функция. Исходя из таблицы 3.1, легко прийти к выводу, что коэффициент автокорреляции начинает убывать уже с лага второго порядка. Аналогичный вывод можно сделать и относительно коэффициент частной автокорреляции. Поэтому для прогнозирования курса доллара с помощью модели авторегрессии со скользящими средними в остатках необходимо использовать модель ARMA(1,1), которая у нас примет следующий вид (3.11): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _70.jpg] Две последних столбца в таблице 3.1 показывают соответственно Q-статистику Люнга-Бокса, (Q-Stat) и ее значимость (Prob) для каждого лага. Следует иметь в виду, что Q-статистика для лага k является тестовой статистикой при нулевой гипотезе об отсутствии автокорреляции между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-k. При этом Q-статистика Люнга-Бокса для лага k-го порядка находится по следующей формуле (3.12): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _71.jpg] [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _72.jpg] Следует иметь в виду, что в том случае, когда в таблице 3.1 значимость (Prob) Q-статистики будет больше 0,05, то нулевую гипотезу об отсутствие автокорреляции между уровнями ряда с лагом k-го порядка нельзя считать опровергнутой с 95 % уровнем надежности. Если значимость Q-статистики будет больше 0,01, но меньше 0,05, то нулевую гипотезу об отсутствие автокорреляции между уровнями ряда с лагом k-го порядка нельзя считать опровергнутой с 99 % уровнем надежности. Судя по коррелограмме исходных уровней временного ряда USDOLLAR (см. табл. 3.1), значимость Q-статистики для всех 36 лагов равна нулю, поэтому нулевая гипотеза об отсутствии автокорреляции в остатках отклоняется для всех лагов. 3.4. Решение в Excel уравнения авторегрессии второго порядка AR(2) После того как с помощью соответствующей коррелограммы (см. табл. 3.1) мы пришли к выводу, что для получения оптимального прогноза по курсу доллара следует построить модель авторегрессии второго порядка AR(2), то следующим нашим шагом должно стать нахождение ее параметров. Правда, для этого развернутое уравнение авторегрессии AR(2), представленное в формуле (3.10), необходимо немного упростить. С этой целью из этой формулы следует убрать остатки, которые появятся только после решения данного уравнения. Кроме того, чтобы убрать у коэффициентов факторных переменных подстрочные индексы (цифры) обозначим их различными буквами. В результате формула (3.9) приобретет более удобный для решения вид (3.13): [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _73.jpg] ГдеY t-1 – курс доллара США с лагом в один месяц; Y t-2– курс доллара США с лагом в два месяца; c – свободный член (константа). Мы уже научились решать уравнения регрессии в Excel – см. алгоритм действий № 3 «Как решить уравнение регрессии в Excel». Поэтому используя этот алгоритм, можно получить соответствующее уравнение авторегрессии, которое, как известно, является частным случаем уравнения регрессии и отличается от последнего лишь наличием лаговых факторных переменных. А для загрузки и первичной обработки данных по ежемесячному курсу доллара необходимо воспользоваться первым пунктом алгоритма действий № 1 «Как строить диаграммы в Microsoft Excel» ‑ Шаг 1. Поиск данных, их загрузка и первичная обработка в Excel». Далее создадим в Excel три столбца: во-первых, с зависимой переменной USDOLLAR – ежемесячный курс доллара США; во-вторых, с двумя независимыми переменными USDOLLAR(-1) – курс доллара США с лагом один месяц и USDOLLAR (-2) ‑ курс доллара США с лагом два месяца. При этом загруженная база данных по американской валюте у нас охватывает период с июня 1992 г. по апрель 2010 г. Далее, согласно алгоритму действий № 3 «Как решить уравнение регрессии в Excel», установим в появившемся окне РЕГРЕССИЯ следующие опции (см. рис. 3.2): Входной интервал y ($B$1:$B$214); Входной интервал Х($C$1:$D$214); Уровень надежности (99); выходной интервал ($L$2). [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _74.jpg] Рис. 3.2. Установка опций в окне РЕГРЕССИЯ В результате решения в Excel уравнения авторегрессии AR(2) со свободным членом мы получим следующий вывод итогов, представленный в виде таблицы 3.2. Возьмем из данной таблицы значения коэффициентов (см. столбец «Коэффициенты») и, подставив их в формулу (3.13), получим следующее уравнение авторегрессии (с округлением): USDOLLAR = 0,2260+1,2980 USDOLLAR(-1) -0,3047 USDOLLAR(-2) Где USDOLLAR ‑ зависимая переменная курс доллара США; USDOLLAR(-1) ‑ независимая переменная курс доллара США с лагом один месяц; USDOLLAR(-2) ‑ независимая переменную курс доллара США с лагом в два месяца; 0,2260 ‑ свободный член (константа). При этом экономическая интерпретация данного уравнения авторегрессии второго порядка следующая: во-первых, в период с июня 1992 по апрель 2010 г. при исходном уровне 0,2260 руб. рост на один рубль курса доллара в текущем месяце приводил к повышению прогнозируемого курса доллара в будущем месяце в среднем на 1,2980 руб.; во-вторых, одновременно с этим рост курса доллара в прошлом месяце приводил к снижению прогнозируемого кура доллара в будущем месяце в среднем на 0,3047 руб. Действуя согласно алгоритму действий № 4 «Оценка статистической значимости уравнения регрессии и его коэффициентов», мы можем сделать следующие выводы. 1.1. Поскольку коэффициент детерминации R2для данного уравнения регрессии оказался равен 0,9977, то отсюда можно сделать вывод, что оно в 99,77% случаях в состоянии объяснить ежемесячные колебания курса доллара. 1.2. Значимость F равна 1,3E-245или =0, а, следовательно, уравнение регрессии статистически значимо как при 95% уровне надежности, так и при 99% уровне надежности. 2.1. P-Значение для коэффициента свободного члена уравнения равно 0,037226, а следовательно этот коэффициент статистически значим лишь при 95% уровне надежности, но не значим при 99% уровне надежности, поскольку он больше 0,01. P-Значение для двух коэффициентов регрессии равно 0, а, следовательно, эти коэффициенты статистически значимы как при 95% уровне надежности, так и при 99% уровне надежности. Таблица 3.2 «Вывод итогов в Excel для уравнения авторегрессии второго порядка AR(2)» [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _75.jpg] 3.5. Решения в EViews уравнения авторегрессии второго порядка AR(2) Однако вышеуказанное уравнение авторегрессии второго порядка с константой можно решить не только в Excel, но и в EViews. Более того, решение данного уравнения регрессии в EViews имеет ряд преимуществ, обусловленных спецификой данной программы. Во-первых, в EViews можно быстрее оценить прогностическую точность полученной статистической модели; во-вторых, есть возможность протестировать полученные остатки на стационарность, наличие автокорреляции, а также провести ряд других важных тестов, о которых мы расскажем позднее. Тем читателям, которым еще не приходилось решать уравнения регрессии в EViews, советуем внимательно познакомиться с алгоритмом действий № 5 «Как решить уравнение регрессии в EViews» Алгоритм действий № 6 «Как решить уравнение регрессии в EViews» Шаг 1. Импорт данных из Excel и создание рабочего файла в EViews Для импорта ежемесячных данных по курсу доллара (на конец месяца) за период с июня 1992 г. по апрель 2010 г. из Excel в EViews необходимо воспользоваться алгоритмом действий № 2 «Импорт данных и создание рабочего файла в EViews». При этом столбец с соответствующими данными по курсу доллара мы обозначили как USDOLLAR. Шаг 2. Выбор опций в EViews для решения уравнения регрессии. После импорта данных в Excel выбираем в командной строке EViews опции Object/New OBJECT, а затем в появившемся окне new OBJECT(новый объект) выбираем опцию EQUATION(уравнение) ‑ см. рис. 3.3. [Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - _76.jpg] Рис. 3.3. Опция EQUATION в окне New OBJECT программы EViews Далее в EViews появляется новое окно ‑ EQUATION ESTIMATION(ОЦЕНКА УРАВНЕНИЯ), которое мы должны заполнить следующим образом (см. рис. 3.4.). Конец ознакомительного фрагмента. Текст предоставлен ООО «ЛитРес». Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес. Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом. Читайте больше книг на сайте онлайн-библиотеки mir-knigi.org