"Похожесть" двух рядов данных

z731a

Есть два ряда данных (цены на топливо в двух регионах по дням которые судя по графику ведут себя очень похоже и вообще близки по значениям.
Хотелось бы найти какое-нибудь математическое обоснование их похожести: формулу, показывающую что ряды близки, что-то типа "сумма (x - y) / сумма (х^2 + y^2)", и соответствующую теорию.
Загуглить не получилось(

griz_a

Если похожесть - это коррелированность, то гуглить по словам "корреляция временных рядов". А если нет, то тогда надо объяснить как-то более понятно чем
"формулу, показывающую что ряды близки, что-то типа "сумма (x - y) / сумма (х^2 + y^2)", и соответствующую теорию." (это критерий Стьюдента что ли? оО)

z731a

Да, наверное нужно показать не "похожесть", а "близость". Причем относительную - разница между соответствующими значениями рядов намного меньше самих значений.
Корреляция немного не то. Она как раз "похожесть" поведения показывает.
Например, у нас есть два ряда:
sin(pi * n / 10) + 1000
и
cos (pi * n / 10) + 1000
на 100 точках от 1 до 100
Их корреляция равна 0. При этом разница между двумя значениями в каждой точке не больше 0,1% от самих значений, т.е. ряды расположено очень "близко" друг у другу

AGRANIT

Это называется коинтеграция тогда, или существование стационарной разности x - b*y. http://en.wikipedia.org/wiki/Cointegration Применяется в парном трейдинге, например, когда доходности двух активов "ходят вместе".

griz_a

Казалось бы приведенные ряды не очень-то коинтегрированы, разность у них не сильно похожа на стационарную.
Коинтеграция, в частности, не меняет при сдвиге на константу, а вещь, описанная выше, зависит.
Я тогда не очень понимаю, зачем какую-то математику под это подводить, учитывая, что свойство-то совершенно не математическое :)
Вычли, нормировали на корень из суммы квадратов и сказали, что маленькие числа получились. Чтобы подводить "математичность" нужно математическую формализацию самого понятия малости отличия иметь.

z731a

Зачем это нужно - убедить людей, далеких от науки, что с научной точки зрения эти ряды настолько близки, что, например, любой из них можно использовать в финансовых расчетах и выбор на результат расчетов сильно не повлияет. В общем затереть красиво
Коинтеграция тоже не похоже на то, что нужно.
Формула кстати не обязательно такая должна быть. Подойдет такая, например, "среднее (x - y) / (x + y)" или "сумма (x - y)^2 / x^2)". Главное, чтобы показывала, что относительная разность между рядами маленькая.
И не факт, конечно, что что-то подобное существует)

griz_a

Зачем это нужно - убедить людей, далеких от науки, что с научной точки зрения эти ряды настолько близки, что, например, любой из них можно использовать в финансовых расчетах и выбор на результат расчетов сильно не повлияет. В общем затереть красиво

Смотря какие расчеты. Если тренд прогнозируется, то повлияет.
Тебе нужно не близость рядов измерять, а продемонстрировать непрерывность применяемых к ним функционалов по равномерной метрике :D

wawa321

если по одной последовательности что-то можно сказать о второй последовательности, то последовательности коррелированы. вполне адекватной мерой коррелированности является информация Шеннона - сумма парциальных энтропий минус совместная энтропия: H(a)+H(b)-H(ab).

filippov2005

Может быть, хватит одного примера какого-нибудь типового финансового расчета, в котором получаемая погрешность при замене одного ряда на другой получается маленькой. "Этот убедительный пример доказывает..." :)

z731a

Всем спасибо за идеи)

Serg1912

Спасибо.
http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D1%80%D0%B5%... - на русском языке
Оставить комментарий
Имя или ник:
Комментарий: