Подгонка функции вероятности, зависящей от времени

tatushnik77

вот более простое для понимания условие в этой же теме
   Есть 2-мерный вектор, координаты которого принимают случайные значения от 0 до 9. Через равные промежутки времени измеряются координаты этого вектора.
  Какой прогой можно построить ф-ю вероятности, которая должна зависеть от времени?
   например, есть вектор
  t0: (0, 0)
  t1: (0, 0)
  t2: (1, 4)
  t3: (0, 0)
  t4: (6, 7)
  t5: (0, 0)
  t6: (0, 1)
  t7: (3, 0)
  t8: (0, 0)
  t9: (4, 5)
  отсюда видно, что координата x принимает такие значения:
  0 с вероятностью 6/10
  1 с вероятностью 1/10
  3 с вероятностью 1/10
  4 с вероятностью 1/10
  6 с вероятностью 1/10
  а координата y принимает такие значения:
  0 с вероятностью 6/10
  1 с вероятностью 1/10
  4 с вероятностью 1/10
  5 с вероятностью 1/10
  7 с вероятностью 1/10
  каким пакетом и какими функциями делаются такие вещи?
  и еще небольшой непринципиальный вопрос: допустим, в самом начале вектор "понапринимал" много значений (9, 9) (ну прибор неразработался или еще что, а потом прибор сам "прогрелся" затем все начало нормально работать, значения (9, 9) исчезли, но свой вклад в вероятность они еще вносят. Можно ли от них как-нибудь избавиться, кроме как вручную их отсекать? задать время корреляции а лучше — чтобы он сам определял "время корреляции"?
  З.Ы. функция вероятности интересна для предсказания только тех значений вектора, которые будут в момент времени t+1, где t — текущее время.
  З.З.Ы. и еще: если вектор в момент времени t имеет определенные значения, то в момент времени t+1 они должны быть, вообще говоря, другими.

demiurg

) в твоём примере очень маленький sampling. Если это только для примера, то ладно, а если реально так, то это всё глупости. То есть у тебя 100 точек на твоей 2D решётке, так нужно хотя бы, ну не знаю там 1000 реализаций, чтобы какую-никакую плотность построить. Прогой можно любой которая трёхмерные интерполяции может делать, например, matlab.
2) Ну ты же знаешь какая у тебя задача. Если тебя прогрев прибора не интересует и влиять он не должен, то и начинай измерять от "после прогрева".

tatushnik77

Это только для примера. Дело в том, что пример с прибором я привел лишь как пример. В разные моменты времени функция меняется. Например, вектор снеачала "любит" принимать значения, близкие к началу координат, а через какой-то промежуток времени средние, потом опять близкие, и т. д. . Главное, что пока принимает значения, близкие к началу координат, не стоит учитывать срединные, а пока принимает серединные — не стоит учитывать близкие.
Типа того.

sverum

Ты извини, но у тебя каша в голове какая-то. Давай разбираться.
Есть 2-мерный вектор, координаты которого принимают случайные значения от 0 до 9. Через равные промежутки времени измеряются координаты этого вектора.
Для начала неплохо было бы ответить на следующий вопрос: являются ли эти значения реализациями независимых одинаково распределенных случайных величин? (*)
Если это так, то функция распределения каждой из них не зависит от времени и не понятно, чего ты хочешь. Если это не так, то вот это рассуждение неверно:
   например, есть вектор
  t0: (0, 0)
  t1: (0, 0)
  t2: (1, 4)
  t3: (0, 0)
  t4: (6, 7)
  t5: (0, 0)
  t6: (0, 1)
  t7: (3, 0)
  t8: (0, 0)
  t9: (4, 5)
  отсюда видно, что координата x принимает такие значения:
  0 с вероятностью 6/10
  1 с вероятностью 1/10
  3 с вероятностью 1/10
  4 с вероятностью 1/10
  6 с вероятностью 1/10
  а координата y принимает такие значения:
  0 с вероятностью 6/10
  1 с вероятностью 1/10
  4 с вероятностью 1/10
  5 с вероятностью 1/10
  7 с вероятностью 1/10
  каким пакетом и какими функциями делаются такие вещи?
Если ты разберешься с постановкой задачи, то можно сделать хоть в чем, например в Excel. Пакет, который тебе "сам все сделает", ты вряд ли найдешь. Разве что если у тебя задача какая-то типовая.
  и еще небольшой непринципиальный вопрос: допустим, в самом начале вектор "понапринимал" много значений (9, 9) (ну прибор неразработался или еще что, а потом прибор сам "прогрелся" затем все начало нормально работать, значения (9, 9) исчезли, но свой вклад в вероятность они еще вносят. Можно ли от них как-нибудь избавиться, кроме как вручную их отсекать? задать время корреляции а лучше — чтобы он сам определял "время корреляции"?
Для начала нужно определиться с (*) и последующими вопросами.
  З.Ы. функция вероятности интересна для предсказания только тех значений вектора, которые будут в момент времени t+1, где t — текущее время.
Опять же, если ответ на (*) положительный, то это не будет важно.
  З.З.Ы. и еще: если вектор в момент времени t имеет определенные значения, то в момент времени t+1 они должны быть, вообще говоря, другими.
Свидетельствует о зависимости наблюдений.

griz_a

Видимо, марковская цепь у него. Но мб еще до случайного момента ее нужно откинуть. Интересно, до марковского ли момента :)

sverum

Видимо, марковская цепь у него.
Да, похоже на то. А ты случайно не знаешь каких-нибудь тестов на марковость (и есть ли они вообще)?
Но мб еще до случайного момента ее нужно откинуть. Интересно, до марковского ли момента
Это вообще загадочно :cool:

tatushnik77

кстати, да, спасибо, события в момент времени t и t+1 зависимы, а именно:
если
(х1, у1) — вектор в момент времени t+1
(х2, у2) — вектор в момент времени t+2
(х3, у3) — вектор в момент времени t+3 , то
с большой вероятностью ( как показывает опыт и предварительные расчеты)
х2 != х1 и у2 != у1
х3 != х2 и у3 != у2
и с немного бoльшей (но все еще малой) вероятностью
х3 != х1 и у3 != у1
также, судя по наблюдениям, событие x = y наступает также достаточно редко.

sverum

А можно куда-нибудь выложить данные?

sverum

с большой вероятностью
Об этом говорить рано. Нет модели - нет вероятности.

tatushnik77

сейчас еще более просто сформулирую задачку:
допустим, есть число х, которое может принимать значения от 0 до 99. Сначала достаточно часто попадаются числа
3, 66, 8, 17, 97, 54, 38, 66, 38, 97, 97, 17, 54, 38, 66, 8, 54, 8 — промежуток времени [t1, t1+18]
— как видно, этот набор состоит из чисел 3, 66, 8, 17, 97, 54, 38
потом он стал принимать такие значения:
9, 24, 56, 3, 99, 55, 76, 24, 56, 76, 99, 9, 3, 56, 76, 55, 9, 24 — промежуток времени [t2, t2+18]
— здесь видно, этот набор состоит из чисел 9, 24, 56, 3, 99, 55, 76
т. е., величина х сначала принмает один ряд значений, потом — другой. Мы лишь значем, что числа эти могут принимать значения от 0 до 99 и при стремлении опытов к бесконечности частота появления каждого числа стремится к 1/100.
нецелесообразно в промежуток времени [t1, t1+18] искать числа в диапазоне, отлично от 3, 66, 8, 17, 97, 54, 38
также
нецелесообразно в промежуток времени [t2, t2+18] искать числа в диапазоне, отлично от 9, 24, 56, 3, 99, 55, 76
кроме того, в каждый из промежутков [ti, ti+18] времени числа следуют с нестрогой периодичностью периодичностью.

Цель: находить промежутки, в которых величина x принимает одни и те же значения, понимать ( с определенной точностью когда они заканчиваются, вычислять эти самые промежутки. например, есть промежуток [t1, t1+18] : надо вычислить его длину ( мы не знаем, что она 18 надо знать, когда начнется уже другой промежуток, т. е. понять, когда прекращают следовать числа
3, 66, 8, 17, 97, 54, 38 (*)
В смысле — не то, чтобы появилось число 10 и все — крышка, мы обрываем промежуток, а именно понять, после скольки чисел, отличных от (*) промежуток надо оборвать.
а еще — вычислять вероятность, с которой в промежутке [t1, t1+18] появляются те или иные числа. Следует принять во внимание, что числа появляются в этом промежутке с нестрогой периодичностью.
Что посоветуете?

 
Об этом говорить рано. Нет модели - нет вероятности.

  есть опытные наблюдения и предположения.
 
А можно куда-нибудь выложить данные?

  ой, пока не могу

griz_a

Критерии марковости есть конечно, но как видно, тут какая-то совсем странная хрень :confused:

griz_a

Ты забыл сказать что ты хочешь от этой задачи. Прогнозировать что будет дальше?

tatushnik77

спасибо, подправил вверху, допишу и здесь:

Цель: находить промежутки, в которых величина x принимает одни и те же значения, понимать ( с определенной точностью когда они заканчиваются, вычислять эти самые промежутки. например, есть промежуток [t1, t1+18] : надо вычислить его длину ( мы не знаем, что она 18 надо знать, когда начнется уже другой промежуток, т. е. понять, когда прекращают следовать числа
3, 66, 8, 17, 97, 54, 38 (*)
В смысле — не то, чтобы появилось число 10 и все — крышка, мы обрываем промежуток, а именно понять, после скольки чисел, отличных от (*) промежуток надо оборвать.
а еще — вычислять вероятность, с которой в промежутке [t1, t1+18] появляются те или иные числа. Следует принять во внимание, что числа появляются в этом промежутке с нестрогой периодичностью.
Что посоветуете?

griz_a

причем тут вероятность я что-то совсе не понимаю.
по-моему, ты и сам свою задачу не понимаешь

tatushnik77

еще раз подправил

sverum

допустим, есть число х, которое может принимать значения от 0 до 99. Сначала достаточно часто попадаются числа
3, 66, 8, 17, 97, 54, 38, 66, 38, 97, 97, 17, 54, 38, 66, 8, 54, 8 — промежуток времени [t1, t1+18]
— как видно, этот набор состоит из чисел 3, 66, 8, 17, 97, 54, 38
потом он стал принимать такие значения:
9, 24, 56, 3, 99, 55, 76, 24, 56, 76, 99, 9, 3, 56, 76, 55, 9, 24 — промежуток времени [t2, t2+18]
— здесь видно, этот набор состоит из чисел 9, 24, 56, 3, 99, 55, 76
т. е., величина х сначала принмает один ряд значений, потом — другой.
Пример неудачный. Данных маловато. Знаковый тест на случайность считает что перед ним реализации независимых одинаково распределенных случайных величин.
Мы лишь значем, что числа эти могут принимать значения от 0 до 99 и при стремлении опытов к бесконечности частота появления каждого числа стремится к 1/100.
нецелесообразно в промежуток времени [t1, t1+18] искать числа в диапазоне, отлично от 3, 66, 8, 17, 97, 54, 38
также
нецелесообразно в промежуток времени [t2, t2+18] искать числа в диапазоне, отлично от 9, 24, 56, 3, 99, 55, 76
кроме того, в каждый из промежутков [ti, ti+18] времени числа следуют с нестрогой периодичностью периодичностью.
Сформулируй нормально, что у тебя есть.
Что посоветуете?
Найти побольше данных.

griz_a

Боюсь, что это к шаманам. Модель настолье расплывчатая.
Начнем с того, что задача какие числа у тебя появляются в следующий раз - задача о распределении шестимерного случайного вектора.
Чтобы решить ее каким-нибудь методом сколько-то прилично тебе понадобится бешеный размер выборки.
Оставить комментарий
Имя или ник:
Комментарий: