Объяснение закона Бенфорда

lana

не понимаю я этот Закон Бенфорда, объясните плиз, почему он работает?
Он мне нужен в связи со следующей задачкой:
Пусть a и b два действительных числа. Какова вероятность того, что ведущие цифра а/b равна 1. Ведущая цифра в 0.001980 — 1.

pavloff

Помимо всего прочего, надо ещё знать распределение для этих двух чисел, а там уже можно думать. Ну и закон Бенфорда тут скорее всего неприменим.

BSCurt

не понимаю я этот Закон Бенфорда, объясните плиз, почему он работает?
Вариант объяснения
http://vivovoco.rsl.ru/VV/JOURNAL/QUANTUM/ARNOLD/ARN.HTM
Вообще как уже сказали зависит от того откуда берутся числа.

lana

 
Вообще как уже сказали зависит от того откуда берутся числа.

я не знаю, вот задачка, больше ничего не сказано
 
Let a and b are two real numbers. What is the probability that leading digit of a/b is 1. Leading digit in 0.001980 is 1.

BSCurt

Некорректна в такой формулировке задача.

BSCurt

ну разве в пространстве R^2 с координатами (а,b) посмотреть какой угол высекают сектора вида 2b 10^n> a > b 10^n (для а>0, b>0)

griz_a

Если считать, что [math]$a,b$[/math] равномерны на [0,u], то a/b такое же, как для [0,1]. Значит вероятность того, что первая значащая цифра 1, если
\sum_{n=-\infty}^{\infty} P(10^n<a/b<2*10^{n}) = \sum_{n=-\infty}^{\infty} \int_{0}^{1} P(x* 10^n<a<2*x*10^{n}) dx = \int_{0}^{1} x \sum_{n: 10^{n}<1/(2x)} 10^{n} dx + \int_{0}^{1} \sum_{n: 1/(2x)<10^{n}<1/x} dx
Соответственно, можно дальше досчитать.

lana

явно не 1/9 получится в итоге, как это объяснишь?

BSCurt

А почему должна получится 1/9 - как это объяснишь?

lana

ну как бы исходя из того, что 1,2,3,4,5,6,7,8,9 равновероятны как ведущие цифры

blackout

\sum_{n=-\infty}^{\infty} P(10^n<a/b<2*10^{n}) = \sum_{n=-\infty}^{\infty} \int_{0}^{1} P(x* 10^n<a<2*x*10^{n}) dx = \int_{0}^{1} x \sum_{n: 10^{n}<1/(2x)} 10^{n} dx + \int_{0}^{1} \sum_{n: 1/(2x)<10^{n}<1/x} dx
явно не 1/9 получится в итоге
Явно?

BSCurt

Возьми комп да проведи численный эксперимент!

lana

/3 получается, не понимаю ничего :confused:
Если решать как вы говорите, то тоже в районе 1/3 получается.
Чем единица лучше других цифр?

BSCurt

Чем единица лучше других цифр?


красный кусок это уже вклад 1/4 а там ещё и другие будут.

blackout

Кинь монетку 9 раз. Посчитай количество орлов. Получится цифра от 0 до 9. Так как все цифры одинаково хорошие, то вероятность получить 0 будет 1/10. Так ведь?

lana

не считается за ведущую цифру

lana

нафиг ты квадратом ограничил?

BSCurt

нафиг ты квадратом ограничил?
А почему не квадратом? Не важно смысл это верно иллюстрирует.

griz_a

Делим два одинаково устроенных числа друг на друга, число от 1 до 2 получаем раз из 10 по-вашему?

lana

короче у меня получилось
\frac{2}{\pi}\sum_{-\infty}^{+\infty}(arctg(2*10^{-k})-arctg(10^{-k}
я никак не ограничивала, последнюю сумму хз, как посчитать

griz_a

Что значит никак не ограничивала? Какие распределения-то у а, б были?

lana

Я рассматривала случай, когда a,b>0. Нам нужно, чтобы 1≤а/b⋅10^k<2, или 10^{-k}≤а/b<2*10^{-k}. Т.е получаем множество углов в первом квадранте arctg(2*10^{-k})-arctg(10^{-k}). Итоговая вероятность равна \frac{2}{\pi}\sum_{k=-\infty}^{k=+\infty}(arctg(2*10^{-k})-arctg(10^{-k}

iri3955

Так всё равно ответ зависит вероятностной меры, которую ты задаёшь (в данном случае на R+^2).
А если, например, задавать пределом равномерной меры на [0,a]^2 при a -> \infty, то ответ будет другой (выше его написали уже).

stm8853410

Если числа x и y выбираются из отрезка (0,1) или из отрезка (0,100 то их отношение будет иметь и в том, и в другом случае одну и ту же функцию распределения.

iri3955

Если выбираются равномерно, то да.
Но если выбирать равномерно на полярных координатах (как это сделала ТС то распределение будет уже другое и вроде бы даже в этом случае случайные величины a и b перестают быть независимыми (для ограниченного r, для неограниченного, надо ещё аккуратно функцию распределения достроить что наверняка подразумевалось в задаче.

stm8853410

Насколько я понимаю природу закона, величина x (а также и y) имеет плотность распределения p(a) = С/a, где C — нормирующий множитель. Так как интеграл расходится, эта плотность берётся на отрезке [epsilon, N].

iri3955

Это что за закон? И почему именно такое распределение? Зачем искусственно делать особенность в нуле?
Почему не взять нормальное распределение N(0,1) на R? Не придётся придумывать поведение на бесконечности.

stm8853410

Распределения можно брать любые, но исходно спрашивали про закон Бенфорда (ссылка в первом посте). В предыдущем посте я написал, какое распределение рассматривается в этом законе.
Он действует в предположении, что логарифм случайной величины распределён равномерно на большом интервале, а это и значит, что плотность распределения такая, какую я написал.

iri3955

Так уже решили вроде, что к задаче он отношения не имеет. А ответ самой задачи зависит от распределения. И да, нельзя просто взять функцию распределения из какой-то другой задачи, думая, что и так сойдёт.
Нет функции - нет мультиков.

griz_a

Он действует в предположении, что логарифм случайной величины распределён равномерно на большом интервале, а это и значит, что плотность распределения такая, какую я написал.

Если логарифм величины распределен равномерно на большом отрезке, то она практически экспоненциальна:
P(\ln X <x) = P(X<e^{x}) = (e^{x}-a)/(b-a) I_{\ln a < x<\ln b} + I_{x>\ln b}
Плотность, соответственно, e^{x-\ln (b-a)} I_{\ln a< x<\n b}
Если b фиксировано, а a близко к нулю, то это просто -X+\ln b, где X - экспоненциальная.

stm8853410

Погоди. Где я ошибаюсь?
Если логарифм величины равномерно распределён, то вероятность того, что величина находится на [1, 2], такая же, как вероятность того, что она находится на [4, 8].
У тебя получается плотность Ce^x, где C — некоторое число, и всё это на некотором большом отрезке.
Тогда вероятность того, что величина лежит в отрезке [1, 2], равна интегралу этой плотности по [1,2], то есть С(e^2 - e^1).
Вероятность того, что величина лежит в отрезке [4, 8] равна C(e^8 - e^4).
Вторая величина явно больше.

griz_a

Пардон, почему-то решил, что речь о логарифме величины, распределенной равномерно.
Оставить комментарий
Имя или ник:
Комментарий: