А должен ли быть Гаусс

SimonovIV

Не знаю сюда или в стади...
На работе с коллегами обсуждали всем известную статью про результаты выборов: http://www.livejournal.ru/themes/id/41601
Сошлись на мнении, что по первому графику нельзя сказать со стопроцентной уверенностью, что были массовые фальсификации. Точнее чего-то прям некорректного там нет, т.к. по оси Y отложен процент проголосовавших за партию, от общего числа зарегистрированных на участке избирателей. Т.е. сумма по всем партиям должна показывать процент явки. Т.е. с увеличением явки сумма по всем партиям должна увеличиваться и при 100%-ой явке, сумма по Y должна быть 100%. Т.е. как минимум у одной партии график должен расти.
По хорошему рост должен быть у всех партий тем круче, чем популярнее партия. Но если учесть что голосование было протестным, то можно предположить что все протестно настроенные граждане проголосовали в числе первых 30-40%. И тогда остаются те кому пофиг или за ЕР, т.к. их электорат менее активен. Следовательно с повышением явки наибольший рост должен быть у ЕР, что мы и видим на графике.
После этого решили рассмотреть второй график, но не сошлись во мнениях должен ли быть там Гаусс.
Собственно вот, давайте обсудим Гаусса, должно ли быть распределение нормальным? Так же приветствуются комментарии по первому графику и нашим рассуждениям.

Dizell77

вот разложили по полочкам:
http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml

asora

но не сошлись во мнениях должен ли быть там Гаусс
Должен ли он там быть проверяется эмпирически. И он есть у всех партий кроме едра, у которого совсем непохожая хрень, полученная из-за фальсификаций.

Rastreador

Нет, конечно, там не должен быть Гаусс. И даже не должен быть Пуассон.
Но можно приблизить если очень хочется.

Rastreador

Ответа на вопрос топик стартера там нет. Так что не всё разложили.

SimonovIV


Гауссово распределение типично для многих величин, которые зависят от множества случайных независимых факторов (как в нашем случае количество выпавших орлов зависит от результатов бросания монетки в ходе эксперимента).
К числу таких величин относятся в том числе и явка избирателей, и доля голосов, поданных за конкретную партию, если каждый избиратель принимает решение об участии в выборах и голосовании самостоятельно и независимо.
Читать полностью: http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml
А с чего мы взял и уровняли всех избирателей. У каких-то партий электорат более активен, у каких-то менее? Напоминаю голосование было протестным.
PS
Просьба трезво все взвесить, данный вопрос в меньшей степени политический, в большей - научный ;)

Rastreador


И он есть у всех партий кроме едра
Это совершенно очевидно не так. Кто не верит может отфитировать распределение для любой партии и поглядеть нормированный хи-квадрат.

asora

У каких-то партий электорат более активен, у каких-то менее
Да, и при этом у все партий кроме едра по факту распределение похоже на нормальное.

SimonovIV


Должен ли он там быть проверяется эмпирически. И он есть у всех партий кроме едра, у которого совсем непохожая хрень, полученная из-за фальсификаций.
Напоминаю электорат сильно различается. У КПРФ, СР и Яблока очень активный (протестный) и по этому распределение получились узкими. У ЕР электорат пассивнее, следовательно распределение должно было получиться широким, причем после пика должно быть плато, примерно это и есть. Правда там еще один пик наблюдается, вот это не вяжется, но насколько по этому пику можно судить о массовости?

sever576

ты провокационные вопросы задаешь
еще договоришься до того, что выборы честными были

Rastreador

А с чего мы взял и уровняли всех избирателей. У каких-то партий электорат более активен, у каких-то менее? Напоминаю голосование было протестным.
Да понятно что ни с чего, но это как бы просто нулевое приближение. Вовсе не факт что оно работает. Кстати, ешё один камень в огород аналитиков, нкто нигде не рисуети не упоминает про ошибки. Какие они? какова доля статистических ошибок, систематических? Вот почему есть микропики на процентах кратных 5 ? Это в пределах статпогрешности или на скока сигма отличается?
Да подобных вопросов дофига и больше.

Rastreador

у яблока-то оно похоже на нормальное ? Ещё раз критерием похожести является величина хи-квадрат. Ты посчитал его чтобы утверждать что распределния "похожи"?

Rastreador


У ЕР электорат пассивнее, следовательно распределение должно было получиться широким, причем после пика должно быть плато, примерно это и есть.
Разверни плз мысль.

asora

У КПРФ, СР и Яблока очень активный (протестный)
Если это и верно, то будь электорат менее активен, графики (http://img.gazeta.ru/files3/510/3922510/9elect8.jpg) сожмутся влево, но не превратятся в неведомую кривулю едра.

vadim_sv74

Конечно, должно быть похоже на нормальное распределение, центральная предельная теорема... Потому что избиратели в своей массе по идее независимо друг от друга должны голосовать.

Rastreador


но не превратятся в неведомую кривулю едра.
она прекрасно похожа на гаусс, если отбросить пик при 10 процентов.

asora

http://img.gazeta.ru/files3/510/3922510/9elect8.jpg
На этот график посмотри. Если считаешь, что синяя линяя похожа на нормальное распределение, то ты упоротый дебил.

Rastreador

а если ты считаешь что остальные кривые похожи на гаусс то упоротый дебил ты.
К тому же я говорил про этот график:
http://www.livejournal.ru/themes/id/41601
Так что держи-ка свои эмоции в узде.

Santiny

читаем внимательно статью
там все написано
и не Гаусс там, а сумма Гауссов

raushan27

Думаю, Гаусс не должен быть . Но тем не менее график свидетельствует о махинациях.

Rastreador


Конечно, должно быть похоже на нормальное распределение, центральная предельная теорема...
Нет, в ЦПТ неявно подразумевается что случайные величины распределены по всей дейсвительной оси. В случае отрезка это не так.

komBAR

и не Гаусс там, а сумма Гауссов
Кстати, что под этим понимается ввиду? Сумма независимых гауссов - снова гаусс, а суммой зависимых можно очень много что получить.
Простите что придираюсь, просто режет глаза.

asora

если ты считаешь что остальные кривые похожи на гаусс
Ясное дело похожи, утупок. Отличает их только кусочек в начале он занмает процентов 5 площади под графиком. А чтобы из едросовского распределения сделать нормальное, нужно удалить процентов 70.

komBAR

Нет, в ЦПТ неявно подразумевается что случайные величины распределены по всей дейсвительной оси. В случае отрезка это не так.
Suddenly I lold. Это ж где там такое подразумевается?
В данном случае отдельная случайная величина - это голосовал ли человек за выбранную партию, значение 0 или 1.

Rastreador


Из-за разных размеров избирательных участков, разной активности и разных предпочтений избирателей на разных участках и т. п. на практике распределение этих показателей является суммой множества Гауссовых распределений с разной шириной и разным положением центральной линии, но разумно ожидать, что его общий характер (симметричная колоколообразная форма) будет по-прежнему сохраняться.
Читать полностью: http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml
Очевидно что это полная охинея. А уж отфитировать любую кривую (не только за ЕР) суммой произвоьного числа гауссов совершенно не составляет никакого труда.

asora

в ЦПТ неявно подразумевается что случайные величины распределены по всей дейсвительной оси
Да ты же просто пиздобол.

komBAR

Очевидно что это полная охинея. А уж отфитировать любую кривую (не только за ЕР) суммой произвоьного числа гауссов совершенно не составляет никакого труда.
И снова замечу для прогулявших матстат, что если распределения на участках независимы между собой (непонятно, с чего бы было не так) и являются гауссовскими, то их сумма (о чудо!) снова гауссовское распределение.

Rastreador


Suddenly I lold. Это ж где там такое подразумевается?
Подумай головой, как может распределение равное в точности нулю вне пределов отрезка приближаться к гауссу в ненулевыми параметрами. Можешь ещэ прочесть матчасть про ЦПТ на полуоси. Что быть ещё более лолдым.

В данном случае отдельная случайная величина - это голосовал ли человек за выбранную партию, значение 0 или 1.
только мы обсуждаем другие распределения.

Rastreador

С тобой ублюдок разговор окончен.

Rastreador

Капитан очевидность намекает для тех кто не умеет читать, что сумма гауссов не есть распредение суммы случайных величин, каждая из которых распределена по Гауссу.

Logon

И снова замечу для прогулявших матстат,
честно скажу, матстат я прогуливал, по нему у меня вымученная тройка, да и подозреваю, что на геофаке он был несколько иным, чем о котором идет речь - но имхо, в словах топа есть резон определенный.
ЗЫ. Речь ведь идет о распределении независимых величин, о случайной выборке - а в данном случае (голосование за ЕдРо) это не так. :)

asora

Только не это, товарищ дважды пиздобол.

stm7542793

Капитан очевидность намекает для тех кто не умеет читать, что сумма гауссов не есть распредение суммы случайных величин, каждая из которых распределена по Гауссу.
А ты случайно не путаешь понятия "сумма" и "смесь"?

komBAR

Вы троллите или правда идиот?
Я с трудом понимаю, что имеется в виду в первом предложении, но на всякий случай наводящий вопрос - а нет ли в цпт нормировки? Не вычитаем ли мы из суммы независимых случайных величин суммарное матожидание? Не делим ли мы потом на дисперсию?
Если не понятно, подсказываю дальше: если у нас есть 1000 независимых случайных величин, равных 0 или 1 с вероятностью 1/2, то в случае когда они все оказались равны 0, величина рассматриваемая в цпт, является очень даже отрицательной (несмотря на неотрицательность величин).
Я не знаю, что обсуждаете вы. Иногда складывается впечатление, что вы с сами собой разговариваете. Но если мы смотрим на результаты одной конкретной партии, то нас интересует именно такая случайная величина (а точнее сумма таких величин).

Lene81

Не делим ли мы из суммы независимых случайных величин
Вычитаем?

Logon

Если не понятно, подсказываю дальше: если у нас есть 1000 независимых случайных величин, равных 0 или 1 с вероятностью 1/2, то в случае когда они все оказались равны 0, величина рассматриваемая в цпт, является очень даже отрицательной (несмотря на положительность величин).
Фишка в том, что голосование за ЕдРо не относится к "независимым случайным величинам".
Между остальными шестью партиями народ разрывался, выбирая умом и сердцем, поэтому они к нормальному распределению близки должны быть - а за ЕдРо голосовали по приказу, соответственно случайной величиной этот результат являться не должен

komBAR

Вычитаем?
Да, конечно, спасибо. Исправил. Писать формулы словами - очень непривычно :grin:

asora

а за ЕдРо голосовали по приказу
По приказу могло проголосовать 2-3 миллиона.

Logon

Смотри, вроде как по независимым оценкам, за ЕдРо проголосовали 20-30% населения, где-то больше-где-то меньше.
Вот на твой взгляд, сколько из этих людей проголосовали по зову сердца и совести, а не по давлению сверху (или сбоку)?
Я, к примеру, практически уверен, что распределение голосов за партии должно быть похоже на Гауссовское распределение - за исключением одного случая, случая партии власти, которая активно замещает в сознании себя на "действующую властью", ну и плюс, использует административный ресурс.
Роту солдат поведут голосовать - будет ли там это гауссовское распределение? Что-то сомневаюсь

KazantesDmitry

Отложим на время распределение. Что скажешь про зависимость голосов ЕдРа от явки?
http://users.livejournal.com/_winnie/327011.html

radion93

а если ты считаешь что остальные кривые похожи на гаусс то упоротый дебил ты.
К тому же я говорил про этот график:
http://www.livejournal.ru/themes/id/41601
Так что держи-ка свои эмоции в узде.
Вполне себе хорошие пики. У ЕдРа многогорбое чудовище (вбросы). У яблока сильно задран левый край (тупо передавали голоса яблока едру). Остальные похожи.

asora

Роту солдат поведут голосовать - будет ли там это гауссовское распределение
Не будет конечно. Я поэтому и дал с запасом оценку 2-3 млн людей, кого реально заставили. Но если вычесть этих 3 млн, распределение не станет похожим на нормальное. Чтобы стало, нужно вычитать 15 млн.

SimonovIV


Отложим на время распределение. Что скажешь про зависимость голосов ЕдРа от явки?
http://users.livejournal.com/_winnie/327011.html
а что там по осям?
UPD
по X - явка это ясно,
вопрос по Y - это процент от проголосовавших или от зарегистрированных на участке?
в случае если от проголосовавших, то такое возможно, в случае если от зарегистрированных, то косяк, т.к. в этом случае спада быть не должно.

SimonovIV


В ответ на:
У ЕР электорат пассивнее, следовательно распределение должно было получиться широким, причем после пика должно быть плато, примерно это и есть.
-------------------------------------------------Разверни плз мысль.
Блин, что-то сам запутался пока формулировал.. Наверно спать пора.. Завтра с утра еще раз попробую для себя сформулировать. И потом сюда скину.
PS
Я не хочу сказать, что нарушений не было. Они были, я в этом не сомневаюсь. Вот только хочу понять насколько корректно доказывать их этими графиками или стоит попробовать построить какие-то другие зависимости. Которые более явно смогут объяснить происходящее. Т.ч. не надо меня записывать в "СурковскуюПропаганду". Просто, по-моему, тема довольно интересная, да и вброс говна на вентилятор неплохой получился.

BSCurt

Вот только хочу понять насколько корректно доказывать их этими графиками или стоит попробовать построить какие-то другие зависимости.
Бритва Оккама поможет тебе.
Ещё один "удивительный феномен" (не)вероятностного распределения ЕР, это пики на процентах голосов кратных 5 и больше 50%.

griz_a

Всем неудовлетворительно, все свободны.
Sotrudnik идет читать что такое ЦПТ, для начала пусть погуглит словосочетание "ЦПТ для схемы Бернулли". Gazeta.ru просто идет на курсы статистики и теорвера для чайников.
На деле прямо строго обосновать сходимость к нормальному распределению тяжеловато, ибо модель однозначно не вырисовывается.
Простое грубое объяснение, обосновывающее гауссовость, таково. Каждый округ состоит из участков, где все примерно независимо и одинаково распределено. Округи между собой независимы, на каждом получаем нормальность, сумма независимых нормальных нормальна.
Независимость и одинаковая распределенность участков внутри округа - предположение сильное, ослабим его до m-зависимости (зависимость внутри округа у каждого участка фактически идет с несколькими ближайшими а одинаковую распределенность вообще уберем. И воспользуемся теоремой типа

Тут, конечно, останется вопрос хватит ли нам скорости сходимости, но величины у нас не так уж сильно отличаются друг от друга по разным участкам, так что вроде третий момент ограничен достаточно сильно в масштабах объема общей выборки.
Можно придираться, можно говорить, что грубовато, но я не очень понимаю, зачем вам нужно строгое обоснование, если даже графического материала хватает, чтобы убедить в подтасовке любого, кто вообще способен в ней убедиться.

TOXA

Напоминаю голосование было протестным.
В этом случае доля ЕР должна быть обратно пропорциональна явке ;)

MammonoK

ты провокационные вопросы задаешь
еще договоришься до того, что выборы честными были
зачем ты в этот тред написал? ты нормальное распределение от равномерного не отличишь

Santiny

Кстати, что под этим понимается ввиду? Сумма независимых гауссов - снова гаусс, а суммой зависимых можно очень много что получить.
Простите что придираюсь, просто режет глаза.
лол?
что есть сумма "независимых" Гауссов?
есть конкретные параметры системы/процесса
ими определяется среднее
вокруг него возникает Гаусс
в РФ много региональной/классовой/интеллектуальной специфики
именно она может обеспечивать формирование нескольких Гауссов
сумма таких Гауссов никогда не будет Гауссом, ибо нельзя регионы считать независимыми
какие же основные претензии?
1) на соседних участках параметры отличаются несущественно(ГАУСС!) -> различие в результатах = фальсификация
2) никакая сумма Гауссов не наружает гладкости -> изломы на графиках = фальсификация

Santiny

Каждый округ состоит из участков, где все примерно независимо и одинаково распределено. Округи между собой независимы, на каждом получаем нормальность, сумма независимых нормальных нормальна.
сильное предположение
в нац. республиках "независимо и одинаково распределено"?
а вообще спасибо за корректную формулировку :)

griz_a

Чукча не читатель?
Во-первых, между регионами я не говорил про одинаковую распределенность, я только разбивал всю страну на участки, где все примерно независимо и одинаково распределено. Типа УИК или может район города\края.
Во-вторых, это была первая итерация. Во второй вместо н.о.р. было два предположения:
а) n-зависимость, то есть некоторое небольшое число, много меньше размеров выборки, при котором элементы дальше чем через n независимы. Это вроде логично, потому что зависимость явки на УИК в ФДС слабо связана с явкой на УИК в Алтуфьево и тем более в Чечне, правда?.
б) То, что среди участков нет сильно выбивающихся по третьему моменту. Это вроде тоже логично, потому как просто нет участков, где бы было сильно много народу.
Можно схему улучшать, например, разбить на кластеры примерно одного размера, типа отдельно по деревням посчитать, отдельно по городам, тогда оценка будет солиднее выглядеть. Скорости сходимости я в теореме не указываю, ибо не знаю, есть ли неравенство Берри-Эсеена для такой схемы, но ясно, что она от этого третьего момента зависит, так что чем данные однороднее, тем лучше. Но и так ЦПТшность налицо.

Santiny

результаты испытаний разные
ты все выводишь из того, что каждый сам решает идти или нет
а если есть указание сверху - идти?
например, по всей Чечне?
ты уверен, что количество участков в нац.республиках достаточно мало, чтобы обеспечить сходимость по твоей теореме?
http://www.vybory.izbirkom.ru/region/region/izbirkom?action=...

Galaxy_

На мой взгляд больше похоже на распределение Максвелла (Максвелла - Больцмана).
http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D1%80%...

BSCurt

а если есть указание сверху - идти?
Восемь ошибок в глаголе рисовать, садись, два.

Santiny

это на какое из?
и что в данном случае выполняет роль массы/импульса?
координаты - это партии что ли?

griz_a

Это называется распределение хи-квадрат. Может быть еще на распределение Лапласа похоже и еще много на что, но никак не равномерный вид иметь или бимодальный.

griz_a

ты все выводишь из того, что каждый сам решает идти или нет
а если есть указание сверху - идти?
например, по всей Чечне?

Вовсе нет. Будет дисперсия близкой к 0, что плохого, фактически просто среднее сместится да и всё.
ты уверен, что количество участков в нац.республиках достаточно мало, чтобы обеспечить сходимость по твоей теореме?

Чем больше участков, тем лучше, если только большой неоднородности (очень большого участка) не возникнет.

BSCurt

Ещё картинка

SimonovIV


Блин, что-то сам запутался пока формулировал.. Наверно спать пора.. Завтра с утра еще раз попробую для себя сформулировать. И потом сюда скину.
Вроде сформулировал.
У Яблока, СР и КПРФ электорат намного активнее чем у ЕР. Т.е. независимо от явки на участке все или почти все избиратели Яблока, СР и КПРФ пришли, чего нельзя сказать о ЕР. У них ситуация следующая: чем больше явка, тем больше доля проголосовавших за ЕР.
Если разбить электорат ЕР на 2 группы, более активных и совсем пассивных, то можно сделать вывод, что активные придут точно и нарисуют таки что-то похожее не Гаусса. Далее, если явка на участке большая - это значит что пришла (или их привели) пассивная часть избирателей, вот они и составят плато после пика (второго пика конечно же быть не должно, это явные подтасовки в пользу ЕР).
Основная мысль в том что из-за специфики электората ЕР их поддержка на участках должна зависеть от явки.

SimonovIV

Да, если по Y действительно процент от зарегистрированных избирателей на участке, то падения быть не должно ну никак, значит голоса воровали в пользу ЕР.
Если бы по Y был процент от проголосовавших, тогда ничего удивительного в графике не было бы.

Santiny

вот этого и не понимаю...
как пик вблизи 100% вдруг исчезнет на фоне общей статистики (общее среднее ведь сильно меньше 100%)?
я в упор вижу несколько пиков (т.к. неоднородностей в масштабе РФ достаточно мало и они локализованы)
а ты мне пытаешься объяснить, что на самом деле пиков очень много и они сольются в гауссово распределение... КАК?

filippov2005

значит голоса воровали в пользу ЕР.
Ура, ура. Ты понял, что в субъекте федерации не может быть такого, что за КПРФ, например, проголосовало меньше 0.5% всех-всех-всех избирателей, как в Чечне например.

Santiny

глянул в профиль...
препод ММ может и обосновать применимость приведенной им теоремы более строго...
мне как физику очевидно, что суммарная статистика по нескольким (небольшому числу) разных систем никогда не сойдется в общее распределение...
например, результаты тестов bmv и жигулей... как ни утверждай, что детали у них практически однородны

SimonovIV


Ура, ура. Ты понял, что в субъекте федерации не может быть такого, что за КПРФ, например, проголосовало меньше 0.5% всех-всех-всех избирателей, как в Чечне например.
Да, епрст =)
Я тему поднял не из-за того что считаю, что подтасовок не было. Были они, это очевидно =)
Тему поднял, чтоб обсудить графики которыми это доказывается. Т.е. тема в большей степени научная, в меньшей - политическая =)
Читаем внимательнее, господа ;)

Santiny

Ура, ура. Ты понял, что в субъекте федерации не может быть такого, что за КПРФ, например, проголосовало меньше 0.5% всех-всех-всех избирателей, как в Чечне например.
почему? :confused:
если деды помнят, как их в вагоны - в Казахстан
если достаточно сильные родственные связи
если едро субсидирует нормально

filippov2005

Есть не чеченцы. Есть приезжие.
Всех субсидировать равномерно не получится. Будут недовольные всегда.

SimonovIV


Есть не чеченцы. Есть приезжие.
Всех субсидировать равномерно не получится. Будут недовольные всегда.
а теперь давай всему этому численную оценку ;)

filippov2005

Хм.
Русские 40,6 тыс. чел. (3,7 %)
Может я и не прав.

raushan27

 Вид распределения не важен, в живой природе идеальные математические объекты не встречаются. Имеем статистически значимый факт: на участках, где явка была заметно больше средней доля голосов за Едро была заметно больше средней.
 Можно ли это объяснить чем-то иначе чем тупым вбросом бюлетеней? ИМХО нет. Ни протестное голосование, ни дисциплина избирателей не объясняют этого.

stm7542793

По-моему у тебя в доказательстве есть все-таки один изъян. В теореме берется одно среднее и да, оно имеет нормальное распределение. А в графике используются средние по каждому участку. На каждом участке по приведенной тобой теореме среднее будет иметь нормальное распределение, но параметры у этих нормальных распределений могут на каждом участке быть разными. И если мы возьмем выборку из этих средних, то это будет смесь нормальных распределений с разными параметрами. И эта смесь не всегда будет иметь нормальное распределение.
Например, если предположить что за едро в Москве проголосовало 25%, а в остальной России 50%, распределение будет бимодальным с пиками в районе 25% и 50%.
В принципе под любой график можно подогнать смесь нормальных распределений.
Однако все, что я написал выше подойдет скорее как отмазка. Оно ни фига не объясняет ни пики на 5% отметках, ни то что на соседних УИКах результаты за едро 25% и 75%, ни явную зависимость между явкой и голосами за едро.

griz_a

По тому графику, который в исходном посте был - действительно может быть что угодно.
Но собрать данные под ЦПТ вроде несложно. Разбить данные на блоки, например, случайным образом разбить на 50-100 блоков и по каждому посчитать среднее.

SimonovIV

Форумчане, просьба прокомментировать это. Есть ли тут, по-вашему, какие-то ошибки в рассуждениях?

У Яблока, СР и КПРФ электорат намного активнее чем у ЕР. Т.е. независимо от явки на участке все или почти все избиратели Яблока, СР и КПРФ пришли, чего нельзя сказать о ЕР. У них ситуация следующая: чем больше явка, тем больше доля проголосовавших за ЕР.
Если разбить электорат ЕР на 2 группы, более активных и совсем пассивных, то можно сделать вывод, что активные придут точно и нарисуют таки что-то похожее не Гаусса. Далее, если явка на участке большая - это значит что пришла (или их привели) пассивная часть избирателей, вот они и составят плато после пика (второго пика конечно же быть не должно, это явные подтасовки в пользу ЕР).
Основная мысль в том что из-за специфики электората ЕР их поддержка на участках должна зависеть от явки.

SimonovIV


Вид распределения не важен, в живой природе идеальные математические объекты не встречаются. Имеем статистически значимый факт: на участках, где явка была заметно больше средней доля голосов за Едро была заметно больше средней.
Можно ли это объяснить чем-то иначе чем тупым вбросом бюлетеней? ИМХО нет. Ни протестное голосование, ни дисциплина избирателей не объясняют этого.
А я думаю, что можно объяснить относительно слабой активностью сторонников ЕР и высокой активностью противников ЕР. Что это значит, что график популярности (процент от зарегистрированных избирателей) партий СР, КПРФ и Яблока от явки растет быстро и дальше выходит на некоторое постоянное значение. Аналогичная зависимость для ЕР будет расти медленно, зато на протяжении всей оси X. Т.е. на участках с большой явкой логично обнаружить высокий процент за ЕР. На участках с небольшой и средней явкой ЕР отсасывает у оппозиции.
Разве нет?

rkagan

У Яблока, СР и КПРФ электорат намного активнее чем у ЕР.
собстно, уже изначальная посылка как-то очень сомнительна.

SimonovIV


В ответ на:
У Яблока, СР и КПРФ электорат намного активнее чем у ЕР.
--------------------------------------
собстно, уже изначальная посылка как-то очень сомнительна.
Голосование было по большей части протестным, особенно в Москве, по этому думаю предположение можно считать верным. Хотя, это конечно же предположение.

Santiny

Можно ли это объяснить чем-то иначе чем тупым вбросом бюлетеней? ИМХО нет.
т.е. наличие более дисциплинированных избирателей, голосующих за ЕдРо не объяснение?
а нежелание идти на выборы, если и так все устраивает?
а победа КПРФ в гз - тоже вброс?
ЗЫ тут неглупые люди.. давайте внимательнее относиться к фактам

igor_56

Насчет корреляций не все так однозначно.
Наткнулся на сайт http://www.electoralgeography.com
Там есть статистика (правда не по УИКам, а по ТИКам) 1 го тура президентских выборов 1996 года: http://www.electoralgeography.com/rus/countries/russia/pres-...
Вот какие регрессии там возникают:
Ельцин

Зюганов

Жириновский

Лебедь

Явлинский

filippov2005

Округи между собой независимы, на каждом получаем нормальность, сумма независимых нормальных нормальна.
Можно поподробнее?
Не могу понять, где возникает сумма нормальных величин, когда объединяем результаты по округам.
Когда объединяем результаты по округам, то получаем приблизительно взвешенное среднее плотностей вероятности. Если у округов далеко отстоящие средние, то получим многомодальное распределение.
При этом графики у нормальных партий получаются красивые. Наверное, это говорит о том, что количество округов с распределением сильно отличным от суммарного мало.

BSCurt

Насчет корреляций не все так однозначно.
Возможно, интересно посмотреть было бы количество участков по количеству проценту голосов за кандидата.

philnau

Форумчане, просьба прокомментировать это. Есть ли тут, по-вашему, какие-то ошибки в рассуждениях?
Это гипотетическое рассуждение. Приведу контр-аргументацию.
Почти всем было очевидным, что "победит" ЕдРо. Если бы ведро не победило, то власть пустила бы вход все свои возможности (сейчас видим это в Ю.Осетии, Приднестровье). Поэтому многие забили на выборы. Некоторые партии (Парнас) вообще призывали не ходить на выборы.
Однако. Если бы человека все-таки заставили прийти, то он бы точно проголосовал ПРОТИВ ведра. То есть можно сделать предположение, что чем больше придет людей, тем % за ведро будет НИЖЕ.
P.S. Опять же непонятно, зачем вообще обсасывать эти предположения, когда все видят происходящий вокруг пиздец. Ну разве что дима-медведь & санный дедушка чуров мычат о том, что все зашибись.

stm7542793

А я думаю, что можно объяснить относительно слабой активностью сторонников ЕР и высокой активностью противников ЕР. Что это значит, что график популярности (процент от зарегистрированных избирателей) партий СР, КПРФ и Яблока от явки растет быстро и дальше выходит на некоторое постоянное значение. Аналогичная зависимость для ЕР будет расти медленно, зато на протяжении всей оси X. Т.е. на участках с большой явкой логично обнаружить высокий процент за ЕР. На участках с небольшой и средней явкой ЕР отсасывает у оппозиции.
Разве нет?
Ну как объяснение эффекта в целом это может прокатить. Но там с графиками явка/результаты более сложная картина.
1) Кто-то в одном треде вешал графики с зависимостью голосов от явки (к сожалению не помню точно, если кто найдет выложите сюда). На этих графиках кроме стандартных облаков были еще графики со средним результатом в зависимости от явки. На этих графиках у едра при явки 40-50% результат шел стабильно около 35%, а потом уходил вверх.
2) В статье на gazeta.ru, которую привел здесь , на графике можно отчетливо увидеть 2 облака: одно горизонтальное с явкой 40-60%, другое как раз идущее под углом. (кстати, к вопросу о неоднородности, сложно придумать, по какому признаку разбить участки в Москве на группы, чтобы при честном подсчете могла получиться такая картинка)
Эти эффекты уже не так просто объяснить предложенной тобой моделью.

vovkak

Там не должен быть классический симметричный гаусс, т.к. население неоднородно.
Поэтому о фальсификациях свидетельтствует не он, а наличие локальных экстремумов:
1) пики
2) зоны концентрации - сумма нескольких явно выраженных гауссов в рамках однородных регионов.
http://www.facebook.com/notes/ilya-fedorkov/%D0%B7%D0%B0%D0%...

demiurg

Там ещё двумерные гистограммы кто-то строил. Много вообще свидетельств.
Поймите одну вещь: выборы эот не математическя теорема и 100% доказательств быть не может в принципе. И в суде никто не должен предоставлять 100% доказательства.
А так да, не пошёл солдат голосовать и его голос приписали к ЕР или же его погнали голосовать за ЕР — эта статистика не различит. Но честно говоря и я различать не хочу — один хуй это жульничество.
Выборы нужны в первую очередь для легитимизации власти, и поэтому, если народ их результатами недоволен, если считает что они были жульническими, то это значит что они не состоялись, не выполнили сво функцию, и надо новые проводить.

demiurg

В принципе даже если в абстрактной стране были бы кристалльно честные абстрактные выборы, а народ говорит что нечестно и выходит на улицы — надо перевыбирвть. Видимо процесс значит недостаточно прозрачный. Надо делать прозрачнее, чтобы люди могли всё видеть и контролировать.

ozura

Между остальными шестью партиями народ разрывался, выбирая умом и сердцем, поэтому они к нормальному распределению близки должны быть - а за ЕдРо голосовали по приказу, соответственно случайной величиной этот результат являться не должен
Если бы голосовали по приказу, то всё равно должен, а вот если вбрасывали, то нет.

Morian

По-моему не было еще?
http://eruditor.ru/k/?15

komBAR

в одной народ строго любит Партию, в другой — строго ненавидит её. Каждая республика в отдельности даст на графике свой «гаусс», первая — ближе к 100% за Партию, вторая — ближе 0%. И результирующий график будет суммой этих двух гауссов — кривой с двумя горбами. А теперь представьте, что будет, если республик не две, а несколько десятков, и в каждой — своё отношение к Партии? Получите многогорбую размытую кривую.
Еще один прогульщик матстата.

avp1976

Эээ. Чувак дальше шестого класса, похоже, не особо продвинулся.

Morian

Эээ. Чувак дальше шестого класса, похоже, не особо продвинулся.
Ну да про гаусса как-то не очень убедительно :), но про пики на кратных значениях честно говоря достаточно забавно звучит. Или тоже гон по-твоему?

avp1976

Забавно — это ты хорошее слово подобрал. Именно что забавно.
Лично я не особо понял, откуда он это вывел.

demiurg

Пиздец какой :)
Магистр МФТИ: красный диплом. Золотой медалист. Призер всероссийской олимпиады по математике (СЗ). Диплом международного конгресса математиков (ICM-98). ex-сотрудник ИТЭФ.
Равномерное распределение числа бюллетеней, лол. И независимое от него равномерное распределение голосов за единую россию :)

demiurg

Лично я не особо понял, откуда он это вывел.
Из дурацких предположений, причём возможно, ещё и с ошибкой (это проверить можно, но даже и смысла нет).

Morian

Забавно — это ты хорошее слово подобрал. Именно что забавно.
Лично я не особо понял, откуда он это вывел.
Я так понял: взял и построил реальный график с большим разрешением по какому-то набору участков (ну в смысле в предположении о данном распределении). Нет?

avp1976

Я заметил кучу дурацких предположений, но не заметил логического перехода к выводам.

komBAR

Ну на самом деле зря вы вторую часть так сразу гнобить начали. В ней вполне себе есть доля разумного. Понятно, что про равномерные распределения - это бред. Но в любом случае - если рассматривать дроби x/y, где x и y натуральные и как-нибудь разумно распределены, то 1/2 будет получаться гораздо чаще, чем 5/11 или 9/20. Просто потому, что для получения последних двух результатов надо чтоб количество избирателей на участке делилось на 11 и на 20 соответственно.
Ну, еще конечно интересно, правда ли не сглаженный график таков. Вообще странно, неужели никто еще не выкачал все результаты в каком-нибудь приятном формате?

avp1976

Вообще странно, неужели никто еще не выкачал все результаты в каком-нибудь приятном формате?
Выкачали.
Ну, еще конечно интересно, правда ли не сглаженный график таков.
Похож более-менее.

demiurg

Ну типа чем меньше число, тем больше у него кратных в интервале. А 50% это типа 1/2, 2/4, 3/6 и так далее, и таких будет больше чем каких-нить там 47/185. Это если одно равномерно рапределённую дискретную случайную величину разделить на другую.
Но даже и тут может быть ошибка + эффект наверняка спадает сильно с ростом интервала (что похоже на переход в континуум)

komBAR

Собственно, для проверки разумности достаточно построить графики для Y распределенного так же, как реальные размеры участков, и X - суммы Y независимых случайных величин, каждая со значением 0 или 1 с некоторой фиксированной вероятностью. Должен получиться "дискретный Гаусс", надо посмотреть, будут ли у него такие же пики и какой высоты.

komBAR

Выкачали.
А можно ссылку? Поковырялся бы.

avp1976

Ну поищи. Vissi где-то ссылку выкладывал, вроде. Ну и с сайта ЦИК можно в xml скачать как-то.

avp1976

Это всё, конечно, очень здорово, но избирателей на участке в среднем около 1000, и я очень сильно сомневаюсь, что эффект проявится настолько хорошо, насколько этот товарищ предполагает.

komBAR

Это всё, конечно, очень здорово, но избирателей на участке в среднем около 1000, и я очень сильно сомневаюсь, что эффект проявится настолько хорошо, насколько этот товарищ предполагает.
Насколько я понимаю, при равномерном распределении - проявится и при 1000. При адекватном - проверять надо, я написал как, если не лень будет - займусь.

demiurg

О чём я и говорю

Logon

При адекватном - проверять надо
Можно в МГУ провести эксперимент - сделать голосование какое-нибудь подходящее и посмотреть, будет Гаус или нет
Думаю, если в шайбе поставить урну с бюллетенями, то энное количество народу наберется

stm7542793

А почему не вылезло скачка в 87.5%? При сглаживании в 0.5% как на этом графике эта точка ничем не отличается от кратных 5%, а 7/8 более красивая дробь, чем, например, 13/20.

stm7542793

Да кстати, где скачки на 40% и 45%? Из той статьи они обязаны быть.

jurec67

Можно в МГУ провести эксперимент - сделать голосование какое-нибудь подходящее и посмотреть, будет Гаус или нет
Думаю, если в шайбе поставить урну с бюллетенями, то энное количество народу наберется
Зачем еще раз проверять? Во всех странах у всех партий Гаусс, только ер православненько нарушает законы природы
тем более что формально уже объясняли про испытания Бернулли и ЦПТ

Logon

Во всех странах у всех партий Гаусс, только ер православненько нарушает законы природы
Честно говоря, немного голословно - пруф не подкинешь?

demiurg

http://podmoskovnik.livejournal.com/
пролистай вниз немного

demiurg


k=[]
for i in range(0,100000): k.append(sum(round_(rand(2000
k1=array(k)
hist(k1,bins=100)

Logon

пролистай вниз немного
Прикольно, не знал, спасибо.
Тогда другой вопрос - если взять несколько честных выборов на протяжении в какой-то одной стране, регионе - должны ли там кривые совпадать?
Т.е., если посмотреть статистику выборов за последние -дцать лет на каком-нибудь участке, с численностью ну пусть 100 тысяч человек (100 участков будут ли там кривые совпадающие?

Morian

Насколько я понимаю, при равномерном распределении - проявится и при 1000. При адекватном - проверять надо, я написал как, если не лень будет - займусь.
Ну вот чел вроде сам заморочился http://jemmybutton.livejournal.com/1359.html
Но тоже, конечно пока сам не попробуешь, не поймешь.

demiurg

Вот, это хорошая ссылка что ты привёл.
И ещё одна http://kobak.livejournal.com/102646.html

jurec67

это распределение участков по явке, при чем здесь это вообще

Morian

Вот, это хорошая ссылка что ты привёл.
Круто, да... :). Реально к выборам надо мехмат привлекать.

avp1976

Да, я тоже прочитал, действительно интересная.
Огромный 50%-ый пик в самом деле получается из-за округлений, и его можно убрать, добавив шум в 1 голос…
Но пики 65%, 70%, 75%, 80%, 85%, 90% и 95% таким образом не уберутся! :D

demiurg

Реально к выборам надо мехмат привлекать.
Наоборот, артефакты получаются из слишком мелких бинов, не подумали о реальности, излишне математизировав проблему. А способ решения с шумом — "физический".
Правда, podmoskovnik, который это делал первым (ещё в 2007) вроде с физфака.
В любом случае, было видно, что пики слишком широкие, чтобы быть подобным артефактом, а вот пик на 50% (кстати, в 2007 он не был так заметен) был подозрительным сразу из-за ямки перед.

Morian

Странно, что они примеры из других стран никто не приводит, кто этой проблемой с пиками озадачился. Неужели там нет открытых данных на таком уровне. Ну в смысле походу в других странах просто нет таких пиков действительно..

demiurg

Я думаю, в 2007 он делал более крупные бины (недостаточно мелкие для этих артефактов и увидел пики. На выборах между 2007 и 2011 просто не было столько данных, поэтому он тоже не делал мелких бинов на процентых.
Сейчас, возможно, эти пики были не так ярко выражены как в 2007. Тогда, возможно, было больше разнарядок сверху на минимальные проценты как по явке так и по "за ЕР", ну и натянуть до этих разнарядок было легче, т.к. "реальная" (с учётом конечно отсутствия конкуренции и административного ресурса) поддержка была выше.
Сейчас на фотках протоколов я в основном видел перекидывание голосов с других партий на ЕР ровными сотнями (например ЕР 272 КПРФ 302 Яблоко 214 превращается в 672 — 102 — 14 а такое не должно давать пиков на ровных процентах.
Поэтому возможно подмосковник, ожидая этих пиков, уменьшил бин, чтобы посмотреть повнимательнее, и нашёл.
Соответственно, на выборы в других странах никто никогда не смотрит с таким бином, там везде нормальные гауссианы, чо смотреть то.

KazantesDmitry

Раз уж тут копилка анализов выборов, то вот ещё URL:
http://docs.google.com/viewer?a=v&pid=explorer&chro...
Disclaimer: я не особо читал что там внутри.

Lene81

 
чем больше явка избирателей, тем меньше возможностей для приписок имеет Главный Кандидат из-за сужения области определения функции [W’,1]! Тем самым, тактика бойкота выборов идет на пользу Главному Кандидату.
Собственно, это ответ ЗАЧЕМ нужно ходить на выборы

demiurg

 
чем больше явка избирателей, тем меньше возможностей для приписок имеет Главный Кандидат из-за сужения области определения функции [W’,1]! Тем самым, тактика бойкота выборов идет на пользу Главному Кандидату.
Собственно, это ответ ЗАЧЕМ нужно ходить на выборы
Это по его модели, где приписки происходят только вдобавок к настоящим голосам. А у нас не так

demiurg

В общем, чтобы такие пики получились артефактные, надо чтобы было значительное число участков было таким, чтобы бин был меньше чем 1/явка (в человеках).

Lene81

Это по его модели, где приписки происходят только вдобавок к настоящим голосам. А у нас не так
Он также рассмотрел ситуацию отъема голосов от конкурирующих партий. Вообще достаточно интересное исследование, прямо-таки даже очень.

demiurg

Ну он oversells своё распределение Фреше. Это интересный момент, что это "распределение максимальной величины", но тут нужно дальше думать, он сказал "сверху ограничено давлением наблюдателей итд".
Но в прицнипе чо, это просто фитанул чем фитанулось. Модель с ограничением наблюдателями надо ещё строить.
И вот эта фраза, что раз дисперсия у настоящей гауссианы за едро маленькая — то это "очень узкий круг очень сплочённых людей" — вообще хуета какая-то.
Так что на коленке сделано.
Я ещё призадумался по поводу параболы (логарифмированной гауссианы) которая "упирается в 30%", но
то просто означает что таких участков в среднем должно быть меньше 1. Поэтому если вы типа такой встретили, то это скорее всего жульничество.
Оставить комментарий
Имя или ник:
Комментарий: