Новости, статьи, видео - общественно-политический форум Политбюро.

Вернуться   Новости, статьи, видео - общественно-политический форум Политбюро. > Мир вокруг нас > Россия

Ответ
 
Опции темы
Старый 06.03.2012, 16:28   #1
skroznik
Кот, гуляющий сам по себе
 
Аватар для skroznik
 
Регистрация: 18.02.2010
Адрес: Родом из детства
Сообщений: 9,616
Сказал(а) Фууу!: 1
Сказали Фууу! 4 раз(а) в 4 сообщениях
Сказал(а) спасибо: 349
Поблагодарили 960 раз(а) в 816 сообщениях
skroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордится
Отправить сообщение для skroznik с помощью Skype™
По умолчанию Выборы 2012 (статистика)










Последний раз редактировалось skroznik; 06.03.2012 в 17:42.
skroznik вне форума   Ответить с цитированием
Старый 06.03.2012, 17:17   #2
skroznik
Кот, гуляющий сам по себе
 
Аватар для skroznik
 
Регистрация: 18.02.2010
Адрес: Родом из детства
Сообщений: 9,616
Сказал(а) Фууу!: 1
Сказали Фууу! 4 раз(а) в 4 сообщениях
Сказал(а) спасибо: 349
Поблагодарили 960 раз(а) в 816 сообщениях
skroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордится
Отправить сообщение для skroznik с помощью Skype™
По умолчанию Re: Выборы 2012 (статистика)

Газета Российского научного центра
"Троицкий вариант"

28 февраля 2012 г.
ТрВ № 98, c. 1-3, "Наука и общество"

Борис Овчинников


В преддверии президентских выборов 4 марта мы вновь обращаемся к теме оценки честности результатов. В №№ 94 и 96 ТрВ-Наука [1] рассказывалось о статистических аномалиях в официальных результатах голосования на думских выборах 4 декабря 2011 года, свидетельствующих о значительных фальсификациях. Эти аномалии потому и аномалии, что кроме участков, где были фальсификации, существовали участки, где подсчеты велись честно. Борис Овчинников, заместитель руководителя Аналитической службы Объединения «Яблоко», эксперт Международного института гуманитарно-политических исследований, партнер компании Data Insight, задался вопросом — есть ли какие-то универсальные признаки, которые позволяют с достаточной степенью надежности оценить, были значимые фальсификации в том или ином регионе, городе, районе или нет? Оказывается, такие эффективные индикаторы есть — и в первую очередь это степень равномерности голосования за «Единую Россию» по отдельным участкам в пределах одного города и сравнительная география поддержки «Единой России» и ЛДПР.


402 города. Россия — очень неоднородная страна, и попытки применения того или иного статистического метода сразу ко всем избирательным участкам не всегда продуктивны и даже в какой-то степени рискованны — слишком много факторов, включая разный размер избирательных участков, определяет различия между крупными городами и удаленными деревнями. Исследование, результаты которого представлены здесь, проведено по специально собранному массиву из относительно однородных объектов: я отобрал все города, выделенные в отдельные территориальные избирательные комиссии (или составляющие несколько ТИКов, как в случае с наиболее крупными городами). После применения дополнительных фильтров — исключения из анализа малочисленных, нехарактерных для городских ТИКов участков менее чем с 1000 избирателей на каждом (чаще всего это закрытые участки — больницы, корабли, СИЗО) и исключения из анализа трех десятков особо маленьких городских ТИКов (с количеством «полноценных» участков менее 8 на город) получился массив из 402 городов и 29693 участков, к которым приписано 60,6 млн избирателей. Это 31 % от всех избирательных участков на территории России и 56 % избирателей.

Обычные и необычные отклонения. Стартовая гипотеза заключается в том, что любой город — это относительно однородный объект, где люди из разных микрорайонов регулярно общаются между собой и где на них влияют общие экономические, социальные, инфраструктурные и локально-политические факторы. В этих условиях электоральные предпочтения избирателей не должны сильно отличаться между разными участками одного города. Однако — и это вторая часть гипотезы — естественная равномерность электоральных предпочтений (особенно в части поддержки «Единой России») должна нарушаться в тех городах, в которых результаты голосования на некоторых или на многих участках были искажены существенными фальсификациями.

Степень неоднородности поддержки «Единой России» по отдельным участкам для каждого города можно оценить через среднеквадратичное отклонение (СКО): для каждого участка считается разница между результатом «Единой России» на этом участке и средним результатом по городу, потом эта разница возводится в квадрат (в том числе чтобы эта дельта всегда была положительной), после чего считается сумма квадратов отклонений по всем участкам города и из полученной суммы извлекается квадратный корень.



Распределение всех 402 городов по размеру СКО представлено на рис. 1, и это распределение в целом подтверждает нашу гипотезу. Слева на графике мы видим большую группу городов с небольшим разбросом поддержки «Единой России» (СКО — от 1 до 7 %), притом на графике эти города образуют «колокол» с пиком в районе 3 %, похожий на нормальное (или скорее логарифмическое нормальное) распределение. «Колокол» включает 278 городов (69% от всей выборки), притом большинство — 222 города — попадает в еще более узкий диапазон с СКО (для голосования за «Единую Россию») от 2 до 5 %.

В правой части графика видна хаотичная «гребенка» с разбросом СКО от 7 до 17%, а 6 городов расположены еще правее (СКО от 17 до 26%). На первом месте по величине СКО Магнитогорск, «прославившийся» тем, что все участки в городе четко поделились на две группы — те, где «Единая Россия» получила от 29 до 48 % голосов (101 участок), и те, где она получила не менее 76 % (67 участков). Размер СКО превышает 20 % также и в городах Владимирской области — в самом Владимире и в Коврове, — где эффективный контроль со стороны КПРФ за подсчетом голосов на обычных участках сочетался с результатами «Единой России» свыше 90 % на специально созданных на некоторых предприятиях участках, на каждом из которых непонятно откуда появилось почти по 3000 избирателей. СКО более 17 % также фиксируется в Тюмени, где средний результат «Единой России» по большинству участков составляет только 34 %, но за счет нескольких десятков участков с высокой явкой и результатом ЕР от 55 до 93 % итоговый процент в целом по городу составил 49 %, в Астрахани, о фальсификациях в которой много говорили представители «Справедливой России», и в Туапсе (подробный разбор результатов голосования в Туапсе см. [3]).

Хаотичная лояльность и равномерная оппозиционность. Можно зафиксировать первый вывод — города России достаточно четко делятся на две категории: на города с небольшими различиями между избирательными участками в результатах голосования (в частности, по поддержке «Единой России») и на города с высокой неоднородностью результатов. На следующем шаге мы обнаруживаем, что эти две группы городов отличаются друг от друга не только по степени равномерности голосования за «Единую Россию», но и по среднему (в масштабах города) результату этой партии.



На рис. 2 видно что, в подавляющем большинстве городов с относительно однородным голосованием (СКО не более 7 %) поддержка «Единой России» составляет от 25 до 45 %. Второй вариант, намного менее распространенный,— это, наоборот, однородная очень высокая поддержка «Единой России» — от 72 до 100 %. В то же время равномерная поддержка «партии власти» на уровне 55 — 70 % встречается очень редко (всего 3 города).

Другая группа городов — города с неравномерной поддержкой «Единой России» — не образует явных «скоплений» на графике, и результат «партии власти» здесь варьируется в широком диапазоне — от более чем 30% (только в 3 городах этой группы результат «Единой России» ниже 33%) до более чем 80 %.

Промежуточная классификация: три группы городов. Приведенный график (рис. 2) наглядно показывает три отдельные группы городов, и я затрудняюсь дать этим группам иную интерпретацию, кроме как связанную с уровнем фальсификаций. Характер расположения точек на графике, поименный состав каждой из трех групп и ряд других параметров позволяют утверждать, что повышенный уровень неоднородности голосования в отдельных городах в сочетании с повышенной поддержкой в них «Единой России» носят искусственный характер и определяются фальсификациями.

Соответственно, первая, самая многочисленная группа точек (плотное «облако» внизу слева на рис. 2) — это города, в которых, видимо, фальсификаций не было или они были незначительными. Вторая группа (с СКО более 7 %) — это города, в которых большие различия между отдельными участками определяются тем, что на одних участках были масштабные фальсификации (физический вброс, приписывание голосов или переписывание от других партий), а на других участках их не было.

Наконец, третья, относительно малочисленная группа точек — с СКО менее 7 % и поддержкой «Единой России» более 70 % — это города (преимущественно из национальных республик), в которых фальсификации носили повсеместный и однотипный (в масштабах города) характер, что и обеспечило высокий равномерный результат «партии власти».

Поддержка ЛДПР как проверочный параметр. Между городами с высоким и низким уровнем СКО (для голосования за «Единую Россию») можно проследить множество других различий — для городов с неравномерной поддержкой «Единой России» также характерны неравномерность явки (как суммарной за день, так и промежуточной), сильная корреляция между явкой и результатом «Единой России», большие различия между участками по распределению «оппозиционных» голосов между остальными партиями. Но в первую очередь имеет смысл обратить внимание на такой параметр, как корреляция (по участкам) между результатами «Единой России» и ЛДПР. Этот параметр интересен тем, что при переходе от городов с равномерным голосованием к городам с неравномерным голосованием корреляция не просто усиливается или ослабевает, но меняет свой знак. Подробные разборы результатов голосования по отдельным городам, которые в большом количестве публиковались энтузиастами в «Живом Журнале», показывают, что в тех городах, где не было оснований предполагать наличие масштабных фальсификаций, повышенная поддержка «Единой России» и ЛДПР наблюдалась на одних и тех же участках — в рабочих районах, на окраинах городов (и, наоборот, в центре города обе партии получали меньше среднего).

Фальсификации же должны нарушать эту естественную положительную корреляцию, притом независимо от конкретного типа фальсификаций: и при искусственном увеличении явки, и при переписывании на «Единую Россию» голосов других партий результат «партии власти» увеличивается без одновременного роста на тех же участках результатов ЛДПР.



Действительно, как хорошо видно на рис. 3, обнаруживается тесная взаимосвязь между уровнем однородности поддержки «Единой России» и коэффициентом корреляции для результатов двух партий: для подавляющего большинства городов с неравномерным голосованием за «Единую России» фиксируется сильная (от -0,55 и ниже) отрицательная корреляция между результатами «Единой России» и ЛДПР по участкам, тогда как в городах с относительно равномерной и при этом невысокой поддержкой «партии власти» корреляция как правило положительная или вообще отсутствует (от -0,15 и выше).

Отдельно можно выделить группу городов с умеренной отрицательной корреляцией между результатами «Единой России» и ЛДПР (от -0,55 до -0,15). В этот диапазон попадает и существенная часть (60 из 246) городов с равномерной невысокой поддержкой «партии власти», и многие города с неравномерным голосованием за «Единую Россию» или с равномерными, но высокими результатами (в сумме 33 города).

Уже предсказуемым (но нелогичным с теоретической точки зрения) оказывается и следующий результат (см. рис. 4) — четкая взаимосвязь между процентом голосов, полученных «партией власти», и коэффициентом корреляции. Например, результат «Единой России» меньше 25 % всегда сопровождается положительной корреляцией с голосованием за ЛДПР, тогда как результат выше 45 % почти всегда сочетается с отрицательной корреляцией.



Для того, чтобы объяснить подобную картинку без упоминания фактора фальсификаций,надо предположить, что электорат «Единой России» в городах состоит из двух резко отличающихся друг от друга типов избирателей, при этом представители одного типа присутствуют во всех городах (где-то больше, где-то меньше), внутри города распределены равномерно и по своим социальным характеристикам похожи на избирателей ЛДПР, тогда как представители другого типа вообще не представлены в одних городах, а в других присутствуют только на части участков, где они составляют сразу десятки процентов от общего количества избирателей.

Однако такая модель не подтверждается никакими эмпирическими данными или социально-экономическими факторами. Например, трудно объяснить, почему в Воронеже, Курске или Липецке «второй тип» избирателей «Единой России» вообще не фиксируется, а в Туле, Тамбове, Пензе или Саратове он столь заметен.
К сожалению, приходится снова возвращаться к предположению о масштабных фальсификациях как единственно возможному объяснению столь глубоких различий в электоральном поведении.

Результаты диагностики. Проанализировав такие неочевидные, на первый взгляд, параметры, как однородность поддержки «Единой России» и корреляция между ее результатами и результатами ЛДПР, мы можем построить итоговую классификацию городов с точки зрения отклонений от естественного (ожидаемого) электорального поведения и, соответственно, вероятного наличия или отсутствия фальсификаций.



Начнем с городов, в которых наблюдались большие различия между участками по уровню голосования за «Единую Россию». Всего в этой группе 120 городов, большинство из которых располагается в трех ячейках (которые можно условно назвать «московской», «казанской» и «саранской» по крупнейшим городам) нижней строки табл. 1, т.е. в них наблюдается сильная отрицательная корреляция между результатами «Единой России» и ЛДПР. Для этих городов есть все основания для вывода о масштабных фальсификациях. Несколько менее уверенно можно говорить о фальсификациях в «петербургской группе» городов, в которых высокая неоднородность результатов «Единой России» сочетается с невысокой отрицательной корреляцией между результатами «партии власти» и ЛДПР — если про фальсификации в Петербурге есть достаточно свидетельств наблюдателей, то, например, случаи Пензы, Якутска, Великого Новгорода требуют дополнительного анализа.

За пределами 4 названных выше групп городов оказалось только 10 городов из 120. Фальсификации в них были не только масштабными, но и плохо организованными, как, например, во Владикавказе, в котором на некоторых участках вместо «стандартных» 75 % за «Единую Россию» и 20 % за КПРФ официально зафиксировали противоположный результат — с 75% у КПРФ. Что же касается Улан-Удэ, то здесь, как и в случае с «петербургской» группой городов, требуется более подробный анализ.

Теперь посмотрим на города с равномерной поддержкой «Единой России» (табл. 2). Всего таких 282 города. Здесь выделяется «новосибирская» группа городов с положительным или близким к нулю коэффициентом корреляции между результатами «Единой России» и ЛДПР и невысокой (не более 47%) равномерной поддержкой первой. Всего таких городов 180, в том числе сразу 6 крупных городов с населением около 1 млн человек или более. Эта группа объединяет города, электоральное «поведение» которых на выборах 4 декабря в наибольшей степени соответствует ранее накопленным знаниям о естественном статистическом и географическом распределении участков по результатам выборов. Иными словами, для этой группы есть больше всего оснований говорить о честном подсчете голосов на прошедших выборах (впрочем, сравнение с результатами выборов 20072008 и 2003—2004 годов показывает, что в эту группу, возможно, попали несколько городов с небольшими и при этом равномерными фальсификациями).



В другой многочисленной группе городов, «белгородской», невысокое равномерное голосование за «Единую Россию» сочетается с отрицательной (но не очень сильной) корреляцией между результатами «Единой России» и ЛДПР. Предварительный анализ показывает, что в большинстве случаев отрицательная корреляция возникает из-за нескольких участков, на которых «Единая Россия» получала намного больше среднего по городу результата — и при этом нет очевидных социально-географических особенностей, которые могли бы объяснить их исключительность. Но все же, как и в случае с «петербургской» группой городов, требуется более подробный анализ для более определенного вывода о наличии или отсутствии фальсификаций в Белгороде, Нижнем Тагиле, Вологде и других городах этой группы. Аналогичную оговорку можно сделать и для Норильска и ряда других городов с сильной отрицательной корреляцией между результатами «Единой России» и ЛДПР по отдельным участкам (и невысоким средним результатом «Единой России» в целом по городу).

Что же касается городов, представленных в остальных ячейках (табл. 2), то применительно к этим трем десяткам можно достаточно уверенно говорить о наличии фальсификаций, притом существенных и повсеместных.

Россия 180 городов. Как сказано выше, есть большая группа из 180 городов, для которых у нас максимум оснований считать, что подсчет голосов 4 декабря там проводился честно. В этих городах 24,4 млн избирателей, из которых проголосовало 12,4 млн человек. Тут есть и миллионники, и небольшие города вроде Лермонтова или Ко-стомукши. Географически данная выборка охватывает всю Россию — от Калининграда и Великих Лук до Петропавловска-Камчатского и Южно-Сахалинска, от Мурманска и Енисейска до Ейска и Кисловодска. Существенно отличаются и электоральные предпочтения городов, попавших в эту группу: если в Подмосковье, Владивостоке, Рыбинске результат «Единой России» составил менее 25 % (а иногда даже менее 20 %), то в малых городах Челябинской области, республик Поволжья и некоторых других регионов он превышает 40 %.



Совокупный результат «Единой России» по этим 180 городам — 30 % голосов против 61 % в сумме у трех других партий, прошедших в парламент, тогда как по остальным городам соотношение 51 %/41 % в пользу «Единой России» (табл. 3). Что же касается одинакового (около 5 %) результата «Яблока» в 180 «честных» городах и в остальных городах, то это объясняется тем, что в категорию «прочих» попадают Москва и Петербург, два электоральных оплота партии, где даже при высоком уровне фальсификаций официальный результат «Яблока» оказался существенно выше среднего по стране.

Выше были перечислены крупнейшие города, в которых проведенный анализ не показывает наличия значимых фальсификаций, — это Новосибирск, Екатеринбург, Омск, Пермь, Воронеж и Красноярск. В этот список можно также добавить Ижевск, Ульяновск, Ярославль, Тольятти, Барнаул, Владивосток, Иркутск, Хабаровск, Киров, Оренбург, Липецк, Томск, Рязань, Курск, Чебоксары, Иваново, Тверь, Калининград, а также еще целый ряд областных центров и других крупных городов. Фальсификаций не было в большинстве или во всех городах Свердловской области, Красноярского, Приморского и Алтайского краев, Иркутской области, Мурманской и Тверской областей, Чувашии и многих других регионов.
  1. Шпилькин С. Математика выборов, №94, 20.12.2011 http://trv-science.ru/2011/12/20/mat...-vyborov-2011/
  2. Пшеничников М. Пятнадцать курьезных фактов о выборах, №96, 31.01.2012 http://trv-science.ru/2012/01/31/pya...ov-o-vyborakh/
  3. http://kireev.livejournal.com/743301.html
skroznik вне форума   Ответить с цитированием
Старый 06.03.2012, 17:42   #3
skroznik
Кот, гуляющий сам по себе
 
Аватар для skroznik
 
Регистрация: 18.02.2010
Адрес: Родом из детства
Сообщений: 9,616
Сказал(а) Фууу!: 1
Сказали Фууу! 4 раз(а) в 4 сообщениях
Сказал(а) спасибо: 349
Поблагодарили 960 раз(а) в 816 сообщениях
skroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордится
Отправить сообщение для skroznik с помощью Skype™
По умолчанию Re: Выборы 2012 (статистика)

Газета Российского научного центра
"Троицкий вариант"

20 декабря 2011 г.
ТрВ № 94, c. 2-4, "Наука и общество"

Сергей Шпилькин


Математика выборов

В статье «Математика выборов», опубликованной в № 40 «Троицкого варианта» за 27 октября 2009 г. [1], исследовалась статистика результатов федеральных и московских выборов 2007—2009 гг. Проведенный в статье анализ официальных данных выборов с детализацией до избирательных участков показал, что, согласно этим данным, доля избирателей, проголосовавших за кандидатуру власти, имеет сильную положительную корреляцию с явкой, в отличие от долей избирателей, проголосовавших за другие кандидатуры. Этот эффект проявлялся на всех рассмотренных выборах, но исчезал на участках с автоматизированным подсчетом (оборудованных сканерами избирательных бюллетеней — КОИБ).

В совокупности с другими обстоятельствами (такими, как пики на красивых значениях явки в распределении избирательных участков по явке) этот анализ позволил сделать вывод, что и наблюдаемое увеличение явки выше некоторых средних величин (50-55%), и сопровождающий его рост доли голосов, поданных за кандидатуру власти, обусловлены одним механизмом — искусственным завышением голосов за партию власти путем административного давления, вброса и приписок. В статье был предложен метод вычисления величины этого завышения («аномального вклада») на основании распределений голосов за партии в зависимости от явки.

Статья [1] не прошла незамеченной для общественности, и после недавних выборов в Госдуму в Интернете появилось множество работ, посвященных сбору и анализу выборных данных. Многие результаты были получены независимо и практически одновременно разными людьми, поэтому установить приоритет не представляется возможным. В этой статье я сначала коротко показываю основные статистические особенности прошедших выборов, а затем представляю результаты сравнительного анализа голосования на участках с автоматизированным и неавтоматизированным подсчетом голосов в масштабах всей страны. Окончательные результаты выборов по участкам на момент подготовки статьи не были доступны, поэтому при расчете использовался набор данных с сайта http://kartaitogov.ru, датированный 23:26 9 декабря 2011 г. Набор охватывает 95073 избирательных участка и 109,055 миллиона зарегистрированных избирателей.

Учитывая прошлый опыт, по итогам выборов следует задавать два вопроса. Первое: были ли на выборах статистически заметные фальсификации и аномалии? Второе: если были — какого они были масштаба, и можно ли оценить неискаженные результаты? Этим вопросам и посвящена данная статья.

Аномалии и фальсификации

На нынешних выборах в Госдуму сохранилась главная аномалия российских выборов прошлых лет — разная зависимость от явки доли голосов, поданных за кандидатуру власти (в данном случае за партию «Единая Россия»), и долей голосов за другие партии. Это хорошо видно на следующей диаграмме распределения результатов голосования по Москве (рис. 1):




Как и на выборах прошлых лет, на этом распределении можно выделить две области. В области средних явок (45-55 %) с ростом явки доли голосов за все партии растут пропорционально. При более высоких явках доля голосов за «Единую Россию» растет, а за остальные партии остается неизменной и даже снижается. Новая тенденция, которая не была видна на прошлых выборах, — необычное скопление точек выше наклонной линии, соответствующей 50%-ному голосованию за «Единую Россию» (тонкая белая линия на графике). Мы вернемся к этой особенности при обсуждении распределения участков по явке.

Вторая аномалия, сохранившаяся на этих выборах, — необычное распределение избирательных участков по явке, не отвечающее разумным представлениям о том, как должна выглядеть явка на выборах при свободном волеизъявлении, и не похожее на распределения для стран, которые принято рассматривать как демократические. После предыдущей статьи автора справедливо упрекали в том, что для сравнения предлагалось только распределение избирательных участков на президентских выборах в Польше в 2006 г.

Теперь автор может предложить для сравнения более обширный набор распределений избирательных участков по явке в зарубежных странах (рис. 2).




Из общего ряда выделяются только Азербайджан с мощным пиком на значении явки 67% (вероятно, 2/3) и Украина с завышенным правым краем распределения. В остальных странах распределение участков по явке имеет простую колоколообразную, достаточно симметричную форму. Заметное количество участков с явкой 100% наблюдается помимо перечисленных Азербайджана и Украины только в Болгарии.

В России же на думских выборах 2011 года самобытная традиция сохранилась: распределение избирательных участков по явке по-прежнему выглядит странно.



Да, распределение 2011 г. ближе по форме к выборам 2003 г., чем к выборам 2007—2008 гг., — меньше участков на высоких явках, меньше выражены зубцы на «круглых» явках. Однако зубцы на 70, 75 и 80% остались — и это означает, что по крайней мере на некоторых участках были фальсификации явки.

В Москве распределение избирательных участков по явке тоже получилось интересное — двугорбое (рис. 4).



Первый «горб» располагается примерно на том же месте, где находился максимум явки на выборах 2007 г. — на явке около 50 %. Второй же горб, «выросший» у распределения участков в Москве, очевидно, связан с верхней частью облака точек на рис. 1, т.е. с участками, где наблюдается повышенное голосование за «Единую Россию».

Распределения голосов по явке

Распределения голосов за партии в зависимости от явки тоже выглядят (увы!) традиционно для российских выборов (рис. 5).



Видно, что голоса за все партии, кроме ЕР, ведут себя с изменением явки сходным образом,а распределение голосов ЕР примерно до явки 50 % следует общей тенденции, а затем отклоняется от нее. При этом, в отличие от предыдущих выборов, соотношения между голосами, поданными за альтернативные ЕР партии, заметно зависят от явки. Это видно, если нормировать поданные голоса на сумму голосов за все партии, кроме ЕР (рис. 6).



Видно, что на средних явках (50-55 %) среди «альтернативных» партий увеличивается доля «Справедливой России» и «Яблока», а на высоких — доля КПРФ (последний эффект может быть результатом «нарисованного» голосования в некоторых республиках — так, например, во Владикавказе КПРФ получила практически ровно 20% на большинстве избирательных участков).

Как уже было видно из рис. 6, до явки 50 % количество голосов, поданных за ЕР, действительно остается пропорциональным количеству голосов за другие партии. Как и в прошлом анализе, выделим из распределения голосов за ЕР «нормальную» часть, пропорциональную сумме голосов за все остальные партии, подобрав эмпирический коэффициент таким образом, чтобы по возможности обнулить разность между полным распределением и «нормальной» частью ниже некоторой пороговой явки (которая, как видно из предыдущего графика, должна составлять около 50%) (рис. 7).



Как видим, выполнить такое разделение действительно удается. При таком разделении из общего числа в 32,3 млн голосов за «Единую Россию» «нормальными» оказываются 17,1 млн, а «аномальными» — 15,2 млн. (Анализируемый набор данных голосования неполон; по официальным данным общее количество голосов за ЕР составляет 32,4 млн.)

Аналогичные процедуры можно выполнить и для голосования по Москве (рис. 8).



Отметим, что распределения голосов за все в зависимости партии от явки получились двугорбыми, как распределение участков, а за «Единую Россию» — одногорбым. При этом распределения голосов за все партии достигают максимума на первом «горбе», а за ЕР — на втором. Это подтверждает, что второй горб в распределении участков действительно связан с одновременным завышением явки и количества голосов именно за «Единую Россию».

Разделение голосов за ЕР на «нормальную» и «аномальную» составляющие в этих условиях выглядит так — рис. 9.



Примечательно, что «аномальная» составляющая голосов за ЕР появляется примерно на том же значении явки, что и для распределения в масштабах всей страны. Количество «аномальных» голосов за ЕР при таких разделениях составляет 15,2 млн по всей России и 1,03 млн по Москве. Исключив «аномальную» часть голосов за ЕР, можно рассчитать «скорректированные» результаты выборов в Госдуму 4 декабря 2011 г. (см. таблицу 1).



Нечеловеческий фактор

В прошлой статье [1] было продемонстрировано поразительное различие в статистике выборов на московских избирательных участках с автоматическими сканерами бюллетеней (КОИБ) и без них. На нынешних выборах КОИБы решением ЦИК были распределены по всем субъектам Федерации. В общей сложности планировалось установить КОИБы более чем на 5000 избирательных участков. При этом в Москве КОИБов осталась четверть от прежнего количества (250 участков), а в Санкт-Петербурге не осталось практически совсем (25 участков).

К сожалению, централизованной информации об участках, оборудованных КОИБами, нет. Сведения об их распределении необходимо искать на сайтах избиркомов субъектов Федерации, но даже там они обнаруживаются не всегда. Автору удалось собрать списки участков по 57 субъектам Федерации. Увы, не удалось найти перечни участков для многих важных субъектов Федерации, например для Московской области и таких видных участников избирательного процесса, как Татарстан и Башкортостан. С другой стороны, есть данные по Дагестану, Чечне, Кабардино-Балкарии, Ингушетии, Карачаево-Черкесии. Из уже собранного списка досрочно выбыла Бурятия, где, по сообщениям местной прессы, все 41 КОИБ «отказались выдать результаты», так что их вскрыли и считали бюллетени вручную.

В итоге получилась выборка из 3282 избирательных участков, охватывающая всю страну, от Приморья до Калининградской области. Общее количество зарегистрированных на этих участках избирателей составляет 5,8 миллиона человек— больше, чем в Санкт-Петербурге, хотя и меньше, чем в Москве. Отличный материал для статистического анализа.

С чем сравнивать данные голосования по этой выборке? Решения о расстановке КОИБов по избирательным участкам принимают избиркомы субъектов Федерации или даже более низкого уровня. Конечно, из организационных и хозяйственных соображений КОИБами скорее оборудуют городские участки, чем сельские, и скорее в центре субъекта, чем на периферии (хотя во многих субъектах Федерации их распределили по райцентрам), поэтому нашу выборку нельзя считать представительной для всего населения страны.

Кроме того, в ней есть не все субъекты Федерации. В качестве компромиссного решения в данной статье для сравнения взяты результаты голосования на всех остальных участках тех территориальных избирательных комиссий, где есть участки с КОИБами. В общей сложности таких участков оказалось 16405 — в 5 раз больше, чем участков с КОИБами. Возможно, при более строгом исследовании следовало бы отфильтровать базовую выборку дополнительно — например, по численности избирателей — и применить весовые коэффициенты в зависимости от доли участков с КОИБами в конкретных ТИК. Но это дело будущего, а пока первые результаты. Они удивительны.
Сначала результаты для участков с КОИБами (рис. 10).



Хочется специально отметить для любителей теории «особой электоральной культуры» российского провинциального населения: эта выборка включает в себя участки в Погаре, Почепе, Суземке и Трубчев-ске Брянской области, в Гороховце и Петушках Владимирской области, в райцентрах Кабардино-Балкарии, Карачаево-Черкесии и Краснодарского края. Доля москвичей в ней примерно такая же, как среди всех избирателей в стране, доля петербуржцев совсем мала.

И, тем не менее, распределение участков по явке — узкий, почти га-уссовский пик с пиком на 52% и небольшим «хвостом» справа. Оно лишь немного шире, чем распределение избирательных в Москве на думских выборах 2007 г. (см. рис. 4). Под стать ему и распределение голосов за партии в зависимости от явки (рис. 11).



Повышенная доля голосов за ЕР при высоких явках присутствует, но относительно невелика.

Теперь результаты для базовой выборки — избирательных участков без КОИБов из тех же территориальных избирательных комиссий (рис. 12).



Избирательные участки находятся на тех же самых территориях, — а распределение по явке совершенно другое. Правый край распределения поднят, прорезались пики на красивых явках (рис. 13).



Сравните с рис. 9. На выборке участков с КОИБами «Единая Россия» получает при повышенных явках лишь небольшую прибавку по сравнению с другими партиями. На выборке участков без КОИБов доля голосов за ЕР с ростом явки буквально взлетает.

В заключение проведем процедуру вычитания аномальной составляющей для двух выборок участков — с КОИБами и без КОИБов, как это делалось выше для страны в целом, и рассчитаем соответствующие результаты выборов. Естественно, абсолютные количества голосов значения не имеют, существенны лишь процентные доли голосов за партии (рис. 14).





И, наконец, результаты голосования — исходные и скорректированные (таблица 2).



Заключение

Анализ статистики данных думских выборов 2011 года указывает, что на этих выборах имели место существенные манипуляции с явкой и голосами за партию «Единая Россия». Разные варианты коррекции результатов дают «Единой России» от 30.5 до 34% голосов по стране и около 30% — по Москве. Для явки получается соответственно от 44 до 50% по России и около 47% по Москве.

Вторым важным выводом статьи является неожиданная однородность явки по стране — анализ статистики по охватывающей всю страну выборке из участков с КОИБ не показывает существенных отличий в распределении явки от распределения явки в пределах Москвы.
  1. Шпилькин С.А. Статистическое исследование результатов российских выборов 2007 — 2009 гг. «Троицкий вариант» № 40, 27 октября 2009г. http://trv-science.ru/2009/10/27/sta...2007—2009-gg
  2. Шень А. Выборы и статистика: казус «Единой России» (2009). http://alexander.shen.free.fr/elections.pdf
  3. Постоянно обновляемый анализ текущих выборов публикуется в блоге Дмитрия Кобака: http://kobak.livejournal.com/102646.html#cutid1
skroznik вне форума   Ответить с цитированием
Старый 09.03.2012, 23:19   #4
skroznik
Кот, гуляющий сам по себе
 
Аватар для skroznik
 
Регистрация: 18.02.2010
Адрес: Родом из детства
Сообщений: 9,616
Сказал(а) Фууу!: 1
Сказали Фууу! 4 раз(а) в 4 сообщениях
Сказал(а) спасибо: 349
Поблагодарили 960 раз(а) в 816 сообщениях
skroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордится
Отправить сообщение для skroznik с помощью Skype™
По умолчанию Re: Выборы 2012 (статистика)

Газета Российского научного центра
"Троицкий вариант"

Голая школьная математика

28 февраля 2012 г.

Волнующий вопрос о достоверности результатов выборов в Госдуму 4 декабря становится все менее актуальным – люди привыкают ко всему. Зато скоро станет сверхактуальным вопрос о президентских выборах 4 марта. Достоверность декабрьских результатов можно проверить иным способом, который пока не обсуждался широко, который прост и понятен, хотя не сможет, наверно, дать ответ на вопросы: КТО, КАК, КОГДА, ЗАЧЕМ и НАСКОЛЬКО вмешивался и корректировал результаты.

1. Немного почти школьной арифметики

Если представить себе колесо вроде рулетки, но с 10 цифрами, то нетрудно догадаться, что закрутив колесо 100 раз, мы получим примерно по 10 выпадений каждой цифры. «Примерно» – потому что, возможны случайные отклонения. Но, с другой стороны, если все 100 раз колесо остановится на цифре «3», вряд ли кто сочтет такой результат случайным совпадением. Граница между «случайностью» и «закономерностью» чуть ли не со времен Гаусса, то есть уже 200 лет, принимается равной некоей величине, которую называют «три сигма» — 3σ. Величину σ можно подсчитать по школьной формуле, это √(pqN). В нашем случае p=0,1 – вероятность выпадения одной определенной цифры из десяти, а q=0,9 – вероятность противоположного исхода, N – число испытаний, в нашем примере это 100. Тогда получится, что «3 сигма» равна 9. То есть результат для каждой цифры колеблется вокруг 10, с размахом 9, а значит от 1 до 19. Довольно «либерально», не правда ли? Но теория вероятностей утверждает, что в 99,7% случаев результат укладывается в этот диапазон. Можно и просто разделить число выпадений цифры на число опытов с рулеткой N и тогда мы должны ждать, что каждая цифра будет выпадать с частотой около 0,1 и с σ=√(pq/N)

Вот, что получится, если не 100, а сто тысяч раз закрутить рулетку с 10 цифрами.




Зеленые линии как раз показывают плюс/минус три сигмы к средней величине 0,1 и видно, как все точки лежат внутри такого «зеленого коридора».
Но уж если результаты НЕ укладываются в коридор «три сигма», тогда произошло что-то существенное. Для физика-экспериментатора выход измеряемой величины за пределы «3 сигма» практически означает доказательство.

Но это лишь одна из десяти цифр. Чтобы учесть сразу все 10 цифр, используют величину, которую назвали «хи-квадрат» — χ2 или критерием Пирсона. Это сумма квадратов отклонений числа результатов по каждой цифре от ожидаемого. В нашем примере с сотней опытов эта разница от десяти, отнесенная к самому ожидаемому результату. Есть таблицы, которые показывают, что если в нашей рулетке χ2 стало равно 14,7, то такое может получиться в 10% случаев, ну а если достигло 27,9 – то это уже совсем неправдоподобно редко – лишь 0,1%.

Можно и сразу считать вероятность, с которой получается такое χ2, что мы и будем делать. Так если подсчитать χ2 для нашего графика, то она окажется равной 5,5, а вероятность составит 78%. Значит на графике результаты хорошей, честной рулетки.

2. А теперь займемся выборами.

Ведомство господина Чурова, повинуясь закону, сделало доступным результаты выборов по каждому из почти 100 тысяч избирательных участков России. Правда оно запрятало эти данные так глубоко, так тщательно разбило их на отдельные фрагменты, что рядовой и даже не рядовой пользователь интернета до них не доберется, а если и доберется, то только до отдельных фрагментов, которых без малого 100. А дальше придется или терпеливо собирать пазл, или просить помощи.
Но вот все трудности преодолены и у вас есть полная таблица с протоколами всех 95228 избирательных участков. В протоколах много граф. Выберем из них те, числа в которых, как правило, большие. Это число избирателей в списках; число избирателей получивших бюллетени в помещении для голосования; число бюллетеней, признанных действительными (то есть не испорченных), а также число голосов за каждую из двух самых больших партий. Всего у нас получится пять граф.

В каждом из этих 95228 чисел, в каждой из 5 граф будем смотреть лишь на ПОСЛЕДНЮЮ ЦИФРУ. Но и тут побеспокоимся – не будем брать в расчет однозначные и двузначные числа, только большие: трехзначные и четырехзначные: в них последняя цифра должна встречаться равновероятно, как в нашей мысленной рулетке с 10 ячейками.

Но сначала проделаем всё это для парламентских выборов 2010 года в Швеции. Просто для того, чтобы убедиться, что метод работает.



Ну что же – как и в нашей рулетке, здесь все точки пляшут внутри коридора, да и вероятность более 60%. Значит, и тут нет оснований сомневаться.

А теперь взглянем, используя тот же самый алгоритм и программу, на Российские выборы 4 декабря.



Разница не может не удивлять. На графике точки далеко вылезают из «зеленого коридора». Количество нулей среди последних цифр в России неправдоподобно велико, они встречаются много чаще, чем разрешает «три сигма». Да что там жалкие «три сигма», если такого не разрешают и 10 сигм! Вероятность, что такой результат получился совершенно случайно, описывается дробью, в знаменателе которой число большее, чем масса Земли в граммах (1027). А вот девятки встречаются почти столь же неправдоподобно редко. Даже семерки оказываются «нелюбимым» числом, всего лишь в 0,3% случаев такое может получиться случайно.

Но стоит лишь отодвинуть от подсчета голосов подчиненных господина Чурова («Россия без Ч»), то есть взять лишь те участки, где бюллетени считали не люди, а автоматы, то как по волшебству (или все же без «волшебства»?) всё становится почти таким же, как в Швеции (кстати, и число избирательных участков в этих случаях близкое: 4374 и 6063, и численность избирателей от 7 до 8 миллионов).



Почему «почти обыденным»? Да просто потому, что и в «Россию без Ч.» попадают числа избирателей в списках и числа выданных избирателям бюллетеней, а тут уж без людей не обошлось.

А если взять Дагестан, то там из 7176 чисел цифрой «0» заканчивается 1495 чисел, а вот цифрой «1» лишь 575, хотя число повторений каждой цифры с вероятностью 99,7% должно укладываться в диапазон от 642 до 794.



Разница уже не шесть, а 36 сигм! (Да и без всякой математики понятно, что если в нашей рулетке из 10 цифр сто раз из ста выпала одна и та же цифра, то рулетка явно мошенническая, а ведь тут разница лишь 11 сигма, а не 36). Только «5» пользуется некоторым преимуществом перед остальными цифрами, и лишь три из десяти цифр остаются в «зеленом коридоре». (Обратите внимание на то, что масштаб для Дагестана пришлось брать много мельче – иначе числа просто не умещаются)

Значения χ2 в Дагестане превосходят многие сотни, а мы помним, что уже значение χ2=28 дает вероятность, которую не встретишь на практике, менее 0,1%. Вероятность того, что такое распределение как на рисунке произошло в результате случайного стечения обстоятельств, равна дроби 1/10204, в знаменателе которой стоит число, много большее, чем число элементарных частиц во всей Вселенной (жалкие 1080!).

Результаты выборов на Кавказе на самом верху вертикали власти наивно объясняли особой тейповой структурой общества и уважением к старшим (начальству). Обществом, в котором все голосуют так, как сказал старейшина. Пусть так, поверим. Но, как мы видим, тогда придется объяснить, почему тейпы преимущественно состоят из целых десятков людей, которые так и живут десятками (лишь бы не по 7, или 9 или 11 человек), и на выборы ходят десятками, и партию выбирают десятками? Что это за чудеса? Может быть стоит объяснять это по-другому?

Читателю должно быть понятно, что таким способом можно заметить лишь самые грубые подделки, те, которые делаются без оглядки на возможные проверки, на какой-либо контроль, в твердой убежденности, что наверху «схавают» всё — лишь бы был приятный результат. Создается впечатление, что в некоторых местах выборов не было вообще, а результаты просто рисовали в протоколах, не утруждая себя даже и процедурами подсчета бюллетеней.

3. Регионы и тенденции

Точно такой же анализ можно сделать и по всем регионам России. У каждого получится свое значение вероятности: от совершенно неправдоподобной, как в Дагестане, до вполне разумной, как в Орловской области, где вычисленная по χ2 вероятность более 80%.

Теперь можно последовательно выключать из подсчетов результата голосования регионы, в которых вероятность, вычисленная по χ2,слишком мала, и смотреть на итоги. Ведь если преобладание нулей и недостаток единиц и девяток есть результат лишь маленького, простого и невинного округления, то на явке и результатах голосования это не должно сказаться, не правда ли?

Но проверим и это, и вот что тогда увидим.



Здесь каждой точке соответствуют итоги голосования по всем регионам, в которых достоверность результатов не ниже указанной. Оказывается, что результат голосования все же зависит уровня достоверности, и при этом вполне отчетливо: чем выше достоверность, тем ниже явка и хуже результат одной из партий. Точки на левом краю графика дают явку и результат ЕР, представленный ЦИК. Но если последовательно отбрасывать наименее правдоподобные результаты, то значения упорно снижаются. При достоверности уже чуть большей, чем 1%, результат ЕР падает ниже 50%, при этом остается учтенным почти 39% всех активных избирателей. Остальные 60% с лишним (а значит мнение почти 40 миллионов граждан России) бессмысленно испорчены посторонним вмешательством.

Но если есть такая зависимость, то мы все же сможем ответить и на вопрос, который был задан в самом начале: «КТО, КАК, КОГДА, ЗАЧЕМ и НАСКОЛЬКО вмешивался и корректировал результаты».

КТО: региональные и местные власти. КАК: переписыванием или прямым «сочинением» результатов. КОГДА: при подготовке протоколов. ЗАЧЕМ: чтобы обеспечить цифры, которые понравятся «вертикали власти». НАСКОЛЬКО: настолько, чтобы вывести результат, нужный «вертикали», на требуемый ею уровень.

Вопросы вместо выводов

Есть три вопроса, которые нужно задать В.Чурову.
  1. Почему такой, или более сложный анализ, не делает он и люди его ведомства?
  2. Почему ЦИК не посылает строгие инспекции в регионы, в которых достоверность результатов падает до умопомрачительно малых величин?
  3. Чем занят Центризбирком и его аппарат, которым именно за организацию честных выборов налогоплательщики платят немалые деньги?
skroznik вне форума   Ответить с цитированием
Старый 14.03.2012, 22:44   #5
skroznik
Кот, гуляющий сам по себе
 
Аватар для skroznik
 
Регистрация: 18.02.2010
Адрес: Родом из детства
Сообщений: 9,616
Сказал(а) Фууу!: 1
Сказали Фууу! 4 раз(а) в 4 сообщениях
Сказал(а) спасибо: 349
Поблагодарили 960 раз(а) в 816 сообщениях
skroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордитсяskroznik за этого человека можно гордится
Отправить сообщение для skroznik с помощью Skype™
По умолчанию Re: Выборы 2012 (статистика)

skroznik вне форума   Ответить с цитированием
Старый 13.04.2012, 05:59   #6
Билли Бонс
Администратор
 
Аватар для Билли Бонс
 
Регистрация: 15.09.2009
Адрес: Эстония, Таллин
Сообщений: 3,450
Сказал(а) Фууу!: 3
Сказали Фууу! 1 раз в 1 сообщении
Сказал(а) спасибо: 223
Поблагодарили 1,028 раз(а) в 713 сообщениях
Билли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордитсяБилли Бонс за этого человека можно гордится
По умолчанию Как оппозиционеры пытались доказать фальсификации выборов, а доказали их честность

Это просто чудо, сколько за последние два месяца у нас в стране появилось фанатов хоккея и футбола матстатистики и теорвера. Ни одному популяризатору науки никогда не удавалось добиться такого успеха в такие короткие сроки, как председателю ЦИК Чурову. Это ничего, что многие из них не объяснят разницу между распределениями Гаусса и Пуассона, зато какая тяга к знаниям! За мной, мои маленькие любители прикладной математики, к новым вершинам знания!


Для тех, кому не нужны подробности
Так называемая «гребенка Чурова» — пики на графике распределения процента голосов — не является доказательством подтасовок, так как такие пики присутствуют:
  • На аналогичных графиках по выборам в других странах, включая оплоты демократуры (США, Германия).
  • На графиках процента голосов, отданных на декабрьских выборах за оппозиционные партии — что, Чуров подыгрывал КПРФ?
Более того «гребенка» доказывает отсутствие подтасовок!
  • Как убедительно показывают графики, которые приводят оппозиционные обличители фальсификаций, если искусственно смоделировать «вбросы» на выборах, то «гребенка» исчезает.
Вывод: наша оппозиция со своим враньем в очередной раз села в лужу: хотели доказать что выборы фальсифицированы, а доказали обратное.
Теперь обо всем по порядку.
Для тех, кто хочет подробностей
Начну с предыстории для тех, кто не следил за приключениями «гауссинианы». Остальные могут сразу перейти к самому интересному.
Сразу после выборов стали появляться люди, у которых были «математические доказательства фальсификаций».
Претензий озвучено было две:
  1. Все графики похожи на гауссово распределение, а график «Единой России» — нет. Следовательно, результаты ЕР подтасованы.
  2. На «красивых» процентах ,кратных пяти, на графике видны пики, следовательно результаты ЕР подтасованы.
Так как набросов было два, то и разбор делится на две части.
Первая – разбор «гауссинианы». Обязательность похожести на гауссово распределение для всех партий доказана никем не была, это была ни на чем не основанная аксиома протестующих.
Поэтому самое эффективное опровержение в данном случае — доказательство ложности самой аксиомы, т.е. нахождение не-гауссовых выборов. И такие выборы были найдены:
Таким образом вопрос с «похожестью на гауссиниану» был закрыт
С пиками на «красивых» числах история более интересная.
Для начала заметим в скобках, что на плакате «Верим Гауссу» наличествуют пики на 20% и 25% у КПРФ. Очевидно сурковскаяпропагандаTM решила немного пофальсифицировать и в пользу коммунистов.
После предъявления «математического доказательства фальсификаций» было высказано мнение, что как минимум часть пиков не имеет никакого отношения к подтасовкам, а имеет естественное происхождение. Самая убедительная статья на эту тему — «Математические распределения и выборы в ГосДуму 2011 (ОПРОВЕРЖЕНИЕ популярного заблуждения)» С.Г.Кузнецова. Вот вывод о пиках из нее:
В районе 50% обязан быть скачок, обусловленный тем, что дробь 1/2 среди других дробей n/m встречается чаще остальных. Но этот скачок легко сгладить, взяв слишком широкий шаг диаграммы. То же самое относится и к другим «красивым» дробям — 1/3, 2/3, 3/4, 4/5 и т.д. Чем «красивее» дробь, тем более резким в её окрестности будет пик. Ну а теперь давайте посмотрим на настоящий график распределения числа участков по проценту голосов, без сглаживания и просчитанный с высокой детализацией.

Более внимательное рассмотрение показало, что данный целочисленный эффект полностью объясняет якобы аномальный, а на самом деле совершенно естественный пик на значении 50% = 1/2, полностью или частично объясняет пики на 20%, 25% и 75%, но НЕ объясняет некоторые другие пики на круглых значениях процентов (65%, 70%, 85%, 90%, 95%) в правой части графика.
Итак, часть пиков объясняется тем, что данная «красивая» дробь встречается чаще, чем остальные, для других данное объяснение не подходит.
Сторонникам теории фальсификации пришлось на эту критику реагировать. В статье Дмитрия Кобака «ПЖиВ: о пиках на дробях с малыми знаменателями» не признаются естественными пики 65, 70, 80, 85, 95% плюс, почему-то, 75%. Более того, они прямо называются вбросами, и делается попытка это доказать:

Слева — всем известный график, бин 0.25%. Видны пики на 50%, 60%, 65% и т.п. Справа — тот же график с бином 0.001%. Та-та! Мы ясно видим те самые артефакты, о которых шла речь выше. Красивые пики на 1/2, 2/3… и нули между пиками. Достаточно сравнить эти две картинки, чтобы понять, что пики слева, по крайней мере некоторые, и пики справа имеют совершенно разную природу. Пики справа (а) расположены на дробях с малыми знаменателями, (б) поэтому непериодичны, (в) уменьшаются с увеличением знаменателя дроби, (г) окружены нулями с обеих сторон, (д) видны только на хорошем разрешении. Пики слева расположены на числах, кратных 5% (ясно видны пики на 60%, 65%, 70%, 75%, 80%, 85%, 95%), имеют примерно одинаковый размер (кроме 50%), не окружены нулями и видны на нормальном разрешении. Можно посчитать спектр и увидеть пик на гармонике 1/5, у меня это сделано в основной записи. У пиков справа такого нет. Вывод: слева видны фальсификации, справа — артефакты.
Во-первых, пики и их периодичность сильно зависят от шага дискретизации. Дмитрий просто выбирает наиболее выгодные себе. При увеличении шага пики вообще исчезают. Если 0,25 несколько уменьшить, пик на 65% распадется на два – 65% и 66,6%, что несколько испортит периодичность, и так далее. При чем тут фальсификации непонятно. Вообще, главное в этих двух графиках — это два разных представления одних и тех же данных.
Приведу пример. Представим, что некто Дмитрий брился и немного порезался, после чего его сфотографировали с двух сторон – на одной фотографии виден порез, на другой нет. Это два образа одного и того Дмитрия. Сравнив две эти фотографии, вы бы сделали неизбежно вывод, что на Дмитрия напали бандиты и исполосовали лицо?
Поэтому если кто-то усматривает связь между периодичностью или непериодичностью пиков с фальсификациями, хотелось бы увидеть от кого-то разъяснения этой самой связи.
Во-вторых, также непонятно какие знаменатели малые, а какие нет, и что из этого следует (по мне так 20 тоже не великий знаменатель), что следует из «примерно одинакового размера», уменьшения при увеличении знаменателя, а главное, как это связано с выводом в конце.
В-третьих, «нули с обеих сторон» абсолютно точно никак с доказываемыми фальсификациями не связаны, это артефакт дискретизации. Зачем на них дважды заострять внимание? Для объема?
В-четвертых, даже на нормальном разрешении я вижу справа пики и на 60%, и на 70%, и на 75%, и на 80%:

Почему их Дмитрий также вносит в ряд фальсификаций?
Ну и в-пятых, положим на каком-то значении у нас есть пик при шаге 0,25, и нет при 0,001, что это значит? Учитывая, что данные одни и те же, это значит лишь то, что «плотность пиков» рядом с этим значением выше, чем в соседних областях, поэтому при увеличении бина, когда соседние пики начинают сливаться, вырастает «артефакт». А вот является ли эта повышенная плотность естественной или нет, заслуживает отдельного внимательного рассмотрения.
Но нам же нужно побыстрее разоблачить фальсификации, а не разобраться, так ведь?
Но вернемся к статье:
Единственное остающееся подозрение на артефакт — пик на 50%, он есть и справа, и слева. Что делать? А вот что: гениальный [info]jemmybutton растолковал мне (спасибо ему за очень полезную дискуссию!), как одним махом избавиться от всех артефактов. Нужно к количеству бюллетеней за каждую партию на каждом участке добавить случайное число равномерно распределенное на (-0.5, 0.5). Понятно, что такая маленькая добавка результатов не изменит, но наши числа станут дробными и все артефакты сразу исчезнут. Три тонкости: (1) амплитуда шума должна быть именно 1, чтобы целиком покрыть значения между целыми числами, (2) я считаю результат 100 раз с разным шумом и усредняю, (3) на участках, где ЕР набрало ровно 100% голосов, я не добавляю шум, чтобы не размывать самое правое значение на графике (это всё равно не бин, а значение на границе бина). Для сравнения: прежняя кривая (черным) и исправленная кривая (красным):

Пик на 50% исчез бесследно, остальные остались. Мораль: при вычислении любых таких гистограмм, нужно добавлять к количеству голосов шум с амплитудой в 1 голос и средним 0.
Вот это действительно интересно. Правда исчез, судя по графику, не только 50% пик, но и 35%, 40% и 60% пики тоже пропали. Но не будем сильно придираться — если бы Дмитрий заметил их исчезновение, пришлось бы признавать естественными не один пик, а целых четыре. Впрочем, интересно не это, а то, что часть пиков исчезает при неизменности остальных.
Чтобы разобраться почему так получается, вспомним как строятся эти графики. Что означает бин 0,25%? Это значит, что ордината точки с абсциссой, например, 50% есть сумма всех УИКов с процентами за «Единую Россию», попадающими в промежуток от (50%-0,25%/2) до (50%+0,25%/2). А теперь представим два участка. На одном пришло проголосовать 10 человек, из которых за ЕР отдали голос 5. На другом из 1000 пришедших – 800. На первом за ЕР – 50% избирателей, на втором -80%. Добавим на участках по полголоса. Процент за ЕР на первом участке станет 52,38, а на втором – 80,01. Т.е. на первом участке процент сместился на 2,38%, а на втором – 0,01%. Если шаг 0,25%, то в первом случае смещение больше 9-ти шагов, а во втором лишь 1/25-ая шага.
То есть описанные Дмитрием Кобаком действия размывают пики, обусловленные участками с малым количеством проголосовавших, и не изменяют обусловленные участками с большим. К фальсификациям это снова никакого отношения не имеет. Применение этого метода уберет фальсифицированные пики на малых УИК и оставит естественные пики на больших.
Напоследок хочется ещё немного процитировать эту статью.

Природа пиков у других партий (кроме ЕР) ясно видна на графике Северной Осетии. Видите пик у коммунистов на 20%? Естественно, если почти на всех участках для ЕР рисуют 75%, то что-то нужно и для всех остальных нарисовать, не правда ли? Кстати, в Северной Осетии эти пики возникают только во Владикавказе, в деревне всё в порядке (интересно, почему). Но во Владикавказе — беспредел.
Если имеется пик у ЕР – это безусловно доказательство фальсификаций злобной власти. Если же пик у её соперника … барабанная дробь .. это всё равно доказательство фальсификаций злобной власти. Не правда ли, превосходный пример двоемыслия? Рукопожатые блоггеры, демократические журналисты и геи аплодируют стоя.
Критерий естественности пиков
Критиковать других это конечно хорошо, но знаю ли я сам, как отличить естественные пики от результатов фальсификаций? Думаю, да. Предлагаю для проверки пользоваться следующим критерием:
Все естественные пики, вызванные неравномерностью распределения дробей, будут симметричны относительно 50% и будут проявляться у всех партий.
Обоснование простое: любая дробь n/m имеет «симметричную» (m-n)/m, значит, если n/m встречается чаще, чем (n-1)/m и (n+1)/m, то и (m-n)/m будет встречаться чаще, чем (m-n-1)/m и (m-n+1)/m. Также очевидно, что математика одинакова для всех партий, потому и проявляться будут закономерности у всех.
Потому, чтобы проверить на фальсификации Единую Россию, обратим взор на графики остальных партий. Ещё раз посмотрим на график С.Г.Кузнецова:

То, что пики есть и у остальных партий, видно невооруженным глазом. Чтобы проверить естественность пиков на «красивых значениях», построим те же для ЛДПР (обозначено синим цветом) и КПРФ (обозначено красным). Данные для графиков взяты тут.
Обратим внимание на графики КПРФ и ЛДПР:

Мы видим, что удивительным образом на 5, 10 и 15% у этих партий находятся «аномальные пики». Особенно интересен пик на 5% у КПРФ. Он имеет такой же характер, как собратья на 90% и 95% у ЕР. Вместо узкого пика вверх мы видим небольшую «горку». Может быть кто-то фальсифицировал результаты КПРФ на 5%?
Кроме того, хотя у ЛДПР я не отметил пиков на 5% и 10%, мне кажется они там есть. Просто их не видно. Да-да, я не шучу.
На 10% он «спрятался» из-за того, что в этом месте график резко идет вверх, но, увеличив масштаб, мы увидим на графике и резкий «скачок» вверх перед этой точкой, и «отскок» сразу после. Что касается 5%, то тут много зависит от того, где проводить кривую «без пиков» в районе 3-5%. Если по нижним точкам, получим несколько пиков с максимальным на 5%. Если по высшим, пиков не будет, зато появится аномальный провал сразу за 5%-ми.
То есть пики 5, 10% у ЛДПР можно видеть или можно не видеть. Единственное место, где не видно пика – 15% у КПРФ.
Дабы меня не заподозрили в подтасовках, давайте посмотрим, не видны ли «симметричные пики» на графике Кузнецова, тем более детализация там выше.

Оказывается, пики видны как у оппозиции, так и самой «Единой России».
Таким образом, мы видим, что пики на высоких процентах, кратных пяти, имеют своих симметричных собратьев, как это и должно быть из предложенного «критерия естественности». Откуда следует, что либо нужно признать верным этот критерий, и автоматически признать естественными все эти пики, либо объяснить кто, и главное, зачем фальсифицировал результаты оппозиции (да и самой ЕР) на «красивых» числах в левой части графика.
Но это все была предыстория, теперь обещанное самое интересное -
Доказательство честности прошедших выборов
Вернемся к заметке Дмитрия Кобака. Итак, он добавляет на каждом участке плюс-минус полголоса, проводит эксперимент 100 раз и усредняет, в итоге получаются вот такие графики:

Часть пиков при этом исчезает. Что сделал Дмитрий Кобак? Он фальсифицировал результаты выборов всего лишь. Да, размер «вброса» ничтожен, но даже он уничтожает часть пиков (почему часть, а не все, мы рассмотрели выше).
Вы еще не догадались, что на самом деле доказывает этот график?
Прежде чем я покажу, какой вывод и почему следует отсюда, построим еще несколько графиков.
Мы будем фальсифицировать выборы. А если быть совсем точным, будем вбрасывать голоса избирателей за «Единую Россию». Делать будем это следующим образом: на каждом участке увеличим количество проголосовавших за ЕР на некоторое количество от общего количества избирателей. Например, добавим на каждом участке процент избирателей из промежутка [0;20] процентов. Конкретное значение из промежутка будем выбирать случайным образом.
Итак, первый график:

Графики с вбросами опущены по оси ординат, чтобы удобней было сравнивать.
Итак, мы видим, что вбросы приводят к смещению максимальных значений графика вправо (что естественно) и исчезновению пиков.
Уменьшим процент вбросов:

Пики по-прежнему исчезают.
Ещё уменьшим вбросы:

Только теперь угадываются пики, но привычного своего характера они всё ещё не носят:

Наконец, на уровне средних вбросов около 0,1% появляются знакомые пики.
Чтобы убедится в неслучайности результатов, ещё несколько графиков с теми же уровнями:

Результаты аналогичны предыдущему: при случайных вбросах в промежутке [0; 0,25%] видны пики на ½ и ¾ ; увеличение вбросов до промежутка [0; 0,25%] пики в привычном виде убирает.
Для полноты картины построим ещё пару графиков, где вбросы добавим не на всех участках, а лишь на которых процент проголосовавших за ЕР попадает в определенный промежуток:

Первый график для промежутка избирателей [35%; 55%], а второй для [42%; 92%]. Уровень вбросов 0-0,25 %. Что можно сказать, глядя на графики: внутри промежутков исчезли все пики, кроме двух самых больших, вне промежутков графики не изменились, на границах появились новые пики – пик вниз слева и вверх справа.
Вернемся к тому, какие выводы следуют из всех этих графиков. Итак, что нам известно:
  1. На графиках при достаточном количестве участков появляются пики. Они есть у всех партий — и у партии власти, и у оппозиции.
  2. Пики (или их часть) имеют естественное происхождение. Это никем не оспаривается, разные мнения лишь говорят о разном соотношении «естественных» и «неестественных» пиков.
  3. Фальсификации (добавление случайной величины) даже в незначительных количествах естественные пики убирает. Это следует из графиков Дмитрия Кобака.
И, как я надеюсь, это показал ваш покорный слуга.
Что следует из вышеперечисленного? Вывод из всего этого – декабрьские выборы были честными. Ну, или, чтобы быть совсем точным, возможные фальсификации не превышали десятой процента от общего количества голосов.
Если фальсификации стирают пики и вбросы имели место, то пиков бы мы не увидели, так? Но мы их видим, причем у всех партий. А значит, выборы были честными. Что и требовалось доказать.
Спасибо господам оппозиционерам, что своим упорством заставили разбираться с графиками. Так называемая «гребенка Чурова», которую наши оппозиционеры приводили в качестве доказательства фальсификации выборов, на самом деле доказывает отсутствие массовых вбросов. Я конечно понимаю, что этот вывод может разорвать хомячка похлеще капли никотина, но что поделать, истина дороже.

http://www.vmestepobedim.org/i/hotel...zali-obratnoe/
__________________
Мы из Советского Союза. Прибыли по культурному обмену. Наши знают где мы.
Билли Бонс вне форума   Ответить с цитированием
Ответ

Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Выборы. Украинские хроники: старт клоунов Аспид Украина 251 25.02.2010 19:22
Рубикон 2012. Что дальше? Rage Fury Политические и экономические прогнозы 65 20.01.2010 18:14
Немного о прививках / Статистика Viknova Актуальная угроза 4 10.12.2009 12:17
New Video: Апокалипсис 2012 - Первая часть Viknova Музыка и видео 1 21.10.2009 12:34


Часовой пояс GMT +4, время: 22:59.


Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd. Перевод: zCarot
Template-Modifications by TMS
Яндекс цитирования