(no subject)

ТОРЖЕСТВЕННЫЙ КОМПЛЕКТ.

НЕЗАМЕНИМОЕ ПОСОБИЕ ДЛЯ СОЧИНЕНИЯ ТРОГАТЕЛЬНЫХ ВОСПОМИНАНИЙ О ДОНЕЦКЕ И СОКРОВЕННЫХ ОЧЕРКОВ О НЕМ.


Раздел I. Словарь.

Имена собственные:

Дегтярев (любой из)
Александровская урла: Толик, Дядясаша, Витя Кореец
Александровская шпана: Толик, Саня, Косой Витек
Галя
Марк Исаакович
Лазарь Ефимович
Аркадий Пахомович
Петр Ильич
Старухин

Топонимы:

1. Первая Линия (упомянуть обязательно, применить наречие «по старинке»)
2. Бульвар (упомянуть обязательно, название не конкретизировать!)
3. Где-то за Веткой (очень далеко)
4. Паркщербакова (обязательно!)
5. Бутылек (где угодно)
6. Рутченково.
7. №-шахта.
8. Смолянка.
9. Калиновка (Рыковка).
10. Буденновка (Прохоровка, Алексеевка, Пролетарка, Чулковка, Объединенный) – в целом Заперевальная.
11. Пожарка.

12. Ларинка (Ливенка) – любой поселок.
13. Бахмутка (в т.ч. Кальмиус).

Привязки:

Наш-старый-двор.
Посадка (бутылек).

Чебурашка.
Юный Техник.
Уголь-75, Уголь-83.
Давно лежит на Мушкетово ( на Донецком море).

Ставок (за ставок).
Бывший карьер (в бывший карьер).
Кафе «Арктика».

Первый гастроном, (тринадцатый, четырнадцатый, Киев, Ленинград).

Персонажи:


1. Наша Первая Учительница.

2. Старик- шахтер.
3. Сосед по двору.
4. Мой тогдашний руководитель.
5. Галя (другая).

6. Шахтер-кубковый-боец.
7. Обезьяна Яша.

8. Гойко Митич.
9. Друг Витька.

10. Одноклассницы с бантами.
11. Какие-то неизвестные бандиты.
12. Какие-то знакомые бандиты.

Существительные:

1. Глей (террикон, но глей - предпочтительнее).
2. Акация (пыльная).
3. Акация-высотой-с-два-бабушкиных-(дедушкиных)-дома - (не смешивать с акацией пыльной!).
4. Детская железная дорога.
5. Газировка.
6. Гудок.
7. Тополь (не заменять на акацию!).


Прилагательные:


1. Доброе.
2. Еще довоенный.
3. Покосившийся.
4. Крошечные.
5. Тихий (шумный).
6. Заводской (шахтный).
7. Пыльные (да-да, акации).
8. Футбольный.
9. Старый (старенький).
10. Ароматного.
11. Которое никогда уже не вернется.
12. Только-недавно-построенный-казавшийся-мне-тогда-огромным.

13. Доброе.
14. Настоящее (не то, которое теперь называют).

15. Давно ушедшее (прежнее).
16. Глубоко.
17. Вкуснейшее.
18. Любимые.
19. Доброе.

Глаголы:

1. Пылить.
2. Возвращаться (не возвращаться).
3. Забывать (не забывать).
4. Чувствовать.
5. Любить.
6. Выпивать.
7. Успевать.
8. Помнить.
9. Продавать.
10. Выгодно продавать.

Художеств. подробности:

1. Нагретые солнцем.
2. Тополиный пух.
3. Портной (маляр, зубной техник, рыбак) Сталино номер один.
4. Лучший отоларинголог (фтизиатр) области.

Необходимые слова:

1. Навсегда.
2. Никогда.
3. Уже никогда.
4. Никто больше.
5. Разве кто-то еще.
6. Самый любимый в мире.
7. Самый лучший.


Прочие обороты:


1. Где-то приблизительно в десятом классе (уже на втором курсе).
2. Частенько с отцом.
3. Однажды с мамой.
4. Приближались новые времена.
5. Перед самым своим отъездом в Москву (Киев, Хайфу).
6. В свой последний приезд в родной город.
7. Закрыть гештальт.
8. Уже никогда больше не встретить.

9. А какие были у нас на факультете кавээны (на конечной тройки пирожки с ливером, в группе красивые девочки, на заводе отстойники, теплые старые гэдээровские вагоны (подштанники))

10. Любая внезапно точная дата из сугубого и глубочайшего прошлого (пример - 29 апреля 1968 года).
11. Когда мы еще жили все вместе с бабушкой в старом покосившимся домике юзовских времен.


(Междометия, предлоги, союзы, запятые, многоточия, восклицательные знаки, смайлы и т. п.)

Примеч. Запятые по-прежнему ставят перед "что", "который" и "если". Многоточия, восклиц. знаки - где только возможно. Кавычки теперь не применяют.



Раздел II.

Творческая часть (Составляется исключительно из слов раздела 1-го)



Местный орнамент:


1. ГОЛОВА (Пушкин)
2. НЕЛЬСОН (Тарас)
3. БАХМУТКА (любая вода)
4. БУТЫЛЕК (духовная пища)
5. ТОРМОЗОК (пища)
6. СТАВОК (хорошо)
7. МАКЕЕВКА (далеко)
8. ПЕТРОВКА (макеевка)
9. ВИНОГРАДНИК (дача без всякого виноградника на ней)
10. БАРАК (любой тип жилья, которое не нравится любому человеку)

Добавление.
При помощи материалов раздела 1-го по методам раздела 2-го сочиняются также: рассказы, бытовые зарисовки, художественный репортаж, хроника и т. д.

Бельгия запретила Facebook следить за незарегистрированными пользователями

Дата публикации: 10 Ноябрь 2015, 08:18


Бельгийский суд вчера обязал Facebook прекратить слежку за пользователями, которые не зарегистрированы в соцсети. На исполнение судебного решения у руководства соцсети есть 48 часов.

В случае нарушения судебного решения суд оставляет за собой право штрафовать социальную сеть – по 250 тысяч евро/день до исполнения судебного поручения.

В июне бельгийская комиссия по защите неприкосновенности частной жизни подала в суд на социальную сеть Facebook.

Как отмечает комиссия, отслеживание соцсетью поведения как ее членов, так и людей, которые не зарегистрированы в Facebook, нарушает бельгийское и европейское законодательство.

В Facebook полагает, что дело лишено какого-либо смысла.




За нами следят: руководство параноика

Топ веб-сервисов, соцсетей и приложений для слежки за людьми и сбора информации.

Если у вас паранойя, это еще не значит, что за вами не следят. ©

Мы уже не мыслим своей жизни без смартфонов и соцсетей: мы привыкли всегда быть на связи с родными, узнавать новости друзей из статусов в Facebook и по несколько раз в день чекиниться в Foursquare. И нам это нравится: у нас больше нет шансов на скуку или одиночество. Правда, за это нам приходится платить довольно высокую цену, хотя большинство из нас редко об этом задумывается.

«Жучки» и скрытые камеры остались в фильмах про шпионов; сегодня мы сами охотно делимся ценной информацией: о себе, своих близких, своем местонахождении, своем имуществе, своих мыслях, своих интересах... Изучив аккаунты активного пользователя в социальных сетях, вполне можно составить на него довольно полное досье.

Неудивительно, что возможностями социальных сетей и мобильных приложений активно пользуются многие заинтересованные лица: от маркетологов до спецслужб, от hr-специалистов до воров-домушников. Мы составили рейтинг социальных сетей и мобильных приложений для сбора информации о людях. Какими из них пользуетесь вы?
№1 Социальные сети / Facebook

Социальные сети в целом и Facebook в частности — уникальный источник информации. Прежде всего, потому, что количество и активность их пользователей поражают воображение. В случае с Facebook, количество пользователей уже перевалило за 1 млрд человек. А в начале апреля Марк Цукерберг в интервью Wired поделился планами по увеличению базы пользователей Facebook до 5 млрд человек. Одним из способов достижения этой цели станет «социальная оболочка» для смартфонов Facebook Home.

Уже сегодня традиционное мобильное приложение Facebook, по сути, является «самым популярным мобильным браузером», отмечают аналитики Flurry: социальная сеть стала для многих пользователей основной «точкой входа» в интернет. А с выходом Facebook Home отпадет даже необходимость заходить в приложение: Facebook-лента будет всегда под рукой, прямо на экране телефона, даже в режиме блокировки.

Facebook уже давно и безоговорочно лидирует по количеству времени, которое пользователи проводят в соцсети. С выходом Facebook Home этот показатель может вырасти в разы: у современных пользователей смартфон всегда под рукой, а в смартфоне теперь всегда будет Facebook. Похоже, таким вездесущим, как теперь, Facebook еще не был никогда.

Кроме того, ценность Facebook заключается в количестве контактов пользователей и в объемах информации, которой они делятся в соцсети. По некоторым данным, среднее количество друзей у пользователя социальной сети достигает неправдоподобной цифры в 342 человека. Вполне очевидно, что с большинством из них пользователь не поддерживает никакого общения, а может быть, и вовсе никогда не встречался в реальной жизни, но в этом списке, безусловно, присутствуют и родственники, и близкие друзья.

А теперь попробуем проанализировать, что Facebook знает о каждом из нас:

имя, пол, возраст, образование, место работы, номер телефона (информация о пользователе)
с кем мы общаемся в реальной жизни (переписка, комментарии, отметки на фото)
где живем, где бываем, где отдыхаем (чекины, фотографии)
чем интересуемся, о чем думаем (записи, комментарии, подписки на страницы, like и share)
что планируем купить или уже купили (записи, фотографии)
какими товарами и услугами пользуемся (подписки на страницы, записи и комментарии на страницах компаний и брендов)
что мы читаем, слушаем, смотрим (новый функционал Facebook).

И это только верхушка айсберга. Ни для кого не секрет, что Facebook «следит» за нами и за пределами сайта соцсети. По сути, Facebook раскинул сети по всему интернету: на всех сколько-нибудь популярных веб-сайтах сегодня присутствуют виджеты социальной сети.

При этом Facebook отслеживает ваши перемещения по просторам интернета даже тогда, когда вы вышли из своего аккаунта. Как утверждают специалисты, файлы cookies, по которым можно идентифицировать пользователя, при выходе из соцсети не удаляются, а модифицируются. То есть отслеживание действий пользователя продолжается незаметно для него.

№2 Поиск, e-mail и другие ключевые веб-сервисы / Google

По объемам информации о пользователях с Facebook сопоставимы разве что сервисы Google. Если собственная социальная сеть корпорации Google+ пока не смогла приблизиться по популярности к Facebook, то другие сервисы Google уже располагают огромными объемами информации о своих пользователях.

Чего стоит один только почтовый сервис Gmail. Не говоря уже об истории поиска Google; даже если вы не слишком хорошо разбираетесь в рекламных инструментах, вы наверняка замечали, что Google показывает вам рекламные объявления о тех товарах и услугах, которые вы недавно искали с помощью поисковика. Из-за подобных методов корпорация неоднократно подвергалась резкой критике и обвинениям в «слежке» за пользователями.

Количество пользователей Gmail превышает 278 млн человек. В феврале корпорация Microsoft запустила в США масштабную рекламную кампанию, построенную на обвинениях в адрес Google. Как утверждает Microsoft, почтовый сервис Google Gmail нарушет конфиденциальность пользовательских данных: тексты писем используются для таргетирования рекламных сообщений. Устами конкурента глаголет истина?

Впрочем, Google утверждает, что этот процесс полностью автоматизирован, а данные пользователей надежно защищены; в компании не существует сотрудников, которые могут читать личную переписку пользователей. При этом представители корпорации не скрывают, что выдают информацию о своих пользователях по запросам спецслужб.

Стремясь создать и поддерживать имидж прозрачной и открытой компании, Google даже публикует статистику по количеству запросов на раскрытие информации о пользователях, полученных корпорацией. Если верить официальной статистике Google, количество таких запросов неуклонно растет, а вот доля запросов, которые были удовлетворены полностью или частично, напротив, постепенно падает.

№3 Геолокационные мобильные приложения / Foursquare

Foursquare, конечно, не может похвастаться такой огромной аудиторией, как Facebook или Google: количество зарегистрированных пользователей — более 25 млн человек, активная аудитория геолокационного сервиса — около 8 млн человек. Тем не менее, Foursquare незаменим в качестве источника информации о местонахождении и перемещениях людей.

Мы уже привыкли «чекиниться» буквально на каждом шагу, не задумываясь о том, что о нашем текущем местоположении узнают не только друзья. Вспомните, вы когда-нибудь отмечались у себя дома? А в аэропорту, радостно сообщая об отбытии в отпуск на долгие 2 недели? Считайте, что вы опубликовали приглашение для воров-домушников посетить ваше жилище во время отсутствия.

По данным исследования, проведенного в Великобритании в прошлом году, из 50 преступников, осужденных за квартирные кражи, 78% использовали различные социальные сервисы для выбора очередной цели ограбления. Среди них — Foursquare, Facebook, а также панорамы улиц на картах Google Maps.

№ 4 VoIP-сервисы / Skype

Когда-то Skype был одним из немногих каналов голосовой связи, который невозможно было прослушать благодаря различным механизмам шифрования данных. Однако после того, как сервис был приобретен Microsoft, ситуация изменилась. Спецслужбы получили алгоритмы шифровки и дешифровки голосового трафика, а вместе с ними — и возможность прослушивать разговоры по Skype.

Впрочем, у законопослушных граждан нет повода задумываться о прослушивании разговоров по Skype спецслужбами, а подозревать сервис в использовании данных пользователей каким-либо другим способом пока не приходилось. Правда, рекламная платформа Skype уже на подходе: рекламные объявления будут таргетироваться по ключевым словам из чата.

Исключением из общего правила является Китай: в китайскую версию Skype встроена программа, которая отслеживает упоминания ключевых слов и отправляет эту информацию, вероятно, спецслужбам. Среди таких слов, к примеру, Тяньаньмэнь (площадь, где в 1989 была подавлена протестная акция) и названия правозащитных организаций.

№ 5 Фото- и видеохостинги / YouTube и Instagram

Казалось бы, ну что интересного можно найти на фото- и видеохостингах, помимо хипстерских луков, котиков, вирусных роликов... Но, как выясняется, фото- и видео-контент вполне может использоваться как лакмусовая бумажка: уже сейчас, задним числом, мы узнаем, что Тамерлан Царнаев размещал видеоролики экстремистского содержания на YouTube, а Джохару Царнаеву нравились в Instagram фотографии террориста Шамиля Басаева.

СМИ сообщают, что Царнаев-старший выкладывал на YouTube ролики чеченского барда Тимура Мацураева, чьи песни запрещены в России как экстремистские (одна из песен называлась «Посвятим наши жизни джихаду»), а также видеоотчеты о проведенных акциях боевиков в Дагестане в категории «Террористы» (эти ролики были удалены модераторами YouTube).

В свою очередь, Царнаев-младший ставил отметки «нравится» под фотографиями с названиями вроде «Свободная Чечня» и «Джихад», а также под фотографиями ликвидированного чеченского террориста Шамиля Басаева. (Аккаунт Джохара Царнаева в Instagram был удален незадолго до бостонского теракта, однако специалистам удалось частично восстановить его данные).
А также: Новые технологии / Ingress

Новые технологии открывают новые возможности по сбору информации. Ingress — массовая многопользовательская онлайн-игра для Android-устройств с привязкой к местности и с элементами дополненной реальности, новый проект дочерней компании Google Niantic Labs. Считается, что основной целью запуска проекта Ingress является совершенствование алгоритмов пешей навигации для карт Google Maps.

Суть мобильной игры заключается в перемещениях по местности в поиске игровых объектов дополненной реальности — «энергии» — для захвата «порталов», которые, как правило, привязаны к каким-либо достопримечательностям. В ходе игры участникам также приходится разгадывать довольно сложные загадки, выполняя игровые задания.

Ключевым отличием Ingress от других игр является необходимость физического присутствия игрока в заданной точке на местности. В борьбе за виртуальный контроль за городом игроки должны регулярно посещать одни и те же места. Маршруты перемещения игроков отслеживаются с помощью средств спутниковой навигации; информация о местоположении игроков непрерывно передается на сервера Google. Кроме того, для создания «портала» необходимо отправить фотографию соответствующей точки.

Все вышесказанное дало повод снова говорить о «слежке» за пользователями, причем на этот раз — за гражданами других государств на их собственной территории. По словам представителей Google, уже в предварительном тестировании игры участововали пользователи из России. По данным ПИР-Центра, Ingress-сообщество Москвы сегодня оценивается в 1500-2000 игроков, из которых регулярную активность проявляет несколько сотен.

Все дело в том, что Ingress все еще находится в стадии закрытого бета-тестирования и присоединиться к игре можно только по индивидуальному приглашению, которое довольно сложно получить. Такая закрытость проекта обеспечивает некую элитарность игры и дает пищу для домыслов о попытках «вычленения технически грамотного креативного класса».

Не будем утверждать, что эти предположения имеют под собой основание, но нельзя не признать: с появлением сервисов и приложений с использованием новых технологий, таких как мобильные игры с элементами дополненной реальности, возможностей для слежки за каждым из нас будет становиться все больше.

(no subject)

Не исключено, что программа АНБ SKYNET убивает тысячи невинных людей (Ars Technica, США)

В 2014 году бывший директор ЦРУ и АНБ объявил: «Мы убиваем людей, основываясь на метаданных». Сейчас, проведя новый анализ ранее опубликованных документов Сноудена, можно сделать вывод о том, что многие из этих людей ни в чем не повинны.

В прошлом году издание The Intercept опубликовало документы, в которых излагаются подробности программы АНБ SKYNET. Согласно этим документам, SKYNET осуществляет обширную слежку в сети сотовой связи Пакистана, а затем при помощи алгоритма машинного обучения по метаданным этой сети на 55 миллионов человек пытается оценить, насколько вероятна причастность того или иного человека к террористической деятельности.

Специалист по обработке данных Патрик Болл (Patrick Ball), работающий директором по исследовательской работе в неправительственной Группе анализа данных по правам человека (Human Rights Data Analysis Group) и не раз дававший экспертные показания в судах по военным преступлениям, назвал методы АНБ «абсурдно оптимистичными», а также «полным дерьмом». Изъян состоит в том, методы АНБ по обучению этого алгоритма SKYNET анализу сотовых метаданных делают результаты ошибочными с научной точки зрения.

С 2004 году в результате ударов беспилотников в Пакистане погибли от 2 500 до четырех тысяч человек, причем большинство из них было занесено американским правительством в категорию «экстремистов», о чем сообщает Бюро следственной журналистики (Bureau of Investigative Journalism). Эта программа машинного обучения находится в стадии разработки и развития с 2007 года, если судить по дате классификации «20070108», которую можно увидеть на одном из слайдов SKYNET (сами слайды датируются примерно 2011-2012 годом).

За это время из-за такого научно необоснованного алгоритма тысячи невинных людей в Пакистане могли по ошибке попасть в категорию террористов, что не исключает их преждевременной гибели от ударов дронов.

Сладкозвучная песнь больших данных

SKYNET работает как обычное современное коммерческое приложение больших данных. Программа собирает метаданные и хранит их на облачных серверах АНБ, извлекая необходимую информацию, а затем при помощи машинного обучения выявляя наводки и подсказки для проведения целенаправленной кампании. Но вместо того, чтобы что-то продавать с учетом внимания американского правительства к Пакистану, в ходе этой кампании могут задействоваться другие институты государственной власти, такие, как ЦРУ и армия, которые в рамках своей стратегии Find-Fix-Finish (найти, зафиксировать, устранить) используют беспилотники Predator и наземные группы ликвидаторов.

Кроме обработки данных о звонках с мобильных телефонов (это так называемые «данные опознавания набранных номеров» (DNR), такие, как время звонка, его продолжительность, личности абонентов), SKYNET собирает информацию о местонахождении пользователя, что позволяет создавать подробные графики и схемы его поездок. Если телефон отключается, это считается попыткой уйти от массовой слежки, и такие люди заносятся в категорию подозрительных. Те пользователи, которые меняют SIM-карты, наивно полагая, что это помешает слежке, также помечаются особым образом (за телефонами можно следить по электронным серийным номерам и идентификаторам типа ESN/MEID/IMEI, вне зависимости от того, какую SIM-карту ты используешь).

В презентации АНБ говорится, что даже смена телефона фиксируется, и сменивший его человек получает особую метку. Мы можем лишь строить предположения (поскольку в презентации это детально не указано), но такая фиксация может осуществляться, исходя из того, что прочие метаданные, такие, как местонахождение пользователя в реальном мире и в социальных сетях, остаются без изменений.

Имея полный комплект метаданных, SKYNET методом анализа вычисляет распорядок дня человека и его повседневные занятия — с кем он вместе ездит, с кем обменивается контактными данными, у кого останавливается на ночь, какие страны посещает, или куда переезжает на постоянное место жительства. В целом, как показывают слайды презентации, в алгоритме машинного обучения АНБ используется более 80 различных характеристик для определения «террористичности» объекта слежки.

Как говорят нам слайды, эта программа основана на исходной посылке о том, что поведение террористов существенно отличается от поведения обычных граждан по некоторым из этих 80-ти показателей. Но как показал в прошлом году разоблачительный материал The Intercept, согласно этой программе, самым подозрительным в рамках таких характеристик оказался Ахмад Зейдан (Ahmad Zaidan), долгое время работающий шефом бюро Al-Jazeera в Исламабаде.

Как сообщил The Intercept, Зейдан часто ездит в районы активной террористической деятельности, чтобы брать интервью у боевиков и готовить информационные материалы для новостей. Но вместо того, чтобы усомниться в выдавшем столь странный результат алгоритме машинного обучения, разработавшие его инженеры из АНБ в своей презентации для служебного пользования громко раструбили, что Зейдан — это яркий пример успеха SKYNET. А на одном из слайдов они даже назвали его членом «Аль-Каиды».

Обучая машину

Обучение машинного алгоритма подобно обучению байесовской фильтрации спама: туда подается заведомо известный спам и заведомо известный «чистый» материал. На основе этих контрольных данных алгоритм учится правильно отфильтровывать спам.

Точно так же важнейшая составляющая программы SKYNET — это подача в алгоритм данных о «известных террористах», чтобы научить его фиксировать похожие наборы данных.

Но проблема заключается в том, что «известных террористов» мало для обучения алгоритма, а реальные террористы вряд ли станут заполнять гипотетические анкеты АНБ, чтобы помочь в обучении. Служебные документы АНБ показывают, что SKYNET в качестве контрольных использует данные об «известных курьерах», и по умолчанию исходит из того, что остальные люди ни в чем не виновны.

В Пакистане живет примерно 192 миллиона человек, и по состоянию на конец 2012 года, когда была сделана презентация АНБ, у них было около 120 миллионов сотовых телефонов. АНБ проанализировало 55 миллионов записей с этих мобильных устройств. Умножаем 80 характеристик на 55 миллионов пакистанских абонентов сотовой связи, и понимаем, что данных явно слишком много, и разобраться в них вручную невозможно. Поэтому АНБ прибегает к помощи машинного обучения, как в любом приложении больших данных, заменяя алгоритмом человеческий разум и здравый смысл.

Классификационный алгоритм SKYNET анализирует метаданные и контрольные данные, а затем выдает счет очков по каждому человеку на основании его метаданных. Цель заключается в том, чтобы дать наивысшее количество баллов настоящим террористам и минимальное — мирному населению.

Для этого в алгоритме SKYNET используется алгоритм случайного леса, часто применяемый в такого рода приложениях больших данных. Надо сказать, что Управление правительственной связи Великобритании скорее всего использует аналогичные методы машинного обучения, о чем свидетельствуют новые документы Сноудена, опубликованные на прошлой неделе. «Похоже, методом отбора в машинном обучении является случайный лес», — написал в своем анализе опубликованных документов адъюнкт-профессор Университетского колледжа Лондона Джордж Дейнезис (George Danezis), специализирующийся на вопросах безопасности и конфиденциальности информации.

В методе случайного леса используются случайные подпространства учебных данных, чтобы создавать «лес» из «решающих деревьев». Затем выводятся средние показатели по прогнозам отдельных деревьев, после чего они комбинируются. Алгоритм SKYNET берет 80 характеристик каждого сотового пользователя и назначает им шкалы баллов — как в фильтре спама.

После этого SKYNET отбирает пороговое значение, и превышающий его пользователь попадает в категорию «террорист». На слайдах представлены результаты анализа, когда порог установлен на 50% ложно негативных заключений. При таком показателе половина людей, которых следует считать «террористами», заносятся вместо этого в категорию невиновных, дабы количество ложно позитивных заключений (это когда невиновного относят к террористам) было как можно меньше.

Ложно позитивные

Безусловно, мы не можем быть уверены в том, что выбранный для презентации показатель в 50% ложно негативных заключений — это тот самый порог, на основе которого составляются расстрельные списки. Но так или иначе, остается нерешенной проблема: что делать с ложно позитивными невиновными людьми?

«Они делают это, — объясняет Болл, — потому что чем меньше у них ложно негативных заключений, тем больше ложно позитивных. Здесь нет симметрии: истинно негативных заключений так много, что понижая порог для уменьшения ложно негативных заключений на 1, мы признаем появление многих тысяч дополнительных ложно позитивных заключений. Так и принимается решение».

На одном из слайдов хвастливо заявлено: «Статистические алгоритмы способны находить курьеров при очень низком показателе ложных тревог, если нам будет позволено пропускать половину из них».

Но насколько низок этот «очень низкий показатель»?

«Полное дерьмо»

Проблема состоит в том, говорит Болл, как АНБ обучает алгоритм при помощи контрольных данных.

АНБ оценивает программу SKYNET, используя подмножество из 100 тысяч случайно отобранных людей (их определяют по паре MSIDN/MSI /сопоставленный SIM-карте телефонный номер абонента / идентификатор мобильной станции/ на их мобильных телефонах) и известную группу из семи террористов. Затем АНБ обучает алгоритм, вводя туда данные о шести террористах и ставя SKYNET задачу найти седьмого. Эти данные дают проценты по ложно позитивным заключениям.

«Во-первых, в мире очень мало „известных террористов“, чтобы использовать их для обучения и проверки модели, — сказал Болл. — Если они используют одни и те же записи для обучения модели и для ее тестирования, их оценка соответствия превращается в полное дерьмо. Обычная практика состоит в том, чтобы не включать часть данных в процесс обучения, и тогда в проверку можно будет включить записи, которые модель никогда прежде не видела. Без такой меры их оценка совпадения по классификационным признакам будет абсурдно оптимистичной».

Все дело в том, что 100 тысяч граждан отобраны случайно, а семеро террористов взяты из известного кластера. При случайном отборе крошечного подмножества, составляющего менее 0,1% от всего населения, плотность социального графа граждан очень сильно снижается, а «террористический» кластер остается тесно взаимосвязанным. Чтобы статистический анализ был научно обоснованным, АНБ должно включать террористов в население до случайного отбора подмножества. А это непрактично из-за их ничтожного количества.

Это может показаться чисто научной проблемой, однако, по словам Болла, в действительности это очень сильно сказывается на качестве результатов, а тем самым, на точности классификации и выявлении «террористов» для их последующей ликвидации. В данном случае качество оценки особенно важно, так как известно, что метод случайного леса переучивает обучающие множества, давая неоправданно оптимистичные результаты. Таким образом, анализ АНБ не является четким индикатором качества данного метода.

Если 50% ложно негативных, то есть реальных «террористов» позволить жить, ложно позитивный показатель АНБ в 0,18% все равно будет означать тысячи невинных людей, которых ошибочно заносят в разряд «террористов» и могут убить. Даже самый оптимистичный результат АНБ, а это 0,008% ложно позитивных заключений, все равно приведет к гибели многих мирных граждан.

«На слайде с показателями ложно позитивных заключений следует отметить последнюю строчку. Так говорится: »+ привязочный отбор«, — рассказал Дейнезис. — Это ключевой момент, и об этих цифрах не сообщается… если применить классификатор с ложно позитивным показателем 0,18% к населению 55 миллионов человек, мы наверняка убьем тысячи ни в чем не повинных людей. [0,18% от 55 миллионов = 99 тысяч человек.] А если применять его к населению, где мы и без того уже ждем высоких показателей по «терроризму», потому что эти люди, скажем, живут в двух шагах от интересующих нас личностей, то априорная вероятность вырастет, и мы убьем еще больше невиновных«.

Существуют вполне очевидные возражения по поводу того, какой показатель убийства невинных людей допустим. Но здесь также возникает исходная посылка о том, что террористов много. «Мы знаем, что доля „настоящих террористов“ в соотношении с общей численностью населения очень мала, — отметил Болл. — Как говорит Кори Доктороу (Cory Doctorow) (канадский писатель, журналист и философ — прим. пер.), если бы это было не так, то мы все сегодня были бы уже мертвы. Следовательно, низкий показатель ложно позитивных заключений ведет к ошибкам в идентификации людей в качестве террористов».

«Есть еще более важный момент, — добавил Болл. — В этой модели мы полностью упускаем из виду тех „настоящих террористов“, которые статистически отличаются от других „настоящих террористов“, используемых для обучения модели».

В большинстве случаев показатель ошибок в 0,008% значит очень много…

В обычном коммерческом приложении показатель ложно позитивных заключений в 0,008%это ничтожно мало. Это вполне приемлемо, так как следствием здесь станет то, что рекламу покажут не тому человеку, или с кого-то по ошибке возьмут больше денег. Однако 0,008% населения Пакистана это 15 тысяч человек, и эти люди могут быть по ошибке занесены в разряд «террористов», а следовательно, по ним могут нанести удар военные. И это не говоря уже о жертвах среди невинных посторонних лиц, которые могут оказаться поблизости.

С этим согласен авторитетный специалист по безопасности Брюс Шнейер (Bruce Schneier). «Государство использует большие данные совсем не так, как корпорации, — говорит он. — Потребность в точности указывает на то, что та же самая технология здесь не работает. Если ошибку сделает Google, люди увидят рекламу машины, которую они не хотят покупать. Если ошибку сделает государство, оно убьет ни в чем не повинных людей».

Убивать гражданское население запрещает Женевская конвенция, которую подписали Соединенные Штаты. Но многие факты, касающиеся программы SKYNET, остаются неизвестными. Например, является ли SKYNET замкнутой системой, работающей без вмешательства человека, или аналитики просматривают профиль каждого абонента сотовой связи, прежде чем приговорить его к смерти на основе метаданных? Предпринимаются ли попытки схватить подозреваемых в терроризме и привлечь их к суду? Как американское правительство может быть уверено в том, что оно не убивает невиновных, если в алгоритме машинного обучения, готовящем данные для расстрельных списков, есть очевидные изъяны?

«Вопрос о том, является ли использование SKYNET военным преступлением, я адресую юристам — сказал Болл. — Это ненаучно, я в этом чертовски уверен, потому что такая классификация изначально является вероятностной. Если ты собираешься осудить кого-то на смерть, то здесь необходимо применять стандарт „без доли обоснованного сомнения“. Но когда мы ведем речь о пороговых значениях, баллах и „вероятных террористах“, этот стандарт не соблюдается абсолютно. При этом у меня вызывает сомнение даже то, что классификатор вообще работает, так как у нас просто нет достаточного количества известных террористов, чтобы правильно строить на них модель случайного леса».

Утечки информации из АНБ наглядно свидетельствуют о том, что на тысячи невинных людей навешены ярлыки террористов, и мы не знаем, что происходит потом. У нас нет полной картины, а АНБ вряд ли станет заполнять ради нас пробелы. (Мы неоднократно обращались в агентство за комментариями по этим вопросам, однако не получили оттуда ответа.)

Нашими жизнями все чаще управляют алгоритмы. Логику SKYNET, применяемую для поиска террористов в Пакистане, легко можно перенести внутрь нашей страны, чтобы искать «наркоторговцев», «протестующих» или просто тех, кто не согласен с государством. Убийства людей на основе метаданных можно легко и просто игнорировать, когда они совершаются очень далеко и в чужой стране. Но что будет, когда SKYNET применят против нас — если это уже не произошло?

Две кровавые единицы

Поздний вечер. Я бреду привычным путем к автостанции "Центр". Подходя к вокзалу, увидел толпы людей, пытающихся вернуться поскорей домой. Придется пробиваться сквозь уставший народ. Как путешественник в тропических джунглях, я пробираюсь сквозь очереди. Нужный мне маршрут находится в конце вокзала, поэтому усилий приложить пришлось достаточно, но я всё-таки добрался до своего автобуса. Зашел в него. Сел на свободное место у окна и закрыл глаза. Ещё один тяжелый день остался позади. Музыка в наушниках убаюкивала меня.

Автобус тронулся. Я открыл глаза и увидел скопившихся работяг на станции в ожидании транспорта, который доставит их к домашнему очагу. Сейчас на автостанции человек триста. Мы проезжаем мимо первой станции. У меня перед глазами стало страшное число - две окровавленные, обожженные, прошитые острыми осколками 120мм мины единицы- 11. Речь идёт о теракте на АС Центр в Донецке.



Collapse )

Оригинал: http://dnr-pravda.ru/2016/02/11/dve-krovavye-edinicy-2/

(no subject)

«КАКАЯ ЦЕЛОСТНОСТЬ? О ЧЁМ ВЫ?»

КАКАЯ ЦЕЛОСТНОСТЬ? О ЧЁМ ВЫ?
РУЧКАТЬСЯ С ТЕМИ, КТО ВЧЕРА
СТРЕЛЯЛ В ТВОИХ ДЕТЕЙ БЕЗБОЖНО?
ВЫ ИДИОТЫ? ГОСПОДА.

ЗАКРЫТЬ ГЛАЗА, ЗАБЫТЬ, ДА ПЛЮНУТЬ?
ПОГИБШИХ ПАМЯТЬ РАСТОПТАТЬ?
О ЧЁМ ТЫ КИЕВ? ПРЕЖДЕ ДУМАЙ,
ПРЕД ТЕМ, КАК ЧТО-НИБУДЬ СКАЗАТЬ.

ПРОДАЖНЫЙ, СРАНЫЙ ГОРОДИШКА,
НЕ МАТЬ ТЫ РУССКИХ ГОРОДОВ.
ЦЕЛУЕШЬ ПЁС САПОГ ФАШИСТСКИЙ,
НЕ МОЖЕШЬ ВЫПЕРЕТЬ ЖИДОВ.

НО РАЗ, УЖ, ВЫПАЛ ТАКОЙ СЛУЧАЙ,
СОВЕТ ВАМ ДАТЬ ХОЧУ ДАВНО:
ВЫ СОБИРАЙТЕ ДЕНЬГИ ЛУЧШЕ
НА ВАЗЕЛИН, А НЕ АТО.

/С.Яшакин/

(no subject)

Намечается новая драка,
Перерезана пуповина.
На соседском заборе – собака,
А вернее – ее половина.

По поселку стреляют с востока,
Вновь на прочность проходим проверку.
На оборванной линии с током
Провода коротят фейерверком.

Снова эти ужасные «бахи»,
Приносящие страшное горе.
И кишки половины собаки
На соседском красивом заборе...

Слышал здесь я и правду и враки,
Видел здесь и Христа и Иуду,
Но глаза половины собаки,
Я навряд ли когда-то забуду...