Проверка новостей на подлинность: работа с изображениями.

ПРЕДИСЛОВИЕ: Начал писать эти заметки еще в Феврале. Первоначально хотелось все вместить в одну статью, но материала оказалось столько, что мои нервы отказали и я понял - или пишу частями или просто никогда не напишу по причине нехватки времени. Я выбрал второй вариант и мы рассмотрим данную тему порционно (тем более, что дописать первую статью уже пытаюсь полгода :)).

***

В связи с последними событиями в Украине и разгоревшейся информационной войной, довольно остро стала проблема «нахождения уток». Популярными стали подходы написания текстов направленных на эскалацию конфликта и ставка изображений к нему из каких-то событий проходивших не только ранее, но и даже в другой стране. Яркий пример такого материала - статья на российских ресурсах про погромы и мародерство во Львове, изображением к которым стало фото из Прибалтики 2009 года (этот эпический пример черной пропаганды быстро удалили после скандала с разоблачением в январе 2014).

Возникает закономерный вопрос: "Что же с этим делать?".
По запросу «как проверить новость на достоверность» на первую же страницу поисковая система выдаст «батарею» статей в духе «10 инструментов для проверки новости, а не фэйк ли это». При этом везде звучат названия вроде Stopfake.org, fakecontrol.org или профессиональных инструментах вроде Wolfram. Последнему инструменту и его «коллегам» я планирую посвятить подробную статью в ближайшем будущем, сейчас же предлагаю рассмотреть подход, относительно простой и который никто, почему-то, не берет во внимание.

Для начала, давайте вместе немного подумаем, над такими банальными вопросами как:

- что такое контент?

- как распространяется контент?

- как контент публикуется?

Я понимаю, что многие из Вас захотят пропустить эти моменты, но я НАСТОЯТЕЛЬНО СОВЕТУЮ прочитать.

Итак, контент. Википедия говорит, что это содержимое, информационное наполнение сайта, издания. В случае, если мы говорим про графические изображения, контент может распространяться на:

- специализированных сайтах (Пр: фотобанк),

- новостных ресурсах (Пр: Медиапорт, ТСН, Ukr.net),

- блогах, форумах,

- социальных сетях.

Соответственно, у него есть место привязки (или даты первой публикации). Уважающие себя издания ВСЕГДА покупают фотографии и право на эксклюзивное владение ним. В случае же с блогами и форумами - скорее всего на изображение будет вести ссылка (т.к. многие ресурсы такого плана предоставляют только вставку ссылки на изображение).

В таком случае первым шагом по проверке подлинности, будет:

а) установить, на сколько это изображение уникально, какое его количество в интернете. Вы вполне можете найти новости с "абсолютно свежей, эксклюзивной фотографией" 5-7 летней давности на 100+ ресурсах в новостях.

б) просмотреть источники публикации, кто его использовал и когда (видел интересные посты на сайтах, когда новость публиковалась следующим днем).

Для примера проверки возьмем фото c мэром Харькова, Генадием Кернесом.

Забрасываем это изображение в Google Images и проводим поиск по изображению. О том как это делается Google написал целую статью тут.

Фото с Генадием Кернесом в разных размерах встречается 634 раза.

Открыв этот набор, ручным перебором (увы, да), просматриваем источники публикации их дату и тип контента.

Помимо этого, как писалось выше, графическое изображение содержит в себе вшитые данные об авторе, дате создания, чем создавали и на кого зарегистрирован продукт. Зачастую эти данные вшиваются лицензионной копией ПО, которое использовалось для создания изображения. Даже если это был малоизвестный online-редактор все равно будет оставаться определенный след. У Вас вполне может возникнуть резонный вопрос, почему не начать именно с этого? Конечно можно, даже нужно. Однако, тут есть два "НО". Во первых - системы постинга изображений, могут заменять часть информации файла собственной (хотя и в этом случае у нас остается ниточка об источнике публикации, ибо заменяется только часть). Во вторых - если мы ищем не графическую работу добропорядочного пользователя, а проделку конкурентов, скорее всего данные изображения будут вытерты или наоборот - чрезмерно заполнены специфическими тегами.

Пр: вбиваем в Google запрос UI Design Studio и случайным порядком открываем первое что привлекает внимание. В данном случае это сайт basov dessign bureau. Зайдя на страницу работ, произвольным порядком скачиваю изображение:

Работы на этом сайте редко бывают прошиты какими-то тегами, но все же, проверим. Довольно не сложно нажать правой кнопкой мыши на файле, выбрать File/Properties вкладка Details и посмотреть, "кто же это делал?" В свойствах файла видим: название работы, тему, программу в которой это делали и название исполнителя, а также авторские права на работу.

Проведем еще один эксперимент, открыв первую подвернувшуюся страницу Behance, скачиваем вот это изображение:

Проделываем те же манипуляции, но тут видим только название программы.

Следовательно, у файла всегда есть ряд данных дающих понять, кто это делал, но не всегда они оставлены. В этом случае есть определенный инструментарий по восстановлению такой информации, но это уже другая история. Обычный пользователь интернета мало думает про такие вещи и довольно быстро можно напасть на след автора по нику, названию ПК (если поискать), найти его в соц. сетях (по моей личной статистике, в 85% случаев поиска человек находится за интервал от полуминуты до 5 минут, если он не поменял там свое имя или фамилию). Затем посмотреть, а похожа ли его учетная запись на "жизнедеятельность реального человека". Если там пара невнятных фото, какие-то котики и куча "целевого трафика" на определенную тематику - ясно что-то не то. Тем более, что если вбить у Google запрос: "контакт фейковые аккаунты", можно получить такую вот "замечательную страницу", т.е. работать под прикрытием - не проблема.

В случае с невнятными аккаунтами, есть ряд методик по проверке, о которых очень постараюсь написать попозже, т.к. эта тема даже не одной статьи. Самым относительно простым, но долгим, не техническим способом, является подача запроса в органы, с просьбой установить через владельца такой вот услуги по продаже аккаунтов, кто и когда данный аккаунт купил.

Принимая во внимание информацию описанную выше, предлагаю краткую пошаговую инструкцию, что можно сделать по проверке графического контента:

1) Проверить пути распространения изображения применив поиск по изображениям в Google (Google Images). Нам важно понять сколько еще раз это изображение публиковалось, где и когда.

В первую очередь проверяем: а) социальные сети, т.к. скорее всего постинг мог начаться оттуда; б) новостные ресурсы.

2) Проверяем "трастовость" ресурса, кому он принадлежит, где находится, и т.п.

3) Проверить дату публикации. Здесь очень важен фактор времени. При "массовом постинге" вполне можно найти публикации, которые были опубликованы на несколько часов /день-два раньше, чем "все произошло". Это конечно грубый ляп, но такого добра тоже много и "массовый потребитель" новостей редко на такое смотрит.

4) Проверить, какая из сторон первой запустила информацию. Всегда есть определенная опозиция существующему укладу вещей. В связи с вполне существенным может быть понимание того, кто же первым начал.

По итогам проверки, мы уже можем сделать определенные выводы. Скептикам данного метода предлагаю его проверить и поделиться своими впечатлениями. Если у Вас есть замечания, предложения - пишите, постараюсь оперативно дополнить.

ЧТО ПОСМОТРЕТЬ ЕЩЕ:

"Массовая работа". Часть #1. "Окно Овертона" в работе, или как внушить массовому потребителю то, против чего он настроен скептически.

"Массовая работа". Часть #2. Как из группы людей сделать аморфную биомассу.

Поиск по этому блогу

Ramzeit

Проверка новостей на подлинность: работа с изображениями.

Популярные сообщения из этого блога

Как "Харьковские моняки" сокровища старого города искали.

А что для вас значит фраза «Да это же не по-женски!»?

"Массовая работа". Часть #2. Как из группы людей сделать аморфную биомассу.