Проверка новостей на подлинность: работа с изображениями.


ПРЕДИСЛОВИЕ: Начал писать эти заметки еще в Феврале. Первоначально хотелось все вместить в одну статью, но материала оказалось столько, что мои нервы отказали и я понял - или пишу частями или просто никогда не напишу по причине нехватки времени. Я выбрал второй вариант и мы рассмотрим данную тему порционно (тем более, что дописать первую статью уже пытаюсь полгода :)). 

***

В связи с последними событиями в Украине и разгоревшейся информационной войной, довольно остро стала проблема «нахождения уток». Популярными стали подходы написания текстов направленных на эскалацию конфликта и ставка изображений к нему из каких-то событий проходивших не только ранее, но и даже в другой стране. Яркий пример такого материала - статья на российских ресурсах про погромы и мародерство во Львове, изображением к которым стало фото из Прибалтики 2009 года (этот эпический пример  черной пропаганды быстро удалили после скандала с разоблачением в январе  2014).


Возникает закономерный вопрос: "Что же с этим делать?". 
По запросу «как проверить новость на достоверность» на первую же страницу поисковая система выдаст «батарею» статей в духе «10 инструментов для проверки новости, а не фэйк ли это». При этом везде звучат названия вроде Stopfake.org, fakecontrol.org или профессиональных инструментах вроде Wolfram. Последнему инструменту и его «коллегам» я планирую посвятить подробную статью в ближайшем будущем, сейчас же предлагаю рассмотреть подход, относительно простой и который никто, почему-то, не берет во внимание. 


Для начала, давайте вместе немного подумаем, над такими банальными вопросами как:
- что такое контент?
-  как распространяется контент?
-  как контент публикуется? 
Я понимаю, что многие из Вас захотят пропустить эти моменты, но я НАСТОЯТЕЛЬНО СОВЕТУЮ прочитать. 
Итак, контент. Википедия говорит, что это содержимое, информационное наполнение сайта, издания. В случае, если мы говорим про графические изображения, контент может распространяться на:
- специализированных сайтах (Пр: фотобанк),
- новостных ресурсах  (Пр: Медиапорт, ТСН, Ukr.net),
- блогах, форумах,
- социальных сетях. 
Соответственно,  у него есть место привязки (или даты первой публикации). Уважающие себя издания ВСЕГДА покупают фотографии и право на эксклюзивное владение ним. В случае же с блогами и форумами  - скорее всего на изображение будет вести ссылка (т.к. многие ресурсы такого плана предоставляют только вставку ссылки на изображение).

В таком случае первым шагом по проверке подлинности, будет:
а) установить, на сколько это изображение уникально, какое его количество в интернете. Вы вполне можете найти новости с "абсолютно свежей, эксклюзивной фотографией" 5-7 летней давности на 100+ ресурсах в новостях.
б) просмотреть источники публикации, кто его использовал и когда (видел интересные посты на сайтах, когда новость публиковалась следующим днем).

Для примера проверки возьмем фото c мэром Харькова, Генадием Кернесом. 



Забрасываем это изображение в Google Images и проводим поиск по изображению. О том как это делается Google написал целую статью тут.

Фото с Генадием Кернесом в разных размерах встречается  634 раза.


Открыв этот набор, ручным перебором (увы, да), просматриваем источники публикации их дату и тип контента.

Помимо этого, как писалось выше, графическое изображение содержит в себе вшитые данные об авторе, дате создания, чем создавали и на кого зарегистрирован продукт.  Зачастую эти данные вшиваются лицензионной копией ПО, которое использовалось для создания изображения. Даже если это был малоизвестный online-редактор все равно будет оставаться определенный след. У Вас вполне может возникнуть резонный вопрос, почему не начать именно с этого? Конечно можно, даже нужно. Однако, тут есть два "НО". Во первых -  системы постинга изображений, могут заменять часть информации файла собственной (хотя и в этом случае у нас остается ниточка об источнике публикации, ибо заменяется только часть). Во вторых - если мы ищем не графическую работу добропорядочного пользователя, а проделку конкурентов, скорее всего данные изображения будут вытерты или наоборот -  чрезмерно заполнены специфическими тегами.

Пр: вбиваем в Google запрос UI Design Studio и случайным порядком открываем первое что привлекает внимание. В данном случае это сайт basov dessign bureau.  Зайдя на страницу работ, произвольным порядком скачиваю изображение:



Работы на этом сайте редко бывают прошиты какими-то тегами, но все же, проверим. Довольно не сложно нажать правой кнопкой  мыши на файле, выбрать File/Properties вкладка Details и посмотреть, "кто же это делал?" В свойствах файла видим: название работы, тему, программу в которой это делали и название исполнителя, а также  авторские права на работу.



Проведем еще один эксперимент, открыв первую подвернувшуюся страницу Behance, скачиваем вот это изображение:

Проделываем те же манипуляции, но тут видим только название программы.

Следовательно, у файла всегда есть ряд данных дающих понять, кто это делал, но не всегда они оставлены. В этом случае есть определенный инструментарий по восстановлению такой информации, но это уже другая история.  Обычный пользователь интернета мало думает про такие вещи и довольно быстро можно напасть на след автора по нику, названию ПК (если поискать), найти его в соц. сетях (по моей личной статистике, в 85% случаев поиска человек находится за интервал от полуминуты до 5 минут, если он не поменял там свое имя или фамилию). Затем посмотреть, а похожа ли его учетная запись на "жизнедеятельность реального человека". Если там пара невнятных фото, какие-то котики и куча "целевого трафика" на определенную тематику - ясно что-то не то. Тем более, что если вбить у Google запрос: "контакт фейковые аккаунты", можно получить такую вот "замечательную страницу", т.е. работать под прикрытием - не проблема. 



В случае с невнятными аккаунтами, есть ряд методик по проверке, о которых очень постараюсь написать попозже, т.к. эта тема даже не одной статьи. Самым относительно простым, но долгим, не техническим способом, является подача запроса в органы, с просьбой установить через владельца такой вот услуги по продаже аккаунтов, кто и когда данный аккаунт купил. 

Принимая во внимание информацию описанную выше, предлагаю краткую пошаговую инструкцию,  что можно сделать по проверке графического контента:
1) Проверить пути распространения изображения применив поиск по изображениям в Google (Google Images). Нам важно понять сколько еще раз это изображение публиковалось, где и когда. 
В первую очередь проверяем: а) социальные сети, т.к. скорее всего постинг мог начаться оттуда; б) новостные ресурсы.
2) Проверяем "трастовость" ресурса, кому он принадлежит, где находится, и т.п. 
3) Проверить дату публикации. Здесь очень важен фактор времени. При "массовом постинге"  вполне можно найти публикации, которые были опубликованы на несколько часов /день-два раньше, чем "все произошло". Это конечно грубый ляп, но такого добра тоже много и "массовый потребитель" новостей редко на такое смотрит. 
4) Проверить, какая из сторон первой запустила информацию. Всегда есть определенная опозиция существующему укладу вещей. В связи с вполне существенным может быть понимание того,  кто же первым начал. 

По итогам проверки, мы уже можем сделать определенные выводы. Скептикам данного метода предлагаю его проверить и поделиться своими впечатлениями. Если у Вас есть замечания, предложения  - пишите, постараюсь оперативно дополнить. 


ЧТО ПОСМОТРЕТЬ ЕЩЕ:



Популярные сообщения из этого блога

"Массовая работа". Часть #2. Как из группы людей сделать аморфную биомассу.

А что для вас значит фраза «Да это же не по-женски!»?