Проверка новостей на подлинность: работа с изображениями.
ПРЕДИСЛОВИЕ: Начал писать эти заметки еще в Феврале. Первоначально хотелось все вместить в одну статью, но материала оказалось столько, что мои нервы отказали и я понял - или пишу частями или просто никогда не напишу по причине нехватки времени. Я выбрал второй вариант и мы рассмотрим данную тему порционно (тем более, что дописать первую статью уже пытаюсь полгода :)).
***
В связи с последними событиями в Украине и разгоревшейся информационной войной, довольно остро стала проблема «нахождения уток». Популярными стали подходы написания текстов направленных на эскалацию конфликта и ставка изображений к нему из каких-то событий проходивших не только ранее, но и даже в другой стране. Яркий пример такого материала - статья на российских ресурсах про погромы и мародерство во Львове, изображением к которым стало фото из Прибалтики 2009 года (этот эпический пример черной пропаганды быстро удалили после скандала с разоблачением в январе 2014).
Возникает закономерный вопрос: "Что же с этим делать?".
По запросу «как проверить новость на достоверность» на первую же страницу поисковая система выдаст «батарею» статей в духе «10 инструментов для проверки новости, а не фэйк ли это». При этом везде звучат названия вроде Stopfake.org, fakecontrol.org или профессиональных инструментах вроде Wolfram. Последнему инструменту и его «коллегам» я планирую посвятить подробную статью в ближайшем будущем, сейчас же предлагаю рассмотреть подход, относительно простой и который никто, почему-то, не берет во внимание.
По запросу «как проверить новость на достоверность» на первую же страницу поисковая система выдаст «батарею» статей в духе «10 инструментов для проверки новости, а не фэйк ли это». При этом везде звучат названия вроде Stopfake.org, fakecontrol.org или профессиональных инструментах вроде Wolfram. Последнему инструменту и его «коллегам» я планирую посвятить подробную статью в ближайшем будущем, сейчас же предлагаю рассмотреть подход, относительно простой и который никто, почему-то, не берет во внимание.
Для начала, давайте вместе немного подумаем, над такими банальными вопросами как:
- что такое контент?
- как распространяется контент?
- как контент публикуется?
Я понимаю, что многие из Вас захотят пропустить эти моменты, но я НАСТОЯТЕЛЬНО СОВЕТУЮ прочитать.
Итак, контент. Википедия говорит, что это содержимое, информационное наполнение сайта, издания. В случае, если мы говорим про графические изображения, контент может распространяться на:
- специализированных сайтах (Пр: фотобанк),
- новостных ресурсах (Пр: Медиапорт, ТСН, Ukr.net),
- блогах, форумах,
- социальных сетях.
Соответственно, у него есть место привязки (или даты первой публикации). Уважающие себя издания ВСЕГДА покупают фотографии и право на эксклюзивное владение ним. В случае же с блогами и форумами - скорее всего на изображение будет вести ссылка (т.к. многие ресурсы такого плана предоставляют только вставку ссылки на изображение).
В таком случае первым шагом по проверке подлинности, будет:
а) установить, на сколько это изображение уникально, какое его количество в интернете. Вы вполне можете найти новости с "абсолютно свежей, эксклюзивной фотографией" 5-7 летней давности на 100+ ресурсах в новостях.
б) просмотреть источники публикации, кто его использовал и когда (видел интересные посты на сайтах, когда новость публиковалась следующим днем).
Для примера проверки возьмем фото c мэром Харькова, Генадием Кернесом.
Забрасываем это изображение в Google Images и проводим поиск по изображению. О том как это делается Google написал целую статью тут.
Фото с Генадием Кернесом в разных размерах встречается 634 раза.
Открыв этот набор, ручным перебором (увы, да), просматриваем источники публикации их дату и тип контента.
Пр: вбиваем в Google запрос UI Design Studio и случайным порядком открываем первое что привлекает внимание. В данном случае это сайт basov dessign bureau. Зайдя на страницу работ, произвольным порядком скачиваю изображение:
Работы на этом сайте редко бывают прошиты какими-то тегами, но все же, проверим. Довольно не сложно нажать правой кнопкой мыши на файле, выбрать File/Properties вкладка Details и посмотреть, "кто же это делал?" В свойствах файла видим: название работы, тему, программу в которой это делали и название исполнителя, а также авторские права на работу.
Проведем еще один эксперимент, открыв первую подвернувшуюся страницу Behance, скачиваем вот это изображение:
Проделываем те же манипуляции, но тут видим только название программы.
Следовательно, у файла всегда есть ряд данных дающих понять, кто это делал, но не всегда они оставлены. В этом случае есть определенный инструментарий по восстановлению такой информации, но это уже другая история. Обычный пользователь интернета мало думает про такие вещи и довольно быстро можно напасть на след автора по нику, названию ПК (если поискать), найти его в соц. сетях (по моей личной статистике, в 85% случаев поиска человек находится за интервал от полуминуты до 5 минут, если он не поменял там свое имя или фамилию). Затем посмотреть, а похожа ли его учетная запись на "жизнедеятельность реального человека". Если там пара невнятных фото, какие-то котики и куча "целевого трафика" на определенную тематику - ясно что-то не то. Тем более, что если вбить у Google запрос: "контакт фейковые аккаунты", можно получить такую вот "замечательную страницу", т.е. работать под прикрытием - не проблема.
В случае с невнятными аккаунтами, есть ряд методик по проверке, о которых очень постараюсь написать попозже, т.к. эта тема даже не одной статьи. Самым относительно простым, но долгим, не техническим способом, является подача запроса в органы, с просьбой установить через владельца такой вот услуги по продаже аккаунтов, кто и когда данный аккаунт купил.
Принимая во внимание информацию описанную выше, предлагаю краткую пошаговую инструкцию, что можно сделать по проверке графического контента:
1) Проверить пути распространения изображения применив поиск по изображениям в Google (Google Images). Нам важно понять сколько еще раз это изображение публиковалось, где и когда.
В первую очередь проверяем: а) социальные сети, т.к. скорее всего постинг мог начаться оттуда; б) новостные ресурсы.
2) Проверяем "трастовость" ресурса, кому он принадлежит, где находится, и т.п.
3) Проверить дату публикации. Здесь очень важен фактор времени. При "массовом постинге" вполне можно найти публикации, которые были опубликованы на несколько часов /день-два раньше, чем "все произошло". Это конечно грубый ляп, но такого добра тоже много и "массовый потребитель" новостей редко на такое смотрит.
4) Проверить, какая из сторон первой запустила информацию. Всегда есть определенная опозиция существующему укладу вещей. В связи с вполне существенным может быть понимание того, кто же первым начал.
По итогам проверки, мы уже можем сделать определенные выводы. Скептикам данного метода предлагаю его проверить и поделиться своими впечатлениями. Если у Вас есть замечания, предложения - пишите, постараюсь оперативно дополнить.
ЧТО ПОСМОТРЕТЬ ЕЩЕ: