футпринты или как спрятать (найти) сайты от конкурентов

 Публичный пост
27 октября 2021  853

для доргейщиков, вебмастеров, севошников и прочей нечести, засирающей энторнеты, как мне кажется актуально уметь находить сайты/сетки конкурентов и при этом максимально усложнить поиск своих.
спрятаться совсем как мне кажется невозможно (с удовольствием выслушаю аргументацию против). а уж "прятаться" от поисковика/ов... с учетом того что даже такой дибил как я, используя публичные инструменты, может находить сетки. то что говорить про поисковые системы, обладающие куда большими ресурсами.

самый простой способ, спалить сетку, если ее автор например заботливо вкруговую перелинковал. но такие подарки редкость и потому, зачастую придется немного поработать.

все мы, выполняя те или иные действия, подчиняемся своим привычкам и то, как именно вы выполняете действие и формирует "отпечаток" и работая в вебе, вы выполняете все так как вам привычно, и даже когда вы пытаетесь сделать не как обычно, вы тоже будете действовать по имеющемуся у вас шаблону. и чем больше отпечатков, тем с большей вероятностью можно их "привязать" к конкретному человеку или в нашем случае сайту/сетке.

Царь зверей собрал всех в лесу и говорит:
-"Хочу я разделить всех на красивых и умных, так вот - все кто красивые направо, а те кто умные налево!"
Звери начинают выбирать. Вот почти все разошлись кто куда... Но между правой и левой сторонами стоит обезьяна и смотрит по сторонам. Лев не выдерживает и говорит:
-"Слушай обезьяна, да ты выбирать вообще собираешься - давай или к умным или к красивым!"
Обезьяна посмотрела на льва и говорит:
-"Так что ж мне - разорваться что ли? А я и умная и красивая!"

этот анекдот демонстрирует нам пример футпринтов (характеристики: умная, красивая). и того как находится искомое на пересечении этих двух множеств.

у сайтов же характеристик гораздо больше и я попробую рассказать о некоторых из них. и где именно могут скрываться футпринты

зы, порядок признаков произвольный и не абсолютный, при желании его можно дополнять и дополнять.


какое-то специфическое окружение вебсервера?
какие-то свои произвольные заголовки?
отсутствие каких-то заголовков
порядок вывода заголовков
регистр заголовков
и т.д. и т.п.

сюда же отнесу и "печеньки" (которые cookie)
какие-то специфические имена ключей и/или значений, облегчат работу по поиску сетки


используете что-то подобное на своих проектах? вы опять же сильно облегчили поиск ваших сайтов.


в одну строку (минификация)
наличие/отсутствие каких-то специфических тегов
регистр
форматирование (отступы)
имена стилей

и т.д. и т.п.
любой шаг в сторону от усредненного, и вас уже проще найти


предположим что вы некорректно настроили вебсервер и при ошибках в работе сайта, он начинает отображать вещи, которые посторонним видеть и знать не нужно.
особенно если там будет что-то вроде /home/anonov_anon/my_pbn/govnosite_1/www/...
сюда же можно отнести и довольно распространенную ошибку. раскрытие файловой структуры в связи с неправильной настройкой вебсервера


использование систем аналитики, которые встраиваются в код страницы, также облегчают ваш поиск (особенно если вы ленитесь и используете один и тот же код с тем же идентификатором на всех проектах. да, и такое бывает)
использование своих систем аналитики, на отдельном домене. может легко вас выдать.
либо нетипичная для данного гео аналитика. например яндекс метрика на проектах под бразилию. это и футпринт и прямое указание на то, откуда растут ноги у данного проекта


кем выпущены
когда выпущены
для кого выпущены (не редки случаи, когда в составе сертификата прописаны все остальные домены сетки или часть)


где регнут домен
на кого (в некоторых зонах whois protect за отдельную плату. где-то нужно отдельно его включать и т.д.)
время регистрации (например опять же бразильский домен, зарегистрированный глубокой ночью, намекает что его регистрант вероятно находится в ином часовом поясе. а пачка подобных доменов понятно дело, увязывается в сетку)
name сервера (одни и теже. какие-то кастомные особенно в стиле ns1.anon_anonov_my_pbn.com.)


наличие/отсутствие каких-то файлов (особенно это касается CMS. ваш админ по каким-то причинам удалил файл readme.html из вп и раскатал это по всей сетке. и тем самым пометил всю сетку)
или скажем вы делаете бекапы в корень сайта (да еще и называете его backup.zip). мало того что это уязвимость, так еще и помогает увязать в сетку сайты.
изменение содержимого стандартных файлов
и т.д. и т.п.


как уже отметил в пункте про заголовки, набор программного обеспечения. особенно отличающегося от усредненного, опять же облегчает поиск.
например ваш админ по личным причинам предпочитает использовать лайти (lighttpd) и тем самым сводит на нет ваши усилия по сокрытию сетки
сюда же можно отнести например наборы плагинов для вп. используя одни теже наборы во всей сетке, вы оставляете след.


тот или иной формат урлов, опять же вас выдаст
например вы используете на вп какой-то плагин перевода кирилицы в транслит в урлах и у этого плагина своя собственная таблица перевода символов в транслит
или у вас везде урлы формируются по шаблону скажем вида /bla-bla-bla-day-month-year
или везде только первый уровень вложенности (/page-1, /page-2, /page-n)


вы решили повторно использовать какое-то изображение? фавиконку? любой другой графический элемент?
поздравляю, ну вы поняли


вы посещаете все свои проекты с одного компьютера/браузера, да еще и напичканного всяким разным, что в итоге передает данные в клистрим сервисы?
значит все ваши сайты будут там как на ладони


используете одни и теже ресурсы и методы для продвижения сетки? теперь сетка видна во всяких ахревсах с семрашами

+- все тоже самое, но еще более занудно в видео версии (или аудио, кому как больше нравится)

Связанные посты
8 комментариев 👇

Несмотря на то что пост написан возвышенным стилем всезнающего гуру, почти всеми перечисленными методами можно найти только самописки нерадивых проггеров. А способ через сертификаты найти где у каждого дорвейшика будет ssl от кф повеселил)

Копайте, Шура, в пересечения ip, даже скрытых под кф, сервисов что их сохраняют, что ищут коды счетчиков и сеток, а также как собрать все линки на ашрефсе и похожих инструментах и найти пересечения.

  Развернуть 1 комментарий

@wooden_boy, рад что смог вас повеселить.
юзкейс про полный список сетки в составе сертификата, как раз про клауд.
про ip ИМХО не особо актуально, проще как раз повесить домены на шаред к лидерам рынка и затеряться (по конкретно этому признаку) среди 100500 доменов находящихся там. а не висеть пачкой на одном айпишнике на впске у экзотического хостера.
про счетчики я упомянул, про пересечение ссылочного тоже

  Развернуть 1 комментарий
Арген , Предприниматель 28 октября 2021

😱 Комментарий удален автором поста...

  Развернуть 1 комментарий

@argenturdugulov, нативная реклама такая нативная...
ну распишите хотябы юзкейс продукта и постом оформите, админы будут только за (в правилах написано по этому поводу)

  Развернуть 1 комментарий

@realefs, не, сервис даже не запущен и в ближайшее время не планируется. Хотелось обсудить с людьми, которые сталкиваются с необходимостью закрытия сайтов/сетки какие у них есть боли, какие решения используют. Возможно про ЛС было лишнее

  Развернуть 1 комментарий

@realefs, спасибо за статью

  Развернуть 1 комментарий

@argenturdugulov, усредненный пользователь обычно борется с 3 вещами:
воровство контента
перерасход трафика
паразитная нагрузка

т.е. по факту, борется с потерей денег. ИМХО от этого вам и необходимо плясать

  Развернуть 1 комментарий

@realefs, Привет, оформил :)
https://4aff.club/project/1228/ что думаете? Дайте, пожалуйста, обратную связь

  Развернуть 1 комментарий

Думаю что в целом достаточно интересная, но закрывать её рано. Предлагаю из статьи сделать более развернутый мануал с полезными тулами и плюшечками. Кто считает что шарит в теме, не язвите, а помоги сделать пост полезным (мы вроде как тут за этим и собрались), а не писюнчиками мериться. От себя дополню, иногда оказываются достаточно полезными сервими по Reverse IP Lookup или CloudFail который помогает найти ip спрятанные за cloudflare.

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб