Идентификация владельца веб-сайта

Журналист

Журналист
Статус
offline
Регистрация
28.09.2022
Сообщения
1,120
Репутация
996
Практически каждый кибер-преступник имеет свой сайт. Мошенники используют сайты, для того чтобы войти в доверие жертве, хакеры используют сайты для продажи своих услуг и интернет-вымогательства. В наше время почти у каждого есть свой сайт, именно по этому эта тема настолько важна.

Из чего состоит веб-сайт?​

Домен​

Домен это название сайта которое вы вводите в адресную строку, как yandex.ru, google.com итд.

DNS (Domain Name System) — Компьютерная распределённая система для получения информации о доменах. Чаще всего используется для получения IP-адреса по имени хоста, получения информации о маршрутизации почты и/или обслуживающих узлах для протоколов в домене.

Обычно домен состоит из 3х частей, но бывает что домен состоит из 4х частей.

|https://|maps|.|google|.|com| — Пример домена из 4х частей.

https:// — Это протокол безопасности, чаще всего вы можете встретить протоколы http (Протокол прикладного уровня передачи данных, изначально - в виде гипертекстовых документов в формате HTML, в настоящее время используется для передачи произвольных данных.) и более безопасную его версию https, который позволяет обменивается сайту с пользователем данными так, чтобы администратор сайта не смог увидеть действия пользователей.

maps — В данном случае слово "maps" является поддоменном, это то слово которое находится под основным доменом.

google — Доменное имя, основной домен.

com — Доменная зона, обозначает статус домена, в данном случае com, что означает что это международный домен. Приведу еще пару примеров.

ru — Российский сайт
Пример национальной доменной зоны, скорее всего такая доменная зона будет состоять из кода страны, например RU (Russia).​
gov — Государственный сайт
biz — Для бизнеса

Доменные зоны, вы можете посмотреть по ссылке.

Cистема Управления Сайтом​

Для быстрого доступа администратора к админ-панели была создана CMS.

CMS (Content Management System) — Информационная система или компьютерная программа, используемая для обеспечения и организации совместного процесса создания, редактирования и управления содержимым сайта.

Конечно, если вы будете создавать свой сайт, вы должны будете выбрать такую CMS, которая подойдет вам.

WordPress
Эту CMS используют для введения информационных ресурсов, дневников, создания сайтов-визиток.

Популярнейшая утилита для исследования сайтов на WordPress является WPScan (GitHub), это многофункциональное приложение для поиска уязвимостей и информации о сайте на WP, созданное для специалистов в сфере информационной безопасности.​
Drupal
Эта CMS используется для введения веб-сайтов с функционалом социальных сетей, обычно форумы.

Для анализа сайтов на Drupal, вы можете использовать Drupal Introspection, которая произведет аудит безопасности сайта на Drupal.​
Joomla!
Это многофункциональный CMS, умеющий все понемногу.

JoomlaVS, это сканнер уязвимостей сайтов на Joomla.​
Это пример 3х популярных CMS сайта. CMS вообще является отдельной темой. Их неисчислимое количество и написать про все, я просто не могу.

Структура веб-сайта​

Веб сайт состоит из главной и второстепенных страниц. Некоторые из этих страниц, скрыты для пользователя, но в большинстве случаев информация о директориях веб-сайта хранится в документе robots.txt. Его можно получить таким образом:

example.com/robots.txt

Вы можете попробовать такой трюк с сайтом google.com.

17f24ce7-0a18-49e0-bd0a-3f5bf0c59f45.jpeg
17f24ce7-0a18-49e0-bd0a-3f5bf0c59f45.jpeg

Скриншот robots.txt
Попрошу заметить, что документ может быть скрыт, или передвинут на другое место от любопытных глаз.

Роясь в robots.txt, вы можете наткнутся на не менее полезную нам директорию sitemap.xml.

Sitemap — XML-файлы с информацией для поисковых систем о страницах веб-сайта, которые подлежат индексации. Sitemaps могут помочь поисковикам определить местонахождение страниц сайта, время их последнего обновления, частоту обновления и важность относительно других страниц сайта для того, чтобы поисковая машина смогла более разумно индексировать сайт.

Грубо говоря, это документ который содержит в себе информацию о всех страницах, на которые вы могли бы наткнутся, используя Google.

example.com/sitemap.xml

0d44d25a-b3ba-4998-aecb-ba38eaa78c7e.jpeg
0d44d25a-b3ba-4998-aecb-ba38eaa78c7e.jpeg

Пример карты сайта​

Поиск используя WHOIS​

WHOIS — Сетевой протокол прикладного уровня, базирующийся на протоколе TCP. Основное применение - получение регистрационных данных о владельцах доменных имён, IP-адресов и автономных систем.

Грубо говоря, это протокол который может выдать информацию о регистрационных данных сайта, в том числе, это иногда может быть ФИО владельца веб-сайта.

Я собрал топ-3 самых удобных WHOIS сервисов:
  1. 2IP.RU, это сервис с достаточно большим функционалом, от развлечений, до нужного нам WHOIS.​
0664d998-2f62-4a7f-9463-2599a1f0d6f9.png
0664d998-2f62-4a7f-9463-2599a1f0d6f9.png

Интерфейс 2IP.RU
Есть предосмотр, так же можно посмотреть полный WHOIS, нажав на соответствующую кнопку.

2. DomainWatch, веб-сайт который будет производить анализ, с более OSINTерским уклоном. Он соберет информацию о владельце домена, на основе WHOIS.

350580a4-e785-462c-9302-c45ef5f654a5.png
350580a4-e785-462c-9302-c45ef5f654a5.png

Интерфейс DomainWatch
3. https://t.me/pwIPbot, такой же многофункциональный сервис с возможностью WHOIS, только уже в виде Telegram-бота, что многим может показаться достаточно удобным.

9892f6f2-b0e4-4e34-8dea-e58178517e42.png
9892f6f2-b0e4-4e34-8dea-e58178517e42.png

Интерфейс PwIPbot​

Ручной анализ WHOIS​

Ниже я разберу интересующие нас строки при анализе WHOIS веб-сайта.

Creation Date, Expiration Date — Эти две строки покажут нам когда домен был создан и когда его действие истекает, которое конечно же, можно продлить.

Registrar — Эта строка дает информацию о регистраторе веб-сайта, это компания которая хранит уже личную информацию о владельце сайта

Name, Organization, Street, City, State/Province, Postal Code, Country, Phone, Fax, Email, Admin ID — Это все интересующие нас, личные данные администратора. Если вам повезло, они могут быть и не скрыты, но чаще всего эти данные скрыты организациями, как Domains By Proxy.

Name Server — Наименования серверов сайта, это так же может вам помочь в расследовании.

Автоматизированные сервисы уже научились производить анализ строк выше, но тем не менее перечисленное выше, сможет вам помочь в расследовании.

6646f742-7ca9-4f34-b3ae-7e23de36abbf.png
6646f742-7ca9-4f34-b3ae-7e23de36abbf.png

Пример скрытия данных​

Поиск информации о репутации сайта​

Если нам необходимо узнать, участвовал ли конкретный веб-сайт в судебных делах, подвергался ли блокировки и как пользователи отзываются об этом сайте, необходимо будет использовать следующие инструменты и методики.

Блокировки веб-сайта​

На территории РФ блокировку веб-сайта могут инициировать такие ведомства как Роскомнадзор, Генеральная прокуратура, ФСБ, Роспотребнадзор и конечно суды.

163e0d89-89f9-4294-a4c0-fdccd8a4766e.jpeg
163e0d89-89f9-4294-a4c0-fdccd8a4766e.jpeg

Кто блокирует и за что
Но вместо того, чтобы бегать от сайта одной структуры, к другой, мы можем просто обратится к общим реестрам, таким как RuBanList, тут собрана информация о заблокированных сайтах на территории РФ. Так же я кратко пройдусь по подобным сайтам, только на территории нескольких стран СНГ.
Вы так же можете воспользоваться сервисами предоставляющих услугу Check-Host, которая показывает в каких странах доступен и недоступен сайт и время ответа. К примеру, сайт check-host.net.
Важно: Если сервис показывает что сайт недоступен в одной, или более странах, это не значит что была произведена блокировка, на это есть разные причины, к примеру владелец интернет-ресурса мог самостоятельно отключить доступ к сайту с определенных стран.

Для того чтобы быть более уверенным, воспользуйтесь реестрами соответствующих стран, которые вы можете найти в открытом доступе​

Информация о нарушении авторского права​

Сайт Lumen предоставит информацию о юридических жалобах и запросах на удаление онлайн-материалов. Использование инструмента крайне просто, необходимо вбить веб-сайт поисковую строку и получить информацию о всех жалобах на него.

b4f660d2-eaca-41a6-ac9c-e8bbdf9aaa83.png
b4f660d2-eaca-41a6-ac9c-e8bbdf9aaa83.png

Интерфейс Lumen​

Просмотр пользовательских оценок​

Тут, все проще простого, просто вбиваем в Google (домен.ru "отзывы", "оценки") и получаем сайты отзывников, упоминания в социальных сетях и многую другую информацию о конкретном сайте.

f7c0dc51-07d5-471e-b3f1-05db5e481257.png
f7c0dc51-07d5-471e-b3f1-05db5e481257.png

Поисковой запрос
Помните, что не всему написанному в интернете можно доверять, используйте сразу несколько источников для составления доказательной базы.

Поиск с использованием Google-Доркинга​

Google-Доркинг очень часто может помочь в поиске информации о веб-сайте, так как, с помощью доркинга можно находить конкретные страницы, файлы и текст. Давайте рассмотрим несколько полезных дорков. Опять же, тут все зависит от вашей фантазии, вы можете составлять запросы как вам угодно, я буду приводить только базу.

Данный запрос выдаст нам сохраненную версию сайта, что можно сделать более эффективно используя инструменты как Internet Archive, Archive Today, ВЕБ-АРХИВ, Perma, вышеупомянутые сервисы обладают гораздо большим функционалом чем браузерный кэш. У других браузеров есть схожие функции, например "Сохраненная копия" в Яндекс Браузере.

Такой же трюк можно выполнять с директориями, пример cache:https://site.com/login

16afe9eb-1268-4795-8d4d-08fd38b848d9.png
16afe9eb-1268-4795-8d4d-08fd38b848d9.png

Сохраненная страница сайта interpol.int через Google​

filetype​

Этот запрос выдаст информацию о файлах определенного формата находящихся на веб-сайте. К запросу можно добавить intext: для того чтобы получить файл с нужным нам текстом.

На примере видим такой запрос: site:gov.spb.ru filetype:xls. Следующий запрос должен выдать нам все файлы формата xls (excel) находящихся на сайте и в открытом доступе.

0336240c-6446-4d63-a99c-8ecc279ddf64.png
0336240c-6446-4d63-a99c-8ecc279ddf64.png

Пример запроса с filetype.
Еще напишу, что существует filetype:log, который выдает общедоступные логи.

22432d4b-98aa-4cf1-9da1-738d492a5954.png
22432d4b-98aa-4cf1-9da1-738d492a5954.png

запрос с filetype:log​

Кавычки ("")​

Кавычки могут быть использованы для того, чтобы произвести поиск по определенному слову, к примеру site:facebook.com "Andrew Tate". Такой запрос выдаст нам информацию об упоминаниях Эндрю Тейта на сайте Facebook.

6b7eb0d7-40b7-473f-85bd-f4d67f7d901f.png
6b7eb0d7-40b7-473f-85bd-f4d67f7d901f.png

Запрос с кавычками
Это самые популярные способы поиска информации о веб-сайте, конечно Google способен на большее, я вам советую воспользоваться Google Hacking Database для составления собственных запросов.

Поиск информации о метаданных​

Владелец сайта мог не удалить exif-данные при загрузки их на свой сайт и по ошибке оставить свои личные данные, как данные об устройстве на который делался снимок.

EXIF — Стандарт, позволяющий добавлять к изображениям и прочим медиафайлам дополнительную информацию, комментирующую этот файл, описывающий условия и способы его получения, авторство и т. п. Получил широкое распространение в связи с появлением цифровых фотокамер. Информация, записанная по этому стандарту, может использоваться как пользователем, так и различными устройствами, например, принтером.

Для просмотра метаданных, можно использовать сайт Metadata2Go, вы можете выбрать 1 из 4х видов загрузки файла, с устройства, Google Диска, DropBox и напрямую из ссылки.

0a209e89-8a9f-4b85-b004-2dc913832e9d.webp
0a209e89-8a9f-4b85-b004-2dc913832e9d.webp

Метаданные​

Поиск связанных контактов​

Для начала вы можете попробовать подбор email-адресов с соответствующим доменным именем. Попробуйте использовать следующие слова: admin, info, наименование организации, contact, office, support и др.

Далее, проверьте почту на существование, с использованием протокола STMP.

STMP — Широко используемый сетевой протокол, предназначенный для передачи электронной почты в сетях TCP/IP.

Для этого можно использовать 2IP Mail Checker, который покажет существует ли ваша почта на самом деле.

37249c8e-a25f-47ec-80e5-797c0d0939de.png
37249c8e-a25f-47ec-80e5-797c0d0939de.png

Работа STMP
Этот процесс так же был автоматизирован сервисом hunter.io. Конечно, Hunter использует дополнительные методы поиска электронной почты, для поиска требуется зарегистрированный аккаунт.

5caaa7d7-fd7f-4bb4-85cd-0b7d6bf80f5e.png
5caaa7d7-fd7f-4bb4-85cd-0b7d6bf80f5e.png

Интерфейс Hunter.io
В большинстве случаев, администратор веб-сайта оставляет платежные реквизиты, либо другие контактные данные, как номер телефона, либо адрес электронной почты.

790086cd-a953-4f0f-9f0a-4db7177a26ca.png
790086cd-a953-4f0f-9f0a-4db7177a26ca.png

Контактные данные
После того, как у вас имеются другие данные, вы можете продолжать поиск, но уже по ним.

Узнаем о всех доменах одного владельца​

Для того чтобы узнать все домены одного владельца мы можем воспользоваться сервисом SpyOnWeb, который покажет все домены и поддомены одного владельца основываясь на разных данных, как одинаковый IP.

Интерфейс сайта удобный и достаточно многофункциональный. Доступен API, регистрация не требуется.

3f85e731-4716-44fa-8e27-deb9a7e0d89f.png
3f85e731-4716-44fa-8e27-deb9a7e0d89f.png

Интерфейс spyonweb
Конечно, у сервиса большое количество аналогов, тот самый 2IP, тоже предоставляет такие услуги, но тем не менее, этот сайт я считаю наиболее удобным для следующей цели.

Изучение уникальных рекламных идентификаторов на сайте​

В наше время все больше и больше корпораций продают данные о своих клиентах рекламным компаниям.

Рекламный идентификатор — это уникальный сбрасываемый идентификатор для показа рекламы. Он упрощает управление данными для пользователей и обеспечивает простую стандартизированную систему монетизации приложений для разработчиков.

Большое количество веб-сайтов используют рекламные идентификаторы. Давайте же попробуем найти их. Для этого, нам понадобится открыть код страницы.

После того, как открыли код страницы, ищем следующие ключевые слова:

Pub- или ca-pub (Компания AdSense)
UA- (Компания Google)
&tag= (Компания Amazon)
#pubid / pubid (Компания AddThis)
mc.yandex / ym (Компания Яндекс)

814bffb4-5344-49a4-8f3c-e76122d0e860.png
814bffb4-5344-49a4-8f3c-e76122d0e860.png

Яндекс Метрика
Вот, к примеру сайт РИА Новости использует Яндекс Метрику для сбора аналитических данных своих пользователей.

Конечно, было бы очень муторно каждый раз самостоятельно искать индикаторы, именно по этому были разработаны онлайн-сервисы которые определяют какие компании проводят сбор данных на том, или ином сайте.

TheMarkUp, это один из сервисов который показывает какие компании причастны к сбору данных на конкретном веб-сайте.

6ea504e0-6944-4b99-b705-7984a30a6c77.png
6ea504e0-6944-4b99-b705-7984a30a6c77.png

Работа The Markup
Самое интересное то, что Яндекс позволяет получать доступ к статистики имея уникальный ID, через следующую ссылку: https://metrika.yandex.ru/dashboard?id=ID, но вместо ID, нужно будет вставить, тот самый Advertising ID который вы найдете в коде страницы. У РИА, это 960630.

7499f616-e482-47f5-9228-8e2d407693f2.jpeg
7499f616-e482-47f5-9228-8e2d407693f2.jpeg

Интерфейс Яндекс.Метрики
Для просмотра, понадобится регистрация в Яндексе. Интересную находку обнаружили коллеги из T.Hunter. Первым пользователем сайта вероятней всего будет сам администратор. Соответственно, мы сможем вычислить его интересы.

5f53d361-943b-43d4-8cba-33599dd57453.jpeg
5f53d361-943b-43d4-8cba-33599dd57453.jpeg

Интересы администратора сайта N​

Популярные решения для проведения аудита​

Конечно, все мы наслышаны о популярных утилитах для проведения аудита безопасности определённого интернет-сайта. Давайте кратко поговорим о каждом и как он может помочь в поиске данных.

Acunetix Web Vulnerability Scanner​

Acunetix, это один из наиболее распространенных сканнеров уязвимостей сайта. Это отдельная тема, так как среднестатистический отчет состоит из 150 страниц

88804704-c63b-42e1-adeb-2d24b45965b5.png
88804704-c63b-42e1-adeb-2d24b45965b5.png

Из отчета Acunetix
Как вы уже поняли, ПО обладает огромным функционалом и является мощнейшим инструментом. У сканнера приятный и простой интерфейс, вам просто понадобится ввести домен и ждать. Единственное, что ждать придется долго, мой опыт работы со сканнером показал, что примерное время ожидания — 8-9 часов.

Spider Foot​

Наипопулярнейший среди специалистов в OSINT инструмент, который вошел в ТОП-10 лучших инструментов по версии компании T.Hunter, утилита позволяет анализировать огромное количество данных и строить графы, spider foot, подобно Maltego способен работать с модулями. А самое главное то, что SpiderFoot, является частично бесплатным инструментом, он позволяет проводить 3 анализа в месяц бесплатно.

384fc1c1-555f-4a5e-a784-71a4277e7407.jpeg
384fc1c1-555f-4a5e-a784-71a4277e7407.jpeg

Интерфейс Spiderfoot​

Nikto​

Nikto, достаточно не новый инструмент для проведения анализа уязвимостей сайта, но это не делает его хуже, мощный, бесплатный инструмент с открытым исходным кодом, способен провести анализ сайта за достаточно быстрый срок.

В вышеупомянутом Telegram-Боте @pwIPbot внедрен следующий сканнер в премиум версии. Если у вас стоит ОС Kali Linux, то сканнер будет уже предустановлен. А, если у вас нет Kali Linux, то можете скачать его с GitHub и воспользоваться командой ниже.

apt install nikto

5b11928c-40f9-4230-965a-4b4221528ac3.png
5b11928c-40f9-4230-965a-4b4221528ac3.png

Интерфейс Nikto​

Итоги​

На этом все, я описал большую часть методик для поиска информации о владельце сайта, конечно их очень много и они просто не поместятся в одну статью. Подписывайтесь на мой канал для того чтобы быть осведомленным.
 

xam111

Главный модератор
Модератор
Статус
online
Регистрация
02.02.2020
Сообщения
3,829
Репутация
2,768
Позволю себе дополнить материал следующими методами идентификации:

1 Исследование архивных данных WHOIS
- http://whoishistory.ru/
- https://drs.whoisxmlapi.com/whois-history
- https://osint.sh/whoishistory/
- https://www.whoxy.com/archive.php

2 Поиск контактов по доменному имени
- https://domainwat.ch/
- https://phonebook.cz/

3 Поиск технологий на вебсайте (чат-ботов, эквайрингов)
- https://urlscan.io/
- https://pagexray.fouanalytics.com/
- https://sitereport.netcraft.com/
- https://pulsedive.com/