Защита от идентификации в интернет. Проблема идентификации пользователей. HTML5 и хранение данных

Методы определения уникальности пользователя развиваются с каждым днем. Есть 15 основных факторов, которые определяют пользователя.

  1. Браузер клиент
  2. Отпечаток браузера
  3. Web Cookies
  4. LSO Cookies
  5. Временные файлы
  6. Соответствие часового пояса ip адресу и dns
  7. JavaScript
  8. MAC адрес + HWID
  9. Кэш браузера
  10. Evercookie
  11. Системные шрифты
  12. Операционная система
  13. Установленные языки

Рассмотрим их более подробно:

Рассмотрим их более подробно:

IP-адрес (айпи-адрес, сокращение от англ. Internet Protocol Address) - это уникальный сетевой адрес узла в компьютерной сети, построенной по протоколу IP. В сети Интернет требуется глобальная уникальность адреса; в случае работы в локальной сети требуется уникальность адреса в пределах сети. В версии протокола IPv4 IP-адрес имеет длину 4 байта.

DNS (англ. Domain Name System - система доменных имён) - компьютерная распределённая система для получения информации о доменах. Чаще всего используется для получения IP-адреса по имени хоста (компьютера или устройства), получения информации о маршрутизации почты, обслуживающих узлах для протоколов в домене (SRV-запись).

Веб-обозреватель, обозреватель, браузер - ПО для просмотра веб-страниц; отображения веб-документов, компьютерных файлов и их папок; запуск веб-приложениями; а также для решения других задач. В интернете веб-браузеры применяются для запроса, обработки, изменения и просмотра содержания веб-страниц. Современные обозреватели могут использовать обмен файлами с серверами ftp, а также для непосредственного просмотра содержания файлов с графическим содержимым (gif, jpg, png), аудио-видео содержимым (mp3, mpg, avi, mp4), текстовым содержимым (txt, pdf, djvu) и других файлов.

Цифровой отпечаток браузера (ЦОБ) - весьма интересный способ идентификации браузера пользователя без анализа каких либо файлов кукис. Анализ производится по информации, передаваемой веб серверу при запросе - HTTP заголовки, есть/нет кукис, установлена ли java, установлена ли javascript, установлен ли flash, установлен ли silverlight, какие плагины встроены в браузер и т.д. Это последняя проверка, создающая уникальную цифровую подпись на основе вышеперечисленных элементов. Есть известная статья, подробно описывающая данную проверку «How Unique is Your Browser?». Приведённый в ней тест ведёт на Pantoptclick (открытый проект, созданный для защиты пользователей) и он использует часть способов, описанных в статье, но тем не менее они весьма эффективны. Существующий алгоритм проверки может быть сложнее и гораздо эффективнее. С помощью Pantoptclick можно довести уникальность своего браузера до 1 из 50000. Только не стоит забывать об одной важной вещи - если вы уникализируете веб-обозреватель так, что ничего невозможно будет о нем узнать, то среди других броузеров он будет выделяться как голый человек в центре густонаселенного мегаполиса в час пик. Есть возможность при желании подменить свою версию браузера во что-то типичное при помощи User Agent Switcher, но главное не менять тип операционной системы, в которой вы используете программу. Протокол TCP сообщает о версии ОС, и если он говорит, что у Вас используется Unux-like ОС, а User Agent Switcher HTTP заголовки информирует, что Windows ОС, то скорее всего это вызовет подозрения у администрации веб серверов.

Web Cookies — небольшой фрагмент данных, отправленный веб-сервером и хранимый на компьютере пользователя. Веб-клиент (обычно веб-браузер) всякий раз при попытке открыть страницу соответствующего сайта пересылает этот фрагмент данных веб-серверу в виде HTTP-запроса. Применяется для сохранения данных на стороне пользователя, на практике обычно используется для:

  • аутентификации пользователя;
  • хранения персональных предпочтений и настроек пользователя;
  • отслеживания состояния сеанса*en+ доступа пользователя;
  • ведения статистики о пользователях.

Local Shared Objects - Flash cookie. Это тип метаданных, которые хранятся в виде файлов на компьютере каждого пользователя. На сегодняшний день все версии Flash Player используют LSO.
С дефолтными настройками, Flash делает запрос пользователю о разрешении о сохранении локальных файлов на компьютер. Большинство из Вас это многократно замечали, так что некоторые из читателей моего блога уже понимают о чем идет речь. Как и с обычными кукисами, онлайн банки, рекламодатели или торговцы используют LSO для анализа и контроля трафика. Flash cookie не возможно использовать третьей стороной на других сайтах. На пример, LSO от сайта “www.name.ru” не могут быть считаны сайтом “www.name.com”. В случае когда пользователь удаляет хранящиеся куки от сайта, то новому файлу будет присвоен новый уникальный ID-cookie, используя хранимые данные Flash в качестве “резервного копирования”.

Временные файлы — данные, которые создаются большинством программ или операционной системой для сохранения промежуточных результатов в процессе функционирования или передачи данных в другую программу. Как правило такие файлы удаляются автоматически создавшим их процессом.
Некоторые операционные системы имеют дополнительные возможности при работе с временными файлами - возможность получить имя временного файла (причём такое, которое будет уникальным - то есть не совпадёт с именем уже существующего файла); возможность указать особый параметр при создании (открытии) файла, предписывающий удалить файл сразу после записи.

JavaScript — прототипно-ориентированный сценарный язык программирования. Является диалектом языка ECMAScript*~ 1+.
JavaScript обычно используется как встраиваемый язык для программного доступа к объектам приложений. Наиболее широкое применение находит в браузерах как язык сценариев для придания интерактивности веб-страницам.
Основные архитектурные черты: динамическая типизация, слабая типизация, автоматическое управление памятью, прототипное программирование, функции как объекты первого класса.

MAC адрес (от англ. Media Access Control - управление доступом к среде, также Hardware Address) - это уникальный идентификатор, присваиваемый каждой единице активного оборудования компьютерных сетей. Большинство сетевых протоколов канального уровня используют одно из трёх пространств MAC-адресов, управляемых IEEE: MAC-48, EUI-48 и EUI-64. Адреса в каждом из пространств теоретически должны быть глобально уникальными. Не все протоколы используют MAC-адреса, и не все протоколы, использующие MAC-адреса, нуждаются в подобной уникальности этих адресов. В широковещательных сетях (таких, как сети на основе Ethernet) MAC-адрес позволяет уникально идентифицировать каждый узел сети и доставлять данные только этому узлу. Таким образом, MAC-адреса формируют основу сетей на канальном уровне, которую используют протоколы более высокого (сетевого) уровня. Для преобразования MAC-адресов в адреса сетевого уровня и обратно применяются специальные протоколы (например, ARP и RARP в сетях IPv4 и NDP в сетях на основе IPv6). HWID — это общее название уникального(с некоторой долей допущения) некого идентификатора, который генерируется из данных, связанных с конкретным аппаратным обеспечением. Алгоритм генерации может быть любой, и никакой унификации тут нет. Алгоритмов можно нафантазировать бесчисленное множество.

Кэш браузера — это копии веб-страниц, картинок, видеороликов и прочего контента, просмотренного с помощью браузера. Кэш хранится на вашем компьютере.
Кэш помогает сократить количество запросов к сайтам: если страница, которую вы хотите просмотреть, уже есть в кэше, браузер мгновенно загрузит ее с вашего жесткого диска.

Evercookie — Samy Mamkar разработал систему, которая позволяет хранить куки в 8 местах, автоматически восстанавливая друг друга, и даже добиться того, чтобы куки, поставленное в одном браузере, действовало и в другом. Удалить это куки практически невозможно! (Все возможно, конечно, но слишком много мороки)
Куки хранятся в:

  • HTTP Cookies;
  • Local Shared Objects (Flash);
  • Сохранение куки в значениях RGB автосгенерированных и форсированно кэшированных PNG с использованием HTML5 canvas;
  • Сохранение куки в Web History;
  • HTML5 Session Storage;
  • HTML5 Local Storage;
  • HTML5 Global Storage;
  • HTML5 Database Storage через SQLite.

При удалении из одного из этих мест кука автоматически восстанавливается из оставшихся. Работает даже если пользователь сменит браузер (через Local Shared Objects из Flash).

Операционная система — комплекс управляющих и обрабатывающих программ, которые, с одной стороны, выступают как интерфейс между устройствами вычислительной системы и прикладными программами, а с другой стороны - предназначены для управления устройствами, управления вычислительными процессами, эффективного распределения вычислительных ресурсов между вычислительными процессами и организации надёжных вычислений. Это определение применимо к большинству современных операционных систем общего назначения.

Частично проверить свой браузер Вы можете тут — https://panopticlick.eff.org

Все партнерские программы соблюдают эти пункты для идентификации пользователя, кто то соблюдает все, кто то лишь половину — об этом знают лишь разработчики.

Идентификация пользователя

Идентификация пользователя

Идентификация пользователя - распознавание пользователя компьютерной системы на основании ранее заданного описания. Идентификация имеет целью определение полномочий пользователя (права доступа к данным и выбора режима их использования).

По-английски: User identification

Финансовый словарь Финам .


Смотреть что такое "Идентификация пользователя" в других словарях:

    идентификация пользователя - vartotojo atpažinimas statusas T sritis automatika atitikmenys: angl. user identification vok. Anwenderidentifikation, f; Benutzerkennung, f rus. идентификация пользователя, f pranc. identificateur d utilisateur, m … Automatikos terminų žodynas

    идентификация пользователя сети - (МСЭ Т Х.7). Тематики электросвязь, основные понятия EN network user identificationNUI …

    Авторизация (идентификация) пользователя Интернет-сайта - Авторизация (идентификация) проверка пользователя на право просматривать определенные страницы сайта. Идентификация пользователя осуществляется с помощью имени пользователя (логина) и пароля... Источник: Приказ Казначейства РФ от 28.08.2008 N 231 … Официальная терминология

    автоматическая идентификация пользователя - — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN user automatic secure authentication … Справочник технического переводчика

    У этого термина существуют и другие значения, см. Идентификация. Идентификация в информационных системах процедура, в результате выполнения которой для субъекта идентификации выявляется его идентификатор, однозначно идентифицирующий этого… … Википедия

    Идентификация - – процесс распознавания пользователя автоматизированной системой, для чего он сообщает ей свое уникальное имя, к примеру логин. Это имя называют идентификатором. Идентификация позволяет системе отличить одного пользователя от другого, у двух… … Банковская энциклопедия

    идентификация (код) пользователя (для определения его полномочий) - — [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в целом EN user identification … Справочник технического переводчика

    идентификация по паролю - Процедура, позволяющая однозначно идентифицировать пользователя по паролю, копия которого хранится в системе. Процедура выполняется для определения прав и полномочий пользователя на использование ресурсов системы. [Л.М. Невдяев.… … Справочник технического переводчика

    ГОСТ Р ИСО/МЭК 19762-3-2011: Информационные технологии. Технологии автоматической идентификации и сбора данных (АИСД). Гармонизированный словарь. Часть 3. Радиочастотная идентификация (РЧИ) - Терминология ГОСТ Р ИСО/МЭК 19762 3 2011: Информационные технологии. Технологии автоматической идентификации и сбора данных (АИСД). Гармонизированный словарь. Часть 3. Радиочастотная идентификация (РЧИ) оригинал документа: 05.02.21 абстрактный… …

    ГОСТ Р ИСО/МЭК 19794-4-2006: Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 4. Данные изображения отпечатка пальца - Терминология ГОСТ Р ИСО/МЭК 19794 4 2006: Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 4. Данные изображения отпечатка пальца оригинал документа: 4.16 впадина (valley): Область,… … Словарь-справочник терминов нормативно-технической документации

Меня всегда напрягало то, как навязчиво Google AdSense подсовывал контекстную рекламу в зависимости от моих старых запросов в поисковике. Вроде бы и времени с момента поиска прошло достаточно много, да и куки и кеш браузера чистились не раз, а реклама оставалась. Как же они продолжали отслеживать меня? Оказывается, способов для этого предостаточно.

Небольшое предисловие

Идентификация, отслеживание пользователя или попросту веб-трекинг подразумевает под собой расчет и установку уникального идентификатора для каждого браузера, посещающего определенный сайт. Вообще, изначально это не задумывалось каким-то вселенским злом и, как и все, имеет обратную сторону, то есть призвано приносить пользу. Например, позволить владельцам сайта отличить обычных пользователей от ботов или же предоставить возможность хранить предпочтения пользователей и применять их при последующем визите. Но в то же самое время данная возможность очень пришлась по душе рекламной индустрии. Как ты прекрасно знаешь, куки - один из самых популярных способов идентификации пользователей. И активно применяться в рекламной индустрии они начали аж с середины девяностых годов.