Денис Колисниченко - Анонимность и безопасность в Интернете. От «чайника» к пользователю
Посоветовать изменить стиль, конечно, проще всего. Но не всегда понятно, как это сделать. Чтобы знать, на что обратить внимание, следует ознакомиться с тем, как производится лингвистический анализ, то есть самому превратиться в специалиста по такому анализу.
Вот на что аналитики обращают больше всего внимания:
✓ средняя длина предложения в знаках;
✓ средняя длина диалога в знаках;
✓ соотношение диалогов и предложений в тексте;
✓ использование уникальных слов (как словарных, так и выдуманных автором);
✓ частота использования уникальных слов;
✓ использование одних и тех же уникальных слов в открытых и анонимных публикациях;
✓ активный словарный запас (количество уникальных словарных слов в тексте);
✓ активный несловарный запас (количество уникальных выдуманных слов в тексте);
✓ статистика использования частей речи – процент существительных, глаголов, прилагательных и т. п.;
✓ биграммы частей речи, то есть частота употребления пар "существительное-глагол", "наречие-прилагательное" и т. п.;
✓ позиции частей речи в предложении (по всем частям речи);
✓ биграммы буквенных пар (подсчет по всем алфавитным парам "аа", "аб", "ав" и т. п.).
Для лингвистического анализа текста специалисты используют набор различных методов. С некоторыми из них вы можете познакомиться по адресу: http://filologia.su/metody. В Интернете также можно найти программы для лингвистического анализа текста – например, Лингвистический анализатор 2.0, который можно скачать бесплатно по адресу: http://softok.org/science/naukateh/7776prog.html. Программа не заменит вам опытного аналитика, но все же это лучше, чем ничего.
В общем, информации в Интернете по этой теме – очень много, но наша книга посвящена анонимности в Интернете, а не лингвистике. Главное, чтобы вы знали, что такой способ деанонимизации существует, а предупрежден – значит вооружен.
11.3. Наиболее частые ошибки
Исходя из всего ранее сказанного, выделим основные ошибки, совершаемые желающими быть анонимными пользователями:
✓ использование анонимных и неанонимных сессий для одного и того же вида деятельности – например, при регистрации e-mail и блога вы не анонимизировали трафик, но начали это делать при ведении блога. Понятно, что легко запросить у администратора блога IP-адреса, которые были зафиксированы при регистрации блога, чтобы понять, кто вы;
✓ элементарная забывчивость – забыли включить Tor, забыли перенастроить браузер (например, сначала отменили установку прокси-сервера Tor, чтобы скачать фильм, а затем забыли и продолжили работу, но уже не в анонимном режиме). Чтобы хоть как-то помочь себе, установите два браузера: один вы будете использовать в анонимном режиме, второй – для обычного серфинга;
✓ публикация больших текстов сходного стиля написания под своим обычным именем. Или ничего не публикуйте под своим именем, или же измените стиль написания перед публикацией анонимного контента;
✓ доступ к анонимному почтовому ящику без шифрования – всегда используйте шифрование трафика для доступа к своему анонимному почтовому ящику;
✓ отказ от анонимизации трафика при работе с чужого компьютера – самая распространенная ошибка. Некоторые пользователи почему-то думают, что если они используют чужой компьютер (например, компьютер друга, родственника, соседа и т. п.), то уже анонимны. Это не так, и анонимизация трафика обязательна и в этом случае. Иначе вас очень легко будет выследить – придут к тому, у кого вы были, и спросят, он ли заходил на тот или иной ресурс. Он ответит, что не он и что вы были у него в гостях в то время.
В главе 12 вы узнаете, какие программы нужно использовать, чтобы остаться анонимным. Ведь иногда все старания идут насмарку, если программы для работы с Интернетом сами сообщают куда нужно всю информацию о вас…
Глава 12. Программы с "сюрпризом"
12.1. Программы с открытым кодом
Для обеспечения большей анонимности вы должны использовать программы с открытым исходным кодом (так называемые OpenSource-программы). Исходный код таких программ свободно доступен на сайтах разработчиков программ.
Возникает вопрос: почему именно OpenSource? У таких программ есть одно большое преимущество – их исходный код открыт, а это означает, что в коде программы нет "черных ходов" (backdoors), и эти программы не передают информацию о передаваемых с их помощью данных своим разработчикам или кому-то еще. Ведь если бы это было так, общественность очень быстро бы об этом узнала. В мире много энтузиастов, исследующих исходный код программ на наличие всевозможных ошибок. Если в исходном коде того же Firefox будет найдена "черная дверь", через пару минут об этом узнает весь мир.
Программное обеспечение, исходный код которого закрыт, называется проприетарным. Проприетарное программное обеспечение не обязательно является платным. Наоборот, в мире есть множество программ, распространяемых бесплатно (freeware), но исходный код этих программ закрыт. Взять ту же "Оперу" (браузер Opera) – ее исходный код никому не доступен, то же самое можно сказать и об IE. Да, Internet Explorer может скачать любой желающий с сайта Microsoft, но сама Microsoft до сих пор не открыла его исходного кода.
Исходный код проприетарных программ – тайна за семью замками, и он редко когда бывает выложен в Интернете. Разве что произойдет утечка информации внутри компании, и чем-то обиженный сотрудник возьмет да и выложит "исходники" на каком-то сайте.
Поскольку исходный код проприетарного ПО закрыт, никто не может с абсолютной уверенностью сказать, что такие программы не передают данные (например, информацию о посещаемых вами узлах или содержимое заполняемых вами форм) разработчикам или третьим лицам.
Есть у OpenSource и еще одно преимущество – по сути, над разработкой программ с открытым кодом работает весь мир. Представьте обычную компанию, разрабатывающую проприетарную программу. Сколько человек работает над ее исходным кодом? 10, 20, 50, 100, 500, пусть даже 1000. Так, общее число сотрудников Opera Software (не только программистов, а всех сотрудников и во всех офисах по всем странам) составляет всего 750 человек. Размер относительно небольшого заводика на постсоветском пространстве. А в разработке OpenSource-программ косвенно принимают участие тысячи разработчиков. Да, пусть команда разработчиков какого-то OpenSource-проекта составляет всего несколько десятков человек. Зато к ним с легкостью присоединяются энтузиасты по всему миру, помогающие отлаживать программу, находящие в ней "баги" и подсказывающие, как сделать так, чтобы программа работала лучше.
Но везде есть пятна – даже на Солнце. У программ OpenSource есть свои недостатки, и вы должны знать об этом:
✓ недостаток финансирования – именно поэтому закрываются многие OpenSource-проекты, и ваша любимая программа сначала останется без поддержки (никто не будет исправлять "баги"), а в скором времени устареет и станет неактуальной. А как же энтузиасты? Они есть, пока существует основная команда разработчиков… Конечно, таких гигантов, как Firefox, FileZilla это не коснется, но все же…
✓ доступность исходного кода всем – главное преимущество открытых программ является и главным их недостатком. Ведь любой желающий может скачать исходники программы, встроить в них backdoor или другой вредоносный код, а потом выложить сие произведение на "файлопомойках", на своем сайте (под видом "улучшенной" версии программы) и т. д. Но этот недостаток легко преодолеть – просто возьмите себе за правило качать программы только с их официальных сайтов, а не с произвольных источников.
12.2. Выбор программ
Программ для работы в Интернете очень много – браузеры, почтовые клиенты, FTP-клиенты и т. п. Вы должны знать, какие программы являются программами с открытым кодом, а какие – нет.
Сначала определимся, какие программы понадобятся для работы в Интернете:
✓ браузер – куда же без него;
✓ почтовый клиент – электронная почта была, есть и будет;
✓ программы для закачки файлов, FTP-клиенты – загружать файлы из Интернета приходится довольно часто, и нужно позаботиться о подборе таких программ;
✓ клиенты для мгновенного обмена сообщениями. Электронная почта – это хорошо, но иногда хочется пообщаться, так сказать, в реальном времени, поэтому без клиентов для быстрого обмена сообщениями никак не обойтись;
✓ IRC-клиенты – хотя протокол IRC у нас не очень популярен, но не упомянуть об IRC-клиентах в книге тоже нельзя.
12.2.1. Выбор браузера
Начнем с браузеров. В табл. 12.1 перечислены OpenSource-браузеры и интернет-адреса официальных сайтов проектов, чтобы вы знали, откуда можно загружать программу.
Таблица 12.1. Свободные браузеры
Неужели в мире есть всего три браузера с открытым исходным кодом? Конечно же нет! Но остальные браузеры не могу вам порекомендовать по разным причинам: