Небольшой обзор методов стеганографических цифровых отпечатков для текстовых документов:
http://blog.fastforwardlabs.com/2017/06/23/fingerprinting-documents-with-steganography.html Вкратце, из методов, например, замена английских букв на аналогично выглядящие из других языков -- так вот "слово" и вот "cлoвo". С точки зрения человека они одинаковы, а с точки зрения компьютера -- уже нет. Чтобы увидеть разницу, надо копировать в текстовый файл и глядеть на него, например, шестнадцатеричным редактором. Можно использовать смешение кодировок ASCII и UTF. Добавлять в текст
пробелы нулевой ширины в определённом порядке.
В-общем, методов довольно много и таким образом, даже .txt файл может иметь уникальный цифровой отпечаток, по которому можно отследить его происхождение (и, соответственно, круг тех, кто имел к нему доступ).
Поэтому общая рекомендация тем, кто таки хочет сливать доки в общий доступ, и кому "лавры" Сноудена не дают покоя -- документы распечатывайте, а потом сканируйте. Это с гарантией удалит цифровую подпись, если она есть. Правда, возможно добавление
микроподписи от лазерного принтера (а её будет видно на скане документа), так что лучше распечатывать на струйнике, сканировать строго в ч/б режиме в низком качестве и добавлять случайный шум. Ибо нехер.