Вот схема, как можно было бы устроить дедупликацию при сохранении секретности. Нам нужна функция генерации зашифрованного сессионного ключа G(,,) и две функции восстановления B(,) и D(,), обладающие следующим свойством:
если k=G(s,r,f), то B(s,k)=D(f,k)=r, при этом s и f восстановить из других данных невозможно.
(f - файл, r - случайный сессионный ключ, s - секрет, известный только пользователю).
Ну и обычные функции - хэш H() и симметричное шифрование C(,)
При загрузке файла f первый пользователь случайным образом генерирует r, вычисляет h=H(f), k=G(s,r,f), шифрует файл с помощью r (c=C(r,f)) и загружает на хост тройку (h,k,c).
Следующий пользователь вычисляет h=H(f), видит, что такой хэш уже хранится, скачивает k, восстанавливает r=D(f,k), генерирует k'=G(s',r,f) и загружает на хост только k'.
Если пользователь потерял f, ему нужно скачать c и k , восстановить r=B(s,k), и f=C(r,c).
сейчас дропбокс начнёт всех уверять что они используют исключительно hash-функции, и оперирует размерами файлов, но никак не контентом. а гугл поддакнет, что переход от них гендира Эрика Шмидта в правительство США "всего лишь случайность".
Я наверное туплю с утра, но в чем был новостной повод? Дропбокс обещает хранить шифрованные файлы, он их и хранит. Шифрование происходит на сервере, от клиента/клиенту идут открытые файлы. То есть, он сам ключи порождает, сам их и использует. Ну и сравнивать содержимое можно по хэшу.
Dropbox employees aren't able to access user files
Пока что не противоречит. Работники Кока-Колы тоже не в курсе рецепта, но есть пара специальных чуваков, те знают. Еще более явный пример -- какой-нибудь Verisign. Страшно подумать что было бы, знай его работники приватный ключ для подписи сертификатов :).
All files stored on Dropbox servers are encrypted (AES-256) and are inaccessible
Это скорее такая полууспокоительная мера для клиентов, вопрошающих: а вот вы уволите админа Васю, а он диск сопрет с моим файлОм. На деле шифрование там -- бред, оно не секурное ни разу. Слишком predictable данные у обычных клиентов.
по юридическим соображениям
Любой сервис ВСЕГДА отдаст authorities всю информацию, вне зависимости от утверждений. Более того, сам пользователь отдаст всю информацию в случае юридического наезда, так что даже шифрование на уровне клиента -- лишь приятное самоуспокоение.
Comments 13
если k=G(s,r,f), то B(s,k)=D(f,k)=r,
при этом s и f восстановить из других данных невозможно.
(f - файл, r - случайный сессионный ключ, s - секрет, известный только пользователю).
Ну и обычные функции - хэш H() и симметричное шифрование C(,)
При загрузке файла f первый пользователь случайным образом генерирует r, вычисляет h=H(f), k=G(s,r,f), шифрует файл с помощью r (c=C(r,f)) и загружает на хост тройку (h,k,c).
Следующий пользователь вычисляет h=H(f), видит, что такой хэш уже хранится, скачивает k, восстанавливает r=D(f,k), генерирует k'=G(s',r,f) и загружает на хост только k'.
Если пользователь потерял f, ему нужно скачать c и k , восстановить r=B(s,k), и f=C(r,c).
Остается только придумать нужную тройку функций.
Reply
и где 100% гарантирантия что файлы одинаковые?
Reply
Reply
Reply
Reply
Reply
Reply
Reply
Reply
Пока что не противоречит. Работники Кока-Колы тоже не в курсе рецепта, но есть пара специальных чуваков, те знают. Еще более явный пример -- какой-нибудь Verisign. Страшно подумать что было бы, знай его работники приватный ключ для подписи сертификатов :).
All files stored on Dropbox servers are encrypted (AES-256) and are inaccessible
Это скорее такая полууспокоительная мера для клиентов, вопрошающих: а вот вы уволите админа Васю, а он диск сопрет с моим файлОм. На деле шифрование там -- бред, оно не секурное ни разу. Слишком predictable данные у обычных клиентов.
по юридическим соображениям
Любой сервис ВСЕГДА отдаст authorities всю информацию, вне зависимости от утверждений. Более того, сам пользователь отдаст всю информацию в случае юридического наезда, так что даже шифрование на уровне клиента -- лишь приятное самоуспокоение.
Reply
Leave a comment