Безпечне гешування паролів

Цей розділ пояснює причини використання геш-функцій для убезпечення паролів, а також, як це зробити ефективно.

Навіщо мені гешувати користувацькі паролі моєї програми?

Гешування паролів є основним захисним заходом, що вживається під час розробки програми, яка буде приймати паролі від користувачів. Без гешування будь-які паролі, що містяться у вашій базі даних, можуть бути вкрадені, якщо базу даних зламають, та негайно використані для зламу всієї вашої програми, а також облікових записів ваших користувачів у інших сервісах, якщо користувачі задали не унікальні паролі.

Застосовуючи алгоритм гешування користувацьких паролів перед зберіганням їх у вашій базі даних, ви унеможливлюєте викриття зловмисником оригінального пароля, маючи при тому змогу у майбутньому порівнювати отриманий геш з наявним.

Важливо підкреслити, що гешування паролів лише захищає їх від того, щоб бути скомпрометованими у вашому сховищі даних, але аж ніяк не захищає їх від перехоплення зловмисним кодом, впровадженим у вашу програму.

Чому такі поширені геш-функції як md5() і sha1() не придатні для паролів?

Алгоритми гешування MD5, SHA1 та SHA256 розроблені бути дуже швидкими та ефективними. З сучасною технікою та комп'ютерним обладнанням стало легко зламати результат цих алгоритмів, щоб визначити початковий текст.

Через те, як швидко сучасні комп'ютери можуть запустити такий алгоритм в зворотньому напрямку, багато фахівців з безпеки наполягають не використовувати таке гешування.

Як мені гешувати паролі, якщо поширені геш-функції не придатні.

Під час гешування паролів двома найважливішими факторами є витрати на обчислення та т. зв. "сіль". Чим більше обчислень має виконати алгоритм, тим довше триватиме злам результату його обчислень.

PHP має вбудований API гешування паролів, який надає засоби як гешування, так і перевірки паролів безпечним способом.

Інший спосіб — це функція crypt(), яка підтримує декілька алгоритмів гешування. Використовуючи цю функцію, ви гарантовано оберете доступний алгоритм, адже PHP має власну реалізацію кожного підтримуваного алгоритму, навіть якщо один або декілька не підтримуються вашою системою.

Для гешування паролів рекомендується алгоритм Blowfish, який стандартно використовується API гешування паролів, оскільки він є набагато дорожчим в обчисленні, аніж MD5 або SHA1, залишаючись масштабованим.

Зауважте, якщо ви використовуєте crypt() для перевірки пароля, вам необхідно подбати про запобігання часових атак, використовуючи однаковий час для порівняння рядків. Ані оператори == і ===, ані strcmp() не виконують порівняння за однаковий проміжок часу. Тільки password_verify() зробить це для вас, тож дуже просимо використовувати вбудований API гешування паролів за будь-якої можливості.

Що таке "сіль"?

Криптографічна сіль — це текст, який дописується до даних у процесі гешування, щоб унеможливити пошук результатів у списку попередньо обчислених пар гешів та їхніх вхідних даних, відомого як райдужна таблиця.

Простими словами, сіль — це допоміжна частинка даних, яка значно ускладнює злам ваших гешів . Існує певна кількість онлайн сервісів з надання розширених списків попередньо обчислених гешів, а також їхніх вхідних даних. Використання солі робить малоймовірним або неможливим знаходження отриманого гешу в одному з цих списків.

password_hash() створить випадкову сіль, коли та не вказана, і це, як правило, найпростіший і найбезпечніший підхід.

Як мені зберігати цю сіль?

У password_hash() або crypt() значення, що повертається, містить сіль як частину утвореного гешу. Це значення має бути точно збережене у вашій базі даних, оскільки воно містить інформацію про геш-функцію, яка використовувалася, і потім може бути надано безпосередньо до password_verify() або crypt() під час перевірки паролів.

На наступній діаграмі показано формат значення, що повертається функціями crypt() або password_hash(). Як можна побачити, значення є самодостатнім, з усією інформацією про алгоритм і сіль, необхідну для майбутньої перевірки пароля.


        Порядок складових значення, що повертають функції password_hash і crypt:
        обраний алгоритм, опції алгоритму, використана сіль, загешований пароль.

add a note

User Contributed Notes 3 notes

up
147
alf dot henrik at ascdevel dot com
10 years ago
I feel like I should comment some of the clams being posted as replies here.

For starters, speed IS an issue with MD5 in particular and also SHA1. I've written my own MD5 bruteforce application just for the fun of it, and using only my CPU I can easily check a hash against about 200mill. hash per second. The main reason for this speed is that you for most attempts can bypass 19 out of 64 steps in the algorithm. For longer input (> 16 characters) it won't apply, but I'm sure there's some ways around it.

If you search online you'll see people claiming to be able to check against billions of hashes per second using GPUs. I wouldn't be surprised if it's possible to reach 100 billion per second on a single computer alone these days, and it's only going to get worse. It would require a watt monster with 4 dual high-end GPUs or something, but still possible.

Here's why 100 billion per second is an issue:
Assume most passwords contain a selection of 96 characters. A password with 8 characters would then have 96^8 = 7,21389578984e+15 combinations.
With 100 billion per second it would then take 7,21389578984e+15 / 3600 = ~20 hours to figure out what it actually says. Keep in mind that you'll need to add the numbers for 1-7 characters as well. 20 hours is not a lot if you want to target a single user.

So on essence:
There's a reason why newer hash algorithms are specifically designed not to be easily implemented on GPUs.

Oh, and I can see there's someone mentioning MD5 and rainbow tables. If you read the numbers here, I hope you realize how incredibly stupid and useless rainbow tables have become in terms of MD5. Unless the input to MD5 is really huge, you're just not going to be able to compete with GPUs here. By the time a storage media is able to produce far beyond 3TB/s, the CPUs and GPUs will have reached much higher speeds.

As for SHA1, my belief is that it's about a third slower than MD5. I can't verify this myself, but it seems to be the case judging the numbers presented for MD5 and SHA1. The issue with speeds is basically very much the same here as well.

The moral here:
Please do as told. Don't every use MD5 and SHA1 for hasing passwords ever again. We all know passwords aren't going to be that long for most people, and that's a major disadvantage. Adding long salts will help for sure, but unless you want to add some hundred bytes of salt, there's going to be fast bruteforce applications out there ready to reverse engineer your passwords or your users' passwords.
up
24
swardx at gmail dot com
8 years ago
A great read..

https://nakedsecurity.sophos.com/2013/11/20/serious-security-how-to-store-your-users-passwords-safely/

Serious Security: How to store your users’ passwords safely

In summary, here is our minimum recommendation for safe storage of your users’ passwords:

Use a strong random number generator to create a salt of 16 bytes or longer.
Feed the salt and the password into the PBKDF2 algorithm.
Use HMAC-SHA-256 as the core hash inside PBKDF2.
Perform 20,000 iterations or more. (June 2016.)
Take 32 bytes (256 bits) of output from PBKDF2 as the final password hash.
Store the iteration count, the salt and the final hash in your password database.
Increase your iteration count regularly to keep up with faster cracking tools.

Whatever you do, don’t try to knit your own password storage algorithm.
up
-2
tamas at microwizard dot com
3 years ago
While I am reading the comments some old math lessons came into my mind and started thinking. Using constants in a mathematical algorythms do not change the complexity of the algorythm itself.

The reason of salting is to avoid using rainbow tables (sorry guys this is the only reason) because it speeds up (shortcuts) the "actual" processing power.
(((Longer stored hashes AND longer password increases complexity of cracking NOT adding salt ALONE.)))

PHP salting functions returns all the needed information for checking passwords, therfore this information should be treated as constant from farther point of view. It is also a target for rainbow tables (sure: for much-much larger ones).

What is the solution?
The solution is to store password hash and salt on different places.
The implementation is yours. Every two different places will be good enough.

Yes, it will make problems for hackers. He/she needs to understand your system. No speed up for password cracking will work for him/her without reimplementing your whole system.

This is my two cent.
To Top