Головна » як » Що таке «диференційна конфіденційність» і як вона зберігає мої дані анонімними?

    Що таке «диференційна конфіденційність» і як вона зберігає мої дані анонімними?

    Apple ставить свою репутацію на те, щоб дані, які вона збирає від вас, залишалися приватними. Як? Використовуючи те, що називається «Диференціальна конфіденційність».

    Що таке диференційна конфіденційність?

    Apple пояснює це як таке:

    Компанія Apple використовує технологію диференціальної конфіденційності, щоб допомогти виявити закономірності використання великої кількості користувачів, не порушуючи конфіденційність особи. Щоб приховати індивідуальну ідентичність, Диференціальна конфіденційність додає математичний шум до невеликої вибірки моделі користування. Оскільки більше людей поділяють одну й ту саму картину, починають з'являтися загальні закономірності, які можуть інформувати та покращувати досвід користувачів.

    Філософія Диференціальної конфіденційності полягає в наступному: будь-який користувач, чиє пристрій, незалежно від того, чи є він iPhone, iPad або Mac, додає обчислення до більшої сукупності даних (велика картина, сформована з різних менших зображень), не повинна розкриватися як джерело, не кажучи вже про дані, які вони внесли.

    Apple - не єдина компанія, що робить це, або - Google і Microsoft використовували її ще раніше. Але Apple популяризувала його, детально розмовляючи про це на своєму виступі WWDC 2016 року.

    Отже, як це відрізняється від інших анонімних даних? Добре, анонімні дані все ще можуть бути використані для виведення особистої інформації, якщо ви знаєте про людину.

    Припустимо, що хакер може отримати доступ до анонімної бази даних, яка показує розрахунки заробітної плати компанії. Скажімо, вони також знають, що співробітник X переміщується в іншу область. Тоді хакер міг би просто запитувати базу даних до і після переміщення працівника X і легко вивести його дохід.

    Для того, щоб захистити конфіденційну інформацію працівника X, Диференціальна конфіденційність змінює дані з математичним "шумом" та іншими методами, так що, якщо ви запитуєте базу даних, ви отримаєте лише наближення про те, скільки (чи когось іншого) працівника X було виплачено.

    Таким чином, його конфіденційність зберігається через «різницю» між наданими даними та шумами, доданими до неї, тому вона досить розмита, що практично неможливо дізнатися, чи є дані, які ви шукаєте, насправді конкретною особою.

    Яким є диференційна робота Apple щодо конфіденційності?

    Диференційна конфіденційність є відносно новою концепцією, але ідея полягає в тому, що вона може дати компанії чіткі уявлення на основі даних від своїх користувачів, не знаючи, що точно що дані говорять або від кого вона бере початок.

    Наприклад, Apple розраховує на три компоненти, щоб зробити свою дієсну роботу з конфіденційності на вашому Mac або iOS-пристрої: хешування, подвыборку та введення шуму.

    Хешінг приймає рядок тексту і перетворює його на коротше значення з фіксованою довжиною і змішує ці ключі в необоротні випадкові рядки унікальних символів або "хеш". Це затьмарює ваші дані, тому пристрій не зберігає жодного з них у початковій формі.

    Підвибірка означає, що замість того, щоб збирати кожне слово, вказується людина, Apple використовуватиме лише менший зразок з них. Наприклад, припустимо, що у вас довга текстова бесіда з другом, вільно використовуючи смайлики. Замість того, щоб збирати всю цю розмову, підсумка могла б використовувати лише ті частини, які зацікавлені в Apple, такі як emoji.

    Нарешті, пристрій вводить шум, додаючи випадкові дані до вихідного набору даних, щоб зробити його більш розпливчастим. Це означає, що Apple отримує результат, який маскується так легко і тому не зовсім точно.

    Все це відбувається на вашому пристрої, тому вона вже була скорочена, змішана, вибірка і розмита, перш ніж вона навіть буде відправлена ​​в хмару для того, щоб для Apple проаналізувати..

    Де використовується диференційна конфіденційність компанії Apple?

    Існує безліч випадків, коли Apple може хочуть збирати дані для покращення своїх програм і служб. Хоча зараз, Apple використовує лише диференційну конфіденційність у чотирьох конкретних областях.

    • Якщо достатньо людей замінить слово певним смайликом, це стане пропозицією для всіх.
    • Коли до нових локальних словників додаються нові слова, які вважаються звичайними, Apple додасть їх до словників усіх інших.
    • Ви можете скористатися пошуковим терміном у Spotlight, а потім надасть пропозиції до програми та відкриє це посилання у вказаній програмі або дозволить встановити її з App Store. Наприклад, скажімо, ви шукаєте "Зоряний шлях", який пропонує програму IMDB. Чим більше людей відкриється або встановлює додаток IMDB, тим більше він з'явиться в результатах пошуку кожного користувача.
    • Це дасть більш точні результати для підказок пошуку в примітках. Наприклад, скажімо, у вас є записка зі словом «яблуко». Ви виконуєте пошук пошуку, і він дає результати не тільки для визначення словника, але й для веб-сайту Apple, розташування магазинів Apple і так далі. Імовірно, чим більше людей торкаються певних результатів, тим вищі і частіше вони з'являтимуться в Lookup для всіх інших.

    Для прикладу скористаємося смайликами. У iOS 10 компанія Apple представила нову функцію заміни смайликів на iMessage. Введіть слово "любов", і ви можете замінити його серцем смайликів. введіть слово "собака", і - ви здогадалися - ви можете замінити його на собаку-емозі.

    Крім того, для вашого iPhone можна передбачити, які емоції ви хочете зробити так, щоб, якщо ви набираєте повідомлення "Я збираюся ходити собаку", ваш iPhone буде корисно запропонувати собаку.

    Таким чином, Apple бере всі ті маленькі шматки даних iMessage, які вона збирає, розглядає їх як ціле, і може вивести моделі з того, що люди набирають і в якому контексті. Це означає, що ваш iPhone може дати вам розумніший вибір, оскільки він користується всіма цими текстовими розмовами, які створюють інші користувачі, і вважає, що "це, мабуть, потрібна вам смайлик".

    Це займає село (з Emoji)

    Недоліком диференційної конфіденційності є те, що він не дає точних результатів у невеликих зразках. Це сила полягає в тому, що конкретні дані стають розпливчастими, тому його не можна приписати жодному користувачеві. Для того, щоб він працював і працював добре, багато користувачів повинні брати участь.

    Це виглядає як поглядаюче у bitmapped фото надзвичайно близько. Ви не зможете побачити, що це таке, якщо ви подивитеся лише на кілька бітів, але коли ви відступаєте і дивитеся на все це, зображення стає більш чітким і більш чітким, навіть якщо це не дуже високо дозвіл.

    Таким чином, для того, щоб поліпшити заміну і прогнозування смайликів (серед іншого), Apple повинна збирати дані iPhone і Mac з усього світу, щоб дати їй більш чітку картину того, що роблять люди, і таким чином покращити свої програми та послуги. Це перетворюється на всі ці рандомізовані, шумні, краудсорсинговані дані, і видобуває їх для моделей, наприклад, скільки користувачів використовують персикову смайлику замість «прикладу».

    Таким чином, сила Диференціальної конфіденційності залежить від того, чи зможе Apple вивчити великі обсяги сукупних даних, забезпечуючи при цьому, що ніхто не розуміє, хто надсилає їм ці дані.

    Як відмовитися від диференціальної конфіденційності в iOS і macOS

    Якщо ви все ще не переконані, що Диференціальна конфіденційність підходить саме вам, то вам пощастило. Ви можете відмовитися від налаштувань свого пристрою.

    На пристрої iOS натисніть відкрити "Налаштування", а потім "Конфіденційність".

    На екрані "Конфіденційність" натисніть "Діагностика та використання".

    Нарешті, на екрані Діагностика та використання натисніть "Не надсилати".

    На MacOS відкрийте системні налаштування та натисніть "Безпека та конфіденційність".

    У налаштуваннях безпеки та конфіденційності перейдіть на вкладку "Конфіденційність", а потім переконайтеся, що не надруковано "Надіслати дані діагностики та використання компанії Apple". Зауважте, що потрібно натиснути піктограму блокування в лівому нижньому куті і ввести свій системний пароль, перш ніж ви зможете внести цю зміну.

    Очевидно, що Диференціальної конфіденційності, як в теорії, так і в застосуванні, є набагато більше, ніж це спрощене пояснення. Її м'ясо і картопля в значній мірі покладаються на деякі серйозні математики..

    Сподіваємося, однак, це дає вам уявлення про те, як він працює, і що ви відчуваєте більше впевненості щодо компаній, які збирають певні дані, не побоюючись бути ідентифікованими.