If-Koubou

Какво е "диференциална поверителност" и как запазва данните ми анонимни?

Какво е "диференциална поверителност" и как запазва данните ми анонимни? (Как да)

Apple запазва репутацията си, за да гарантира, че данните, които събира от вас, остават частни. Как? Чрез използването на нещо, наречено "Диференциална поверителност".

Какво е диференциална поверителност?

Apple я обяснява като такъв:

Apple използва технологията за диференциално поверителност, за да открие начините на използване на голям брой потребители, без да компрометира личната неприкосновеност на личния живот. За да затъмни самоличността на отделния човек, диференциалната поверителност добавя математически шум към малка извадка от модела на използване на индивида. Тъй като повече хора споделят един и същи модел, започват да се появяват общи модели, които могат да информират и подобрят практическата работа на потребителите.

Философията за диференциалната поверителност е тази: всеки потребител, чието устройство, независимо дали е iPhone, iPad или Mac, добавя изчисление към по-голям обем от обобщени данни (голяма картина, формирана от различни малки снимки), не трябва да се разкрива източника, да не говорим за какви данни са допринесли за това.

Apple не е единствената компания, която прави това - както Google, така и Microsoft го използват още по-рано. Но Apple я популяризира, като разговаря подробно в своята 2016 WWDC фигура.

Е, как се различава това от другите анонимизирани данни? Е, анонимизирани данни все още могат да се използват за извличане на лична информация, ако знаете достатъчно за даден човек.

Да приемем, че хакерът има достъп до анонимизирана база данни, която разкрива работна заплата на компанията. Да кажем, че те също знаят, че служителят X се премества в друга област. След това хакерът би могъл просто да попита базата данни преди и след като служителят X се премести и лесно извлече доходите си.

За да защитим чувствителната информация на служителя X, диференциалната поверителност променя данните с математически "шум" и други техники, така че ако заявите базата данни, ще получите само приближение от колко (или някой друг) служител X е платен.

Следователно, неприкосновеността на личния му живот се запазва поради "разликата" между предоставените данни и добавения шум, така че е достатъчно неясно, че е почти невъзможно да се знае дали данните, които търсите, всъщност са отделни хора.

Как работи диференциалната поверителност на Apple?

Диференциалната поверителност е сравнително нова концепция, но идеята е, че тя може да даде на компанията стремеж към прозрения, базирани на данните от нейните потребители, без да знае какво точно че тези данни се разказват или от кого произхождат.

Apple, например, разчита на три компонента, за да направи работата по диференциалната поверителност на вашето Mac или iOS устройство: хеширане, подсвирване и инжектиране на шум.

Hashing отнема низ от текст и го превръща в по-кратка стойност с фиксирана дължина и смесва тези клавиши нагоре в необратимо случайни струни от уникални знаци или "хеш". Това затъмнява данните ви, така че устройството да не съхранява нищо в оригиналната си форма.

Подсмятането означава, че вместо да събира всяка дума, която човек набира, Apple ще използва само по-малка извадка от тях. Например, да кажем, че имате дълъг текстов разговор с приятел, който използва емотикони. Вместо да събира целия разговор, подборът на дисплей може вместо това да използва само частите, от които се интересува Apple, като емоти.

Накрая, устройството ви инжектира шум, добавяйки произволни данни в първоначалния набор от данни, за да го направи по-неясен. Това означава, че Apple получава резултат, който е маскиран все така леко и затова не е съвсем точен.

Всичко това се случва на устройството ви, така че то вече е било съкратено, смесено, извадково и замъглено, преди то дори да бъде изпратено до облака, за да анализира Apple.

Къде се използва диференциалната поверителност на Apple?

Има различни случаи, когато Apple биха могли, може искате да събирате данни, за да подобрите приложенията и услугите си. В момента обаче Apple използва само Диференциална поверителност в четири конкретни области.

  • Когато достатъчно хора заменят дума с конкретно емотикони, тя ще се превърне в предложение за всички.
  • Когато нови думи се добавят към достатъчно местни речници, за да бъдат считани за обичайно, Apple ще ги добави и към речника на всички останали.
  • Можете да използвате термин за търсене в Spotlight и след това да даде предложения за приложения и да отворите тази връзка в споменатото приложение или да ви позволи да го инсталирате от App Store. Например, кажете, че търсите "Стар Трек", което предполага приложението IMDB. Колкото повече хора отварят или инсталират приложението IMDB, толкова повече ще се появят във всички резултати от търсенето.
  • Тя ще осигури по-точни резултати за съвети за търсене в бележките. Например, кажете, че имате бележка с думата "ябълка" в нея. Търсите търсене и ви дава резултати не само за речника на дефиницията, но и за уебсайта на Apple, местоположенията на Apple Stores и т.н. Предполага се, че колкото повече хора се докосват до определени резултати, толкова по-високи и по-често ще се появяват в "Търсене за всички останали".

Да използваме емоида като пример. В iOS 10 Apple представи нова функция за замяна на емотикони на iMessage. Въведете думата "любов" и можете да я замените със сърдечно емотико. въведете думата "куче" и - предположихте го - можете да го замените с емотик за куче.

По същия начин е възможно вашият iPhone да предскаже какви емотики искате, така че ако пишете съобщение "Аз ще ходя на кучето", вашият iPhone ще ви посъветва да предложите емотиковото куче.

Така че, Apple взема всички малки парчета от iMessage данни, които събира, разглежда ги като цяло и може да изведе модели от това, което хората пишат и в какъв контекст. Това означава, че вашият iPhone може да ви даде по-интелигентен избор, защото се възползва от всички текстови разговори, които другите създават и мислят, "това е може би емотиконите, които искате".

Тя приема село (на Еможи)

Недостатъкът на диференциалната поверителност е, че тя не дава точни резултати при малки проби. Това е властта, която прави конкретните данни неясни, за да не могат да бъдат приписвани на никой от тях. За да работи и работи добре, много потребители трябва да участват.

Това е нещо като да гледаш снимка с малко изображение, много близо. Няма да можете да видите какво представлява, ако погледнете само няколко бита, но когато се върнете обратно и погледнете цялото нещо, картината става по-ясна и по-дефинирана, дори и да не е супер висока резолюция.

По този начин, за да се подобри емодирането на промяната и прогнозирането (между другото), Apple трябва да събира данни от iPhone и Mac от цял ​​свят, за да му даде все по-ясна представа за това, което хората правят и по този начин да подобри приложенията и услугите си. Обръща се към всички тези рандомизирани, шумни данни с множество данни и ги добива за модели - като например колко потребители използват емотиконите на праскова вместо "задника".

И така, силата на диференциалната поверителност разчита на това, че Apple може да изследва големи количества обобщени данни, като същевременно гарантира, че няма кой да е по-мъдър кой ги изпраща.

Как да се откажете от диференциални поверителност в iOS и MacOS

Ако все още не сте убедени, че диференциалната поверителност е подходяща за вас, все пак имате късмет. Можете да се откажете направо от настройките на устройството си.

На устройството си с iOS докоснете отворете "Настройки" и след това "Поверителност".

На екрана "Поверителност" докоснете "Диагностика и използване".

Накрая, на екрана за диагностика и използване кликнете върху "Не изпращай".

В MacOS отворете системните предпочитания и кликнете върху "Сигурност и поверителност".

В "Предпочитания за защита и поверителност" кликнете върху раздела "Поверителност" и след това се уверете, че "Изпращане на данни за диагностика и използване на Apple" не е отметнато. Имайте предвид, че ще трябва да кликнете върху иконата за заключване в долния ляв ъгъл и да въведете системната си парола, преди да направите тази промяна.

Очевидно е, че има много повече за диференциалната поверителност, както на теория, така и по отношение на приложението, от това опростено обяснение. Месото и картофите от него разчитат сериозно на някаква сериозна математика и като такава може да стане доста тежка и сложна.

Надяваме се, обаче, това ви дава представа за това как работи и че се чувствате по-уверени в компаниите, събиращи определени данни, без да се страхувате да бъдете идентифицирани.