欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

差分隱私和現(xiàn)有的隱私保護方法相結(jié)合:從用戶群體中學(xué)習(xí)的系統(tǒng)架構(gòu)詳解

zhKF_jqr_AI ? 2017-12-08 17:31 ? 次閱讀

了解人們?nèi)绾问褂盟麄兊脑O(shè)備通常有助于改善用戶體驗。但是,若想得到能洞察用戶行為的數(shù)據(jù)(例如用戶在鍵盤上打了什么字、訪問了什么網(wǎng)站),可能會侵犯他們的隱私。

近日,蘋果公司開發(fā)了一個系統(tǒng)架構(gòu),利用本地化差分隱私(local differential privacy)并結(jié)合現(xiàn)有的保護隱私的最佳方法,實現(xiàn)規(guī)?;瘜W(xué)習(xí)(learning at scale)。研究人員設(shè)計了高效可擴展的本地化差分隱私算法,經(jīng)過嚴(yán)謹(jǐn)?shù)姆治龃_定了應(yīng)用程序、隱私、服務(wù)器計算能力和設(shè)備帶寬四個要素的重要性應(yīng)如何分配。平衡這些因素將有助于成功地部署本地差分隱私。這一部署將覆蓋數(shù)以億計的用戶,例如在Safari中跟蹤最受歡迎的emoji、最常用的健康數(shù)據(jù)類型以及媒體播放偏好。后臺回復(fù)“dp”可查看完整版論文。

項目介紹

深入了解用戶的整體行為對于改善用戶體驗至關(guān)重要,但所需的數(shù)據(jù)較為敏感私密,公司必須予以保密。除此之外,利用這些數(shù)據(jù)部署學(xué)習(xí)系統(tǒng)還必須考慮資源開銷、計算成本和通信成本。在本文中,作者概述了將差分隱私和現(xiàn)有的隱私保護方法相結(jié)合,然后從用戶群體中學(xué)習(xí)的系統(tǒng)架構(gòu)。

經(jīng)過嚴(yán)格的數(shù)學(xué)證明,差分隱私是目前最強的隱私保障法之一。它的原理在于用仔細(xì)調(diào)整過的噪聲掩蓋用戶的數(shù)據(jù)。當(dāng)許多人提交數(shù)據(jù)時,增加到其中的噪聲達到平衡,并產(chǎn)生有意義的信息。

在差分隱私框架內(nèi),有兩種設(shè)定:中心(central)和本地(local)。在這套系統(tǒng)中,蘋果不收集中心化差別隱私所需的服務(wù)器上的原始數(shù)據(jù),而是采用本地化差別隱私,這種形式更加可靠。本地差分隱私在數(shù)據(jù)被發(fā)送前就做了隨機處理,所以服務(wù)器無法看到或接收到原始數(shù)據(jù)。

該系統(tǒng)非常透明,用戶可以自愿選擇是否加入。若用戶不同意上報使用信息,則不會記錄或傳輸他們的私人數(shù)據(jù)。通過本地化的差分隱私,用戶的設(shè)備依據(jù)時間等級進行加密。另外,該系統(tǒng)還限制上傳隱私事件的數(shù)量。將信息傳輸?shù)椒?wù)器每天只有一次,而且是在加密通道上進行,沒有用戶ID。用戶信息最終會到達一個訪問受限的服務(wù)器,其中沒有IP標(biāo)識符,也沒有與其他記錄相關(guān)聯(lián)的信息。所以,我們無法區(qū)分一個emoji和另一個Safari網(wǎng)頁記錄是否來自同一個用戶,也就是說這些信息是完全保密的。這些記錄經(jīng)過處理后加入統(tǒng)計數(shù)據(jù)中,然后再由蘋果內(nèi)部相關(guān)團隊進行分析。

同時,蘋果的研究人員還在估計各種記錄的頻率,例如emoji和網(wǎng)絡(luò)域名。他們有兩個想法:從已知的所有類別的記錄中生成直方圖,或者自己創(chuàng)造一個能表現(xiàn)出數(shù)據(jù)集中出現(xiàn)頻率最多的圖表。

系統(tǒng)架構(gòu)

該系統(tǒng)架構(gòu)由設(shè)備端和服務(wù)端的數(shù)據(jù)組成。在設(shè)備上,原始數(shù)據(jù)在加密階段分別進行處理。受限訪問的服務(wù)器在對數(shù)據(jù)處理后進一步將其分為數(shù)據(jù)接入和數(shù)據(jù)聚合階段。下面就為大家詳細(xì)介紹每一個階段。

信息加密(Privatization)

用戶可在macOS或iOS的“系統(tǒng)偏好設(shè)置”里選擇是否同意共享個人記錄以供分析。對于不愿加入的用戶,系統(tǒng)將不會開啟服務(wù)。而對于愿意使用這項功能的用戶,蘋果內(nèi)部為每個用戶行為都設(shè)置了隱私參數(shù)?。

蘋果還對每天傳輸?shù)拿宽椨涗浽O(shè)置了數(shù)量限制。而對于隱私參數(shù)?的選擇,則是基于每個記錄的基礎(chǔ)數(shù)據(jù)集的隱私特性。這些值與其他研究差分隱私的項目提出的參數(shù)是一致的。而且,由于hash沖突,下面的算法給用戶提供了進一步的否認(rèn)條件。除了上述的方法,蘋果還會刪除用戶的ID和IP地址來進一步加強隱私,服務(wù)器上所產(chǎn)生的的用戶ID和IP地址是分隔開的,所以多個記錄之間沒有關(guān)聯(lián)。

無論何時用戶使用了設(shè)備,數(shù)據(jù)會立即通過有特殊參數(shù)?的本地差分隱私進行加密,并使用數(shù)據(jù)保護(data protection)臨時儲存在設(shè)備上,而不是立即傳輸?shù)椒?wù)器上。

系統(tǒng)會根據(jù)設(shè)備的情況進行延遲,之后會隨機抽取不同的私人記錄,并將采樣記錄發(fā)送給服務(wù)器。這些記錄不包括設(shè)備ID或該行為發(fā)生的時間。設(shè)備和服務(wù)器之間的通信使用TLS進行加密。

加密過程

在iOS中打開“設(shè)置”>“隱私”>“分析”>“分析數(shù)據(jù)”后可看到“差分隱私”(DifferentialPrivacy)的入口。在macOS上,這些記錄在“關(guān)于本機”的“系統(tǒng)報告”中可見。下圖是算法對最受歡迎的emoji使用情況的樣本記錄,記錄所涉及的算法和參數(shù)在下文會有體現(xiàn)。

加密記錄的樣本報告

數(shù)據(jù)接入和聚合

在數(shù)據(jù)接入之前,加密記錄會刪除掉IP地址,然后數(shù)據(jù)庫收集所有用戶數(shù)據(jù)后進行批量處理。這一過程將刪除元數(shù)據(jù),例如記錄發(fā)生的時間,并且根據(jù)記錄情況把它們分類。在將結(jié)果輸入到下一階段前,數(shù)據(jù)庫也會隨機對每個用戶行為記錄進行排序。

聚合器收到來自數(shù)據(jù)庫的記錄后,根據(jù)算法為每個使用記錄生成個性化的直方圖。計算統(tǒng)計數(shù)據(jù)時,無需合并來自多個記錄的數(shù)據(jù)。在這些直方圖中,只有高于規(guī)定閾值T的域名才算入其中。

算法

下面就為大家介紹三種本地化差分隱私算法。

1.Private Count Mean Sketch(CMS)

Private Count Mean Sketch(CMS)算法聚合了設(shè)備提交的記錄,并在域名類別中輸出數(shù)量的直方圖,同時保留本地化差分隱私。這一過程分為兩個階段:客戶端處理和服務(wù)器端聚合。

舉個例子吧,假設(shè)一名用戶訪問了 www.example.com 這個網(wǎng)站??蛻舳怂惴◤囊唤M散列函數(shù)(hash function){h1,h2,h3,…,hk}中隨機抽取一個,假設(shè)抽到了h2,然后用它將上述網(wǎng)站域名以m的大小編碼,即h2(www.example.com)=31。該編碼被寫成大小為m的one-hot向量,其中第31位被設(shè)置為1。為了確保隱私的差分性,one-hot向量的每一位獨立地以概率翻轉(zhuǎn),其中?是隱私參數(shù),它構(gòu)成了私有化的向量。這個向量和被選擇的散列函數(shù)一起被輸送至服務(wù)器。

服務(wù)器端的算法通過聚合加密向量組成了sketch矩陣M。該矩陣有k行、m列,每一行都代表一個散列函數(shù),每一列代表從客戶端傳輸來的矢量大小。

當(dāng)記錄到達服務(wù)器時,算法將加密過的矢量添加到第j行的矢量,其中j是設(shè)備采樣的散列函數(shù)的指數(shù)。然后適當(dāng)?shù)卣{(diào)整m的值,以便每行都能為每個類別進行無差別的頻率計算。

為了計算 www.example.com 的頻率,該算法通過讀取每個j行的M,然后計算這些結(jié)果的平均值。在原始論文中有詳細(xì)的分析過程。

2.Private Hadamard Count Mean Sketch(HCMS)

在完整版論文中,作者討論了如何通過增加設(shè)備帶寬讓CMS里的計算更精確。但是,這就增加了用戶的傳輸成本。蘋果希望在降低傳輸成本的同時把對準(zhǔn)確性的影響降到最小,于是就有了Private Hadamard Count Mean Sketch算法(HCMS),其優(yōu)點是設(shè)備可以以極小的精度損失進行傳輸。

依然用上面的來舉例。與CMS類似,客戶端同樣是從一組散列函數(shù){h1,h2,h3,…,hk}中隨機抽取一個,假設(shè)抽到了h3。然后有h3(www.example.com)=42。編碼被寫成v=(0,0,…,0,1,0,…,0,0)的one-hot向量,這里第42位設(shè)置為1。因為我們只想傳輸一位信息,所以一個簡單的方法就是從向量中抽樣并發(fā)送一個隨機坐標(biāo)。但是這可能導(dǎo)致結(jié)果直方圖的錯誤或變化。為了減少誤差,研究人員用Hadamard將v進行轉(zhuǎn)化,即v’=Hv=(+1,-1,…,+1)。同樣,為了確保隱私性,向量中的每一位以的概率翻轉(zhuǎn)。下圖展示了這一過程。

Hadamard Count Mean Sketch中客戶端的算法

同樣,服務(wù)端的算法與CMS的大致相同。

Hadamard Count Mean Sketch中服務(wù)端的算法

3.Private Sequence Fragment Puzzle(SFP

上述兩種算法都假設(shè)有已知的域名集合,服務(wù)器可根據(jù)它來列舉樣本,以確定相應(yīng)的計數(shù)。

然而在某些情況下,一些域名非常大,由于計算能力有限無法全部列舉。例如,當(dāng)研究人員在研究常用單詞時,即使限制只能輸入10位區(qū)分大小寫的英文單詞,服務(wù)器也要進行至少5210次循環(huán)。

所以,蘋果開發(fā)了一種名為Sequence Fragment Puzzle(SFP)的算法,并將其用于發(fā)現(xiàn)新單詞的任務(wù)中。由于一個流行字符串的子字符串使用也很頻繁,所以研究人員利用這一點,用客戶端的CMS算法對打出的字進行加密。

成果

通過這三種新穎的算法,蘋果在提升用戶體驗方面有了很大的收獲。以下是三個典型案例:

發(fā)現(xiàn)流行的emoji

emoji是聊天中必不可少的要素,蘋果公司想要知道用戶最常用的emoji都有哪些,以及地區(qū)的相對分布。于是,他們在鍵盤語言環(huán)境中部署了算法。CMS的中的參數(shù)設(shè)置為:m=1024,k=65536,?=4,本地emoji庫中含有2600個emoji。

數(shù)據(jù)顯示,鍵盤設(shè)置不同,emoji使用也有差異。下圖是英文和法語兩個語言環(huán)境下的emoji使用情況。根據(jù)這一結(jié)果,蘋果可以對emoji的快捷輸入做本地化調(diào)整。

英法兩種鍵盤下人們使用emoji的區(qū)別

找到Safari中占用大量內(nèi)存的網(wǎng)站

有些網(wǎng)站真的是非常消耗資源,蘋果公司想找到這些網(wǎng)站,以優(yōu)化用戶體驗。他們的目標(biāo)有兩類:瀏覽時占用大量內(nèi)存的以及大量占用CPU拖慢速度的。在iOS11和manOS High Sierra中,Safari可以自動檢測到這些域名,并通過差分隱私上報這些域名。

利用算法,研究人員發(fā)現(xiàn),最常見的需要消耗大量資源的網(wǎng)站有視頻網(wǎng)站、購物網(wǎng)站和新聞網(wǎng)站。

擴充詞匯庫

為了優(yōu)化“自動糾錯”功能,蘋果不斷地尋找詞庫中沒有的詞語。這里就用到了上面說的SFP算法。

該算法不僅能用在英語環(huán)境中,還能用于法語和西班牙語。拿英語來說吧,算法學(xué)習(xí)到的新單詞可以被分為以下幾類:

縮寫:wyd(what you doing),wbu(what about you),idc(I don’t care);

習(xí)慣表達:bruh(bro),hun(honey),bae(baby),tryna(trying to);

流行語:Mayweather,McGregor,Despacito,Moana,Leia;

外文詞匯:dia,queso,aqui,jai…

蘋果正是利用這些數(shù)據(jù)不斷更新在線詞典,改善鍵盤體驗。

他們還發(fā)現(xiàn),現(xiàn)在很多人在打字時都會省去結(jié)尾的“e”或者“w”,比如lov(love),th(the)或者kno(know)。所以如果用戶不小心選擇了第一個預(yù)測詞語,也就是你目前所打出來的所有字符,那么系統(tǒng)會自動在單詞后面添加一個空格,而不是自動替換成你想要輸入的那個單詞。這一功能正是本地化差分隱私算法帶來的。

這篇文章介紹了蘋果公司為改善用戶體驗,同時保護用戶隱私推出的一種新穎的學(xué)習(xí)系統(tǒng)架構(gòu),將本地化差分隱私算法覆蓋到各個使用層面。同時還提出了三種獨特的算法——CMS、HCMS和SFP。這些工具幫助公司看到在不同語言環(huán)境下人們使用emoji的差異,并且搜索當(dāng)下最流行的詞語,促進他們改善軟件的體驗。

研究人員希望這一項目能夠彌合隱私理論與實踐之間的差距,同時他們相信這一工作將繼續(xù)推進大規(guī)模學(xué)習(xí)問題的研究,同時進一步增強用戶隱私保護。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24487

    瀏覽量

    200237
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8446

    瀏覽量

    133126

原文標(biāo)題:蘋果用機器學(xué)習(xí)和差分隱私大規(guī)模分析用戶數(shù)據(jù),并保證不會泄露信息

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深度自然匿名化:隱私保護與視覺完整性并存的未來!

    在科技快速發(fā)展的當(dāng)下,個人隱私保護的需求日益凸顯。如何能在隱私保護的基礎(chǔ)上,保持視覺完整性,從而推動企業(yè)開發(fā)與創(chuàng)新? 深度自然匿名化(DNAT)已被證明是傳統(tǒng)模糊化
    的頭像 發(fā)表于 01-15 15:57 ?3988次閱讀
    深度自然匿名化:<b class='flag-5'>隱私</b><b class='flag-5'>保護</b>與視覺完整性并存的未來!

    隱私與安全:動態(tài)海外住宅IP如何保護你在線

    動態(tài)海外住宅IP在保護用戶在線隱私與安全方面發(fā)揮著重要作用。
    的頭像 發(fā)表于 11-25 08:09 ?152次閱讀

    比亞迪獲得國家首批汽車隱私保護標(biāo)識

    近日,在2024中國汽車軟件大會上,中國汽車工業(yè)協(xié)會與中國網(wǎng)絡(luò)安全產(chǎn)業(yè)聯(lián)盟汽車網(wǎng)絡(luò)安全工作委員會聯(lián)合頒發(fā)“汽車隱私保護”標(biāo)識證書,比亞迪成為首批通過測評并獲得“汽車隱私保護”標(biāo)識授權(quán)的
    的頭像 發(fā)表于 11-18 16:14 ?337次閱讀

    IP地址安全與隱私保護

    在當(dāng)今數(shù)字化時代,IP地址作為網(wǎng)絡(luò)設(shè)備的唯一身份標(biāo)識,在網(wǎng)絡(luò)安全與隱私保護中扮演著至關(guān)重要的角色。然而,隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,IP地址也面臨著諸多挑戰(zhàn),對用戶隱私和網(wǎng)絡(luò)安全構(gòu)成了潛
    的頭像 發(fā)表于 09-03 15:59 ?675次閱讀

    蘋果:Safari在隱私保護領(lǐng)域有卓越的性能

    近期,蘋果公司在全球范圍內(nèi)啟動了一項戰(zhàn)略舉措,其目標(biāo)直接指向全球超過14億的iPhone用戶群體,以一種微妙而堅定的方式鼓勵他們谷歌Chrome瀏覽器轉(zhuǎn)向蘋果自家的Safari瀏覽器。這一轉(zhuǎn)變的倡議,核心在于突出Safari在隱私
    的頭像 發(fā)表于 07-18 15:17 ?587次閱讀

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    在人工智能技術(shù)飛速發(fā)展的今天,它不僅帶來了前所未有的便利和效率,也暴露出了一系列倫理和隱私問題。數(shù)據(jù)隱私侵犯到“信息繭房”的形成,再到“大數(shù)據(jù)殺熟”、AI歧視和深度偽造技術(shù)的威脅,A
    發(fā)表于 07-16 15:07

    蘋果再筑隱私防線:iPhone自動強密碼引領(lǐng)安全新風(fēng)尚

    在這個數(shù)字化時代,個人隱私安全成為了社會各界關(guān)注的焦點。蘋果公司,作為全球科技行業(yè)的領(lǐng)軍者,始終將用戶隱私保護放在首位。近日,蘋果在其官方網(wǎng)站上發(fā)布了一則引人注目的“
    的頭像 發(fā)表于 07-08 16:48 ?589次閱讀

    藍(lán)牙模塊的安全性與隱私保護

    藍(lán)牙模塊作為現(xiàn)代無線通信的重要組成部分,在智能家居、可穿戴設(shè)備、健康監(jiān)測等多個領(lǐng)域得到了廣泛應(yīng)用。然而,隨著藍(lán)牙技術(shù)的普及,其安全性和隱私保護問題也日益凸顯。本文將探討藍(lán)牙模塊在數(shù)
    的頭像 發(fā)表于 06-14 16:06 ?643次閱讀

    車載車庫GPS信號屏蔽器:如何保護隱私與安全

    深圳特信電子|車載車庫GPS信號屏蔽器:如何保護隱私與安全
    的頭像 發(fā)表于 05-29 08:54 ?759次閱讀

    車載車庫GPS信號屏蔽器:保護隱私,還是安全隱患

    深圳特信電子|車載車庫GPS信號屏蔽器:保護隱私,還是安全隱患
    的頭像 發(fā)表于 05-16 09:00 ?800次閱讀

    理想汽車澄清偷拍傳聞,重申保護用戶隱私安全

    理想汽車強調(diào),公司生產(chǎn)的超過 70 萬輛汽車,其車內(nèi)傳感器并不具備遠(yuǎn)程查看及存儲圖片、音頻、視頻的功能。公司始終將用戶隱私置于首位,行車記錄儀僅支持車主本地存儲,且不錄音。理想汽車嚴(yán)格遵守國家法律法規(guī),保障用戶信息安全。
    的頭像 發(fā)表于 04-15 15:35 ?687次閱讀

    GPS信號屏蔽器:保護隱私信息的設(shè)備?

    GPS信號屏蔽器:保護隱私信息的設(shè)備?|深圳特信電子
    的頭像 發(fā)表于 03-14 09:04 ?815次閱讀

    什么是手機信號屏蔽器? 手機信號屏蔽器:保護隱私,拒絕干擾

    手機信號屏蔽器:保護隱私,拒絕干擾,助力專注
    的頭像 發(fā)表于 03-12 09:07 ?3715次閱讀
    什么是手機信號屏蔽器? 手機信號屏蔽器:<b class='flag-5'>保護</b><b class='flag-5'>隱私</b>,拒絕干擾

    微軟發(fā)布廣告選擇API,保護用戶隱私,替代第三方cookies

     Ad Selection API內(nèi)置了K-anonymity約束、隱私以及廣告拍賣等多種強力隱私保護措施。同時,也具備可信執(zhí)行環(huán)境功能
    的頭像 發(fā)表于 03-06 11:17 ?524次閱讀

    Meta收到歐盟8家團體投訴違反歐盟的隱私保護規(guī)則

    Meta收到歐盟8家團體投訴違反歐盟的隱私保護規(guī)則 日前,捷克共和國、丹麥、法國、希臘、挪威、斯洛伐克、斯洛文尼亞和西班牙的消費者團體狀告Meta公司違反歐盟的隱私保護規(guī)則。 歐盟這8
    的頭像 發(fā)表于 03-01 16:18 ?379次閱讀