各地政府、國家及國際組織常會提供各類開放資料(open data),供民眾及機關組織利用,或是提出改進服務的建議。一般而言,開放這些資料並不會有什麼大問題,但若處理不慎,就有可能造成個人行蹤、認識的人、政治傾向,以及交友狀況等個人資訊外流的情形。
今年二月,一名網友 James Siddle 從主管倫敦公共自行車的倫敦交通局(TfL)下載了一筆資料。儘管該文件表示,其中並不包含使用者 ID 等個人資訊,但在 Siddle 將取得的資訊製成視覺化圖表後,赫然發現這些資料不但可以看出一個人的行蹤,甚至還能輕易查出此人的身分。
- 當開放資料變得過於開放,就容易產生問題
以下這張由 Siddle 所製作的圖表,顯示了某一位使用倫敦公共自行車的通勤族,在 2012 至 2013 年間長達六個月的移動記錄。其中紫色的線條表示同地租還(來回行程),橘線則代表異地租還(單向行程):
Siddle 表示,就算跟倫敦的街道不熟,也能輕易從這張圖中推測出以下線索:該名通勤族應該住在 Limehouse 周遭(地圖右下處),在 King’s Cross 上班(地圖左上處),並且有家人、朋友或是伴侶住在 Bow(地圖右上處)。
若將時間限制在凌晨四點至早上十點之間,這項推測便會更加有力:
在早上的這段時間,該名通勤族都會前往 King’s Cross,而之所以有兩個出發點,則是因為他偶而會在家裡以外的地方過夜。Siddle 也表示,若將檢視時間設定在傍晚,甚至可以看出這個人常去的社交地點。
儘管 Siddle 表示他無意也不願再深入研究此人的行徑,但若有心人士搜尋到相關的臉書貼文、含有地理資訊的相片,或是抱怨腳踏車格被停滿的推特文,那麼想查出此人的行徑或身分,就會是件非常容易的事。
他表示:「只要很簡單地將已知的資訊連連看,就很可能查出這份公共自行車租借記錄是誰的。對於頻繁的用戶來說,那等於是暴露了他們生活的一大部分。」
- 消息爆出後,官方已將該資料移除
Siddle 表示,他在部落格中發文前,就已向倫敦交通局提出警告,卻未獲得任何回應,直到知名網路媒體《Quartz》詢問,負責人 Nick Aldworth 才出面表示:「我們一向致力於提升各項服務的透明度,並為消費者及利益攸關者提供廣泛的資料。這次由於行政疏失,導致 2012 年 7 月 22 日至 2013 年 2 月 2 日的匿名租借記錄流出。儘管該份資料並未在網路上公開任何使用者的身分,我們仍在第一時間予以刪除。」
在台灣,雖然台北市政府資料開放平台尚未公開 UBike 的使用者租借記錄,但將來若企業要求,政府也不是沒有乖乖順從的可能,加上歷來公家單位無論是國家檔案管理局、法務部、縣政府及勞工局皆資安問題頻傳,希望政府能將這次倫敦的公共自行車事件引以為鑑,在未來更加小心處理開放資料及個資檔案。
COMMENT