還在用舊版Excel?資料行數限制導致英國誤放1.6萬名武漢肺炎確診者
英國上周傳出,因為Microsoft Excel的資料欄位限制,導致有將近1.6萬名武漢肺炎(COVID-19)檢測結果為陽性的人數未被計入確診統計中,引發大眾感染風險。
英國的英格蘭公共衛生局(Public Health England, PHE)上周坦承,有15,841的確診人數因故未被計入官方數字。
為了每日的疫情報告,PHE負責將各地公、民營的樣本檢測結果彙整起來,以便統計每日新增COVID-19確診人數。雖然當地系統逐漸自動化,但是疫情快速發展,導致許多資訊往來仍有賴手動以及格式轉換作業。
本次事件導因於一家檢測實驗室將其每日數據以CSV檔形式傳給PHE。CSV檔中,資料僅以逗點切分。英格蘭的確診數據會再匯入到Excel中,最下方的新增確診資料則加入資料庫中。
然而Microsoft Excel檔案有資料容量限制。最新版可容納1,048,576 行,舊版還只能容納65,536行。如果匯入的CSV檔超過限制,多的部份就會被截掉而無法顯示於資料庫中。因此若檢驗所上傳的資料超過100萬,則PHE從資料庫讀取到的資料,就會少於實際數據。
PHE上周指出,由於「IT錯誤」使得從9月25到10月2日的15,841名檢測為陽性的資料被遺漏了。PHE指出,技術問題已經藉由把Excel檔切分成多個檔解決。
這1.6萬人中,大部份屬於非重症患者,他們是在社區中接受檢測,少部份屬於重症患者,檢測地點是在醫院、照護中心或其他醫護機構中。英國首相Boris Jonhnson也無法評估有多少人受到影響。
衛報以非重症平均傳染3人,重症平均傳染7人計算,這些確診者繼續活動可能造成至少5萬人感染。
除了容量限制外,Excel造成的錯誤甚至改變了人類基因的基礎。因為微軟軟體的問題,去年人類基因命名委員會(Human Gene Nomenclature Committee)已將27種基因名稱改掉。例如微軟的Excel一直會把SEPT1和MARCH1自動辨識為日期,迫使委員會將之改成SEPTIN1及MARCHF1,而把WARS改成了WARS1。
來源:Guardian