避免誤踩雷區 先搞懂資料分析三大盲點

2020年初,因為疫情蔓延,各國皆出現口罩供不應求的情況,台灣透過健保系統並透過開放資料,與民間協作推出的口罩實名制,不僅備受各國媒體推薦,也讓資料應用的議題再被注意。其實不只是應用於公共議題,企業內部如何使用資料、產出什麼應用價值,也是許多人關切的重點。

2020年初,因為疫情蔓延,各國皆出現口罩供不應求的情況,台灣透過健保系統並透過開放資料,與民間協作推出的口罩實名制,不僅備受各國媒體推薦,也讓資料應用的議題再被注意。其實不只是應用於公共議題,企業內部如何使用資料、產出什麼應用價值,也是許多人關切的重點。

國家發展委員會日前辦理2019年「資料應用輔導成果發表會」,透過四個案例應用分享,呈現公私及跨域協力資料應用成果。台灣人工智慧學校執行長陳昇瑋也受邀參與並提出建言。他認為,透過這些案例,除了可以看到企業如何應用資料,也能發現企業在運用資料時常見的三大盲點。

盲點一:沒問對問題,資料再多也沒有用

例如,某藥局分析氣候的變化與銷售量的關係。企業利用氣溫與濕度的數值,對比門市保健食品銷售業績進行關聯性分析,發現當溫度在18度以下,且與前一日的溫度變化在-10% 到-30% 之間,會影響到保健商品的營業額。

這樣的結果乍看合理,但陳昇瑋認為,並未真正提出要解決的問題。他提醒,很多人進行資料分析或是人工智慧應用,總是想要「以資料產生價值」,卻忽略了找出「要解決的問題」。例如知道了氣候變化與保健食品銷售有關係之後,究竟要解答什麼問題?會不會是「要讓某項產品賣得好」才能創造出更明顯的價值?

對於要導入人工智慧的企業來說,「找對問題」一直都是個大挑戰。不同部門的人員,對於問題的理解也不一樣。業務部門的第一線同仁在需求上的描述、對解決方案的期待,以及對上線營運的考量,也與技術部門的資料質量、資料即時性、異常處理等同等重要,因此企業必須有個認知,在市場變化,技術與需求快速變動的時代,企業本身的調適若要快又準,跨部門的協作將必須成為常態而非特例。

盲點二:資料多很重要,正確更重要

另一個案例是流通業,至2019年已突破3500家分店的大型便利商店,30年來所關閉的分店也高達1000家,這當然是相當大的成本負擔。因此如何判斷優良的展店地址,減少「不良店」比例,仍是流通業的重大課題。

為了提升開店質量、速度及確保投資效益,這家超商與台北市商業處合作發展商圈開店選址立地評估,以台北市中山區試辦,利用人口、交通及企業內部等資料,透過線性回歸,人工調整等方式,判定較佳的開店位置,以避免選址錯誤,造成損失。

陳昇瑋認為,就目前的資料集而言,還缺少了POI資料庫,幫助企業掌握當地的加油站、橋梁、路口、河流、警察局等位置。同時,他也建議流通業可以採用機器學習,透過人工智慧建模幫助判斷選擇開店地址的準確率。這些技術並不難,效果也相當立竿見影,他指出,其實台灣人工智慧學校的學員都曾做過類似專題,只要派員至學校學習4個月就可完成技術升級。

盲點三:沒有資料治理 資料很難產生價值

根據國發會的資料,目前政府已開放超過4萬多筆資料集,符合「結構化、機器可讀、開放格式」等規格的金標章資料集,也從2017年的3%提升到73%。陳昇瑋認為,在開放資料之上,必須要談的是資料治理的部分,因為資料可能分散在不同的部門或單位中,「資料是誰的?」以及明確說明資料的「擁有者」、「保管者」以及「仲裁者」,讓資料可以串接起來,才能產生價值。