大數據分析是「工業 4.0」的核心技術之一,數據本身若只紀錄與標記,並不具有任何意義,充其量只是一堆數值而已。倘若利用分析法則,把重點放在大數據背後可創造出來的價值,它就能夠幫助製造商找出可改善的問題處,以求降低損失並提高生產效益。
大數據是什麼?
大數據(Big Data)又稱為「巨量資料」,因為資料的數量龐大與複雜到無法用傳統的數據處理方式來處理,所以主要是由「結構化資料」、「非結構化資料」與「半結構化資料」等三種資料集所組成。
大數據分析
透過分析大數據可以發現其中的趨勢、行為模式與市場需求,進而為整體優化提供更好的決策。因此、進行大數據分析需要使用多種技術,例如:人工智慧、機器學習或預測分析等。
大數據的三大特性
- Volume,資料量大
- Velocity,資料速度快
- Variety,資料多樣性
大數據擁有三大特性(3V),是由 Gartner(高德納公司)所指出,並於 2012 年修改大數據的定義為「大數據是大量、高速、及/或多變的資訊資產,它需要新型的處理方式去促成更強的決策能力、洞察力與最佳化處理」。
Volume,資料量大
顧名思義就是資料量非常的龐大,不僅低密度且結構鬆散,狹義來說,一天之內能夠生成 1 TB 以上的資料量。也因為資料量過大,因此已無法使用傳統的方式處理。
Velocity,資料速度快
這裡的速度指的是資料傳輸或接收的速度,也可以說是處理資料的速度。每天有大量且從各種不同來源所生成的資料快速地湧入,這也代表著我們需要相同的速度來處理與分析資料。
透過自動化生產設備來取代人力可大幅降低人員暴露在高危險環境當中,減少事故的發生。
Variety,資料多樣性
資料除了會從不同的來源生成,同時也包含了多種不同的資料類型,例如結構化和非結構化資料,由於資料類型多元且複雜,因此也需要不同於傳統數據的儲存技術,將多方面的資料整合在一起,才能成為可信度高的數據。
大數據分析的過程
- 數據取得
- 數據儲存
- 運算分析
- 資料視覺化
數據取得
製造業要做大數據分析,最首要的任務就是須先取得生產過程中所有的行為紀錄,並將其轉換為數據。數據會來自不同的生產設備、生產階段,因此也需要整合這些數據。
數據儲存
整合過後的數據需要儲存,此時就可以利用雲端運算技術來支援,選擇最適合自身的儲存解決方案,讓您能隨時儲存、啟用這些數據資源。
運算分析
數據本身並不具有任何意義,需要透過分析來了解其中的模式,才能夠創造出價值,提供最佳決策或預測未來趨勢。可以運用機器學習、人工智慧等技術建置資料模型。
資料視覺化
經分析過後的數據仍然是數字與列表,無法輕易理解,因此可藉助視覺化工具,將分析結果用圖表等更直觀的方式呈現,查明數據背後的真相。
為何企業需要大數據分析?
- 降低生產成本
- 提高生產效率與收益
- 提出更有效的決策方案
- 優化客戶體驗
資料儲存與運算的設備已不像以往那樣昂貴且複雜,例如適合處理大數據分析的工作站電腦、高階專業繪圖卡等,設備門檻降低讓企業有更多的機會從大數據中發掘出具有價值的資訊。
降低生產成本
透過大數據分析,能夠降低生產的不良率,以避免後續大量退貨、重製或維修的龐大成本浪費,進而降低生產成本。
提高生產效率與收益
大數據分析能夠結合影像、設備監控等輔助工具來收集到更多的資料,以分析規劃出較容易產生問題的生產模式並加以改善。
提出更有效的決策方案
當收集的數據越多,可分析與探索的價值就越高且越準確,解讀出數據所代表的意義,就可做為企業決策的依據。
優化客戶體驗
經過長時間不斷地收集客戶的數據,大數據也能從中分析客戶的習慣,以及早為滿足客戶的需求做準備。
大數據分析所需要注意的問題點
- 數據準確性
- 資料安全性
數據準確性
大數據分析的結果來自數據,因此數據的準確性就非常重要,適當的運用準確數據能夠幫製造業者創造更多效益,不過,當過度依賴「不準確的數據」,可能會導致決策錯誤,造成極大的損失。
資料安全性
隨著資料量越來越多,資安的問題就逐漸被越放越大,資料本身不存在資安的問題,而是在於製造業者要如何使用與保護這些數據,當數據外洩時,同時也可能代表製造經驗一併外洩,極有可能會造成莫大的影響。
結論
大數據經過分析後可為企業帶來具有意義的資訊,需要的設備也沒有過去那麼昂貴,例如工作站、繪圖卡、全快閃儲存陣列等,門檻降低後,中小型企業也能夠跨入大數據分析的領域。
不過,大數據分析雖然能夠幫助公司找出問題並進而改善或解決,降低損失風險,提高生產效率,但也存在的風險,例如數據的準確性以及資料的安全性。所以,資料的收集相當重要,也因此透過優質的條碼掃描機、RFID 讀取器甚至 IoT 物聯網的感測器的資訊採集,能事半功倍。