如今,企業產生和收集的數據80%是非結構化數據,而且這一比例將繼續增長。非結構化數據的數量正以每年55%到65%的速度快速攀升。如果沒有合適的工具來分析這些數據,企業就會錯過大量為商業智能提供的信息。但是,重要的是要知道如何利用非結構化數據來服務于企業更廣泛的目標。
什么是非結構化數據?
非結構化數據是高度可變且不遵循任何明確模式的信息。因此,非結構化數據難以標記、組織、搜索和最終分析。
非結構化數據的示例包括:
分析師報告
音頻文件
事件日志
地理空間數據
圖像
會議記錄
多媒體數據
社交媒體帖子
視頻文件
用戶交互數據
非結構化數據和結構化數據有什么區別?
非結構化數據在幾個關鍵方面不同于結構化數據。雖然非結構化數據是可變的,但結構化數據由明確定義、一致且可預測的數據組成,這使得結構化數據更易于搜索和獲取信息。
結構化數據的示例包括電話號碼、日期或姓名,可用于餐廳、航空公司和其他可預訂服務的銷售交易和在線預訂系統。
此外,非結構化數據位于應用程序或NoSQL數據庫中,而結構化數據位于關系數據庫中。例如,會議記錄形式的非結構化數據可以在Notes或MicrosoftWord等應用程序中找到,或者在Instagram中發布社交媒體帖子中。例如,客戶姓名和交易日期是存在于客戶關系管理(CRM)系統的關系數據庫中的結構化數據。
企業并不是只選擇一種格式而不選另一種格式的數據,而是通過將結構化和非結構化數據一起利用以獲得最佳商業智能來獲得最大收益。
誰從非結構化數據中受益?如何受益?
使用非結構化數據的好處包括:
多種信息來源可供借鑒
快速積累豐富的數據集
數據湖中的巨大存儲容量
更準確的數據可提供更好的商業智能,因為非結構化數據占企業數據的四分之三以上
Crux公司首席執行官WillFreiburg表示,“企業的各個層面都可以從對非結構化數據的適當管理中受益,因為它包含豐富的洞察力,可以使各種內部消費者受益。”
例如,Freiburg解釋說,非結構化數據可以更好地了解供應鏈風險的來源,衡量消費者情緒和購買行為,并改進運營流程。
盡管非結構化數據對企業的各個部分都具有相關性和優勢,但業務領導者不需要在企業中整體或均勻地使用它。與其相反,他們應該以符合業務戰略目標的有針對性的方式處理非結構化數據。
非結構化數據的用例
非結構化數據用例適用于銷售和營銷、產品開發和客戶服務。
(1)銷售和營銷
企業使用非結構化數據來識別客戶購買模式和對品牌的看法。情感分析是非結構化數據獨有的主要優勢。分析社交媒體帖子、論壇討論和其他媒體可為企業的銷售和營銷業績提供背景信息。
非結構化數據還為CRM平臺中的算法提供信息。預測分析產生洞察,告知企業如何預測客戶需求。例如,銷售團隊可以根據洞察力采取行動,為新客戶提供更好的產品或服務推薦,或者了解向現有客戶追加銷售的合適時間。
(2)產品開發
通過對客戶論壇、客戶服務電話和社交媒體的情緒分析,非結構化數據可以告知企業如何改進其產品或服務。
(3)客戶服務
自動聊天機器人通過將客戶關注的問題傳遞給可以解決問題的適當人員來增強客戶服務代表。反過來,該信息為上述情緒分析提供信息。
然而,更重要的是,投訴和故障排除對話為研發團隊提供了有關哪些功能運行良好、哪些功能運行不佳的有用信息。該數據為產品開發提供有關如何改進產品或服務的信息。
利用非結構化數據實現商業智能的三個步驟
Crux公司的Freiburg提出了三個步驟,開始利用非結構化數據來獲得更好的商業智能。
(1)確定非結構化數據的具體用途
Freiburg建議管理層“清楚企業試圖用外部數據回答什么問題”。
了解企業希望如何使用非結構化數據是確定使用何種數據的第一步。
首先要收集的非結構化數據。這反過來將告知要實施什么樣的大數據業務解決方案。
(2)簡化數據源
Freiburg建議建立一個“通用數據模型”,以便在數據中建立一組真實性。
由于非結構化數據來自各種來源和多種格式,弗萊堡強調需要“建立高質量的數據管道,以確保數據交付的一致性和及時性保持不變,無論來源如何。”
(3)為數據程序制定路線圖和解決方案
與專門提供高性能質量數據集成工具和服務的供應商合作。例如,Crux公司擁有數千個數據集,可以將這些數據集集成到其在步驟2中創建的數據管道中并發揮其優勢。
一旦業務領導者和數據分析師確定了后端,也就是他們試圖回答的問題以及他們將如何集成數據源,他們就需要在前端工作。這意味著他們需要以一種允許通過日常應用程序可視化和查詢數據的方式嵌入分析。
非結構化數據工具提供商
從非結構化數據中產生的洞察力不僅僅是神奇地出現。與其相反,它需要特殊的工具來處理數據,然后才能產生任何有意義的知識。市場上流行的非結構化數據工具提供商包括:
Accenture
Azure
Crux
DynamoDB
Hadoop
MongoDB
為什么非結構化數據對商業智能很重要?
結構化數據只講述了企業試圖理解的問題的一小部分,準確地說只有20%。
另一方面,非結構化數據占企業數據的80%,并且來自多種不同格式的各種來源。因此,它為企業描繪了一幅更全面的圖景,以幫助他們更好地理解和解決他們的挑戰。
非結構化數據確實更難分析。然而,企業通過這樣做獲得的大量信息使得非結構化數據分析工具非常值得投資。
因此,企業必須通過非結構化數據來定義他們尋求回答的問題或挑戰,集成和簡化各種數據源,并使用正確的工具來幫助分析和可視化它以獲得更好的商業智能。