什麼是情感分析?

情感分析是自然語言處理領域的一個方面,專門用於理解從單一主題的一系列來源匯整的主觀意見或情感。

情感分析圖

放在業務環境中,情感分析是指從意見中識別和推斷資訊然後增強業務營運的工具。這是在一系列演算法的幫助下完成的,這些演算法深入到子意見的上下文,以試圖瞭解對於產品或任何特定元素的態度。

情感分析就是透過輿論探勘來瞭解大眾感受的推理過程,從而使企業能夠查驗其產品定位。情感分析應用於許多不同的領域:

  • 產品分析
  • 市場研究
  • 超個人化
  • 聲譽管理
  • 公共關係認知
  • 精準鎖定客戶
  • 產品評論
  • 產品回饋
  • 高效率客戶服務

情感分析在幫助企業開發更聰明的產品和服務來專門滿足客戶需求方面發揮著巨大的作用。

情感分析軟體試用
嘗試 TIBCO Spotfire - 免費試用
借助 TIBCO Spotfire(市場上最完整的分析解決方案),可以輕鬆地從數據中發現新見解。

為什麼情感分析很重要?

情感分析側重於處理情緒資料中對於產品的感知及其市場需求,有幾種公開和私人資源可用於獲取與客戶感知相關的資訊,這些來源包括:

  • 與產品或服務有關的客戶通訊
  • 使用者產生的公開評論
  • 基於專業媒體的產品評論
  • 產品的社交媒體曝光,例如提及或主題標籤
  • 論壇探勘,包括一般論壇和專門用途論壇

透過情感分析,企業可以瞭解龐大的資料量,並將其轉化為一系列積極成果。好處包括:

  • 清楚瞭解受眾對於產品或服務的看法
  • 從客戶的角度深入瞭解目前的市場狀況

對以上兩者而言,結果都是針對產品的特定受眾創造最適合的價值主張。

但為什麼需要理解這些呢?

就任何產品的關鍵性能指標而言,想要瞭解下一步如何發展,就必須清楚瞭解本身的優缺點。情感分析是確定行銷工作及其方向以及業務發展的理想選擇,透過以情感分析為基礎的行銷方法,企業將可從客戶的角度瞭解任何產品的優勢和劣勢。

此外,情感分析使用的是真實資料,如果分析正確,應該能夠提供真實資訊來制定可行策略,不需要猜測或假設。

關於市場研究,情感分析很重要,但完整性要差得多。它提供另一種視角來查看市場需求的更多變化,通常能開闢新的途徑,幫助企業為產品找到尚未開發的利基市場。

基本程度的情感分析很容易做到,但從企業的角度來看,將需要精細的工具來獲得進階洞察力。

情感分析的類型

以下是不同類型的情感分析,所有這些分析都使用資料驅動的人工智慧 (AI) 和機器學習 (ML)來做出判斷和預測:

細膩的情感分析

細膩的情感分析可看出輿論的極性偏向,這種分析可以是簡單的二元結論(喜歡/不喜歡的情緒,或正面/負面差異),也可以使用更複雜、更深入的規格,例如李克特量表使用 1 到 7 來衡量對行為問題的強烈同意與強烈不同意。

情緒偵測

情感分析是以情緒表達為基礎,使用語言和機器學習演算法來偵測存在於客戶通訊中的特定情緒狀態,其結果可用於判斷為什麼客戶對產品有某種感覺。

針對特定方面的情感分析

針對特定方面的情感分析會更深入一些,重點在於找出客戶對於產品特定方面或元素的意見(如手機軟體的最近一次升級)。透過分析特定方面,就能輕鬆追蹤客戶對於升級的看法,以及從客戶的角度來看具體優缺點是什麼。

意圖分析

意圖分析主要用於客戶支援服務,目的是簡化工作流程,它能判斷某人提出的資訊背後有什麼具體意圖。

情感分析的兩種方法是什麼?

情感分析有兩種成熟的方法:

基於規則的方法

基於規則的方法使用一種演算法來識別詳細而清晰的意見描述,包括識別主觀性、意見極性和意見主體。這種基於規則的方法使用基本的自然語言處理技術來執行,涉及下列其中一些可能操作:

  • 詞幹
  • 解析
  • 代幣化
  • 標註詞性
  • 語言分析

基於規則的方法從兩個詞集開始,其中一組僅包含正面詞彙,另一組僅包含負面詞彙。此演算法會徹底掃描文字內容以找出與其預先定義的規則和字彙表相符的字詞,然後計算出最流行的字詞。正面詞彙越多意味著傾向正極,負面詞彙越多意味著傾向於負極。

基於規則的演算法其缺點是可能不當傳達某些結果,這是因為基於規則的方法並不考慮上下文,所以幾乎不具靈活性也不構精準,無法確保結果可用。但是,它可以確認訊息的語氣,這對於客戶支援來說仍然很有用。

基於規則的方法可能存在著語言學問題。俚語變化很快,這在將字詞歸類為正面或負面情緒時可能會帶來一些挑戰。如今,基於規則的情感分析通常被當做未來實施和培訓機器學習解決方案的起點。

自動情感分析方法

自動情感分析會深入研究文字並提取可用資料,自動情感分析並非以預先定義的規則為基礎,而是使用機器學習來理解訊息大綱。這種自動方法使用監督型機器學習分類演算法,可提高精準度和正確性,並能根據一系列標準來快速處理資訊。

情感分析使用機器學習演算法來探索資料,一般來說,情感分析可能涉及以下類型的分類演算法:

  • 線性迴歸
  • 支援向量機
  • 單純貝氏分類器
  • 遞歸神經網路導數(如長短期記憶網路和門控循環單元)

情緒是相當難判斷的,它被認為是對特定見解的定期提取,但是若要掌握準確的情緒重點,還有很多工作要做。

情感分析的工作原理

情感分析本質上是一種分類演算法,旨在根據意見看法來發現其中的觀點、相關情感和可能特別感興趣的資訊。

情感分析中的「意見」由什麼組成?一般來說,意見是一種觀點,可能不是基於事實或準確的知識。

但是,從資料的角度來看,意見還有很多意義。雖然它是基於個人經驗的主觀評價,但它與情緒相呼應:這是一組訊號,能呈現出複雜的經驗和情緒觀點。有了這種理解,情感分析可以:

  • 在一個特定平台上提取情緒資料,例如評論網站或客戶服務台
  • 確定正極或負極
  • 定義所述的主題是籠統的還是具體的
  • 單獨識別意見持有者,或在現有受眾群體的背景下識別

情感分析可用於許多不同的層面:

  1. 文件等級:分析整份文字
  2. 句子等級:查看單一句子
  3. 子句等級:確認句子中的子表達式

由於意見是主觀的,因此可以將其分為四個子類別:

  1. 直接意見:直接表達重點的意見
    • 「這個應用程式使用者介面很差」
  2. 比較意見:在 A 和 B 之間進行比較
    • 「應用程式 B 的使用者介面比應用程式 A 差」
  3. 闡述意見:非常清楚事情在哪裡發生
    • 「這個應用程式的功能表現最好」
  4. 隱含意見:僅隱喻表達意見
    • 「應用程式在一天內就開始崩潰」

情感分析操作中的常見挑戰

背景和極性

演算法難以理解上下文,雖然人類可以理解互動上下文,但這卻會是演算法的障礙。因此,必須對演算法進行設定,使其包含訊息的上下文組件。

文字向量化可解決這個問題,它能根據詞性來繪製一段文字中的字詞連接方式(以及它們與其他字詞的關聯)。這為文字情感分析增加了一個維度,確保能清晰理解訊息語氣。

判斷主觀性和語氣

識別訊息中的語氣是情感分析的關鍵特徵,分析語氣的範圍可能從簡單到複雜,具體取決於所使用的字詞。人際互動可以是隱含的或明確的,也可以是主觀的或客觀的,這對演算法來說很難判斷。

為了解決這個問題,需要使用多個選項和相關類別來描述產品的特性,以幫助演算法準確判斷主觀性和語氣。

識別諷刺和挖苦

機器和演算法最難理解諷刺和挖苦,在一個序列中使用的字詞可能表達與另一個句子完全不同的意涵,演算法只看表面,可能會完全理解錯誤。解決這個問題的方法是透過深度的上下文分析和海量的語料庫,來訓練自然語言系統處理情感分析模型。

中性訊息

另一個問題是中性訊息,它不屬於任何類別,那麼演算法應該如何處理中性訊息?以下是兩種方法:

  1. 首先是深入瞭解上下文,並查看所有陳述的事實,這可以將任何未表達出來的意見帶到檯面上。這是適合用於特殊情況的手動方法。
  2. 第二個方法與演算法相關,如果某件事沒有分類為正面或負面,則可以觸發演算法將其標記為中性。
情感分析和機器學習白皮書
機器學習的 9 個成功步驟
借助這 9 步成功機器學習指南,充分利用您的數據科學計劃。

情感分析的未來

情感分析是很有價值的技術,尤其對企業而言,它能以無偏見(或相對較少偏見)的方式從客戶那裡獲得真實的回饋。如果執行得當,它可以為組織增加價值,並為未來的決策提供事實和可衡量的資料。

希望改善產品或服務、推動更多銷售並超越競爭對手的組織,應該善加利用情感分析。