說到網絡產品,離不開的話題就是用戶,就像傳統行業的消費者。人是復雜的,網民的用戶行為更加復雜,用戶和用戶是不一樣的,或者說,每個用戶都不一樣。一款成功的互聯網產品往往并沒有滿足所有用戶的需求,而是準確定位了某一類用戶并且很好地滿足了那類用戶的需求。到底定位哪一類用戶是我們需要考慮的,所以就需要用戶分類。
不分類不好定位, 好的用戶分類讓我知道了我在追求哪些人,滿足哪些人,影響哪些人。但分不好類又會錯位,更糟,那怎樣才能對某一款產品的用戶群進行合理分類呢,下面就來談談我對用戶分類的一些看法。
一般提到某一款產品有幾類用戶可能主要包括以下幾種情況:高端和低端用戶、學生用戶和白領用戶、一二線城市和三四線城市用戶、活躍和不活躍用戶、會員與非會員用戶、紅鉆與非紅鉆用戶、IT和非IT用戶、初級用戶、普通用戶、高級用戶等,以上這些用戶分類的共同特征是從一個維度或者二個維度對用戶進行劃分,就比如cooper的《About face 2.0》中提到從兩個用戶分類指標:業務領域水平(domain knowledge)和計算機技能水平,從而把用戶劃分為初級用戶、普通用戶、高級用戶,更簡化地說這種方法的用戶分類模式就是基于操作頻率,這個分類方法可以套用在任何一款產品上,但是這種用戶分類的實際應用效果如何呢?
先來說下如何判斷某一款產品的用戶分類效果如何,主要從兩個角度進行判斷:分類的信度和效度,也就是分類的準確性和精確性。分類的準確性是指分完類后,是不是現實中每一個用戶都能定位到反映該用戶的類別,也就是說任何一個用戶都能給他貼上屬于某個類別的標簽;而分類的精確性是指得到的用戶類別在多大程度上反映了實際用戶所包含的屬性含義,也就是說用來描述各類別用戶的特征信息與實際用戶所有屬性的吻合程度。在實際分類中準確性和精確性往往不能同時達到完美,當你追求100%的準確性時精度肯定會下降,比如只用性別去劃分用戶,準確度很高但是精度不夠,所以在實際用戶分類時找到準確性和精確性的一個平衡點,達到自己分類目的即可。
又回到前面提到的把用戶劃分為初級用戶、普通用戶、高級用戶,這種劃分的方法是準確性很高,但是精確度不夠,每一個用戶都能根據實際情況判斷為初級用戶、普通用戶還是高級用戶,但是描述用戶的特征信息很少只有操作頻率和計算機技能水平兩個維度。這是很不精確的,在實際情況中,用戶的特征信息是包含很多,用戶間任何一個特征因素不同都會導致不同用戶使用某個產品的行為習慣偏好等的不同。比如用戶的年齡、性別、學歷、收入水平、計算機水平、職業、地域、網齡以及使用某個產品的目標等因素都會導致不同用戶不同的使用習慣和偏好。所以在用戶分類時需要從多個維度的特征因素去考慮如何劃分用戶。實際又該如何操作呢?
首先考慮對某個產品進行用戶分類時需要哪些特征因素,也就是從哪幾個維度去劃分用戶。一般會從以下幾個維度去考慮:用戶的人口學信息,用戶的計算機背景(包括用戶的互聯網使用背景),上網地點,收入水平,職業,地域,用戶對于該產品的一些使用經驗和偏好,使用過哪些同類產品,使用的目的是什么,認為哪款最好用,影響選擇某款產品的因素有哪些,通過哪種途徑得知的,使用產品的態度,使用產品的具體行為等因素。那具體到某個產品時應該選擇哪幾個因素去劃分用戶呢,解決的方法是先把所有維度都列出來,然后針對這些維度進行用戶訪談,通過訪談能夠得到大概的用戶間的共同點和不同點。然后把所有因素轉化成問卷題目,通過科學抽樣的問卷調查得到用戶調查數據。對這些用戶數據進性行聚類分析即可得到您所需要的用戶分類。用戶聚類需要注意哪些呢?
聚類分析中有很多因素影響著最后的用戶分類結果,影響較大的因素有:聚類方法選擇,距離算法選擇,聚類變量選擇,用戶類數選擇。對于聚類方法和距離選擇,飛揚動力工作室傾向于推薦選擇兩步聚類法和對數似然值距離算法,因為用戶的人口學特征和使用某產品行為偏好等特征一般都是分類變量,用歐氏距離算法的話,它的距離公式所表示的含義很難用實際意義去描述,或者說它的距離值在現實中是沒有實際意思的。聚類變量的話可以選擇訪談得到差別較大的特征因素,但是這些變量之間也是有關系的,具體還要通過不斷的嘗試去調整,主要看去掉某個變量后聚類結果是否有大得差異,如果有該變量則為重要變量,用戶類數確定可以結合實際聚類得到的描述性判斷因素和訪談等得到的實際情況共同確定。
怎么對用戶分類,細分到何等程度,不太會有一個模式或者方法來通用。所以涉及到某個具體產品的用戶分類時,首先明確你得分類目的,分完類之后你需要面怎么利用這些類。當能夠從用戶分類中得到明確的產品用戶群和產品定位時,說明該分類就基本有效了。