2007-10-06
DM的陷阱 - [投资与创业]
作者:Jo
在与创业者的交流中,DM(数据挖掘)被提到的频率很高,创业者们总是希望得到更多的用户有效数据,通过分析这些数据,达到“让对的人在对的时间看到对的推荐(广告或商品)”的效果。这种想法具有普遍性,却存在一些问题:
- 互联网创业者希望提供其用户最简单易用的操作体验(服务)的愿望,和他们希望得到更多的用户有效数 据的愿望之间,往往是一对矛盾。从简单易用的角度来说,用户总是希望“付出”更少,“获得”更多;而用户“付出”越少,可供网站DM的数据就少了,DM的有效 性就会减弱。
- DM技术尽管已不再神秘,但大部分实施的案例水平依然比较平庸。迄今,我以为Amazon的推荐引擎仍是 最好的DM应用之一,尤其在如此庞杂的数据量和数据种类面前,依然能有为人称道的良好表现,足见其DM的技术实力。而对于国内广受爱戴的豆瓣推荐,已经有不止一人告诉我,豆瓣推荐对他们已经没什么用了:推荐的书、电影都看过了,或者是根 本不喜欢看的。而我也发现,豆瓣认为“和我口味最接近的人”里居然有一个和我只有一本书的共同爱好,这的确有些牵强。
- 要点是预期,当用户预期其“付出”有相应的回报时,自然愿意“付出”。比如,用户在当当网上订购图书时,如果不“付出”真实的地址和联系方式,所购书籍将无法及时送到。又如,用户在last.fm“付出”的原因则是希望得到更多适合其口味的音乐推荐。
- 有效数据种类多少与推荐精确度呈正相关性,但是种类越多,对于DM技术的要求也越高,实施的成本也越高。很多情况下,数学上通畅的计算过程却无法在当今最好的计算机上迅速得到运算结果。所以,DM技术的关键在于精简变量和简化算法。如果现有人脉中没有这样的高级技术人才的话,还是将希望建立在更实际的地方更稳妥。
