來(lái)源:數(shù)據(jù)觀 時(shí)間:2017-01-04 09:02:19 作者:萊信學(xué)院
?你為什么需要制作詞云,是純粹的外貌協(xié)會(huì),還是研究分析內(nèi)容的一種表現(xiàn)方式,是文本挖掘技術(shù)的可視化,還是為了傳播的美觀便捷。
?有很多在線工具提供詞云生成服務(wù),你真的讀懂了詞云的含義了嗎?
?通過(guò)一個(gè)實(shí)際的場(chǎng)景,帶你領(lǐng)略一下詞云的魅力。
?這是一個(gè)地產(chǎn)公司大數(shù)據(jù)營(yíng)銷項(xiàng)目的場(chǎng)景:某房地產(chǎn)公司要為地產(chǎn)項(xiàng)目的可行性投資和營(yíng)銷進(jìn)行前期的評(píng)估,其中一個(gè)投資項(xiàng)目是“大連旅游地產(chǎn)”。除了傳統(tǒng)的評(píng)估方式外,還選擇利用網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行評(píng)估。
?詞云構(gòu)建工作流如下:
?第一步:獲取數(shù)據(jù)。
?對(duì)國(guó)內(nèi)排名前十位的房地產(chǎn)公司網(wǎng)站和論壇、以及公司內(nèi)部CRM系統(tǒng)內(nèi)客戶微博中爬取含有“大連 旅游”關(guān)鍵字的文章、評(píng)論和微博信息,保存為文本文件;
?第二步:分詞。
?對(duì)文本進(jìn)行分詞,并進(jìn)行噪聲詞過(guò)濾(分詞和噪聲詞過(guò)濾可不是一件簡(jiǎn)單的事,需要不斷積累和學(xué)習(xí)的過(guò)程),可以根據(jù)需要選取高頻詞匯,也可以通過(guò)自定義詞云自動(dòng)過(guò)濾低頻關(guān)鍵詞。選擇高頻詞結(jié)果如下:
?第三步:制作詞云。
?使用SmartMining桌面版自定義詞云算法,三種不同配置,運(yùn)行結(jié)果如下:
?從這個(gè)圖云展現(xiàn)出兩點(diǎn)關(guān)鍵業(yè)務(wù)含義:
?第一,大連旅游詞云中出現(xiàn)很多其他城市,如:桂林、香港、海南、貴州、廬山、哈爾濱、張家界、青島…..大家在討論大連旅游的時(shí)候,這些同時(shí)被提及的城市可能是大連的替代品或者竟品;
?第二,另外一部關(guān)鍵詞,如:八仙過(guò)海、藍(lán)莓谷、葡萄溝、金石灘等屬于大連的描述詞,說(shuō)明大家在網(wǎng)絡(luò)上討論大連旅游的時(shí)候主要關(guān)注的內(nèi)容就是圍繞這些關(guān)鍵詞,這些都可以作為大連旅游地產(chǎn)營(yíng)銷的亮點(diǎn)。
?詞云可以包含豐富的業(yè)務(wù)信息,脫離了業(yè)務(wù)的詞云只是一幅華麗的皮囊。
責(zé)任編輯:陳近梅