在大數據時(shí)代,你竟然會(huì )在網(wǎng)上看到的詞云,例如這樣的。
看到之后你是什么感覺(jué)?想不想自己做一個(gè)?
如果你的答案是正確的,那就不要拖延了,現在我們就開(kāi)始,做一個(gè)詞云分析圖,Python是一個(gè)當下很流行的編程語(yǔ)言,你不僅可以用它做數據分析和可視化,還能用來(lái)做網(wǎng)站、爬取數據、做數學(xué)題、寫(xiě)腳本替你偷懶……
如果你之前沒(méi)有編程基礎,沒(méi)關(guān)系。希望你不要限于瀏覽,而是親自動(dòng)手嘗試一番。到完成的那一步,你不僅可以做出第一張詞云圖,而且這還將是你的第一個(gè)有用的編程作品。
安裝wordcloud庫請確保你的python環(huán)境沒(méi)有問(wèn)題,我用的開(kāi)發(fā)工具是VsCode,首先你要在Python擴展中安裝python開(kāi)發(fā)環(huán)境(當然,這不是為你的windows安裝python)
那么你還需要安裝所需要的第三方庫,那么在VSCode中并沒(méi)有PyCharm那么專(zhuān)業(yè),這里需要獲得你自己的Python腳本位置。
?
我們可以發(fā)現里面有一個(gè)名為pip.exe文件,這個(gè)文件就是python官方給我們去安裝python第三方庫的一個(gè)程序,那么我們可以在VsCode的終端中就可以去通過(guò)它,這也是我們?yōu)槭裁匆@取python安裝位置的根本原因。
例如我們安裝WordCloud,我們的操作如下:
pip install WordCloud
數據這個(gè)時(shí)候我們就要開(kāi)始Code了,我們一定需要數據,這里我自己找了一個(gè)繞口令,內容如下:
Betty Botter bought some butter but she said the butter's bitter. If I put it in my batter it will make my batter bitter. So, she bought some better butter, better than the bitter butter and she put it in her batter and her batter was not bitter. So 'twas good that Betty Botter bought some better butter.
翻譯: 貝蒂·波特買(mǎi)牛油, 可她說(shuō):“牛油是苦的。 不過(guò)加上一點(diǎn)好牛油—— 可以使苦牛油更好點(diǎn)?!?于是她買(mǎi)了一點(diǎn)牛油, 比苦牛油好點(diǎn)的牛油。 摻了之后苦牛油真的變的好多了。 所以這就是貝蒂·波特買(mǎi)的一點(diǎn)比苦牛油好點(diǎn)的牛油。
我把其中的文字存儲成了一個(gè)文本,叫做minister.txt。
Codepython做詞云呢,需要導入的包有wordcloud和PIL,其中PIL(Python Image Library)是python平臺圖像處理標準庫,功能是真的強大。首先需要讀取文件 。
首先我們要讀取我們的txt文件,那么代碼如下:
from wordcloud import WordCloud import PIL .Image as image with open("F:\minister.txt") as fp: text=fp.read() print(text)
運行腳本結果如下:
?接下來(lái)導包,我們看看如何生成最簡(jiǎn)單的詞云:
from wordcloud import WordCloud import PIL .Image as image with open("F:\minister.txt") as fp: text=fp.read() #print(text) #將文本放入WordCoud容器對象中并分析 WordCloud = WordCloud().generate(text) image_produce = WordCloud.to_image() image_produce.show()
如果python引入無(wú)誤,并代碼無(wú)誤,那么會(huì )彈出你生成的圖片,該圖片會(huì )儲存在你的系統。詳細位置一般為:C:\Users\MACHENIKE\AppData\Local\Temp 中。
帶形狀的詞云一般來(lái)說(shuō),我們不想要這么方的詞云,肯定喜歡一些有形狀的,
接下來(lái)是生成那種有輪廓的詞云,這里就需要繼續導入其他包,這里導入的包為numpy,numpy系統是python的一種開(kāi)源的數值計算擴展,這種工具可以用來(lái)存儲和處理大型矩陣。這里在處理的時(shí)候將給出形狀的圖片表示為一個(gè)大型矩陣,再有顏色的地方來(lái)進(jìn)行填詞(導包 :import numpy as np)。導包之后需添加一個(gè)遮罩層,遮罩層就是用來(lái)限制生成圖片的形狀 。
?網(wǎng)上隨便找個(gè)圖片放入到項目當中(這里我找的是一個(gè)????),然后開(kāi)始code:
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站