- 資訊首頁(yè) > 網(wǎng)絡(luò )安全 >
- HanLP分詞器的用法
本篇內容介紹了“HanLP分詞器的用法”的有關(guān)知識,在實(shí)際案例的操作過(guò)程中,不少人都會(huì )遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學(xué)有所成!
前言:分析關(guān)鍵詞
如何在一段文本之中提取出相應的關(guān)鍵詞呢?
之前我有想過(guò)用機器學(xué)習的方法來(lái)進(jìn)行詞法分析,但是在項目中測試時(shí)正確率不夠。于是這時(shí)候便有了 HanLP-漢語(yǔ)言處理包 來(lái)進(jìn)行提取關(guān)鍵詞的想法。
下載:.jar .properties data等文件
這里提供官網(wǎng)下載地址 HanLP下載,1.3.3數據包下載
在intellij中配置環(huán)境,并運行第一個(gè)demo
在項目中配置jar包,添加依賴(lài)。
file->Project Structure->Modules->Dependencies->+Jars
將properties文件轉移到src根目錄下,修改root為自己的數據集路徑
字符類(lèi)型對應表加載失?。篋:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes
解決辦法:查看錯誤提示頁(yè)面下是否有該文件,如果沒(méi)有則去網(wǎng)上下載一個(gè)。像我這里,由于只是使用其一部分功能,為了方便就不再下載了,這里我直接修改了一個(gè)文件的文件名—–成功運行!。
成功運行
---------------------
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自互聯(lián)網(wǎng)轉載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權請聯(lián)系QQ:712375056 進(jìn)行舉報,并提供相關(guān)證據,一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容。
Copyright ? 2009-2021 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 珠海市特網(wǎng)科技有限公司 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站