文本相似度的計算

shleyZ 發(fā)布于2019-07-25 10:18 / 3720人閱讀

摘要：文本相似度的計算方法有很多，這里簡單記錄一下傳統(tǒng)的模型計算文本相似度的時候主要是使用來協(xié)助生成文檔向量整個文檔集合有多少詞，就是多少維度每個文檔中的詞用來生成權(quán)重，用權(quán)重來表示文檔的向量生成向量后，就可以計算相似度了，用夾角余弦當(dāng)然這里詞的

文本相似度的計算方法有很多，這里簡單記錄一下

傳統(tǒng)的VSM模型：

計算文本相似度的時候主要是使用tfidf來協(xié)助生成文檔向量
整個文檔集合有多少詞，就是多少維度
每個文檔中的詞用tfidf來生成權(quán)重，用權(quán)重來表示文檔的向量
生成向量后，就可以計算相似度了，用夾角余弦
當(dāng)然這里詞的權(quán)重的生成方式還有很多，也可以用其他的

LSI(Latent semantic indexing) 的方式

這個的方式也比較簡單，主要是先生成文檔 - 詞矩陣
矩陣中的內(nèi)容就是文檔中出現(xiàn)該詞的頻數(shù)
然后用svd分解矩陣得到三個矩陣
C = USV
然后每個文檔向量分別和USV相乘得到向量
文本相似度計算還是夾角余弦
至于降低維度，就要對S進(jìn)行奇異值削減了

云服務(wù)器 GPU云服務(wù)器最好的文本相似度算法 php文本計算 php文本計算年齡 js計算文本框

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/37891.html

發(fā)表評論

登陸后可評論

0條評論

shleyZ

男|高級講師

我要關(guān)注我要私信

TA的文章

HTTP1.1 Keep-Alive到底算不算長連接？

閱讀 2725·2021-11-17 17:01
Markdown入門教程

閱讀 2100·2021-09-28 09:35
racknerd：西雅圖AMD Ryzen9 3900X+DDR4+NVMe系列VPS，起步$14.

閱讀 3610·2021-09-01 11:04
UCloud AMD快杰云主機(jī)助力藍(lán)威加速HPC場景落地

閱讀 879·2020-06-22 14:41
記一次前端面試試水筆記

閱讀 2993·2019-08-30 15:55
cad制圖初學(xué)入門者怎么快速打開dwg格式的設(shè)計圖紙？

閱讀 2605·2019-08-30 15:43
[填坑手冊]小程序Canvas生成海報（一）---完整流程

閱讀 2331·2019-08-26 13:54
構(gòu)建離線WEB應(yīng)用

閱讀 2524·2019-08-26 13:48

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

文本相似度的計算

相關(guān)文章

推薦系統(tǒng)01--余弦相似度

simhash+漢明距離計算文本相似度

敏捷AI | NLP技術(shù)在宜信業(yè)務(wù)中的實踐【智能聊天機(jī)器人篇】

發(fā)表評論

0條評論

shleyZ

男|高級講師

TA的文章

HTTP1.1 Keep-Alive到底算不算長連接？

Markdown入門教程

racknerd：西雅圖AMD Ryzen9 3900X+DDR4+NVMe系列VPS，起步$14.

UCloud AMD快杰云主機(jī)助力藍(lán)威加速HPC場景落地

記一次前端面試試水筆記

cad制圖初學(xué)入門者怎么快速打開dwg格式的設(shè)計圖紙？

[填坑手冊]小程序Canvas生成海報（一）---完整流程

構(gòu)建離線WEB應(yīng)用

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

文本相似度的計算

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！