成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

java 中文繁簡體轉換工具 opencc4j

nodejh / 3166人閱讀

摘要:創(chuàng)作緣由對于中文的繁簡體轉換是一種很常見的需求。存在一個嚴重的問題特殊詞組的轉換可能存在問題。是一款非常優(yōu)秀的轉換工具。使用方式引入轉為簡體生命不息,奮鬥不止結果為生命不息,奮斗不止轉為繁體生命不息,奮斗不止結果為生命不息,奮鬥不止

創(chuàng)作緣由

對于中文的繁簡體轉換是一種很常見的需求。

但是很多工具類都是簡單的做個映射。(使用map,集合,properties)等。

存在一個嚴重的問題:特殊詞組 的轉換可能存在問題。

OpenCC

OpenCC 是一款非常優(yōu)秀的轉換工具。但是沒有直接提供 Java 便于使用的 jar。

opencc4j

opencc4j 就是在上面的工具基礎上提供的 java 使用版本。

opencc4j 使用方式 maven 引入

    com.github.houbb
    opencc4j
    1.0.2
轉為簡體
String original = "生命不息,奮鬥不止";
String result = ZhConverterUtil.convertToSimple(original);

結果為

生命不息,奮斗不止
轉為繁體
String original = "生命不息,奮斗不止";
String result = ZhConverterUtil.convertToTraditional(original);

結果為

生命不息,奮鬥不止

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉載請注明本文地址:http://systransis.cn/yun/76447.html

相關文章

  • NLP 開源形近字算法補完計劃(完結篇)

    摘要:本文將作為漢字相似度的完結篇,為該系列畫上一個句號。起中文形近字相似度計算思路承中文形近字相似度算法實現(xiàn),為漢字盡一點綿薄之力轉當代中國最貴的漢字是什么不足之處之所以有本篇,是因為上一次的算法實現(xiàn)存在一些不足。 前言所有的故事都有開始,也終將結束。本文將作為 NLP 漢字相似度的完結篇,為該系列畫上一個句號。起...

    番茄西紅柿 評論0 收藏2637
  • Python中文簡體轉換工具

    Openccpy ___ _____ __ ___ ___ ___ _____ __ __ / __`/ __` /__`/ _ ` /___ /___/ __`/ / / L L / __// / / \__// \__/ L \_ \____/ ,__/ \____ \_ \_ \____ \____ ,__//`__...

    SimonMa 評論0 收藏0
  • 中文維基百科文本數(shù)據(jù)獲取與預處理

    摘要:下載數(shù)據(jù)方法使用官方的數(shù)據(jù)最新打包的中文文檔下載地址是。中文維基數(shù)據(jù)繁簡混雜大家都說存在這個問題,但的網(wǎng)站是將繁體中文和簡體中文分開處理的,所以一直覺得從數(shù)據(jù)庫到結構都應有方法將兩者區(qū)分開,暫罷,待有空研究其數(shù)據(jù)時再議。 照例,先講下環(huán)境,Mac OSX 10.11.2 ,Python 3.4.3。 下載數(shù)據(jù) 方法1:使用官方dump的xml數(shù)據(jù) 最新打包的中文文檔下載地址是:http...

    loostudy 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<