成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

Android OCR之tesseract

AWang / 1441人閱讀

摘要:開始之旅相關(guān)常量設(shè)置訓(xùn)練數(shù)據(jù)路徑,必須包含文件夾識(shí)別語言英文識(shí)別語言簡(jiǎn)體中文英文識(shí)別設(shè)置圖片可以緩存獲取緩存的初始化的訓(xùn)練數(shù)據(jù)路徑與語言設(shè)置識(shí)別模式設(shè)置要識(shí)別的圖片簡(jiǎn)體中文識(shí)別與英文識(shí)別類似。

Android OCR之tesseract 1. 開源工具簡(jiǎn)介

tesseract是非常有名的開源OCR工具,但是要將它配置到Android開發(fā)環(huán)境中可能要費(fèi)點(diǎn)功夫,別擔(dān)心,github上面有好人幫助我們封裝了Android開發(fā)環(huán)境的tesseract配置,這就是Android平臺(tái)上OCR開源項(xiàng)目tess-two。

2. 環(huán)境配置

利用tess-two配置OCR環(huán)境非常簡(jiǎn)單。

首先,設(shè)置工程的ndk路徑。

其次,在模塊中添加依賴:compile "com.rmtheis:tess-two:6.0.0"。

3. 數(shù)據(jù)準(zhǔn)備

要進(jìn)行OCR還要獲取訓(xùn)練數(shù)據(jù)tessdata,下載該訓(xùn)練數(shù)據(jù),到時(shí)候?qū)⒂?xùn)練數(shù)據(jù)弄到自己的Android設(shè)備上就行了。

注意:不要把所有訓(xùn)練數(shù)據(jù)都弄到Android設(shè)備上,因?yàn)橛?xùn)練數(shù)據(jù)比較大,需要用到什么語言的數(shù)據(jù)就只把這些語言對(duì)應(yīng)的數(shù)據(jù)弄到Android設(shè)備上。

比如,我一般識(shí)別只用到識(shí)別英文與簡(jiǎn)體中文,因此只需要將eng.traineddata,chi_sim.traineddata弄到Android設(shè)備上就行了。

4. 開始Android OCR之旅

相關(guān)常量設(shè)置:

    //訓(xùn)練數(shù)據(jù)路徑,必須包含tesseract文件夾
    static final String TESSBASE_PATH = "/storage/emulated/0/Download/tesseract/";
    //識(shí)別語言英文
    static final String DEFAULT_LANGUAGE = "eng";
    //識(shí)別語言簡(jiǎn)體中文
    static final String CHINESE_LANGUAGE = "chi_sim";  

英文識(shí)別:

     public void EnglishOCR(){
        //設(shè)置圖片可以緩存
        english.setDrawingCacheEnabled(true);
        //獲取緩存的bitmap
        final Bitmap bmp = english.getDrawingCache();
        final TessBaseAPI baseApi = new TessBaseAPI();
        //初始化OCR的訓(xùn)練數(shù)據(jù)路徑與語言
        baseApi.init(TESSBASE_PATH, DEFAULT_LANGUAGE);
        //設(shè)置識(shí)別模式
        baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE);
        //設(shè)置要識(shí)別的圖片
        baseApi.setImage(bmp);
        english.setImageBitmap(bmp);
        englishtext.setText(baseApi.getUTF8Text());
        baseApi.clear();
        baseApi.end();
     }  

簡(jiǎn)體中文識(shí)別與英文識(shí)別類似。

5. 程序界面

程序源代碼下載:https://github.com/lavor-zl/FunctionsDemo

歡迎關(guān)注我的微信公眾號(hào):Android技術(shù)漫談

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/65958.html

相關(guān)文章

  • Python圖像處理圖片文字識(shí)別(OCR

    摘要:與介紹將圖片翻譯成文字一般被稱為光學(xué)文字識(shí)別,。是目前公認(rèn)最優(yōu)秀最精確的開源系統(tǒng)。我們以圖片為例輸入命令識(shí)別結(jié)果如下只識(shí)別錯(cuò)了一個(gè)字,識(shí)別率還是不錯(cuò)的。最后加一句,對(duì)于彩色圖片的識(shí)別效果沒有黑白圖片的效果好。 OCR與Tesseract介紹 ??將圖片翻譯成文字一般被稱為光學(xué)文字識(shí)別(Optical Character Recognition,OCR)??梢詫?shí)現(xiàn)OCR 的底層庫并不多,...

    W4n9Hu1 評(píng)論0 收藏0
  • 識(shí)別圖片中的文字 - Tesseract 和 百度云OCR的對(duì)比

    摘要:一個(gè)簡(jiǎn)單的圖片轉(zhuǎn)文字的函數(shù)實(shí)現(xiàn)如下。百度云這是偶然的發(fā)現(xiàn),百度云提供了一定額度的免費(fèi)的,目前是每日次,做做研究或者小應(yīng)用還勉強(qiáng)夠用,本文主要為了測(cè)試其效果。論中文,還是百度比谷歌更懂一點(diǎn)。 當(dāng)今時(shí)代人工智能都已經(jīng)是爛大街的詞了,OCR應(yīng)該也很多人都知道。 OCR (Optical Character Recognition,光學(xué)字符識(shí)別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印...

    mushang 評(píng)論0 收藏0
  • [譯]OpenCV OCR and text recognition with Tesseract

    摘要:納入深度學(xué)習(xí)模型來進(jìn)一步提升準(zhǔn)確率只是時(shí)間問題,事實(shí)上,這個(gè)時(shí)間已經(jīng)到來。最新版本支持基于深度學(xué)習(xí)的,準(zhǔn)確率顯著提高。該函數(shù)使用基于深度學(xué)習(xí)的文本檢測(cè)器來檢測(cè)不是識(shí)別圖像中的文本區(qū)域。高效使用概率最高的文本區(qū)域,刪除其他重疊區(qū)域。 By Adrian Rosebrock on September 17, 2018 in Deep Learning, Optical Character ...

    gnehc 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<