1、關(guān)于Mini0cr軟件 本軟件是飛濤軟件工作室開發(fā)的一款免費(fèi)0cr軟件,主要用于識(shí)別圖像文件之中,出現(xiàn)的漢字顯示字體。
(資料圖片僅供參考)
2、0cr的中文含意是光學(xué)字符識(shí)別。
3、為什么叫Mini呢?因?yàn)楝F(xiàn)有的識(shí)別漢字的商業(yè)0cr軟件,動(dòng) 二三十兆,而本軟件解壓后,也不過(guò)三兆多,身材比較纖小,再加上本軟件主要用于識(shí)別字體比較小的漢字,所以叫Mini,中文的發(fā)音是“迷你“中文含義是超小型。
4、既然有了商業(yè)0cr軟件,為什么還要開發(fā)這個(gè)軟件? 不同于商業(yè)0cr軟件,本軟件是免費(fèi)的,可以自由使用。
5、第二個(gè)不同之處,本軟件的識(shí)別對(duì)象是屏幕出現(xiàn)的“顯示漢字“而不是針對(duì)掃描儀掃出來(lái)的“打印漢字”。
6、二者有什么不同呢?最重要的一點(diǎn): 掃描出來(lái)的打印漢字的高度和寬度一般都在30多個(gè)像素點(diǎn)之 上,這是我用畫圖軟件,打開某個(gè)商業(yè)0cr的s 1ess 1e)tif,然后一點(diǎn)一點(diǎn)數(shù)出 ’來(lái)的。
7、從文件名和目錄名的中文含意可以看出,這個(gè)點(diǎn)數(shù)應(yīng)該是一個(gè)典型值。
8、那么,如果用商業(yè)0cr識(shí)別屏幕上出現(xiàn)的小五號(hào)字,漢字的高度是12個(gè)像素點(diǎn),會(huì)出現(xiàn)什么情況呢? 測(cè)試方法:用記事本隨便寫幾行漢字,設(shè)置字體為小五號(hào)字。
9、這大概是看著還算舒服的最小號(hào)的漢字字體了(高度是12個(gè)像素點(diǎn)),如果再小,字體就很難看了。
10、然后,按拷屏鍵PrtSc,把屏幕的圖像拷貝、粘貼到畫圖軟件中,修剪尺寸后,保存為b 的格式。
11、然后,我找了兩個(gè)國(guó)內(nèi)最著名的0cr軟件進(jìn)行測(cè)試,結(jié)果讓人大吃一驚,識(shí)別率幾乎為零.把圖像放大兩倍,再測(cè)試,結(jié)果仍然很不理想,大概也只有百分之二三十的樣子。
12、開發(fā)Mini0cr軟件的由來(lái)我在開發(fā)護(hù)花使者反黃圖像識(shí)別軟件的時(shí)候,遇到有些圖像里,嵌有某些文字,如果能把文字識(shí)別出來(lái),圖像的含義就很容易讓計(jì)算機(jī)理解了。
13、預(yù)算有限,我連掃描儀都舍不得買,就更別想買商業(yè)0cr的開發(fā)包了,大概幾十萬(wàn),或者更多,或者別人壓根就不賣。
14、況且它們的識(shí)別率對(duì)小字體幾乎為零,不符合我的要求。
本文到此分享完畢,希望對(duì)大家有所幫助。
關(guān)鍵詞: