資料介紹
軟件簡(jiǎn)介
NCChineseConverter 是一個(gè)?基于 Objective-C?的中文簡(jiǎn)繁正轉(zhuǎn)換庫. 除此之外, 本項(xiàng)目還包括一個(gè) Python 的詞庫轉(zhuǎn)換工具.
本庫的基本實(shí)現(xiàn)原理: 從 Mediawiki 提供的字典中提取數(shù)據(jù), 轉(zhuǎn)換為自己需要的格式, 然后用最大正向匹配算法進(jìn)行字符替換.
特點(diǎn)
-
可以只使用單一詞庫
-
可擴(kuò)充自定義詞庫
-
提供 NSString 的 Category
使用方法
-
?用詞典工具生成詞典
-
?把生成的詞典放在項(xiàng)目的 Resources 目錄下
-
?按如下方式引用轉(zhuǎn)換庫和調(diào)用
#import?"NCChineseConverter.h"?…?NSString?*oriString?=?@"";?NSString?*result?=?[[NCChineseConverter?sharedInstance]?convert:oriString?withDict:NCChineseConverterDictTypezh2TW]; …
Tool
下載詞庫并生成詞典:
python?dictgenerator.py
? ? 用本地詞庫生成詞典(適用于已經(jīng)下載了詞庫文件):
python?dictgenerator.py?n
? ? 利用詞典工具會(huì)在當(dāng)前目錄生成如下詞典文件:
-
zh2TW.txt (簡(jiǎn)體 -> 臺(tái)灣正體)
-
zh2HK.txt (簡(jiǎn)體 -> 港澳繁體)
-
zh2SG.txt (簡(jiǎn)體 -> 新馬繁體)
-
zh2CN.txt (繁體/正體 -> 大陸簡(jiǎn)體)
方便起見, 我在?dictionary?目錄中放了轉(zhuǎn)換好的詞典文件. 目錄名稱即為詞典生成時(shí)間.
注意: 請(qǐng)勿修改文件名, 轉(zhuǎn)換庫是嚴(yán)格按照文件名來讀取詞典的.
自定義擴(kuò)充轉(zhuǎn)換詞組
詞典工具是根據(jù) Mediawiki 的詞庫來進(jìn)行詞典生成, 所以要等待 Mediawiki 的詞庫更新才能得到新的詞典. 如果你有一些 Mediawiki 里沒有的詞語要擴(kuò)充, 則可以使用該方法來使用.
使用前綴相同的字典文件來進(jìn)行自定義詞組的擴(kuò)充, 轉(zhuǎn)換庫會(huì)自動(dòng)加載對(duì)應(yīng)的擴(kuò)充字典.
比如, 把你自己的?簡(jiǎn)體 -> 臺(tái)灣正體?詞典命名為?zh2TW.custom.txt, 這樣轉(zhuǎn)換庫就可以自動(dòng)加載這個(gè)詞典并在轉(zhuǎn)換時(shí)使用.
備注
雖然詞典工具一次生成四個(gè)詞典, 但是你可以視情況只使用其中一個(gè)或多個(gè). 需要注意的是如果你沒有在項(xiàng)目中放入某個(gè)詞典文件, 那么要避免在代碼里調(diào)用該字典.
未來改進(jìn)
-
增加更多轉(zhuǎn)換詞庫
-
使用 Double-array Trie Tree 來構(gòu)造原始字典, 提高搜索速度
-
改進(jìn)分詞算法
背景
簡(jiǎn)繁正的問題在此不多說, 都是歷史遺留問題, 具體情況可以自行查看 Wikipedia, 用自己的思考去判斷(漢字簡(jiǎn)化爭(zhēng)論). 在此只討論技術(shù)相關(guān)問題.
簡(jiǎn)繁轉(zhuǎn)換不是單純的從一個(gè)字轉(zhuǎn)換為另一個(gè)字, 他包含很多內(nèi)容, 如:
-
各種繁體/正體. 如: 港澳繁體, 臺(tái)灣正體. 再加上各個(gè)華人地區(qū)的中文(如新加坡)使用等.
-
簡(jiǎn)體和繁體的對(duì)照往往不止一對(duì)一, 而是一對(duì)二, 一對(duì)三, 甚至一對(duì)五(多繁對(duì)一簡(jiǎn)問題)
目前比較常用的轉(zhuǎn)換方式主要是?Wikipedia 的轉(zhuǎn)換方式?和?OpenCC.
Wikipedia 進(jìn)行簡(jiǎn)繁轉(zhuǎn)換的操作流程參見:?繁簡(jiǎn)處理
OpenCC 的庫相對(duì)比較專業(yè). 不過這是一個(gè) C 庫, 所以如果要在 iOS 下使用, 則需要自己把庫編譯成 iOS 可以使用的庫再進(jìn)行調(diào)用.
參考
- STM32固件庫使用手冊(cè)的中文版 0次下載
- STM32固件庫使用手冊(cè)中文版以及技術(shù)手冊(cè)中文版pdf 0次下載
- 基于VB的轉(zhuǎn)換Access數(shù)據(jù)庫為Excel文件實(shí)驗(yàn)
- 推挽正激零電流轉(zhuǎn)換DC-DC變換器的研究與實(shí)現(xiàn)
- 西門子S7_200模擬量轉(zhuǎn)換庫的使用 50次下載
- 寬輸入范圍電路模式DC-DC升壓轉(zhuǎn)換器芯片XL6009 17次下載
- AN1246中文手冊(cè)之如何在Microchip圖形庫中創(chuàng)建控件
- dsPIC DSC DTMF 生成庫的詳細(xì)中文資料概述
- 如何使用dsPIC DSC線路回聲消除庫的詳細(xì)中文資料概述
- 如何對(duì)dsPIC33E系列器件使用采樣率轉(zhuǎn)換庫的詳細(xì)中文資料概述
- Stellaris軟件庫的安裝,特性介紹和資源說明詳細(xì)中文概述 5次下載
- linux_C函數(shù)庫中文手冊(cè) 14次下載
- STM32固件庫說明(中文版) 0次下載
- orcad與dxdesigner庫轉(zhuǎn)換器
- 簡(jiǎn)繁體字轉(zhuǎn)換軟件下載
- proteus元件轉(zhuǎn)換方向快捷鍵 proteus元件庫沒有的元件怎樣搞 9288次閱讀
- 聊聊日志即數(shù)據(jù)庫 747次閱讀
- 對(duì)象轉(zhuǎn)換工具:MapStruct 庫 1102次閱讀
- Linux中的靜態(tài)庫和共享庫 1071次閱讀
- 正輸出和負(fù)輸出DC-DC轉(zhuǎn)換器使用相同的合格器件 1454次閱讀
- 長(zhǎng)期降低成本:正輸出和負(fù)輸出DC-DC轉(zhuǎn)換器使用相同的合格器件 848次閱讀
- 關(guān)于STEP7庫功能字符串轉(zhuǎn)換 4320次閱讀
- Smart200庫文件添加的Scale指令 1.6w次閱讀
- 基于LTC7149的正至負(fù)轉(zhuǎn)換器解決方案 835次閱讀
- 云數(shù)據(jù)庫和自建數(shù)據(jù)庫的區(qū)別及應(yīng)用 4669次閱讀
- 如何實(shí)現(xiàn)電平轉(zhuǎn)換,多種方法 1.2w次閱讀
- 如何使用采用SPI Flash存儲(chǔ)中文字符庫的方法說明 6632次閱讀
- 將負(fù)脈沖轉(zhuǎn)換為正脈沖 9687次閱讀
- STM32標(biāo)準(zhǔn)庫改為HAL庫的程序?qū)崿F(xiàn) 3.4w次閱讀
- 如何將Altium Designer 6.0的庫檔轉(zhuǎn)換成99se的格式 6264次閱讀
下載排行
本周
- 1A7159和A7139射頻芯片的資料免費(fèi)下載
- 0.20 MB | 55次下載 | 5 積分
- 2PIC12F629/675 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.38 MB | 36次下載 | 5 積分
- 3PIC16F716 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.35 MB | 18次下載 | 5 積分
- 4dsPIC33EDV64MC205電機(jī)控制開發(fā)板用戶指南
- 5.78MB | 8次下載 | 免費(fèi)
- 5STC15系列常用寄存器匯總免費(fèi)下載
- 1.60 MB | 7次下載 | 5 積分
- 6模擬電路仿真實(shí)現(xiàn)
- 2.94MB | 4次下載 | 免費(fèi)
- 7PCB圖繪制實(shí)例操作
- 2.92MB | 2次下載 | 免費(fèi)
- 8零死角玩轉(zhuǎn)STM32F103—指南者
- 26.78 MB | 1次下載 | 1 積分
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 452次下載 | 免費(fèi)
- 2免費(fèi)開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 141次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 137次下載 | 免費(fèi)
- 4A7159和A7139射頻芯片的資料免費(fèi)下載
- 0.20 MB | 55次下載 | 5 積分
- 5PIC12F629/675 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.38 MB | 36次下載 | 5 積分
- 6如何正確測(cè)試電源的紋波
- 0.36 MB | 19次下載 | 免費(fèi)
- 7PIC16F716 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.35 MB | 18次下載 | 5 積分
- 8Q/SQR E8-4-2024乘用車電子電器零部件及子系統(tǒng)EMC試驗(yàn)方法及要求
- 1.97 MB | 8次下載 | 10 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論
查看更多