Python使用langid库来识别字符串语言
python使用 langid 库来实现识别字符串是什么语言;langid 是第三方库,需要我们自己安装;
使用 pip3 安装 langid :
pip3 install langid
langid 依赖一个叫 numpy 的库,不过不用担心,安装 langid 时 pip 会将其依赖也进行安装。
导入库来看看是否安装成功:
import langid
如果没提示错误,则表示安装成功。
langid 简单的示例代码:
import langid
stringA = 'Hello word'
result = langid.classify(stringA)
print(result)
langid.classify() 方法会返回一个元组,第一项为语言的种类,第二项为占比;
用法示例:
import langid
LANGUAGE = {
'en':'英文',
'zh':'中文'
}
UNKNOWN_LANGUAGE = '未知'
def checkLang(string):
try:
return LANGUAGE[langid.classify(string)[0]]
except KeyError:
return UNKNOWN_LANGUAGE
string_en = 'hello word'
string_ch = '你好啊'
print(checkLang(string_en))
print(checkLang(string_ch))