Python使用langid库来识别字符串语言

python使用 langid 库来实现识别字符串是什么语言;langid 是第三方库,需要我们自己安装;

使用 pip3 安装 langid :

pip3 install langid

langid 依赖一个叫 numpy 的库,不过不用担心,安装 langid 时 pip 会将其依赖也进行安装。

导入库来看看是否安装成功:

import langid

如果没提示错误,则表示安装成功。

langid 简单的示例代码:

import langid
stringA = 'Hello word'
result = langid.classify(stringA)
print(result)

langid.classify() 方法会返回一个元组,第一项为语言的种类,第二项为占比;

用法示例:

import langid
 
LANGUAGE = {
    'en':'英文',
    'zh':'中文'
}
 
UNKNOWN_LANGUAGE = '未知'
 
def checkLang(string):
    try:
        return LANGUAGE[langid.classify(string)[0]]
    except KeyError:
        return UNKNOWN_LANGUAGE
    
string_en = 'hello word'
string_ch = '你好啊'
 
print(checkLang(string_en))
print(checkLang(string_ch))

原创内容,如需转载,请注明出处;

本文地址: https://www.perfcode.com/p/598.html

分类: 计算机技术
推荐阅读:
Python complex()函数 在Python中,complex()函数用于创建一个复数对象,它可以接受两个参数,表示复数的实部和虚部,也可以只传入一个参数,此时表示复数的实部为该参数,虚部为0。
Python property()函数 property()函数是Python内置函数之一,用于创建属性。
Golang实现获取文件的后缀名(扩展名) Golang通过调用 path.Ext() 函数,可获取文件的后缀名。
C语言获取操作系统类型 在C语言中,获取操作系统类型的方法通常依赖于操作系统和编译器。以下是一种常见的方法,可以使用预定义的宏来获取操作系统类型:
gin+Nginx获取真实的客户端IP 当使用Nginx为Golang gin程序做反向代理(端口转发)或负载均衡时,gin得到的客户端IP为127.0.0.1,这是由于Nginx没有正确配置导致;
Golang实现判断文件或文件夹是否存在 golang通过使用 os包中的Stat()函数和IsNotExist()函数即可判断文件或文件夹是否存在。