Python使用langid库来识别字符串语言

python使用 langid 库来实现识别字符串是什么语言;langid 是第三方库,需要我们自己安装;

使用 pip3 安装 langid :

pip3 install langid

langid 依赖一个叫 numpy 的库,不过不用担心,安装 langid 时 pip 会将其依赖也进行安装。

导入库来看看是否安装成功:

import langid

如果没提示错误,则表示安装成功。

langid 简单的示例代码:

import langid
stringA = 'Hello word'
result = langid.classify(stringA)
print(result)

langid.classify() 方法会返回一个元组,第一项为语言的种类,第二项为占比;

用法示例:

import langid
 
LANGUAGE = {
    'en':'英文',
    'zh':'中文'
}
 
UNKNOWN_LANGUAGE = '未知'
 
def checkLang(string):
    try:
        return LANGUAGE[langid.classify(string)[0]]
    except KeyError:
        return UNKNOWN_LANGUAGE
    
string_en = 'hello word'
string_ch = '你好啊'
 
print(checkLang(string_en))
print(checkLang(string_ch))

原创内容,如需转载,请注明出处;

本文地址: https://www.perfcode.com/p/598.html

分类: 计算机技术
推荐阅读:
error connecting to db server: no reachable servers解决办法 在使用 mongoexport 进行数据导出时,出现 error connecting to db server: no reachable servers;解决方法如下:
Golang中 :=的详细用法 在Go语言中:=运算符被用来声明变量以及给变量赋值,它可以自动推断变量类型;
C语言isspace()函数:判断字符是否为空白字符 isspace()是C语言标准库中的一个函数,用于判断一个字符是否为空白字符;当字符参数是一个空白字符时,返回一个非0值,否则返回0;
如何卸载 Dev Home Dev Home是Windows的一个新的控制中心,提供了使用可定制的小部件在仪表板中监控项目的能力,通过下载应用程序,包或存储库来设置开发环境;要卸载Dev Home,需以管理员权限打开 PowerShell,并执行以下命令:
Python实现线性搜索(linear search) 比如说我有数组data,1000个元素,要从里面找x;线性搜索,就是从头找到尾,速度最慢,但是适用性最广。
SQL删除数据库 如果要删除现有的数据库,则可以使用DROP DATABASE语句;