从一篇文本中,抽取出所包含的身份证号并解析出其中的省、市、县、出生年月、性别、校验码。 这个功能,JioNLP帮你实现
源码在 github:JioNLP/dongrixinyu/JioNLP/dongrixinyu/JioNLP
在线使用版请戳 => 抽取并解析身份证号
代码安装方法:
安装 Installation
python>=3.6github 版本略领先于 pip$ git clone /dongrixinyu/JioNLP$ cd ./JioNLP$ pip install .
pip 安装
$ pip install jionlp
可能存在的问题
# 如安装失败,遇到安装时提示的 pkuseg、Microsoft Visual C++、gcc、g++ 等信息,# 则说明是 pkuseg 安装失败,需要在相应系统中安装 C 和 C++ 编译器,重新安装。# pip install pkuseg
使用 Usage
# 第一步,抽取出文本中的身份证号>>> text = '此人身份证号是 21040319560330098x,曾经...'>>> res = jionlp.extract_id_card(text, detail=True)>>> print(res)# [{'text': '21040319560330098x', 'offset': [9, 25]}]# 第二部,解析该身份证号中的内容。>>> text = '531109002X'>>> res = jio.parse_id_card(text)>>> print(res)# {'province': '贵州省',# 'city': '贵阳市',# 'county': '云岩区',# 'birth_year': '',# 'birth_month': '11',# 'birth_day': '09',# 'gender': '女',# 'check_code': 'x'}
该工具既可源码调用,也可在线网页直接使用 => 抽取并解析身份证号
如果觉得好就点个 Star 赞吧!