200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 文本数据增强(data augmentation)nlpaug使用

文本数据增强(data augmentation)nlpaug使用

时间:2018-10-11 17:47:11

相关推荐

文本数据增强(data augmentation)nlpaug使用

环境

python==3.7nlpaug==1.1.7

文档

https://nlpaug.readthedocs.io/en/latest/overview/overview.html

/makcedward/nlpaug

安装

pip install numpy requests nlpaug

数据增强主要方式

/p/150600950

nlpaug简单介绍

Support textual and audio input

针对文本数据增强,支持同义词替换、tfidf、拼写错误、随机删除插入、回译等。

详细见api 文档

https://nlpaug.readthedocs.io/en/latest/augmenter/augmenter.html

使用Demo

import nlpaug.augmenter.word as nawfrom nlpaug.flow import Sometimes# 增强时,会保持下面列表中的内容不变。stopwords = ["love", "i"]synonym_aug = naw.SynonymAug(stopwords=stop_words)spelling_aug = naw.SpellingAug(stopwords=stop_words, aug_p=0.1)# 将多种数据增强方式融合aug = Sometimes([synonym_aug, spelling_aug])text = "i love apple. i was born in 2000. how are you?"r = aug.augment(text, 2)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。