失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 字典特征提取 文本特征提取。

字典特征提取 文本特征提取。

时间:2019-09-12 07:11:41

相关推荐

字典特征提取 文本特征提取。

文章目录

1 定义2. 字典特征提取API3. 字典特征提取案例:1.实现效果:2.实现代码 4. 文本特征提取1. 方法2. 英文案例1. 实现效果2.流程 3. 中文案例使用到的包

1 定义

将任意数据(如文本或图像)转换为可用于机器学习的数字特征

注:特征值化是为了计算机更好的去理解数据

特征提取分类: 字典特征提取(特征离散化)文本特征提取图像特征提取

2. 字典特征提取API

sklearn.feature_extraction

3. 字典特征提取案例:

1.实现效果:

2.实现代码

4. 文本特征提取

1. 方法

2. 英文案例

1. 实现效果

2.流程

from sklearn.feature_extraction.text import CountVectorizerdef text_count_demo():"""对文本进行特征抽取,countvetorizer:return: None"""data = ["life is short,i like like python", "life is too long,i dislike python"]# 1、实例化一个转换器类# transfer = CountVectorizer(sparse=False) # 注意,没有sparse这个参数transfer = CountVectorizer()# 2、调用fit_transformdata = transfer.fit_transform(data)print("文本特征抽取的结果:\n", data.toarray())print("返回特征名字:\n", transfer.get_feature_names())return None

运行结果:

文本特征抽取的结果:

[[0 1 1 2 0 1 1 0]

[1 1 1 0 1 1 0 1]]

返回特征名字:

[‘dislike’, ‘is’, ‘life’, ‘like’, ‘long’, ‘python’, ‘short’, ‘too’]

3. 中文案例

使用到的包

from sklearn.feature_extraction import DictVectorizer #字典特征提取from sklearn.feature_extraction.text import CountVectorizer #文本特征提取import jiebafrom sklearn.feature_extraction.text import TfidfVectorizer

如果觉得《字典特征提取 文本特征提取。》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。