首页 > 其他 > 详细

jieba库的使用及词云应用

时间：2020-04-04 15:34:21 阅读：230 评论：0 收藏：0 [点我收藏+]

一、jieba库的相关函数

技术分享图片

技术分享图片

二、词频统计（(以下内容以百度搜索的散文为例）

步骤：

1、下载散文文本并以txt形式保存到与Python相同文件夹中

2、编写代码

技术分享图片

三、wordcloud库的相关函数

w = wordcloud.WordCloud()

方法

描述

w.generate(txt)

向WordCloud对象w中加载文本txt

>>>w.generate()

w.to_file(filename)

将词云输出为图像文件,.png或.jpg格式

>>>w.to_file("outfile.png")

配置对象参数

参数	描述
width	指定词云对象生成图片的宽度（默认像素400） >>>w = wordcloud.WordCloud(width=600)
height	指定词云对象生成图片的高度（默认像素200） >>>w = wordcloud.WordCloud(height=400)
min_font_size	指定词云中字体最小的字号，默认4号 >>>w = wordcloud.WordCloud(font_step=2)
max_font_size	指定词云字体中的最大字号，根据高度自动调节 >>>w = wordcloud.WordCloud(max_font_size=20)
font_step	指定词云中字体字号的步进间隔，默认为1 >>>w = wordcloud.WordCloud(font_step=2)
font_path	指定字体文件的路径，默认为None >>>w = wordcloud.WordCloud(font_path="msyh.ttc")
max_words	指定词云显示的最大单词数量,默认为200 >>>w = wordcloud.WordCloud(max_words=20)
background_color	指定词云图片的背景颜色，默认为黑色 >>>w = wordcloud.WordCloud(background_color="white)

四、生成词云的两种方法：

1、

技术分享图片

2、

技术分享图片

五、加载背景图片生成词云

参数

描述

stop_words

指定词云的排除词列表，即不显示的单词列表

>>>w = wordcloud.WordCloud(stop_words={"Python"}

mask

指定词云形状，默认为长方形

一、引用imread（）函数

目前目前 scipy库不包含 imread 函数，imread函数在imageio库里。

技术分享图片

二、使用其他库：numpy库、matplotlib库、PIL库

技术分享图片

技术分享图片

原图词云

jieba库的使用及词云应用

原文：https://www.cnblogs.com/ni23/p/12631966.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！