首页 > 其他 > 详细

jieba库的使用及词云应用

时间:2020-04-04 15:34:21      阅读:223      评论:0      收藏:0      [点我收藏+]

 

 

一、jieba库的相关函数

技术分享图片

技术分享图片

 

二、词频统计((以下内容以百度搜索的散文为例)

步骤:

1、下载散文文本并以txt形式保存到与Python相同文件夹中

2、编写代码

技术分享图片

 

 

 三、wordcloud库的相关函数

w = wordcloud.WordCloud()

   方法 描述
w.generate(txt)

向WordCloud对象w中加载文本txt

>>>w.generate()

w.to_file(filename)

将词云输出为图像文件,.png或.jpg格式

>>>w.to_file("outfile.png")

 

 

 

 

 

 

配置对象参数

参数 描述
width

指定词云对象生成图片的宽度(默认像素400)

>>>w = wordcloud.WordCloud(width=600)

height

指定词云对象生成图片的高度(默认像素200)

>>>w = wordcloud.WordCloud(height=400)

min_font_size

指定词云中字体最小的字号,默认4号

>>>w = wordcloud.WordCloud(font_step=2)

max_font_size

指定词云字体中的最大字号,根据高度自动调节

>>>w = wordcloud.WordCloud(max_font_size=20)

font_step

指定词云中字体字号的步进间隔,默认为1

>>>w = wordcloud.WordCloud(font_step=2)

font_path

指定字体文件的路径,默认为None

>>>w = wordcloud.WordCloud(font_path="msyh.ttc")

max_words

指定词云显示的最大单词数量,默认为200

>>>w = wordcloud.WordCloud(max_words=20)

background_color

指定词云图片的背景颜色,默认为黑色

>>>w = wordcloud.WordCloud(background_color="white)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

四、生成词云的两种方法:

1、                                                                               

技术分享图片

2、

技术分享图片

 

五、 加载背景图片生成词云

参数 描述
stop_words

指定词云的排除词列表,即不显示的单词列表

>>>w = wordcloud.WordCloud(stop_words={"Python"}

mask

指定词云形状,默认为长方形

一、引用imread()函数

目前目前  scipy库不包含 imread 函数,imread函数在imageio库里。

技术分享图片

 

 二、使用其他库:numpy库、matplotlib库、PIL库

 

 

 

 

 

 

 

 

 

 

 技术分享图片

技术分享图片技术分享图片

 

                                         原图                                                                                         词云

 

jieba库的使用及词云应用

原文:https://www.cnblogs.com/ni23/p/12631966.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!