首页 > 其他 > 详细

kmeans 对表达量进行聚类

时间:2019-09-04 14:42:43      阅读:116      评论:0      收藏:0      [点我收藏+]

代码如下

df = pd.read_csv("../kmeans/gene.fpkm.csv",header=None)
print df.head()
#去掉第一行
tdf = df.drop(index=[0])
#去掉第一列
mdf = tdf.drop([0],axis=1)
#获取第一列作为行的名称
rownames=tdf[0]
#获取第一行作为列的名称
gene=df.loc[0][1:]
#修改原始数据库的行列名
mdf.rename(index=rownames, columns=gene, inplace=True)
from sklearn.cluster import KMeans
seed = 9 # 设置随机数
clf = KMeans(n_clusters=3, random_state=seed) # 聚类
clf.fit(mdf)
mdf[label] = clf.labels_ # 对原数据表进行类别标记
c = mdf[label].value_counts()

 

 



kmeans 对表达量进行聚类

原文:https://www.cnblogs.com/raisok/p/11458777.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!