k近邻算法

时间：2020-06-02 22:05:30 阅读：57 评论：0 收藏：0 [点我收藏+]

怎样计算两个数据的距离（相近程度）
假如两个数据有A B，有两个属性 p1 p2
那么，A与B的距离 distance = 开平方( 平方(A.p1 - B.p1)+ 平方(A.p2 - B.p2) )




import pandas as pd
import numpy as np
from sklearn import preprocessing
from sklearn.neighbors import KNeighborsRegressor

df = pd.read_csv("./titanic_train.csv")
#drop NAN datas
df = df.dropna()

#75%用来训练
trainCount = int(df.shape[0]*0.75)

df_train = df.iloc[:trainCount]
df_test = df.iloc[trainCount:]


#选择哪些列用来做比较
cols = [‘Age‘,‘Pclass‘]
#初始化KNeighborsRegressor，指定取前10个最相似的近邻的平均值，默认是5个
knn = KNeighborsRegressor(n_neighbors=10)
#开始训练，目标是Fare的值
knn.fit(df_train[cols],df_train[‘Fare‘])
#用测试集预测Fare值
predictions = knn.predict(df_test[cols])

print(predictions)
print(df_test[‘Fare‘].values)

k近邻算法

原文：https://www.cnblogs.com/IWings/p/13033893.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)