Classification Using Nearest Neighbors.zip - 1.在BG中加载数据_功能.csv,和背景_对象.csv分成两个独立的数据帧。请注意,这两个文件都有一个标题行,其中列出了变量名。
2.将5个特征数据集明智地组合成一个数据集行,将5个对象数据集明智地组合成一个数据集行。
3.去除共线性
4.使用最小-最大规格化对剩余特征数据集中的每个列进行规范化。请不要规范化对象数据集。
5.随机抽取80%的特征数据集保存在训练数据集中,剩余的20%保存在测试数据集中。以相同的方式拆分对象数据集。
6.利用训练数据集训练kNN模型。设置k等于训练数据集大小的平方根。
7.使用kNN模型预测测试数据集的目标特征。,2020-07-11 15:31:21,下载1次
python基础数据分析实例.zip - 假设要分析的数据包括属性age。数据元组的年龄值为(按递增顺序)13、15、16、19、20、20、21、22、22、25、25、25、25、25、30、33、35、35、35、36、40、45、46、52、70。另外,假设一家医院用上述年龄属性对所选样本受试者的年龄和体脂数据进行测试,得到结果,并执行下列操作:
1、将上述数据保存在逗号分隔值文件中。
2、将逗号分隔值文件中的数据读入R中的变量。
3、年龄和脂肪百分比的平均、中等和标准差是多少?
4、这个时代的模式是什么?评论数据的形式(即双峰、三峰等)。
5、 年龄范围有多大?
6、年龄的第一个四分位数和第三个四分位数是什么?
7、给出年龄和脂肪百分比的五位数摘要。
8、 绘制年龄和脂肪百分比的方框图。
9、显示年龄和脂肪百分比的直方图。
10、根据这两个变量绘制散点图。,2020-07-11 15:07:29,下载1次