SpectralClustering:使用MATLAB频谱聚类的直观实现

  • z2_228848
    了解作者
  • 5MB
    文件大小
  • zip
    文件格式
  • 0
    收藏次数
  • VIP专享
    资源类型
  • 0
    下载次数
  • 2022-04-01 08:43
    上传日期
光谱聚类MATLAB 这是使用MATLAB进行频谱聚类的直观实现。 您可以轻松地完成使用Scikit,了解类似的API(光谱clutsering和其他人之间的比较是频谱聚类分析)。 有关频谱聚类的更多详细信息,您可以阅读以下参考文献或我们撰写。 (GPU加速版即将推出...) 入门 克隆此仓库并运行main.m以查看演示 使用细节 指定数据矩阵X和标签向量y,或获取内置数据 [X, y] = make_digits_dataset(300, true, false); 00examples, balance, no shuffle 在此项目中,我们提供6个数据集,包括3个玩具和3个
SpectralClustering-master.zip
  • SpectralClustering-master
  • datasets
  • SMSSpamCollection(TF_IDF)-1.mat
    657.8KB
  • SMSSpamCollection(TF_IDF)_bigram.mat
    286.3KB
  • SMSSpamCollection-1.mat
    191.8KB
  • make_SMSspam_dataset.m
    1.7KB
  • SMSSpamCollection_bigram.mat
    119.7KB
  • optdigits.tra
    550.4KB
  • SMSSpamCollection-0.mat
    103.6KB
  • SMSSpamCollection(TF_IDF)-0.mat
    369.2KB
  • make_circles.m
    922B
  • make_seeds_dataset.m
    365B
  • make_blobs.m
    1.3KB
  • make_moons.m
    855B
  • seeds_dataset.txt
    9.1KB
  • SMSSpamCollection_w2v.mat
    3.1MB
  • make_digits_dataset.m
    374B
  • utils
  • normalization.m
    292B
  • graph
  • nearest_neighbor.m
    1.2KB
  • fullyconnected.m
    920B
  • e_neighborhood.m
    485B
  • metric
  • cosine_distances.m
    294B
  • adjusted_rand_score.m
    1.2KB
  • matrixplot.m
    15.4KB
  • manhattan_distances.m
    352B
  • sigmoid_kernel.m
    392B
  • rbf_kernel.m
    324B
  • similarity_matrix.m
    1.2KB
  • polynomial_kernel.m
    483B
  • laplacian_kernel.m
    328B
  • euclidean_distances.m
    509B
  • img
  • intro.png
    51.5KB
  • moons.png
    21.6KB
  • circles.png
    18.9KB
  • solver
  • SpectralClustering.m
    2.1KB
  • main.m
    921B
  • prepocessing.m
    270B
  • feature_extraction(word2vec).py
    2.2KB
  • word2vec.py
    1.2KB
  • feature_extraction.py
    1.8KB
  • README.md
    1.6KB
内容介绍
# Spectral Clustering MATLAB <img src=img/intro.png width = "80%" height = "80%"/> This is an intuitive implementation of Spectral Clustering with MATLAB. You can easily finish a spectral clustering analysis using Scikit-Learn similar API (the comparison between spectral clutsering and others is [here](https://scikit-learn.org/stable/modules/clustering.html#overview-of-clustering-methods)). For more deatils about spectiral clustering, you can read the references below or [a brief introduction](https://jhliu17.github.io/codes/spectral_clustering_slide.pdf) written by us. (GPU accelerated version will be coming soon...) ## Getting Started 1. Clone this repo and run `main.m` to see the demo 2. Usage Details - **Specify your data matrix X and label vector y, or get the built-in data** ``` [X, y] = make_digits_dataset(300, true, false); % 300 examples, balance, no shuffle``` In this project, we provide 6 datasets including 3 toys and 3 real datasets. You can find them in `datasets`. - **Construct your graph** ```W = fullyconnected(X, 7.8, 'rbf');``` There havs 3 types of graph you can use. Find them in `graph`. - **Run the Spectral Clustering Solver** ```[C, ~] = SpectralClustering(W, size(unique(y), 1), 2);``` C is the predicted clusters. - **You can also easily metric the predicted answer with the functions under the `metric`.** ## Contributors - Liu Jun-Hao, SCUT - Ning Jin-Lai, SCUT - Huang De-Dong, SCUT - Wen Hao, SCUT ## References 1. Von Luxburg, Ulrike. "A tutorial on spectral clustering." Statistics and computing 17.4 (2007): 395-416.
评论
    相关推荐
    • 高光谱遥感图像数据集
      常用的高光谱遥感图像数据集,包含Indians Pines、Botswana、KSC、PaviaU、Salinas及它们的ground truth矩阵。文件后缀为.mat
    • KITTI数据集点云地图构建资料.rar
      本文描述了如何通过KITTI数据集,读取激光雷达点云数据,并通过ground truth进行点云建图的过程。其代码的主要功能包括:1)点云文件的格式转换2)点云转换矩阵计算3)点云地图构建
    • pmf:MovieLens 100K上的概率矩阵分解
      在此项目中,我们使用MovieLens 100K数据集。 该数据集包含来自943位用户的1,682部电影的100,000个评分。 在此项目中,RMSE(均方根误差)用作度量。 我测试了2种不同的数据分割:密集和稀疏。 数据是随机拆分的,...
    • circuitdata:数据集
      连接组学数据集 此存档的目的是提供各种“计算系统”数据集的规范、清理、正确规范化的版本。 所有文件均以 SQLite 格式提供。 这是因为在处理这些数据集时很难同时获得干净的数据和元数据——亲爱的科学家们,请...
    • honst:根据您的规则修复您的数据集
      在编辑连接的矩阵数据时,需要保持数据完整性。 保持本地状态正确。 演示版 您可以在CodeSandbox上尽情玩乐: 概述 const data = [ { username : "johndoe" , name : "John" , surname : "Doe" , age : "22" } , ...
    • LFW-a 数据集mat文件.zip
      LFW-a 数据集子mat文件,已经做cropped处理切割人脸部分,并且resize成了30x15的大小。只包含样本个数大于等于20的类别。fea为样本矩阵,每行一个样本,gnd为类别标签。
    • 数据结构代码合集
      内含二叉树的遍历、哈夫曼编码、后缀表达式的实现、图的创建与遍历、图的应用、稀疏矩阵、线性表合并、一元多项式的乘法、加法、减法。
    • matrixTests:R包,用于在矩阵数据框的行列上计算多个假设检验
      使用“物种”作为组,对虹膜数据集的每一列进行Bartlett检验: col_bartlett( iris [, - 5 ], iris $ Species ) obs.tot obs.groups var.pooled df statistic pvalue Sepal.Length 150 3 0.26500816 2 16.005702 0...
    • ruse.js:为绘制大型数据集而构建的轻量级 WebGL 库
      ruse.js是一个轻量级的 WebGL 库,用于绘制大型数据集。 它能够一次绘制数百万个点,并在图之间平滑过渡。 依赖 ruse.js仅依赖于进行矩阵转换。 用法 使用常用的脚本标签将gl-matrix和ruse.js包含到项目中。 ...
    • 矩阵分解数据集
      矩阵分解所需数据集,里面数据集有6个,ratings.csv,