• B9_245313
    了解作者
  • 946.8KB
    文件大小
  • zip
    文件格式
  • 0
    收藏次数
  • VIP专享
    资源类型
  • 0
    下载次数
  • 2022-06-15 18:57
    上传日期
python和火花大数据 适用于Python的课程笔记本和适用于大数据的Spark 课程幻灯片:Python和大数据的火花 Spark DataFrames Spark DataFrames部分介绍 Spark DataFrame基础 Spark DataFrame操作 分组和汇总功能 缺失数据 日期和时间戳 Spark DataFrame项目 DataFrame项目练习 DataFrame项目练习解决方案 机器学习 机器学习和ISLR简介 使用Spark和Python和MLlib进行机器学习 咨询项目方法概述 线性回归 线性回归简介 讨论数据转换 带有PySpark示例的线性回归(汽车数据) 线性回归咨询项目(房屋数据) 线性回归咨询项目解决方案 逻辑回归 逻辑回归简介 Logistic回归示例 物流回归咨询项目(客户流失) Logistic回归解决方案项目解决方案 树方法 树
spark-main.zip
内容介绍
# python-and-spark-for-big-data Course Notebooks for Python and Spark for Big Data Slides of the Course : Python and spark for big data * Spark DataFrames * Spark DataFrames Section Introduction * Spark DataFrame Basics * Spark DataFrame Operations * Groupby and Aggregate Functions * Missing Data * Dates and Timestamps * Spark DataFrame Project * DataFrame Project Exercise * DataFrame Project Exercise Solutions * Machine Learning * Introduction to Machine Learning and ISLR * Machine Learning with Spark and Python and MLlib * Consulting Project Approach Overview * Linear Regression * Introduction to Linear Regression * Discussion on Data Transformations * Linear Regression with PySpark Example (Car Data) * Linear Regression Consulting Project (Housing Data) * Linear Regression Consulting Project Solution * Logistic Regression * Introduction to Logisitic Regression * Logistic Regression Example * Logistic Regression Consulting Project (Customer Churn) * Logistic Regression Consluting Project Solution * Tree Methods * Introduction to Tree Methods * Decision Tree and Random Forest Example * Random Forest Classification Consulting Project - Dog Food Data * RF Classification Consulting Project Solutions * RF Regression Project - (Facebook Data) * Clustering * Introduction to K-means Clustering * Clustering Example - Iris Dataset * Clustering Consulting Project - Customer Segmentation (Fake Data) * Clustering Consulting Project Solutions * Recommender System * Introduction to Recommender Systems and Collaborative Filtering * Code Along Project - MovieLens Dataset * Possible Consulting Project ? Company Service Reviews * Natural Language Processing * Introduction to Project/NLP/Naive Bayes Model * What are pipelines? * Code Along * Spark Streaming * Introduction to Spark Streaming * Spark Streaming Code-along!
评论
    相关推荐
    • SparkCore快速入门详解
      SparkCore快速入门详解
    • SparkDemo, spark示例代码,有一些生产实践.zip
      SparkDemo, spark示例代码,有一些生产实践 SparkDemo我们还提供了一些实际的案例,这些案例是对真实场景的抽象,展示了一个实际项目开发需要考虑的问题,这些案例经过了充分测试,读者完全可以在实际项目中参考。...
    • The-Spark-Foundation
      ●这是一个简单的线性回归任务,因为它仅涉及2个变量。 ●您可以使用R,Python,SAS Enterprise Miner或任何其他工具。 ●可以在上找到数据 ●如果学生每天学习9.25小时,则预计得分是多少?
    • Spark相关资料三册.zip
      里面包含了三册和spark相关的资料
    • Spark-Foundation
      任务1-探索有监督的机器学习在此回归任务中,我们将根据学生学习的小时数来预测学生预期得分的百分比。 这是一个简单的线性回归任务,因为它仅涉及两个变量。 如果学生一天学习9.25小时,预计得分是多少?
    • clojure-spark-ml
      使用Flaambo使用Clojure和Spark进行机器学习 ... 使用Flambo在Apache Spark上的Clojure中使用简单的逻辑回归分类器。 Flambo API的某些部分仍然缺失,但是绝对可以使用。 让它工作并获得乐趣并非难事 参考: :
    • Antaki2021:自闭症的表型谱归因于罕见变异,多基因风险和性别的综合作用
      该表包含用于稀有变异分析,常见变异分析和回归模型构建的所有遗传特征。 标头 FID 家庭ID IID 个人编号 表型 表型:1 = ASD; 0 =控制 性别 性别:0 =男性; 1 =女 同类群组 样本的数据收集。 REACH,SSC或SPARK...
    • SparkML(PDF以及所用的数据)
      SparkML(PDF以及所用的数据),高清PDF,数据,一招搞定!
    • Spark使用及性能调优
      1-如何用Sparklens对Spark做性能优化 2-Spark3.0大幅性能优化详解 3-Spark OOM总结 4-多易-Spark3.0原理深入和实战 5-Spark经典调优
    • GaussDB_100_1.0.1-DATABASE-REDHAT-64bit.tar.gz
      guassdb100在redhat上安装包,单机部署的包,安装步骤请看我的文中介绍,经过大量实验搭建总结出来的文档