sh-1993 在 2024-05-17 06:35:23 上传
说明:PySpark-Kaggle,, stars:0, update:2024-05-13 20:25:27
开发平台:Jupyter Notebook | 大小:0KB | 下载0次
sh-1993 在 2024-05-15 12:08:13 上传
说明:Data Engineer projects , stars:0, update:2024-05-14 14:36:33
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-05-14 06:56:43 上传
说明:Building a stock broker web application using Apache HBase, Fast API and React js, stars:2, update:2024-05-13 22:51:41
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-05-11 18:41:10 上传
说明:google-ngrams-big-data,, stars:0, update:2024-05-11 04:32:23
开发平台:Jupyter Notebook | 大小:0KB | 下载0次
sh-1993 在 2024-05-11 04:42:44 上传
说明:The repository hosts Python and Java projects focused on various NLP tasks like sentiment analysis, text classification, and machine translation.
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-05-08 09:51:42 上传
说明:This project aims to address Egypt s energy challenges by leveraging data-driven solutions. With increasing demand from urban centers and industries, conventional approaches such as random power cuts have proven ineffective. To tackle this issue, we are adopting a proactive strategy grounded in data analytics.
开发平台:Jupyter Notebook | 大小:0KB | 下载0次
sh-1993 在 2024-05-07 17:01:00 上传
说明:BIG DATA,, stars:1, update:2024-05-07 03:53:12
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-05-05 13:54:42 上传
说明:football big data,, stars:1, update:2024-05-04 21:30:35
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-05-05 11:07:51 上传
说明:when I forget something... , stars:1, update:2024-05-04 19:52:43
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-04-30 12:17:55 上传
说明:基于Java,SpringBoot,Vue,Python爬虫,Hadoop大数据旅游推荐管理系统设计, stars:1, update:2024-04-30 01:57:56
开发平台:Java | 大小:0KB | 下载0次
sh-1993 在 2024-04-28 08:51:02 上传
说明:PyHDFS: Scalable & resilient distributed file system. Components: Zookeeper, NameNode, DataNode, Metadata service, Client. Setup guide for AWS & local. Explore distributed storage!
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-04-26 18:35:26 上传
说明:I love learning projects! , stars:1, update:2024-04-24 23:03:03
开发平台:Jupyter Notebook | 大小:0KB | 下载0次
sh-1993 在 2024-04-25 21:03:28 上传
说明:Analyze movie ratings and build a recommendation system using MapReduce. This project utilizes the Apriori algorithm, optimized for handling large datasets like the Netflix prize data, to provide personalized movie recommendations. , stars:0, update:2024-04-22 22:59:51
开发平台:Java | 大小:0KB | 下载0次
sh-1993 在 2024-04-24 16:08:44 上传
说明:Empowering Hadoop Learning with Hands-on Environments, stars:0, update:2024-04-24 07:01:19
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-04-20 05:06:23 上传
说明:?? Apache Accumulo is a sorted, distributed key/value store that provides robust, scalable data storage and retrieva, stars:1, update:2024-04-19 15:18:11
开发平台:Java | 大小:0KB | 下载0次
sh-1993 在 2024-04-19 11:10:20 上传
说明:data warehouse index, stars:0, update:2024-04-15 03:58:09
开发平台:Shell | 大小:0KB | 下载0次
sh-1993 在 2024-04-17 09:42:19 上传
说明:收录一些学习大数据技术以来的相关知识, 旨在构建大数据体系知识, stars:3, update:2024-04-16 02:52:27
开发平台:JavaScript | 大小:0KB | 下载0次
sh-1993 在 2024-04-15 15:39:14 上传
说明:Devops for DWH which is for Crypto data analysis (hadoop, hive, spark, kafka, cassandra, trino, etc.), stars:1, update:2024-04-14 06:40:18
开发平台:Dockerfile | 大小:0KB | 下载0次
sh-1993 在 2024-04-09 00:38:56 上传
说明:基于Spring Boot全家桶打造,大数据PAAS组件适配器,一键适配DolphinScheduler、Hadoop、Spark、Hive、Impala、HBase、Kafka、StarRocks、ClickHouse、Neo4j、ElasticSearch,通过标准REST接口和SQL语句操作,简单易用,方便二次开发和快速集成
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-04-07 12:01:03 上传
说明:探索用于大数据处理的基本MapReduce设计模式!该存储库包括“MapReduce设计模式”一书中模式的实际实现,包括跨摘要、过滤、组织、连接等的示例。
开发平台:Java | 大小:0KB | 下载0次
sh-1993 在 2024-04-01 04:14:45 上传
说明:Hadoop、Hive和Spark的例子、细节和注意事项
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-04-01 11:45:43 上传
说明:该存储库旨在开发一个基本的搜索引擎,利用Hadoop的MapReduce框架来高效地索引和处理大量文本语料库。该项目使用的数据集是英文维基百科转储的子集,总大小为5.2GB。该项目侧重于实现朴素搜索算法,以解决信息中的挑战。
开发平台:Jupyter Notebook | 大小:0KB | 下载0次
sh-1993 在 2024-03-30 14:27:10 上传
说明:大数据组件学习代码
开发平台:Java | 大小:0KB | 下载0次
sh-1993 在 2024-03-30 08:46:53 上传
说明:欢迎使用大数据分析存储库!沉浸在精心策划的大数据分析知识库中。探索从大量数据集获取见解和导航强大的分析工具的复杂性。
开发平台:Java | 大小:0KB | 下载0次
sh-1993 在 2024-03-30 07:52:29 上传
说明:Trilha de aprendizagem para navegar pelas differentes tecnologias e metodologias aplicadas em projetos de dados utilizando os serv os de nuvem da AWS como plataforma公司。O conteüdoéorganizado em 10 Sprints,cada qual sendo executada em um período de 14 dias。
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-03-25 17:45:01 上传
说明:通过GitHub Actions自动构建和推送Apache Hadoop文档
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-03-28 08:30:17 上传
说明:掌握数据工程:有效数据管道的策略、工具和最佳实践
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-03-25 05:30:40 上传
说明:阿帕切箭头
开发平台:Python | 大小:0KB | 下载0次
sh-1993 在 2024-03-23 18:20:06 上传
说明:在维基百科文章中使用Hadoop MapReduce技术和python的搜索引擎
开发平台:Others | 大小:0KB | 下载0次
sh-1993 在 2024-03-22 17:30:24 上传
说明:使用Hadoop和Mapper侧连接实现K-means算法。
开发平台:HTML | 大小:0KB | 下载0次