trt-samples-for-hackathon-cn

所属分类:系统/网络安全
开发工具:Python
文件大小:0KB
下载次数:0
上传日期:2022-04-12 11:50:16
上 传 者sh-1993
说明:  黑客马拉松cn的trt样本,,
(trt samples for hackathon cn,,)

文件列表:
.devcontainer/ (0, 2022-04-12)
.devcontainer/devcontainer.json (1528, 2022-04-12)
.vscode/ (0, 2022-04-12)
.vscode/c_cpp_properties.json (424, 2022-04-12)
.vscode/launch.json (1161, 2022-04-12)
.vscode/tasks.json (418, 2022-04-12)
Dockerfile (457, 2022-04-12)
LICENSE (10139, 2022-04-12)
Makefile (68, 2022-04-12)
OldSamples.md (3815, 2022-04-12)
build/ (0, 2022-04-12)
build/Makefile (2692, 2022-04-12)
cookbook/ (0, 2022-04-12)
cookbook/.clang-format (8558, 2022-04-12)
cookbook/.style.yapf (12056, 2022-04-12)
cookbook/00-MNISTData/ (0, 2022-04-12)
cookbook/00-MNISTData/8.png (412, 2022-04-12)
cookbook/00-MNISTData/extractMnistData.py (1005, 2022-04-12)
cookbook/00-MNISTData/loadMnistData.py (3811, 2022-04-12)
cookbook/00-MNISTData/requirements.txt (25, 2022-04-12)
cookbook/00-MNISTData/test/ (0, 2022-04-12)
cookbook/00-MNISTData/test/#empty.txt (0, 2022-04-12)
cookbook/00-MNISTData/train/ (0, 2022-04-12)
cookbook/00-MNISTData/train/#empty.txt (0, 2022-04-12)
cookbook/01-SimpleDemo/ (0, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT6/ (0, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT6/Makefile (887, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT6/TRT6.cpp (6527, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT6/TRT6.py (4977, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT6/requirements.txt (7, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT6/result.txt (3227, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT7/ (0, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT7/Makefile (887, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT7/TRT7.cpp (6527, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT7/TRT7.py (4954, 2022-04-12)
cookbook/01-SimpleDemo/TensorRT7/requirements.txt (12, 2022-04-12)
... ...

# 英伟达TensorRT加速AI推理Hackathon 2022 —— Transformer模型优化赛 ## 开发环境的设置命令 关于如何安装nvidia-docker,如何拉取镜像并运行,见此[文档](https://github.com/wcirq/trt-samples-for-hackathon-cn/blob/master/hackathon/setup.md)。 ## 大赛介绍 深度学习深刻地改变了计算机应用程序的功能与形态,广泛渗透于我们生活。为了加速深度学习模型的推理,英伟达推出了TensorRT。经过多年的版本迭代,TensorRT在保持极致性能的同时,大大提高了易用性,已经成为GPU上推理计算的必备工具。 随着版本迭代,TensorRT的编程接口在不断更新,编程最佳实践也在不断演化。开发者想知道,为了把我的模型跑在TensorRT上,最省力、最高效的方式是什么? 今天,英伟达联合阿里天池举办TensorRT Hackathon就是为了帮助开发者在编程实践中回答这一问题。英伟达抽调了TensorRT开发团队和相关技术支持团队的工程师组成专家小组,为开发者服务。参赛的开发者将在专家组的指导下在初赛中对给定模型加速;在复赛中自选模型进行加速,并得到专家组一对一指导。 我们希望借助比赛的形式,提高选手开发TensorRT应用的能力,因此重视选手的学习过程以及选手与英伟达专家之间的沟通交流。 ## 赛题说明 本赛分初赛和复赛。 ### 初赛 初赛是利用 TensorRT 加速 ASR 模型 WeNet(包含 encoder 和 decoder 两个部分),以优化后的运行时间作为主要排名依据。 - 初赛期间我们将建立包含所有选手的技术交流群,供大家研讨用 - 我们专门为此次比赛准备了系列讲座,为了能更顺利地完成比赛,请参赛者观看学习 - 讲座地址:https://www.bilibili.com/video/BV15Y4y1W73E - 配套范例:[cookbook](https://github.com/wcirq/trt-samples-for-hackathon-cn/blob/master/cookbook) - 初赛结束时将组织一次讲评,介绍优化该模型的技巧 初赛不提供开发机,参赛选手需要自备带有 GPU 的 Linux / Windows 11 (WSL2) 开发机,并在给定 docker 中用赛方提供的模型文件、开发工具完成模型在 TensorRT 中的构建、精度验证和性能测试,并提交最终代码。 - 初赛使用的镜像:`registry.cn-hangzhou.aliyuncs.com/trt2022/dev` 该镜像基于英伟达官方镜像扩充而来,包含 CUDA 11.6,TensorRT 8.2.2,请使用nvidia-docker拉取并运行它([示例命令](https://github.com/wcirq/trt-samples-for-hackathon-cn/blob/master/hackathon/setup.md)) - /workspace含有供选手使用的输入文件和测试文件,只读,请勿修改 - /workspace/encoder.onnx 和 /workspace/decoder.onnx 是在 pyTorch 中训练好的 WeNet 模型的 encoder、decoder 两部分。选手的目标就是把它们转成优化后的TensorRT engine序列化文件(.plan) - encoder 相对容易,请优先完成 - 对于decoder,为了简化起见,请将输入张量 hyps_pad_sos_eos 的末维固定为 64,即在 TensorRT 中构建 engine 时,将该张量形状固为 [-1,10,64],否则不能完成评测 - 有能力的选手可以在模型构建成功后尝试 FP16 模式,可取得更好的加速效果 - 代码验证与提交 - 请保证在 docker 里面能正常运行你的代码,并且无论编译时还是运行时,都不依赖网络下载任何代码或数据,即,你的代码需要是完整的、自包含的(如果确实需要在docker里面新增开发库或软件,请在交流群里反应给赛方) - 在代码根目录下,请创建`build.sh`,并保证运行该`build.sh`时,在根目录下生成encoder.plan和decoder.plan;如果有plugin,在根目录下生成所有 .so - 正式提交前,请验证代码已符合要求: - 把/target作为代码根目录,把干净代码拷贝过去 - 运行/workspace/buildFromWorkspace.sh,检查/target下面的.plan和.so是否正常生成 - 运行/workspace/testEncoderAndDecoder.py,检查TRT engine是否正常运行,并确认在标准输出得到评测表格 - 验证通过后提交代码: - 在[code.aliyun.com](https://github.com/wcirq/trt-samples-for-hackathon-cn/blob/master/https://code.aliyun.com)上创建代码仓库,设为私有,并把wili-Nvidia加为reporter - 注意:不要使用新版的`codeup.aliyun.com` - 借助git将自己的代码上传到代码仓库 - 把仓库的git地址填入天池提交页,正式提交 - 注意:首次提交代码时,请在天池页面点击“提交结果”->“修改地址”,在弹出的窗口中"git路径"中,请写入可用git clone命令顺利下载代码的URL,比如`https://code.aliyun.com/your_name/your_project.git` ### 复赛 复赛是开放赛题,各选手可自由选择公开的transformer模型,移植到TensorRT上加速,在公开托管平台上发布代码并编写总结报告。 总结报告需要包含如下内容(NV将发布报告模板): 1. 所选模型以及该模型在业界的应用情况 2. 开发及优化过程:阐述做了哪些优化方面的工作 3. 遇到的难点问题及解决方法。如果发现TensorRT bug,请列表说明。 4. 精度验证以及加速效果

近期下载者

相关文件


收藏者