-
Notifications
You must be signed in to change notification settings - Fork 73
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[WeeklyReports] 2023.11.22~2023.12.05 周报汇总 #102
Comments
姓名卢畅 实习项目静态图半自动并行执行架构升级 本周工作本周对可视化工具进行收尾工作并着手进行静态图性能优化的准备工作,主要内容如下: 1. Llama2适配工作收尾 相关PR:
2. 修复可视化工具中的逻辑bug 相关PR: 3. 学习分布式论文 学习了一些分布式相关的论文,主要包括: 1)Efficient large-scale language model training on gpu clusters using megatron-lm 2)Megatron-LM- Training Multi-Billion Parameter Language Models Using Model Parallelism 3)Zero: memory optimizations toward training trillion parameter models 4. 将通信算子注册到PHI 相关PR: 5. 更新可视化工具使用文档 相关PR: 6. 着手准备静态图性能优化工作 在多卡环境下跑通LLama2,由于显存受限因此先hack一下代码,在实际run之前直接exit退出,不实际跑模型就不会有临时变量的显存占用。通过调整num_hidden_layers,调一个在这个hack的情况下刚好能跑起来的PP2MP2的配置。 下周工作1、分析LLama2模型run之前的耗时,挖掘程序的耗时热点,看哪部分耗费时间比较多需要专门优化 详细周报链接: |
姓名刘宇博 本周工作api 单测补充与完善
下周工作
详细周报链接 |
姓名王龙志 本周工作
下周工作
详细周报链接: |
姓名宋铠玉 本周工作动转静验证收尾 下周工作完成RAM,RAM++前向对齐且完成验证 详细周报链接: |
姓名詹荣瑞 本周工作
相关PR:
下周工作
详细周报链接: |
姓名朱新明 实习项目算子规范和ProgramTranslator功能优化 本周工作1.将算子单测修复issue发布社区2. 已修复下列单测:test_decayed_adagrad_op 3. 正在修复下列单测test_fake_quantize_op 下周工作1.根据推全名单继续修复Op单测2.修复分布式算子c_softmax_with_cross_entropy相关单测3.统计需要修复的分布式算子单测并区分修复难度4.修复PIR OpTest: not found问题详细周报链接 |
姓名冉崇治 本周工作为PaddleOCR套件接入自动化压缩功能,主要完成PPOCRV4检测模型的压缩与推理,并尝试解决其中的报错。 下周工作完善PaddleClas中剩下两个模型的ACT流程,提交对应的PR 详细周报链接: |
姓名SecretXV 本周工作
下周工作
详细周报链接: |
姓名徐苏勇 本周工作
下周工作
详细周报链接: |
姓名张玉涛 本周工作
下周工作
详细周报链接: |
姓名吴晨灿 本周工作
下周工作
详细周报链接: |
姓名程延福 本周工作
相关PR和分享资料: 下周工作
详细周报链接: |
姓名何咏哲 本周工作
下周工作
详细周报链接: |
姓名杨国浩 本周工作
下周工作
详细周报链接: |
姓名张钰钦 本周工作
下周工作
详细周报链接: |
姓名杨新宇 实习项目CPU 融合算子 / GPU 算子融合 pass 本周工作
下周工作
详细周报链接 |
姓名侯悦欣 本周工作
下周工作
详细周报链接: |
[WeeklyReports] 2023.11.22~2023.12.05 周报汇总
请各位学员在本 issue 下以 comment 的形式填写周报摘要,ddl 本周四晚,格式示例如下:
完成情况:
项目一:算子规范和 ProgramTranslator 功能优化
项目二:新 IR Pass 建设和依赖的核心组件完善
项目三:新 IR API + 自动微分推全和核心组件完善
项目四:组合机制前反向架构统一
项目五:算子支持复数计算专项
项目六:量化算子集成
项目七:开源模型加速复现
项目八:CPU 融合算子 / GPU 算子融合 pass
项目九:动态图半自动并行架构研发[ ] @HermitSun(@LiYuRio)项目十:静态图半自动并行执行架构升级
项目十一:分布式能力矩阵建设
项目十二:全自动并行架构升级
项目十三:科学计算领域拓展专项
项目十四:Clas 套件全流程建设
项目十六:Nougat 复现及优化
项目十七:NLP 大模型复现
- [ ] @rampage0303(@w5688414)项目十八:套件压缩能力建设
项目十九:PIR 适配 AI 编译器 CINN
项目二十:PIR 子图验证+核心机制完善
项目二十一:PIR 核心组件建设与机制完善
项目二十二:PIR 动转静组件建设与单测验证推全
项目二十三:模型迁移工具建设
The text was updated successfully, but these errors were encountered: