AutoTuner for Megatron + TransformerEngine

Scenarios

This is a practical auto-tuner on Megatron targeted at post-training frameworks like verl project.

Our performance tuning target is MFU in MCore training process on both forward-only models and forward-backward-update models, which leads to high performance on training side in RLHF.

Speaking of tuning dimensions, currently include:


Dense Layer	TP	CP	DP	PP	VPP
MoE Parallel Folding	ETP	EP	EDP
Pipeline layout
Seqlen	max_token_len
Recompute	recompute_granularity	recompute_method	recompute_num_layers	recompute_modules

Target shapes:

thd (mainly)
bshd

Docs

Doc in Lark

Go to docs directory

Name		Name	Last commit message	Last commit date
Latest commit History 46 Commits
.github		.github
.secrets		.secrets
.vscode		.vscode
AutoTuner		AutoTuner
Megatron-LM @ 93aa335		Megatron-LM @ 93aa335
TransformerEngine @ f378eaf		TransformerEngine @ f378eaf
docker		docker
docs		docs
install/packages		install/packages
mbridge @ da21f04		mbridge @ da21f04
patches		patches
runtime/megatron/e2e/gpt		runtime/megatron/e2e/gpt
scripts		scripts
tests		tests
verl @ fd8ae66		verl @ fd8ae66
.gitignore		.gitignore
.gitmodules		.gitmodules
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
VERSION		VERSION
pyproject.toml		pyproject.toml
requirements_dev.txt		requirements_dev.txt
requirements_verl.txt		requirements_verl.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

AutoTuner for Megatron + TransformerEngine

Scenarios

Docs

About

Uh oh!

Releases

Packages

Contributors 5

Uh oh!

Languages

License

ETOgaosion/Megatron-LM-AutoTuner

Folders and files

Latest commit

History

Repository files navigation

AutoTuner for Megatron + TransformerEngine

Scenarios

Docs

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 5

Uh oh!

Languages

Packages