DeepHealth

jiarui_li/DeepHealth

Fork 0

Commit Graph

Author	SHA1	Message	Date
Jiarui Li	a832a45c62	config: Tune hyperparameters for multi-GPU training Increase model size (n_embd, n_layer, n_head) for the multi-GPU configuration. Explicitly set AdamW betas to (0.9, 0.99).	2025-10-17 15:37:42 +08:00
Jiarui Li	d760c45baf	feat: Add multi-GPU training and improve config/ignore Add train_multigpu.py for distributed data parallel training. Update train.py to save the training configuration to a JSON file. Generalize .gitignore to exclude all *.pt checkpoint files. Delete obsolete train_dpp.py file.	2025-10-17 14:09:34 +08:00

Author

SHA1

Message

Date

Jiarui Li

a832a45c62

config: Tune hyperparameters for multi-GPU training

Increase model size (n_embd, n_layer, n_head) for the multi-GPU configuration.

Explicitly set AdamW betas to (0.9, 0.99).

2025-10-17 15:37:42 +08:00

Jiarui Li

d760c45baf

feat: Add multi-GPU training and improve config/ignore

Add train_multigpu.py for distributed data parallel training.

Update train.py to save the training configuration to a JSON file.

Generalize .gitignore to exclude all *.pt checkpoint files.

Delete obsolete train_dpp.py file.

2025-10-17 14:09:34 +08:00

2 Commits