sol_87yf6cwp/LLMs-from-scratch

total training iters may equal to warmup_iters (#301)

total_training_iters=20, warmup_iters=20= len(train_loader) 4 multiply n_epochs 5, then ZeroDivisionError occurred.
```shell
Traceback (most recent call last):                                                                                                                                                                                                                                                                                              
  File "LLMs-from-scratch/ch05/05_bonus_hparam_tuning/hparam_search.py", line 191, in <module>                                             
    train_loss, val_loss = train_model(                                                                                                                                                                                                                                                                                         
                           ^^^^^^^^^^^^                                                                                                                         
  File "/mnt/raid1/docker/ai/LLMs-from-scratch/ch05/05_bonus_hparam_tuning/hparam_search.py", line 90, in train_model                                                                                                                                                                                                           
    progress = (global_step - warmup_iters) / (total_training_iters - warmup_iters)                                                                             
               ~~~~~~~~~~~~~~~~~~~~~~~~~~~^~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~                                                                                                                                                                                                                                             
ZeroDivisionError: division by zero 
```

TITC 1 год назад

Родитель

70e5714556

Сommit

d16527ddf2

1 измененных файлов с 1 добавлено и 1 удалено

Разделённый вид Показать статистику Diff

						
							+ 1
							
							- 1
						
ch05/05_bonus_hparam_tuning/hparam_search.py
							 
								Просмотреть файл
							
				@@ -82,7 +82,7 @@ def train_model(model, train_loader, val_loader, optimizer, device,
			
				             global_step += 1
			
				             # Warmup: adjust learning rate linearly
			
				-            if global_step < warmup_iters:
			
				+            if global_step <= warmup_iters:
			
				                 lr = initial_lr + global_step * lr_increment
			
				             # Cosine annealing phase
			
				             else:

total training iters may equal to warmup_iters (#301)

+ 1 - 1 ch05/05_bonus_hparam_tuning/hparam_search.py Просмотреть файл

+ 1 - 1
ch05/05_bonus_hparam_tuning/hparam_search.py
Просмотреть файл