rasbt
|
861c296312
add imports and version on top
|
1 年間 前 |
joel-foo
|
dbb5e65a29
Remove duplicate cells
|
1 年間 前 |
rasbt
|
e0df4df433
add dropout for embedding layers
|
1 年間 前 |
rasbt
|
267e33cfaf
remove redundant import
|
1 年間 前 |
Rayed Bin Wahed
|
2fb035435e
Update ch04.ipynb
|
1 年間 前 |
rasbt
|
f6266c3756
improve code comments
|
1 年間 前 |
rasbt
|
3f186ab072
use .shape instead of .size() for consistency
|
1 年間 前 |
rasbt
|
f057156181
use smaller number of tokens to emphasize next token prediction goal
|
1 年間 前 |
rasbt
|
557ddfc684
make a new example for shortcut connections
|
1 年間 前 |
rasbt
|
250e6306e2
use attn_scores from sec 3.4 instead of 3.3
|
1 年間 前 |
rasbt
|
231a854ae7
use less ambiguous var name
|
1 年間 前 |
rasbt
|
fe332006de
ch4 exercise solutions
|
1 年間 前 |
rasbt
|
352b83d225
make softmax explicit
|
1 年間 前 |
rasbt
|
7d86023fc4
make softmax explicit
|
1 年間 前 |
rasbt
|
5840b4b5f8
update name of last section
|
1 年間 前 |
rasbt
|
baa8617921
variable name fix
|
1 年間 前 |
rasbt
|
496b52f842
format the other GPT architecture sizes
|
1 年間 前 |
rasbt
|
10aa2d099d
add print statements for illustration purposes
|
1 年間 前 |
rasbt
|
5d1d8ce511
add shape information for clarity
|
1 年間 前 |
rasbt
|
3a5fc79b38
add and update readme files
|
1 年間 前 |
rasbt
|
2b38b63a7a
move overview up
|
1 年間 前 |
rasbt
|
bb50de7210
adjust figure width
|
1 年間 前 |
rasbt
|
1653f6953a
adjust figure width
|
1 年間 前 |
rasbt
|
ec312e581b
add chapter 4 code
|
1 年間 前 |
rasbt
|
d261abce4c
add forward pass
|
1 年間 前 |
rasbt
|
fcb13fd636
add code backbone ch04
|
1 年間 前 |