Guillaume Lample sur Twitter : "Last year, we showed that you can outperform a 24-layer transformer in language modeling with just...
Tags:
Au sujet de ce document
Infos sur le fichier
Documents with similar tags (experimental)
2022-03-30 A propos
2019-07-13 A propos