Chris Olah sur Twitter : "I'm excited to *finally* be making progress on understanding the first MLP layer in large transformer LMs. I've tried really hard and prior to SoLU had little success." / Twitter
Tags:
Σχετικά με το έγγραφο αυτό
Πληροφορία αρχείου
Documents with similar tags (experimental)