Les ingénieurs logiciels développent un moyen d’exécuter des modèles de langage d’IA sans multiplication matricielle
Présentation du LM sans MatMul. La séquence d’opérations est affichée pour l’auto-attention vanille (en haut à gauche), le mélangeur de