Aidan Gomez
CEO & medgrundare, Cohere
Forskningsartikeln som uppfann Transformer-arkitekturen — grunden för alla moderna stora språkmodeller inklusive GPT, Claude, Gemini och LLaMA. Artikeln föreslog en ny nätverksarkitektur baserad enbart på attention-mekanismer, utan rekurrens eller konvolutioner, och visade överlägsna resultat på maskinöversättning. Denna artikel har förändrat hela AI-fältet.
Published by Google Brain team
Foundational for GPT architecture
Foundational for Claude architecture
Transformer architecture used by Mistral models
Transformer architecture used by DeepSeek models
Transformer architecture used by Llama models
Co-author Aidan Gomez founded Cohere
Co-author of the paper