🪴 Quartz 4.0

Search

❯

Transformer

Dec 01, 2023, 1 min read

RNNなしCNNなしで注意機構だけ構成されたTransformerが翻訳タスクで良い成績を出すという報告。

We propose a new simple network architecture, the Transformer, based solely on attention mechanisms, dispensing with recurrence and convolutions entirely.

Attention Is All You Need 06
2017年
https://arxiv.org/pdf/1706.03762.pdf

解説 2017-12 http://deeplearning.hatenablog.com/entry/transformer

注意機構
- 注意機構は辞書オブジェクト
- 加法注意と内積注意
- ソースターゲット注意と自己注意
- 縮小付き内積注意 (Scaled Dot-Product Attention)

Graph View

Backlinks

BERT
BERTとTransformer
CNNと自己注意
GPT
Hugging Face
Positional Encoding
clip-ViT-L-14
マルチヘッドアテンション
性能向上が頭打ちになるか、際限なく性能が向上するか
機械学習による書籍PDFからの本文抽出
自己注意

Created with Quartz v4.1.1, © 2023

GitHub
Discord Community