Great video :)! But I have one rema

Great video :)! But I have one remark: At 8:45 you say that the 8 attention vectors get averaged, but in the original paper "Attention Is All You Need" on page 4, it says that the output from the different attention heads are being concatenated rather than being averaged, which I think would also make more sense. But maybe this is just a misunderstanding on my side.

0/5000

源语言: -

目标语言: -

结果 (简体中文) 1: [复制]

复制成功！

很棒的视频:)！但是我有一个评论：在 8:45 你说 8 个注意力向量被平均了，但是在第 4 页的原始论文“Attention Is All You Need”中，它说来自不同注意力头的输出被连接起来，而不是比被平均，我认为这也更有意义。但也许这只是我的一个误解。

正在翻译中..

结果 (简体中文) 2:[复制]

复制成功！

很棒的视频：）！“我想，你需要的是平均的注意力，而不是平均的注意力。”我说，在一页上，你需要的是平均的注意力，而不是平均的注意力。但也许这只是我的误解。

正在翻译中..

结果 (简体中文) 3:[复制]

复制成功！

很棒的视频:)！但我有一句话:在8:45，你说8个注意力向量被平均，但在第4页的原始论文“注意力是你所需要的”，它说来自不同注意力头的输出被连接而不是被平均，我认为这也更有意义。但也许这只是我这边的误会。

正在翻译中..

其它语言

本翻译工具支持: 世界语, 丹麦语, 乌克兰语, 乌兹别克语, 乌尔都语, 亚美尼亚语, 伊博语, 俄语, 保加利亚语, 信德语, 修纳语, 僧伽罗语, 克林贡语, 克罗地亚语, 冰岛语, 加利西亚语, 加泰罗尼亚语, 匈牙利语, 南非祖鲁语, 南非科萨语, 卡纳达语, 卢旺达语, 卢森堡语, 印地语, 印尼巽他语, 印尼爪哇语, 印尼语, 古吉拉特语, 吉尔吉斯语, 哈萨克语, 土库曼语, 土耳其语, 塔吉克语, 塞尔维亚语, 塞索托语, 夏威夷语, 奥利亚语, 威尔士语, 孟加拉语, 宿务语, 尼泊尔语, 巴斯克语, 布尔语(南非荷兰语), 希伯来语, 希腊语, 库尔德语, 弗里西语, 德语, 意大利语, 意第绪语, 拉丁语, 拉脱维亚语, 挪威语, 捷克语, 斯洛伐克语, 斯洛文尼亚语, 斯瓦希里语, 旁遮普语, 日语, 普什图语, 格鲁吉亚语, 毛利语, 法语, 波兰语, 波斯尼亚语, 波斯语, 泰卢固语, 泰米尔语, 泰语, 海地克里奥尔语, 爱尔兰语, 爱沙尼亚语, 瑞典语, 白俄罗斯语, 科西嘉语, 立陶宛语, 简体中文, 索马里语, 繁体中文, 约鲁巴语, 维吾尔语, 缅甸语, 罗马尼亚语, 老挝语, 自动识别, 芬兰语, 苏格兰盖尔语, 苗语, 英语, 荷兰语, 菲律宾语, 萨摩亚语, 葡萄牙语, 蒙古语, 西班牙语, 豪萨语, 越南语, 阿塞拜疆语, 阿姆哈拉语, 阿尔巴尼亚语, 阿拉伯语, 鞑靼语, 韩语, 马其顿语, 马尔加什语, 马拉地语, 马拉雅拉姆语, 马来语, 马耳他语, 高棉语, 齐切瓦语, 等语言的翻译.