Automatically generating the descriptions of an image, i.e., image cap的简体中文翻译

Automatically generating the descri

Automatically generating the descriptions of an image, i.e., image captioning, is an important and fundamental topic in artificial intelligence, which bridges the gap between computer vision and natural language processing. Based on the successful deep learning models, especially the CNN model and Long Short Term Memories (LSTMs) with attention mechanism, we propose a hierarchical attention model by utilizing both of the global CNN features and the local object features for more effective feature representation and reasoning in image captioning. The generative adversarial network (GAN), together with a reinforcement learning (RL) algorithm, is applied to solve the exposure bias problem in RNN-based supervised training for language problems. In addition, through the automatic measurement of the consistency between the generated caption and the image content by the discriminator in the GAN framework and RL optimization, we make the finally generated sentences more accurate and natural. Comprehensive experiments show the improved performance of the hierarchical attention mechanism and the effectiveness of our RL-based optimization method. Our model achieves state-of-the-art results on several important metrics in the MSCOCO dataset, using only greedy inference.
0/5000
源语言: -
目标语言: -
结果 (简体中文) 1: [复制]
复制成功!
自动生成图像的描述(即图像标题)是人工智能的重要且基本的主题,它弥合了计算机视觉和自然语言处理之间的鸿沟。基于成功的深度学习模型,特别是具有注意机制的CNN模型和长期短期记忆(LSTM),我们通过利用全局CNN特征和局部对象特征来提出分层注意模型,以更有效地进行特征表示和推理在图像字幕中。生成对抗网络(GAN)与强化学习(RL)算法一起,用于解决基于RNN的语言问题监督训练中的暴露偏差问题。此外,通过在GAN框架中使用判别器自动测量生成的字幕和图像内容之间的一致性以及RL优化,我们使最终生成的句子更加准确和自然。综合实验表明,分层注意力机制的性能得到了改善,并且我们基于RL的优化方法的有效性。我们的模型仅使用贪婪推断就可以在MSCOCO数据集中的几个重要指标上获得最新的结果。
正在翻译中..
结果 (简体中文) 2:[复制]
复制成功!
自动生成图像的描述,即图像标题,是人工智能中一个重要和基本的主题,它弥合了计算机视觉与自然语言处理之间的差距。基于成功的深度学习模型,特别是具有关注机制的 CNN 模型和长期短期记忆 (LSTM),我们利用全球 CNN 功能和本地对象功能,在图像标题中更有效地进行功能表示和推理,从而提出了一个分层关注模型。生成对抗网络 (GAN) 与强化学习 (RL) 算法一起用于解决基于 RNN 的语言问题监督培训中的暴露偏差问题。此外,通过 GAN 框架中的鉴别器对生成的字幕与图像内容之间的一致性进行自动测量和 RL 优化,使最终生成的句子更加准确和自然。综合实验表明,分层注意机制性能的提高,以及基于RL的优化方法的有效性。我们的模型仅使用贪婪的推论,在 MSCOCO 数据集中的几个重要指标上取得了最新成果。
正在翻译中..
结果 (简体中文) 3:[复制]
复制成功!
图像的描述(即图像字幕)的自动生成是人工智能中的一个重要而基础的课题,它弥补了计算机视觉与自然语言处理之间的差距。在成功的深度学习模型,特别是CNN模型和带有注意机制的长短期记忆模型的基础上,利用全局CNN特征和局部对象特征,提出了一种分层注意模型,以更有效地表示和推理图像字幕。针对基于RNN的语言问题监督训练中暴露偏差问题,采用生成对抗网络(GAN)和强化学习(RL)算法。此外,通过在GAN框架下通过判别器自动测量生成的字幕与图像内容的一致性,并进行RL优化,使最终生成的句子更加准确自然。综合实验表明,该方法提高了层次注意机制的性能,并证明了基于RL的优化方法的有效性。该模型仅利用贪婪推理,在MSCOCO数据集中的几个重要指标上取得了最新的结果。<br>
正在翻译中..
 
其它语言
本翻译工具支持: 世界语, 丹麦语, 乌克兰语, 乌兹别克语, 乌尔都语, 亚美尼亚语, 伊博语, 俄语, 保加利亚语, 信德语, 修纳语, 僧伽罗语, 克林贡语, 克罗地亚语, 冰岛语, 加利西亚语, 加泰罗尼亚语, 匈牙利语, 南非祖鲁语, 南非科萨语, 卡纳达语, 卢旺达语, 卢森堡语, 印地语, 印尼巽他语, 印尼爪哇语, 印尼语, 古吉拉特语, 吉尔吉斯语, 哈萨克语, 土库曼语, 土耳其语, 塔吉克语, 塞尔维亚语, 塞索托语, 夏威夷语, 奥利亚语, 威尔士语, 孟加拉语, 宿务语, 尼泊尔语, 巴斯克语, 布尔语(南非荷兰语), 希伯来语, 希腊语, 库尔德语, 弗里西语, 德语, 意大利语, 意第绪语, 拉丁语, 拉脱维亚语, 挪威语, 捷克语, 斯洛伐克语, 斯洛文尼亚语, 斯瓦希里语, 旁遮普语, 日语, 普什图语, 格鲁吉亚语, 毛利语, 法语, 波兰语, 波斯尼亚语, 波斯语, 泰卢固语, 泰米尔语, 泰语, 海地克里奥尔语, 爱尔兰语, 爱沙尼亚语, 瑞典语, 白俄罗斯语, 科西嘉语, 立陶宛语, 简体中文, 索马里语, 繁体中文, 约鲁巴语, 维吾尔语, 缅甸语, 罗马尼亚语, 老挝语, 自动识别, 芬兰语, 苏格兰盖尔语, 苗语, 英语, 荷兰语, 菲律宾语, 萨摩亚语, 葡萄牙语, 蒙古语, 西班牙语, 豪萨语, 越南语, 阿塞拜疆语, 阿姆哈拉语, 阿尔巴尼亚语, 阿拉伯语, 鞑靼语, 韩语, 马其顿语, 马尔加什语, 马拉地语, 马拉雅拉姆语, 马来语, 马耳他语, 高棉语, 齐切瓦语, 等语言的翻译.

Copyright ©2024 I Love Translation. All reserved.

E-mail: