本文提出一种多流卷积神经网络架构,包含不同的网络结构:引入注意力机制的二维卷积神经网络和基于残差结构的三维卷积神经网络,网络架构如图4-2所的冰岛语翻译

本文提出一种多流卷积神经网络架构,包含不同的网络结构:引入注意力机制的

本文提出一种多流卷积神经网络架构,包含不同的网络结构:引入注意力机制的二维卷积神经网络和基于残差结构的三维卷积神经网络,网络架构如图4-2所示。现有的3D卷积神级网络在时间上做卷积时,采用3D卷积核以滑动窗形式在连续帧图像立方块进行卷积。但是由于行人姿态、动作、位置发生改变,在相同位置进行卷积不合适,并且3D卷积核在对时序上做卷积时,一次只能提取连续三帧图像的时间特征,不能很好的获取运动信息。因此,为了增加运动信息,丰富运动特征,增强单一特征表示的鲁棒性,提出一种基于3D卷积神经网络特征融合的行为识别方法,即在基于VGG16网络模型的基础上,送入预先获取到的光流图像进行学习,然后获取时域特征,最后将该时域特征与3D卷积神经网络提取的特征进行特征融合,采用SVM分类器进行行为分类 多流卷积神经网络分为5个网络分支,其中3个网络为二维卷积神经网络,即引入注意力机制的二维卷积神经网络,是以Inception-V3作为基础网络,在网络结构中嵌入注意力结构,以便让网络自主学习关键区域特征,减少噪音干扰。同时,该网络包含三种模态的数据输入,分别是单帧RGB数据、单帧梯度图数据和堆叠的稠密光流图,最大限度地获取人体行为识别中的时空信息。多流卷积神经网络的另外两个分支是三维卷积神经网络,基于残差结构的三维卷积神经网络,在该网络中,通过添加残差结构加深网络的同时避免性能下降、梯度消失的问题,并使用全局平均池化代替全连接层,减少模型参数量,提高模型训练和推断的速度。三维卷积神经网络的数据输入是连续多帧的RGB图和梯度图数据
0/5000
源语言: -
目标语言: -
结果 (冰岛语) 1: [复制]
复制成功!
Þessi grein leggur til fjölstrauman tauga net arkitektúr, mismunandi net arkitektúr samanstanda af: að kynna athygli vélar <br>víddar tauga net byggir kerfi og þrívíddar uppbyggingu leifar taugakerfi net, net arkitektúr sýnd á mynd 4-2 <br>af sýninguna. Þegar núverandi þrívíddarnet á guðsstigi framkvæmir hrun í tíma er þrívíddarkjarni þrívíddar notaður til að framkvæma krampa í samfelldum rammamyndateningum í formi renniglugga. Hins vegar, vegna breytinga á líkamsstöðu, gangi og stöðu gangandi, er krampa í sömu stöðu ekki viðeigandi og þrívíddarkjarni í þrívídd getur aðeins dregið út tímareiginleika þriggja ramma mynda í röð í einu þegar krampa á tímasetningunni, sem er ekki mjög gott. Fáðu upplýsingar um íþróttir. Þess vegna, í því skyni að auka hreyfingu upplýsingar, auðga hreyfing lögun, og auka áreiðanleika einni lögun framsetning, hegðun viðurkenningu aðferð sem byggist á 3D convolutional tauga net lögun samruna er lagt til, það er, miðað við VGG16 net líkan <br>, það er sent til fyrirfram keyptra til að læra sjónflæðið og fá <br>tímalénseinkenni, tímalénseinkenni lokamynda 3D rúmmáls taugakerfisins eru með útdráttareiginleikasamruna með því að nota SVM flokkara til að flokka hegðun <br>margstraums taugakerfis skipt í fimm netgreinar, þar af þrjú tvívítt taugakerfi, <br>það er að segja tvívítt taugakerfi sem innleiða athyglikerfi. Inception-V3 er notað sem grunnnet og athyglisuppbyggingin er innbyggð í net uppbygging til að gera netið sjálfstætt Lærðu einkenni lykilsvæða til að draga úr truflunum á hávaða. Á sama tíma inniheldur netkerfið þrjú gagnatengi, nefnilega RGB gögn með einum ramma, stigs kortagagna með einum ramma og staflað þétt sjónflæðiskort, til að hámarka öflun rýmisupplýsinga við viðurkenningu mannlegrar hegðunar. Hinar tvær greinar fjölstraums taugakerfisins eru þrívíddar tauganetið sem byggist á leifargerð þrívíddar taugakerfisins. Í þessu neti er leifargerð bætt við til að dýpka netið en forðastu niðurbrot á frammistöðu og hverfa halla. Vandamál og notaðu alþjóðlegt meðaltalssamlag til að skipta um fullkomlega tengda lagið, draga úr magni líkanstika og bæta hraða líkamsþjálfunar og ályktunar. Gagnainntak þrívíða taugakerfisins er samfellt fjölramma RGB kort og hallandi kortagögn
正在翻译中..
结果 (冰岛语) 2:[复制]
复制成功!
Í þessu blaði er lögð til fjölflæðisspólutúr tauganetsarkitektúr, sem inniheldur mismunandi netuppbyggingu: kynningu á athyglisvélum<br>tvívítt spóluð tauganet og þrívítt leifar tauganeta sem byggjast á leifar mannvirkja, netarkitektúr eins og sést á mynd 4-2<br>Sýnt. Þegar núverandi 3D endurramma-stigs net gerir spólun í tíma, þrívíddarspólukjarnann er notaður til að hjóla í rúmblokk samfellda rammamyndarinnar í formi renniglugga. Hins vegar, vegna breytinga á viðhorfi gangandi vegfarenda, aðgerð og stöðu, er ekki við hæfi að endurramma í sömu stöðu, og þegar 3D cournt kjarninn gerir co vöruna á tímasetningu, er aðeins hægt að draga út tímaeiginleika samfelldrar þriggja ramma myndar í einu og ekki er hægt að fá upplýsingar um hreyfingu mjög vel. Þess vegna, í því skyni að auka upplýsingar um hreyfingu, auðga hreyfieiginleika og auka öflugni einn lögun, hegðun viðurkenningu aðferð byggt á samruna 3D converged tauganet einkenni er lagt til, þ.m.t. á grundvelli VGG16 netlíkansins<br>, fæða fyrirfram keypt sjónflæði mynd til að læra, þá eignast tíma lén lögun, og að lokum tíma lén lögun með 3D bindi<br>Einkennin sem safnað er af uppsöfnuðu tauganeti eru samsett og hegðunarflokkunin er framkvæmd af SVM flokkunartæki<br> Fjölflæðisspólutauganetum er skipt í 5 netgreinar, þar af eru 3 net tvívítt covon tauganet.<br>Tvívítt spólunet taugakerfisins, sem kynnir athyglisbúnaðinn, byggir á Inception-V3, sem fellir athyglisuppbygginguna í netuppbyggingunni til þess að leyfa netinu að læra helstu svæðisbundin einkenni sjálfstætt og draga úr truflun á hávaða. Á sama tíma inniheldur netið þrjár stillingar gagnainntaks, þ.e. einramma RGB gögn, einramma blöndunargögn og staflað þétt ljósflæðiskort, til að hámarka mannlega hegðun viðurkenningu á upplýsingum um geimtíma. Hinar tvær greinar fjölflæðisflæðis tauganetsins eru þrívítt afturflæði tauganetsins, sem byggir á afgangsuppbyggingunni, þar sem netið dýpkar netið með því að bæta við afgangsuppbyggingu til að forðast vandann við afköst hnignunar og blöndunar hvarfs, og notar alþjóðlegt meðaltalssöfnun í stað fulls tengilags, dregur úr fjölda líkana Gagnainntak tauganetsins þrívíddarspólu er RGB og gögn um blöndun fyrir samfellda fjölramma
正在翻译中..
结果 (冰岛语) 3:[复制]
复制成功!
正在翻译中..
 
其它语言
本翻译工具支持: 世界语, 丹麦语, 乌克兰语, 乌兹别克语, 乌尔都语, 亚美尼亚语, 伊博语, 俄语, 保加利亚语, 信德语, 修纳语, 僧伽罗语, 克林贡语, 克罗地亚语, 冰岛语, 加利西亚语, 加泰罗尼亚语, 匈牙利语, 南非祖鲁语, 南非科萨语, 卡纳达语, 卢旺达语, 卢森堡语, 印地语, 印尼巽他语, 印尼爪哇语, 印尼语, 古吉拉特语, 吉尔吉斯语, 哈萨克语, 土库曼语, 土耳其语, 塔吉克语, 塞尔维亚语, 塞索托语, 夏威夷语, 奥利亚语, 威尔士语, 孟加拉语, 宿务语, 尼泊尔语, 巴斯克语, 布尔语(南非荷兰语), 希伯来语, 希腊语, 库尔德语, 弗里西语, 德语, 意大利语, 意第绪语, 拉丁语, 拉脱维亚语, 挪威语, 捷克语, 斯洛伐克语, 斯洛文尼亚语, 斯瓦希里语, 旁遮普语, 日语, 普什图语, 格鲁吉亚语, 毛利语, 法语, 波兰语, 波斯尼亚语, 波斯语, 泰卢固语, 泰米尔语, 泰语, 海地克里奥尔语, 爱尔兰语, 爱沙尼亚语, 瑞典语, 白俄罗斯语, 科西嘉语, 立陶宛语, 简体中文, 索马里语, 繁体中文, 约鲁巴语, 维吾尔语, 缅甸语, 罗马尼亚语, 老挝语, 自动识别, 芬兰语, 苏格兰盖尔语, 苗语, 英语, 荷兰语, 菲律宾语, 萨摩亚语, 葡萄牙语, 蒙古语, 西班牙语, 豪萨语, 越南语, 阿塞拜疆语, 阿姆哈拉语, 阿尔巴尼亚语, 阿拉伯语, 鞑靼语, 韩语, 马其顿语, 马尔加什语, 马拉地语, 马拉雅拉姆语, 马来语, 马耳他语, 高棉语, 齐切瓦语, 等语言的翻译.

Copyright ©2024 I Love Translation. All reserved.

E-mail: