谷歌研究院新研究项目曝光：用文字自动说明复杂图像-深圳网站建设-慧通网络-专注财经直播间系统搭建,高流量网站建设

十年品牌建站公司

开启企业移动互联网营销新时代

18175863383

275194004

程序分类

经典案例

房产中介

人才招聘程序

婚恋交友

商城程序

内容分类

最新动态

谷歌研究院新研究项目曝光：用文字自动说明复杂图像

来源：本站类别：最新动态阅读： 2688 时间:2014-11-23

根据谷歌研究院的一份最新文件，该公司现已开发了一套具有“自学”能力的新系统，可以极为精确地描述像下面这样的图像。

图像识别技术在过去短短几年内取得了很大进步，进步速度可能超过了其他任何一个领域，而谷歌已经让最终用户体验到了这种进步。如果你想了解具体取得了多大的进步，只要在Google Photos上面搜索你自己的照片即可。但是，识别物体(以及基本的场景)却还只是迈出了第一步。

今年9月份，谷歌对外演示了它的新技术，这项技术利用当前深受欢迎的深度学习方法，不仅可以识别单一物体的图像，而且还能对一张照片中的不同物体进行分类(例如，果篮中不同类型的水果)。

一旦你能做到这一点，你还可以用自然语言对图像做出完整描述，这正是谷歌当前正在做的事情。根据谷歌研究院(Google Research)的一份最新文件，该公司现已开发了一套具有“自学”能力的新系统，可以极为精确地描述像下面这样的图像。

正如谷歌研究人员所指出的，解决这一问题的常见方法是，首先运用计算机视觉算法进行计算，然后用自然语言处理方法来进行描述。这听上去合情合理，但谷歌研究人员却认为，更好的解决办法是，“将最新的计算机视觉和语言模式整合到一个联合训练的系统中，然后提取照片，直接生成人类读得懂的单词序列进行描述。”谷歌表示，在将两个递归神经网络整合以后，这种方法在机器翻译中效果非常好。这种自动描述系统(captioning system)的工作机制略有不同，但基本上都采用相同的方法。

这并不意味着谷歌的方法是完美的。根据数据集的不同，谷歌电脑字幕系统在BLEU测试(这种测试手段往往被用于对机器翻译质量和人类翻译质量进行比较)中的得分一般介于27分到59分之间。人类的得分往往在69分左右。尽管如此，相比其他得分不超过25分的方法，谷歌的自动描述系统仍然向前迈出了一大步。

短视频平台对于轻松搞笑内容受众都会更高 2022-07-31

工信部数据，上半年，我国软件业务收入46266亿元,手机产量6.09亿台，同比下降1.7% 2022-07-25

揭秘MCN，新人做自媒体必看，什么是MCN呢?如何正确看待这一新生机构? 2022-07-23

腾讯云毫无原因封锁思维导图在线工具网站 2022-07-21

百度打击盗版网文站外，微信里的盗版网文也是非常泛滥 2022-07-16