日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界專題 正文
發(fā)私信給張馳
發(fā)送

0

Google圖像字幕技術:自動描述照片內(nèi)容

本文作者: 張馳 2014-11-19 08:28
導語:Google在圖像搜索領域又進了一步。據(jù)外媒報道,Google已經(jīng)公布了一個新的字幕系統(tǒng),它可以識別照片上的內(nèi)容,并自動對它以自然語言進行描述并標記。也許不久后,你給Google一張圖,它就能給你講個故事。

Google圖像字幕技術:自動描述照片內(nèi)容

Google在圖像識別領域又進了一步。據(jù)外媒報道,Google已經(jīng)公布了一個新的字幕系統(tǒng),它可以識別照片上的內(nèi)容,并自動對它以自然語言進行描述并標記。

目前已經(jīng)有智能系統(tǒng)可以自動標記圖像,識別出其中的某個物體,但Google的這項技術可以描述的更全面,比如它的描述可能是“兩只狗在草地上玩”或“帶粉紅色帽子的小女孩在吹泡泡”。

這一軟件系統(tǒng)是Google使用大規(guī)模模擬神經(jīng)元處理數(shù)據(jù)的最新研究成果。沒人對識別場景的規(guī)則進行編程,這一神經(jīng)網(wǎng)絡是自己“學”會處理數(shù)據(jù)的。

新系統(tǒng)由兩個神經(jīng)網(wǎng)絡合成,一個能處理圖像,對其內(nèi)容進行數(shù)學化表示,供識別物體;另一網(wǎng)絡能自動生產(chǎn)完整文字,是翻譯軟件的一部分。兩者合成后,第一個會“觀看”圖片,向第二個網(wǎng)絡反饋所看到的內(nèi)容,然后后者會將信息加工為自然語言。

經(jīng)過大量圖片數(shù)據(jù)測試后的結果顯示,這一系統(tǒng)得到60分(滿分100),而人類通常的結果是70分,可以說已經(jīng)做得相當不錯了。這項技術所作的描述仍然不如人類那樣完整,但已經(jīng)為人工智能和機器學習未來帶來光明。

想像一下,這種系統(tǒng)的一個用途是幫助視障人士了解照片,說不定,提供幾張圖片,Google也能講個睡前故事。

via mit

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

分享:
相關文章

專業(yè)寫瞎

不受意識控制地報道那些讓人感動的產(chǎn)品技術和事件......zhchsimons@gmail.com ;微信:nksimons;《腦洞》公眾號:hackmind
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說