2014/11/19 0:17:281963 閱讀
把圖片放在網(wǎng)絡(luò)上可能有很多潛在的用途,無論是出于個(gè)人目的或者為了更大的利益群體。但是對(duì)圖片進(jìn)行標(biāo)注,讓圖片搜索更加容易是一件困難的事情,特別是如果你有成千上萬的照片或數(shù)百萬照片情況下。
考慮到這一點(diǎn),谷歌已經(jīng)透露了一個(gè)新的字幕系統(tǒng),該系統(tǒng)可識(shí)別照片的內(nèi)容,并自動(dòng)進(jìn)行標(biāo)記以自然語言進(jìn)行描述。雖然目前已經(jīng)有智能計(jì)算機(jī)視覺軟件,可以自動(dòng)標(biāo)記圖像,但是現(xiàn)在谷歌這款技術(shù)可以實(shí)現(xiàn)全面的描述。這可能是“兩只狗在草地上玩”或“帶粉紅色帽子的小女孩正在吹泡泡”。
從這款技術(shù)目前的這些快照看到,它仍然不能完全準(zhǔn)確的進(jìn)行描述,但事實(shí)證明,目前這款技術(shù)在照片內(nèi)容描述上有一定程度的準(zhǔn)確性,非常令人興奮。雖然它仍然是一個(gè)早期的研究項(xiàng)目,但是已經(jīng)為人工智能和機(jī)器學(xué)習(xí)未來帶來光明。
這種系統(tǒng)最終可以幫助視障人士了解照片,在世界上移動(dòng)連接速度很慢的部分地區(qū)提供替代文本,使用戶更容易地在谷歌搜索圖像。
微信小程序
掃描手機(jī)瀏覽