日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給老王
發(fā)送

0

如何利用圖像識(shí)別、語音識(shí)別、文本挖掘做好鑒黃?

本文作者: 老王 2017-01-11 09:57
導(dǎo)語:人工智能鑒黃市場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈,目前圖普科技、阿里綠網(wǎng)、騰訊萬象優(yōu)圖等團(tuán)隊(duì)已占據(jù)大量市場(chǎng)份額,在此環(huán)境下,不少公司試圖通過提供更全面的服務(wù)從這片紅海中分一杯羹。

如何利用圖像識(shí)別、語音識(shí)別、文本挖掘做好鑒黃?

雷鋒網(wǎng)按:人工智能鑒黃市場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈,目前圖普科技、阿里綠網(wǎng)、騰訊萬象優(yōu)圖等團(tuán)隊(duì)已占據(jù)大量市場(chǎng)份額,在此環(huán)境下,不少公司試圖通過提供更全面的服務(wù)從這片紅海中分一杯羹。

那么更全面的定制服務(wù)體現(xiàn)在哪些地方?雷鋒網(wǎng)特地采訪了極限元 CEO 雷臻,雷臻從圖像識(shí)別、語音識(shí)別、文本挖掘三個(gè)維度向雷鋒網(wǎng)講解 AI 鑒黃,同時(shí)對(duì)一些工程細(xì)節(jié)進(jìn)行闡述。

直播鑒黃一般從哪些方面進(jìn)行鑒定?

通常情況下,直播鑒黃通過視頻截圖、圖像識(shí)別、語音技審、彈幕監(jiān)控、關(guān)鍵字抽取等能力智能識(shí)別色情內(nèi)容。在向客戶正式提供圖像識(shí)別服務(wù)前,會(huì)先邀請(qǐng)直播平臺(tái)用戶進(jìn)行體驗(yàn)測(cè)試,收集一些直播平臺(tái)專屬特征數(shù)據(jù),比如不同的直播背景、環(huán)境光線強(qiáng)度、話題內(nèi)容等,進(jìn)行定制化的訓(xùn)練模型,不同的直播平臺(tái)將獲得定制化的專屬圖像識(shí)別服務(wù)。

其中視頻直播內(nèi)容的審查鑒定可以從以下幾個(gè)步驟:識(shí)別圖像中是否存在人物體征,統(tǒng)計(jì)人數(shù);識(shí)別圖像中人物的性別、年齡區(qū)間;識(shí)別人物的膚色、肢體器官暴露程度;識(shí)別人物的肢體輪廓,分析動(dòng)作行為;除了圖像識(shí)別之外,還可以從音頻信息中提取關(guān)鍵特征,判斷是否存在敏感信息;實(shí)時(shí)分析彈幕文本內(nèi)容,判斷當(dāng)前視頻是否存在違規(guī)行為,動(dòng)態(tài)調(diào)節(jié)圖像采集頻率。

在圖像識(shí)別方面,其中每分鐘視頻采集關(guān)鍵幀的頻率可以由客戶設(shè)定,從1秒到幾十秒均可。例如可以默認(rèn)5秒采集一次關(guān)鍵幀用于識(shí)別,也可以在出現(xiàn)疑似告警時(shí)動(dòng)態(tài)調(diào)節(jié)采集頻率,加快至每秒一張。

您剛提到音頻關(guān)鍵特征提取,這個(gè)可以深入講講嗎?

音頻分析主要有以下幾個(gè)方面:

  • 通過聲紋識(shí)別技術(shù),判斷當(dāng)前直播間的主播是否為注冊(cè)主播本人,對(duì)主播身份進(jìn)行識(shí)別。

  • 對(duì)主播的語音內(nèi)容進(jìn)行關(guān)鍵詞檢索,是否存在禁語、敏感詞。

  • 對(duì)特定的連續(xù)語音數(shù)據(jù)段進(jìn)行識(shí)別,是否存在不良信息。

  • 對(duì)口播廣告的播出頻次進(jìn)行統(tǒng)計(jì),分析廣告投放效果。

不過視頻、音頻雙通道檢測(cè)的方案由用戶來決策,秀場(chǎng)直播通常用圖像檢測(cè)就可以滿足絕大部分需求,音頻檢測(cè)可能更適用于語音內(nèi)容為主的直播平臺(tái)。兩者結(jié)合起來會(huì)大大提高識(shí)別準(zhǔn)確率、降低誤報(bào)率,但成本也會(huì)相應(yīng)提高,所以用戶可以根據(jù)業(yè)務(wù)需求進(jìn)行選擇。

目前的準(zhǔn)確率、誤報(bào)率、召回率大概是多少?是否會(huì)進(jìn)行人工復(fù)審?

目前直播平臺(tái)涉黃圖像檢測(cè)的準(zhǔn)確率高達(dá)99%以上,誤報(bào)率低于1%,需要客戶進(jìn)行人工復(fù)核的比例不超過3%。通常情況下不提供人工復(fù)審的服務(wù),但是會(huì)對(duì)疑似的圖像進(jìn)行標(biāo)注并提醒用戶進(jìn)行人工復(fù)核。人工復(fù)核后的數(shù)據(jù)會(huì)被收集起來進(jìn)行迭代訓(xùn)練,這樣可以不斷提升識(shí)別的準(zhǔn)確率。

直播的實(shí)時(shí)性、對(duì)于機(jī)器的圖片識(shí)別處理速度要求特別高,對(duì)于機(jī)器的計(jì)算能力會(huì)不會(huì)特別高?采用什么樣的方式進(jìn)行處理?

網(wǎng)絡(luò)視頻直播實(shí)時(shí)性強(qiáng),對(duì)服務(wù)端圖像識(shí)別處理的速度要求特別高,除了對(duì)帶寬有較高的要求外,還需要識(shí)別服務(wù)器擁有強(qiáng)大的GPU運(yùn)算能力,尤其是應(yīng)用深度機(jī)器學(xué)習(xí)算法進(jìn)行模型訓(xùn)練階段,強(qiáng)大的GPU集群服務(wù)器是不可或缺的,并基于全鏈接層的特性去除了對(duì)訓(xùn)練圖像大小的限制,快速提升算法處理速度。此外在采集視頻圖片時(shí)也可以采用動(dòng)態(tài)調(diào)節(jié)采集頻率的辦法,通常情況下幾秒一幀,出現(xiàn)敏感信息后加快采集頻率,可以更及時(shí)的識(shí)別涉黃信息并提出告警。

模型訓(xùn)練所需的數(shù)據(jù)的量有多大?一般什么原因會(huì)影晌鑒定準(zhǔn)確率?

以極限元為例,基礎(chǔ)數(shù)據(jù)集有幾千萬張圖片,此外每天還會(huì)追加兩萬張各類正、負(fù)樣本圖片,用于迭代訓(xùn)練,不斷微調(diào)優(yōu)化識(shí)別準(zhǔn)確率。每周會(huì)進(jìn)行一次基礎(chǔ)模型訓(xùn)練,每1-2天會(huì)進(jìn)行一次增量模型迭代訓(xùn)練。

至于鑒定準(zhǔn)確率影響層面,主要還是數(shù)據(jù)量的匱乏,樣本對(duì)應(yīng)用場(chǎng)景的覆蓋不全面導(dǎo)致訓(xùn)練出的模型存在誤報(bào)、漏報(bào)或者識(shí)別錯(cuò)誤,隨著深度機(jī)器學(xué)習(xí)算法的日趨成熟,數(shù)據(jù)來源的多樣性、專業(yè)性反而成為模型構(gòu)造的重中之重。

此外,主播刻意進(jìn)行一些干擾檢測(cè)的手段,比如遮擋敏感部位、畫中畫等等,也會(huì)一定程度上影響到機(jī)器的識(shí)別判斷。

機(jī)器能不能自動(dòng)處理:屏蔽、刪除、禁播等?

涉黃圖片檢測(cè)服務(wù)部署在云端,本身沒有網(wǎng)絡(luò)路徑可以接觸到用戶的直播間管理系統(tǒng),因此無法自動(dòng)屏蔽、刪除、暫停直播間的活動(dòng)。但是如果用戶選擇私有云的部署方式,并授權(quán)識(shí)別服務(wù)器可以訪問直播間管理系統(tǒng),那么對(duì)涉黃直播間的刪、停等操作是可以實(shí)現(xiàn)的。

智能鑒黃相對(duì)于人工鑒黃、成本下降多少?

以一家月直播10萬小時(shí)的中小直播平臺(tái)為例,如果采用傳統(tǒng)的內(nèi)容審核技術(shù),100人的內(nèi)容管理團(tuán)隊(duì)每月所花費(fèi)的成本在80萬上下。如果借助人工智能進(jìn)行內(nèi)容監(jiān)控,人力投入可以削減到10人左右,綜合投入不過10萬到20萬之間,將大大降低人力成本和管理費(fèi)用。此外還有因此而節(jié)省的監(jiān)視設(shè)備費(fèi)、辦公場(chǎng)地費(fèi)等等。

色情和非色情的界限怎么把握、拿捏?

首先,在建立這樣一個(gè)分類模型時(shí),會(huì)有人工對(duì)圖像大數(shù)據(jù)進(jìn)行標(biāo)注,存在一定主觀判斷誤差,但也在大眾理解的范圍內(nèi)。識(shí)別結(jié)果除了色情和正常外,還存在一個(gè)疑似或者稱之為性感的類別,這些都是根據(jù)機(jī)器識(shí)別后的近似值進(jìn)行匹配。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

如何利用圖像識(shí)別、語音識(shí)別、文本挖掘做好鑒黃?

分享:
相關(guān)文章

編輯

微信 wangyafeng123456
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說