基于AI技術(shù)的媒資內(nèi)容管理平臺(tái)
《基于AI技術(shù)的媒資內(nèi)容管理平臺(tái)》由會(huì)員分享,可在線閱讀,更多相關(guān)《基于AI技術(shù)的媒資內(nèi)容管理平臺(tái)(6頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
基于 AI 技術(shù)的媒資內(nèi)容管理平臺(tái) 語(yǔ)音識(shí)別需求書 2017 年 11 月 文檔信息 產(chǎn)品名稱 項(xiàng)目需求確認(rèn)書 產(chǎn)品負(fù)責(zé)人 徐志亮 負(fù)責(zé)人聯(lián)系方式 22005899 51472 文檔修改記錄 版本 修改時(shí)間 修改人 修改章節(jié) 修改說明 目 錄 1 簡(jiǎn)介 4 2 產(chǎn)品需求 4 2 1 產(chǎn)品需求概述 4 2 1 1 視頻預(yù)處理 5 2 1 2 語(yǔ)音識(shí)別文字輸出 5 2 1 3 高識(shí)別率 6 2 1 4 支持多種音頻格式 6 2 1 5 多語(yǔ)言識(shí)別 6 2 1 5 高識(shí)別效率 6 3 其他需求 6 3 1 服務(wù)器環(huán)境配置 6 3 2 測(cè)試需求 6 3 3 運(yùn)維保障需求 7 項(xiàng) 目 需 求 報(bào) 告 1 簡(jiǎn)介 1 1 項(xiàng)目背景 隨著計(jì)算機(jī)自動(dòng)化技術(shù)的發(fā)展 語(yǔ)音識(shí)別 字幕識(shí)別 場(chǎng)景分割等技術(shù)已 經(jīng)日趨成熟 智能語(yǔ)義分析 智能素材關(guān)聯(lián) 人臉識(shí)別技術(shù)也在迅速發(fā)展 日 本 NHK 等發(fā)達(dá)國(guó)家已實(shí)際應(yīng)用 SMG 的自動(dòng)編目可從語(yǔ)音識(shí)別和字幕識(shí)別入手 以新聞 戲曲類節(jié)目為切人點(diǎn) 在節(jié)目素材入庫(kù)媒資時(shí)將語(yǔ)音和字幕自動(dòng)進(jìn)行 文字化 減少編目人員工作量 之后 以自動(dòng)場(chǎng)景分割技術(shù)為基礎(chǔ) 結(jié)合智能 語(yǔ)義分析 逐步對(duì)節(jié)目和素材實(shí)現(xiàn)全自動(dòng)的標(biāo)引 提高整個(gè)媒資編目的自動(dòng)化 率 降低媒資運(yùn)營(yíng)的人工成本 2 產(chǎn)品需求 2 1 產(chǎn)品需求概述 隨著計(jì)算機(jī)自動(dòng)化技術(shù)的發(fā)展 語(yǔ)音識(shí)別 字幕識(shí)別 場(chǎng)景分割等技術(shù)已 經(jīng)日趨成熟 智能語(yǔ)義分析 智能素材關(guān)聯(lián) 人臉識(shí)別技術(shù)也在迅速發(fā)展 日 本 NHK 等發(fā)達(dá)國(guó)家已實(shí)際應(yīng)用 SMG 可從語(yǔ)音識(shí)別入手 在節(jié)目素材入庫(kù)媒資 時(shí)將語(yǔ)音和字幕自動(dòng)進(jìn)行文字化 之后 以自動(dòng)場(chǎng)景分割技術(shù)為基礎(chǔ) 結(jié)合智 能語(yǔ)義分析 逐步對(duì)節(jié)目和素材實(shí)現(xiàn)全自動(dòng)的標(biāo)引 項(xiàng) 目 需 求 報(bào) 告 該項(xiàng)目的目標(biāo)是通過語(yǔ)音識(shí)別 對(duì)視頻進(jìn)行文字內(nèi)容和關(guān)鍵詞的提取 提 取后的內(nèi)容和關(guān)鍵詞按照視頻名稱和視頻時(shí)間信息進(jìn)行存儲(chǔ) 最終為用戶提供 文字內(nèi)容和關(guān)鍵詞的檢索服務(wù) 2 1 1 視頻預(yù)處理 視頻預(yù)處理主要實(shí)現(xiàn)對(duì)視頻進(jìn)行提取音頻視頻提取音頻 從視頻文件中提 取音頻文件 音頻格式為 mp3 或 wav 2 1 2 語(yǔ)音識(shí)別文字輸出 自動(dòng)識(shí)別音 視頻 包括主流格式高 低碼格式 中的語(yǔ)音 并將其識(shí)別 為文本內(nèi)容 并頁(yè)面中展示 語(yǔ)音識(shí)別文本應(yīng)包含時(shí)間戳 即表示在該段時(shí)間內(nèi)音頻的識(shí)別結(jié)果 語(yǔ)音 識(shí)別的結(jié)果按照時(shí)間的順序 入點(diǎn)時(shí)間 出點(diǎn)時(shí)間 在每個(gè)視頻素材的詳情頁(yè) 進(jìn)行展示 語(yǔ)音識(shí)別文字輸出應(yīng)當(dāng)為完整句子形式 詞等 另外應(yīng)具有智能的功能 例如 電話號(hào)碼 車牌 日期 時(shí)間以及量詞的規(guī)整 如 五點(diǎn)三十 會(huì)識(shí)別 規(guī)整為 5 30 自動(dòng)斷句 并且在文本中加入標(biāo)點(diǎn)如好 并且能夠識(shí)別詞屬性 詞屬性包 括 普通詞 語(yǔ)氣猶豫詞 如 嗯 啊 呃 或者無意義的重復(fù)詞等 標(biāo) 點(diǎn)符號(hào) 如 等 項(xiàng) 目 需 求 報(bào) 告 2 1 3 高識(shí)別率 在音頻中為標(biāo)準(zhǔn)普通話的情況下 語(yǔ)音識(shí)別率需要達(dá)到 90 以上 若音頻 中為較為不標(biāo)準(zhǔn)普通話 則語(yǔ)音識(shí)別率可以稍微降低識(shí)別率要求 2 1 4 支持多種音頻格式 語(yǔ)音識(shí)別應(yīng)支持多種視頻格式 例如 wav flac opus m4a mp3 2 1 5 多語(yǔ)言識(shí)別 語(yǔ)音識(shí)別可能需要識(shí)別普通話 上海話 以及英語(yǔ)等 根據(jù)目前項(xiàng)目需求 至少需要能夠識(shí)別普通話以及上海話 并且達(dá)到較好的識(shí)別效果 2 1 5 高識(shí)別效率 由于音頻量大 所以需要高效率的語(yǔ)音識(shí)別軟件 音頻時(shí)長(zhǎng)與識(shí)別時(shí)間的 比要大于 6 1 否則無法正常完成語(yǔ)音識(shí)別業(yè)務(wù) 3 其他需求 3 1 測(cè)試需求 兼容性測(cè)試 壓力測(cè)試 流程測(cè)試 安全性測(cè)試 兼容性測(cè)試需求 PC 端兼容要求 瀏覽器 IE8 Chrome 火狐 屏幕分辨率 1024 768 1920 1080 系統(tǒng) winXP win10- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
15 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 基于 AI 技術(shù) 內(nèi)容管理 平臺(tái)
鏈接地址:http://www.3dchina-expo.com/p-8964445.html