版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
小Q 近期主要關注人工智能 教育等創(chuàng)新產(chǎn)品的研發(fā)小Q小Q
小Q小Q 聊12聊12
小Q33 器QQ空間 器峰值每日聊天2000w次,用戶130w(業(yè)界領先單用戶會話輪次達到15AI模型,算法實踐結果做到70%開 閉?量數(shù) 檢索式
深度學習
多樣化數(shù)據(jù) 生成式
RankingQuery理解(TF、Ranking分詞&
searchdsearchd
基于Sphinx技術特色——獨家配方Rank數(shù)據(jù)數(shù)據(jù)baseline A1:休息下A2:你還 A3:R率F-R率F---------POS-IDF A1:休息下A2:你還 啊A3:下次叫我一起,球場
Word2vecRF-深度學習引入深度學習CNN模型,基于TGU訓練\評測\部署,Q數(shù)據(jù)做了拼接共用一個卷積池化的參數(shù),然后求余弦相似度。ApplyingDeepLearningtoAnswerSelection:AStudyandAnOpen深度學 我們引 改進模型對原有 N模型對比優(yōu)化LearningtoRankShortTextPairswithConvolutionalDeepNeuralNR率F-R率F-技術特色——獨家配方Rank
Pair
12POS-技術特色——獨家配方Rank綜合詞共現(xiàn)/IDF詞向量 N取得比baseline在F值上約70%的提升RF-----N詞共現(xiàn)+idf-基于UGC中文和Emoji表情label利于深度學習LSTM目前6分類的成功率大于80結合寵物的情感分 也開始顯現(xiàn)(KFC&寵物321 器321
小Q小Q
整合人工智能基礎能力 生態(tài)系統(tǒng)合作伙伴?!v訊2017年Q2財+44整合騰訊內多項AI上下文管 會話管
流 流
AILabsAILabsQQ QQ
流式上任 支任 支
我要 稻
意圖識別實體抽 實體消 領域預分 相似度排領域指令粗 指令擴 句子相似 槽位填提高響應速率策略:fastText在top3的領域上選中目標準確率達到97.6%Fasttext1fastText原理
物聯(lián)控制音 故 通 算 電 提 笑 天 百科通用控由于停用詞影響正確率(你、我、他等),這里設置停用詞去掉后剩余詞多于由于停用詞影響正確率(你、我、他等),這里設置停用詞去掉后剩余詞多于個(謂賓短語),停用詞。否則保留停用詞。2t的實體(歌曲、歌手等)給予較低權重。主流語義相似度算法:CNN,wmd 心如刀看深南大道
看深南大道堵 (無實體基于29個句子/詞性特征,實體消歧采用GBDT+Boosting95%,提高容錯能力策略:QueryCorrection(QC)321 器321
小Q小Q的團隊缺乏硬 ,硬件如何選型,硬件研發(fā)如何開展 硬件項目周期長,如何做到快速驗證,快速試錯,快速
頭效果 花
失 按鍵通信題
過 電磁干
1、總耗時達4.423、每個流程都在不同的部門,有些功能還是剛走 4、TTS耗時過長,需要15、靜音檢測每次都要消耗 耗時過長,接近2秒 2、優(yōu)化各個步驟耗時,比如音樂從800ms優(yōu)化到3
靜音檢
目標是秒開,追趕AmazonEcho的應答速度。
音樂意 稻音樂意 稻我要 稻
語音識 語義分
3、TTS不用等待音樂查詢結果,節(jié)省約 生成 流
響應速度優(yōu)化——TTS傳統(tǒng)TTS生成音頻文件,返回地址客戶
痛點:耗時?。ㄔ诎倏祁愰L內容上非常明顯1、 生成完整音頻文件時2、客戶端拿到音頻地址后時間到可 的時響應速度優(yōu)化——TTS根據(jù)文本實時生成語音包數(shù)據(jù),借助TCP ,OPUS將語音包編碼后,有序送往客戶,OPUS可將語音包從2880b減至300b
數(shù)據(jù) 數(shù)據(jù)
OPUSPCM1、流式TTS 時間不依賴于文本的長度,在長文本和短文本上時間無差2、客戶端無需 , 會以PUSH的形式有序傳遞給客戶測試數(shù)據(jù)來源測試數(shù)據(jù)來源 PC調試工具連接前端IC,dump工作時各寄存器的設置,確認IC發(fā)現(xiàn)問題:codec模塊AEC沒有打開前端adc、codec抓取原始音頻pcmmicAEC針對前端信號幅度被截的問題,調整了codec調整mic輸入的放大增益參數(shù)以及調整C信號的放大增益參數(shù),確保信號幅度的完整性。測試的成功率在安靜環(huán)境測試,由原來的%提升到82%比還有明顯差距。專業(yè)音 測試,驗證Mic頻響和結構密封性AudioAudioUSBUSBdriver中多核多線程并 USBUSBUSB修改USB驅動bug,推動解決了MTK底層USBDriver的bug你好小 明天天氣 ,9月份第一版數(shù)據(jù)為誤喚醒為10小時8次,喚醒率為60%; ,在用戶群體差異化情況下,不同習慣容易造成身語音內容丟失,進而語義分 確,導致內容異常。9月份第一版語義的成功率為間斷說 會話開 數(shù)據(jù)傳
明天天氣怎么 天氣|明
天氣怎么 天氣|今會話開
明天天氣怎么 天氣|明喚 [ State
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 法律行業(yè)客服工作總結專業(yè)解決法律問題
- 環(huán)保設備行業(yè)采購工作總結
- 音樂行業(yè)安全生產(chǎn)工作總結
- 分析行業(yè)數(shù)據(jù)解讀培訓總結
- 咨詢行業(yè)中戰(zhàn)略顧問的工作表現(xiàn)概述
- 【八年級下冊歷史】第6課 艱難探索與建設成就 同步練習
- 創(chuàng)新實驗資源共享合同(2篇)
- 2024社團規(guī)章制度(30篇)
- 《政府采購業(yè)務知識》課件
- 2024年福建省《輔警招聘考試必刷500題》考試題庫帶答案(突破訓練)
- 2024年湖北省漢江國有資本投資集團有限公司招聘筆試參考題庫含答案解析
- 廣州市九區(qū)聯(lián)考2023-2024學年高一上學期期末教學質量監(jiān)測數(shù)學試卷(原卷版)
- 西方國家的量刑建議制度及其比較
- 游戲方案模板
- 幼兒園大班數(shù)學上學期期末考試-試題測試
- 地震預警安裝方案
- 汽車產(chǎn)品定義 培訓課件
- NICU患兒常規(guī)監(jiān)測和護理要點
- 高血壓急癥的緊急處理與護理
- 數(shù)字工程勘察信息平臺構建
- 噴涂設備保養(yǎng)和維護操作規(guī)程
評論
0/150
提交評論