智能語音處理系統
智能語音處理系統支持處理千萬級語音數據,系統集成了語音預處理、聲紋識別、關鍵詞識別、語音轉寫、機器翻譯和自然語言理解等核心技術,可對多源海量語音大數據進行結構化處理,實現業務范圍內數據的綜合處理和智能關聯分析,系統支持輿情分析、提示分析、比對分析、語音快聽、歷史數據檢索和系統管理等多種功能應用。
系統功能
- 每日上億數據的處理能力。
- 提供業務模塊定制化開發。
- 與行業內多家業務平臺完美融合。
- 結構化特征數據的深度挖掘。
- 支持近四十種語種識別,支持近二十個語種的連續語音識別。
技術應用:語音檢出、聲紋識別、關鍵詞識別、語音轉文本、機器翻譯、意圖識別、語音合成等。
全民聲紋庫
全民聲紋庫系統可針對海量語音數據自動收集對象語音,通過智能數據清洗、智能語音自動編輯、智能聚類與建模、智能模型評估、自動化迭代自動化建立全民聲紋庫。
系統同時支持人工方式建立專題人員聲紋庫,可對聲紋庫進一步的完善。關聯專題人員相關信息,實現目標的快速定位。
系統功能
無監督建立聲紋庫:支持通過智能數據清洗、智能語音自動編輯、智能建模、智能模型評估自動化建立全民聲紋庫。
有監督建立聲紋庫:支持人工輔助方式建立相關專題人員聲紋庫,可對關聯專題人員的聲紋庫完善聲紋信息。
社會信息研判與專題推薦系統
采用語音識別技術和文本分析挖掘技術,對海量語音信息進行內容分析,挖掘出隱藏在社會網絡中的深層信息;同時對這些信息研判進行歸類、整理和推送,形成專題搜索,使得相關信息能夠快速被獲取。
系統功能
社會信息的分析與歸類?:將語音識別技術和文本分析挖掘技術綜合應用于社會信息的分析歸納工作,對海量語音信息進行內容智能分析,深度挖掘出隱藏在社會信息網絡中的深層涵義。
基于關鍵詞的專題推送?:對社會網絡中的深層信息進行智能歸類、快速整理并形成動態推送,最終整合成專題搜索,使得相關信息能夠快速被獲取。
語音識別云服務
利用自研語音識別引擎,提供公有云接口及私有化部署方案,支持短語音轉寫、實時語音轉寫、文件極速轉寫等服務,適應復雜應用場景。
產品優勢
準確率高,高效穩定:行業先進的語音識別技術,標準普通話識別率≥98%,轉寫結果輸出實現毫秒級響應。
接口豐富,可定制開發:支持跨平臺接口調用,提供多語言SDK及RESTFUL接口。
語義理解,智能糾錯:針對上下文進行語義理解,將中間結果進行智能糾錯,確保識別的高準確率。
格式轉化,標點智能預測:對數字、日期、時間等返回格式化文本,根據對話語境,智能斷句并匹配標點。
方言語種,高效識別:支持多種方言語音識別,可滿足各種復雜場景需求。
機器翻譯云服務
利用機器翻譯技術,輔以語義理解技術對非中文文本進行快速識別和轉換翻譯,降低對非中文語種文本的辨識能力的要求,也可與語音識別技術結合,形成非中文語音的同聲翻譯。支持將實時語音數據信息、錄音、會議內容等領域的外語或方言語音實時轉寫后的文本內容進行機器翻譯。系統支持英、日、韓、俄、越南、泰、維、藏、粵語等五十種語言到中文的翻譯。

系統功能
文檔翻譯:支持格式有PDF、DOC、TXT、HTML等十幾種文檔格式。支持翻譯多語種說明書、專利、合同、論文、文獻等文檔資料,提升效率。
文本翻譯:支持實時文本翻譯,輸入源文本內容到選擇的語言內容翻譯,同時支持反向翻譯。
OCR識別:主要用來處理掃描版PDF文件和圖片文件,將文件或是圖片中的文字內容識別出來。
