中国消费者报北京讯(记者武晓莉)8月8日,汉王科技2024新品发布会圆满举行,致力于让所有人都可以无障碍地进行语言记录、交流沟通的首款智能语音应用——汉王语音王APP发布。
据介绍,汉王语音王是基于汉王自研多模态天地大模型,自主研发的一款集AI语音记录、智能翻译与同声传译于一体的智能语音旗舰应用,支持AI精准转写、拍录同步(自动裁边)、话稿整理、智能总结及不间断实时翻译等功能,用户可以即听即用,帮助跨越语言障碍,提高日常办公、学习、会议、旅游等场景的应用效率和便捷性。
AI语音记录精准识别拍录同步。汉王语音王支持实时语音转录和语音文件转录两种方式,具备录音速记、拍录同步(自动裁边)、语音转文字、说话人精准识别、智能总结、AI话稿整理等多种智能功能。汉王科技自研高精度语音识别模型,具备高准确率、多语言支持、动态修正和自然交流等特点。在行业广泛使用的开源中文语音识别数据集上测试,错误率低至1.94%,处于领先水平。
汉王语音王可以自动修正错误文本,内容规整后无须二次编辑,还支持自动生成标题、总结记录要点等。拍录同步功能则是在录音转写的同时拍照,通过强大的原研OCR技术,在录音类产品中首创照片自动裁边和内容智能排版功能,为用户直接提供一份声、图、文并茂的多媒体记录文档。
在会议、头脑风暴等多人对话场景中,准确分离出每个人的身份以及内容具有极大挑战,声纹识别成为关键。汉王科技声纹识别技术具备在不限定用户说话内容的情况下,最短2秒准确识别说话人的能力。汉王科技解决了场景中的各种环境噪声和回响,以及说话人语速和情感变化等复杂情况下的识别准确性问题,在复杂场景下能够提供稳定的准确识别率。同时,引入聚类算法等实现了结合声纹和语义特征,进一步提高识别的准确性。
当整理好会议纪要、演讲内容等后,汉王语音王能与电纸本一键分享,将语音文本一体化传输到电纸本上进行高效阅读办公操作,实现多端互联、共享的应用生态。
对话翻译即时捕捉自然准确。具备实时翻译和语音合成两大能力,可以精准捕捉每一句对话,即时翻译,让大家可以跨越语言界限,适合办公、教育和旅游等场景下无障碍交流沟通。
基于汉王自研天地大模型的对话翻译,具备更好的语义理解和上下文联系能力,以及自适应语言风格和行业领域,提供更准确和自然的翻译内容,表达更清楚、交流更顺畅。汉王科技自研的语音合成系统不仅具有卓越的多音字准确识别能力,还能处理各种复杂多变的语音现象。汉王科技自研高自然度声学模型,并引入了恒Q变换等多项先进技术,让合成语音能更加高效和精准地还原人类语音特性。
汉王语音王同声传译功能具备长时段不间断即时翻译能力,实时双语对照文字记录,更能准确表达专业术语和词句表达。加上配录同步功能,跨越语言的障碍,帮助用户轻松解决超长时间国际会议、学术研讨的内容记录难题。 |