Whisper 是Openai 开源音频转文字的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Whisper有五种模型尺寸,提供速度和准确性的平衡,其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求和相对速度。
数据统计
数据评估
关于Whisper语音识别模型特别声明
本站AI奇缘提供的Whisper语音识别模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI奇缘实际控制,在2025-02-27 18:12收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI奇缘不承担任何责任。
相关导航
暂无评论...
