通过麦克风识别语音输入

Web Speech API 可以实现语音转文字的功能,目前大部分新款浏览器都可以支持。一个简单示例:

// 客户端
// 判断浏览器是否支持 Web Speech API
if ('SpeechRecognition' in window || 'webkitSpeechRecognition' in window) {
  // 创建 SpeechRecognition 对象
  const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
  recognition.lang = 'zh-CN'; // 设置语言为中文

  // 监听语音识别结果
  recognition.addEventListener('result', event => {
    const transcript = event.results[0][0].transcript;
    console.log(transcript); // 打印识别结果
  });

  // 开始语音识别
  recognition.start();
} else {
  console.log('Web Speech API is not supported');
}

当然我们为了更好地支持语音识别的效果以及兼容不同的浏览器,更推荐使用微软的 speech SDK

我们需要预先获取到token,需要在服务端获取校验信息

在客户端使用 speech SDK实现实时监听并且获取语音转换之后的文字

最后更新于

这有帮助吗?