😀
Intersection of AI and Web Development
HomeKnowledgeGitHubDiscussions
  • 👋Welcome!
  • Before Start
    • 主流平台
    • 名词概念
      • Token
      • Prompt
      • Temperature
      • Top K and Top P
      • Vector & Embeddings
    • CoT and ReAct
  • Practice
    • 发起一次提问和对话
    • Server-Sent Events流式对话
      • 客户端调用
      • 服务端处理
    • Openai Function Calling
      • 获取当前时间 - function calling
      • FunctionCalling实现实时搜索
        • openai functions 入参
        • 设定 functions
    • 通过Embeddings实现PDF检索
      • 上传识别PDF
      • 获取文本,按句整理
      • 上传并按限定长度分割Documents
      • Openai Embeddings 向量化及存储
    • 结合语音输入实现对话
      • 通过麦克风识别语音输入
      • Memory Chat & Conversation
    • Chrome侧边栏对话插件
  • Others
    • Framework and SDK
由 GitBook 提供支持
在本页

这有帮助吗?

  1. Practice

结合语音输入实现对话

上一页Openai Embeddings 向量化及存储下一页通过麦克风识别语音输入

最后更新于1年前

这有帮助吗?

这里结合了语音输入的功能来实现对话,ai 作为一个面试者在回答面试官的问题。

同样,简单的步骤说明:

  1. 根据用户选择的面试职位类型生成对应的SystemMessage

  2. 用户点击按钮之后获取到浏览器麦克风权限监听

  3. 实时识别面试官语音提问并转为文字( Azure Speech-To-Text)

  4. 将面试官提问内容作为HumanMessage传入接口

  5. 结合之前的System message,以及前面几轮的对话内容一同发送给openai

  6. 得到openai的AIMessage并展示。

另外还有一个场景是,ai作为面试官来提问,这和上面的场景略有不同,区别是在这个场景中,

  1. ai要成为一个提问者

  2. 需要根据面试的JD以及面试人员的简历来做提问

  3. 提问顺序由浅入深,并且根据面试者的回答来调整

openai有自己的语音接口 Whipser,但实际使用下来,whisper对中文的处理不如英文。另外 Whipser本身也带了一部分ai的功能,如果是使用它作为翻译功能的话,效果不错。不过这里我们直接使用微软的。

语音服务
Speech to text by Azure and chat with Openai
Speech to text by Azure and chat with Openai