通过Embeddings实现PDF检索

先来看一段 Demo，

这段视频实现的功能是，使用 Openai API，基于用户上传的PDF来回答回答，并且回答的内容范围限定在此PDF。

基本步骤：

上传并识别展示PDF
获取并重新整理PDF文本，分割为多个Documents
通过Openai embeddings 对每段分割后的内容进行向量化
将多组向量存储与向量数据库
获取用户提问，并且将提问的内容也向量化
将两者进行相似度对比，按给定规则获取对应的Document内容
再次将获取到的最有关联性的Document内容以及用户的提问一起传递给 Openai
得到 Openai 的回答

下面我们来一步步实现

上一页设定 functions 下一页上传识别PDF

最后更新于2年前