通过Embeddings实现PDF检索
最后更新于
最后更新于
先来看一段 Demo,
这段视频实现的功能是,使用 Openai API,基于用户上传的PDF来回答回答,并且回答的内容范围限定在此PDF。
基本步骤:
上传并识别展示PDF
获取并重新整理PDF文本,分割为多个Documents
通过Openai embeddings 对每段分割后的内容进行向量化
将多组向量存储与向量数据库
获取用户提问,并且将提问的内容也向量化
将两者进行相似度对比,按给定规则获取对应的Document内容
再次将获取到的最有关联性的Document内容以及用户的提问一起传递给 Openai
得到 Openai 的回答
下面我们来一步步实现