向量数据库的应用场景包括哪些?

最佳答案 匿名用户编辑于2022/11/30 10:47

向量数据库主要的应用领域如人脸识别、推荐系统、图片搜索、视频指纹、语音处理、自然语言处理、文件搜索等。

1.语音、图像、视频检索

向量检索的第一大类应用就是对语音、图 像、视频这些人类所接触到的,也最为常 见的非结构化数据的检索。 以图片搜索为例,先以离线的方式对所有 历史图片进行机器学习分析,将每一幅图 片抽象成高维向量特征,然后将所有特征 构建成高效的向量索引,当一个新查询 (图片)来的时候,对其进行分析并产出 一个表征向量,然后用这个向量在之前构 建的向量索引中查找出最相似的结果,这 样就完成了一次以图片内容为基础的图像 检索。

2.搜索、推荐、广告

在电商领域的搜索/推荐/广告业务场景中, 常见的需求是找到相似的同款商品和推荐 给用户感兴趣的商品,这种需求绝大多数 都是采用商品协同和用户协同的策略来完 成的。新一代的搜索推荐系统吸纳了深度 学习的 Embedding 的能力, 通过诸如 Item-Item (i2i)、User-Item (u2i)、User- User-Item (u2u2i)、User2Item2Item (u2i2i) 等向量召回的方式实现快速检索。

3.文本检索

上左图以搜索“浙一医院”为例,如果使 用文本分词“浙一”和“医院”,是搜索 不到结果的。如果能够利用对人们历史语 言,甚至历史的点击关联进行分析,建立 起语义相关性的模型,把所有的地址都用 高维特征来表达,那么“浙一医院”和 “浙江大学医学院附属第一医院”的相似 度可能会非常高,因此可以被检索出来。 上右图以搜索“杭州阿里巴巴”的地址为 例,在仅使用文本召回的时候,几乎没办 法找到相似的结果,如果通过对海量用户 的点击行为进行分析,将点击行为加上地 址文本信息合并形成高维向量,这样在检 索的时候就可以天然的将点击率高的地址 召回并排列在前面。

4.几乎覆盖了所有的 AI 场景

向量检索几乎覆盖了大部分的可以应用AI 的业务场景。 例如广告反作弊、人群分析、视频指纹、 版权保护、语音识别、智能问答、地址标 准化、多语言翻译、地理信息、分子结构 分析、生物群落分析等。