复制
收藏
提问
全网
什么是主要用来存储某个单词或词组在一组文档中的存储位置的映射。
6月前
理解问题什么是主要用来存储某个单词或词组在一组文档中的存储位置的映射。
已完成理解「什么是主要用来存储某个单词或词组在一组文档中的存储位置的映射。」
展开阅读网页
倒排索引(Inverted Index)是一种主要用来存储某个单词(或词组)在一组文档中的存储位置的映射的数据结构。1357 它使得可以根据内容快速查找文档,这是因为倒排索引不是根据文档来确定文档所包含的内容,而是进行了相反的操作,即通过内容来查找文档。13456 倒排索引通常由一个单词(或词组)以及相关的文档列表组成,文档列表中的文档可以是标识文档的ID号,或者是指向文档所在位置的URL。13 在实际应用中,倒排索引还会为每个文档添加一个权值,用来指出每个文档与搜索内容的相关度。1 实现倒排索引时,主要关注的信息包括单词、文档URL及词频。26 倒排索引是文档检索系统中最常用的数据结构,广泛应用于全文搜索引擎。37 它由“单词词典”和“倒排文件”两部分组成,其中倒排文件可以是水平反向索引或完全反向索引,前者包含每个引用单词的文档列表,后者则包含每个单词在文档中的位置,后者形式提供了更多的兼容性,但需要更多的时间和空间来创建。7
更专业一些
转笔记
专业
什么是主要用来存储某个单词或词组在一组文档中的存储位置的映射。不在提醒