MongoDB – 文本搜索

MongoDB – 文本搜索


从 2.4 版开始,MongoDB 开始支持文本索引来搜索字符串内容。文本搜索通过降低所产生停止的话就像使用词干技术,以寻找在字符串字段中指定词语一,一个的,等。目前,MongoDB的支持大约15种语言。

启用文本搜索

最初,文本搜索是一项实验性功能,但从 2.6 版开始,该配置默认启用。

创建文本索引

考虑包含帖子文本及其标签的帖子集合下的以下文档

> db.posts.insert({
   "post_text": "enjoy the mongodb articles on tutorialspoint",
   "tags": ["mongodb", "tutorialspoint"]
}
{
	"post_text" : "writing tutorials on mongodb",
	"tags" : [ "mongodb", "tutorial" ]
})
WriteResult({ "nInserted" : 1 })

我们将在 post_text 字段上创建一个文本索引,以便我们可以在帖子的文本中搜索 –

>db.posts.createIndex({post_text:"text"})
{
	"createdCollectionAutomatically" : true,
	"numIndexesBefore" : 1,
	"numIndexesAfter" : 2,
	"ok" : 1
}

使用文本索引

现在我们已经在 post_text 字段上创建了文本索引,我们将搜索文本中包含单词tutorialspoint 的所有帖子

> db.posts.find({$text:{$search:"tutorialspoint"}}).pretty()
{
	"_id" : ObjectId("5dd7ce28f1dd4583e7103fe0"),
	"post_text" : "enjoy the mongodb articles on tutorialspoint",
	"tags" : [
		"mongodb",
		"tutorialspoint"
	]
}

上面的命令返回以下结果文档,在其帖子文本中包含单词tutorialspoint

{ 
   "_id" : ObjectId("53493d14d852429c10000002"), 
   "post_text" : "enjoy the mongodb articles on tutorialspoint", 
   "tags" : [ "mongodb", "tutorialspoint" ]
}

删除文本索引

要删除现有的文本索引,首先使用以下查询找到索引的名称 –

>db.posts.getIndexes()
[
	{
		"v" : 2,
		"key" : {
			"_id" : 1
		},
		"name" : "_id_",
		"ns" : "mydb.posts"
	},
	{
		"v" : 2,
		"key" : {
			"fts" : "text",
			"ftsx" : 1
		},
		"name" : "post_text_text",
		"ns" : "mydb.posts",
		"weights" : {
			"post_text" : 1
		},
		"default_language" : "english",
		"language_override" : "language",
		"textIndexVersion" : 3
	}
]
>

从上述查询中获取索引名称后,运行以下命令。此处,post_text_text是索引的名称。

>db.posts.dropIndex("post_text_text")
{ "nIndexesWas" : 2, "ok" : 1 }

觉得文章有用?

点个广告表达一下你的爱意吧 !😁