php – 搜索引擎关键词解析器

前端之家收集整理的这篇文章主要介绍了php – 搜索引擎关键词解析器前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
这是我想要做的:

我需要创建一个使用以下运算符的搜索引擎解析器:

>苹果和橘子(AND操作符)
>苹果或橘子(OR操作符)
>苹果而不是橘子(AND NOT操作符)
>“苹果”(行情操作符)
>苹果和(橘子或梨)(圆括号运算符)
> Appl *(明星操作符)

使用一些preg_replace,我设法将字符串转换为数组,然后解析此数组以获取MySQL查询.
但我不喜欢这种方式而且非常不稳定!

我在网上搜索了一些这样做的脚本,我没有运气!

有人可以帮我实现吗?

谢谢

好的,这将是一个很大的答案.

我认为你需要的是一个解析器生成器.一种软件,可根据给定的语法生成解析文本的代码.这些解析器通常有两个主要组件:词法分析器和解析器.词法分析器识别TOKENS(单词),解析器根据你的语法检查令牌顺序是否正确.

在词法分析器中,您应该声明以下标记

  1. TOKENS ::= (AND,OR,NOT,WORD,WORDSTAR,LPAREN,RPAREN,QUOTE)
  2. WORD ::= '/w+/'
  3. WORDSTAR ::= '/w+\*/'

语法应该像这样定义:

  1. QUERY ::= word
  2. QUERY ::= wordstar
  3. QUERY ::= lparen QUERY rparen
  4. QUERY ::= QUERY and QUERY
  5. QUERY ::= QUERY or QUERY
  6. QUERY ::= QUERY and not QUERY
  7. QUERY ::= quote MQUERY quote
  8. MQUERY ::= word MQUERY
  9. MQUERY ::= word

该语法定义了一种语言,其中包含您需要的所有功能.根据您使用的软件,您可以定义处理每个规则的函数.这样,您可以将文本查询转换为sql where子句.

我不是真的进入PHP,但我在网上搜索了一个解析器生成器并且出现了PHP_ParserGenerator.

请记住,只要数据库增长,这些查询可能会成为结构化存储系统的问题.

您可能想要尝试一个全文搜索引擎,它允许您执行此操作以及与文本搜索相关的许多其他功能.这就是IndexTank的工作原理

首先,将所有数据库记录(或文档)添加(或搜索方言中的“索引”)到IndexTank.

  1. $api = new ApiClient(...);
  2. $index = $api->get_index('my_index');
  3. foreach ($dbRows as $row) {
  4. $index->add_document($row->id,array('text' => $row->text));
  5. }

之后,您可以使用所需的所有运算符在索引中进行搜索

  1. $index = $api->get_index('my_index');
  2. $search_result = $index->search('Apples AND Oranges');
  3. $search_result = $index->search('Apples OR Oranges');
  4. $search_result = $index->search('Apples AND NOT Oranges');
  5. $search_result = $index->search('"apples oranges"');
  6. $search_result = $index->search('Apples AND ( Oranges OR Pears )');
  7. $search_result = $index->search('Appl*');

我希望我回答你的问题.

猜你在找的PHP相关文章