我想搜索包含阿拉伯文和英文文本的postgres DB中的表格.例如:
id | content ----------------- 1 | دجاج 2 | chicken 3 | دجاج chicken
结果会让我排第3行.
我想这与使用正则表达式限制字符有关,但我找不到一个干净的解决方案来选择它们.我试过了:
SELECT regexp_matches(content,'^([x00-\xFF]+[a-zA-Z][x00-\xFF]+)*') FROM mg.messages;
但是,这只匹配{}中的英语和一些非英语字符.
解决方法
我一般对阿拉伯语文本或RTL语言一无所知,但这有效:
create table phrase ( id serial,phrase text ); insert into phrase (phrase) values ('apple pie'); insert into phrase (phrase) values ('فطيرة التفاح'); select * from phrase where phrase like ('apple%') or phrase like ('فطيرة%');