По-долу са дадени пет опции за връщане на редове, които съдържат главни букви в SQL Server.
Примерни данни
Да предположим, че имаме таблица със следните данни:
SELECT c1 FROM t1;
Резултат:
+----------------+ | c1 | |----------------| | CAFÉ | | Café | | café | | 1café | | eCafé | | James Bond 007 | | JB 007 | | 007 | | NULL | | | | É | | É 123 | | é | | é 123 | | ø | | Ø | +----------------+
Можем да използваме следните методи, за да върнем редовете, които съдържат главни букви.
Опция 1:Сравнете с LOWER()
Низ
Можем да използваме LOWER()
функция за сравняване на оригиналната стойност с нейния еквивалент с малки букви:
SELECT c1 FROM t1
WHERE LOWER(c1) COLLATE Latin1_General_CS_AS <> c1;
Резултат:
+----------------+ | c1 | |----------------| | CAFÉ | | Café | | eCafé | | James Bond 007 | | JB 007 | | É | | É 123 | | Ø | +----------------+
Чрез използване на не е равно на (<>
) оператор (алтернативно можете да използвате !=
вместо <>
ако предпочитате), ние връщаме само онези редове, които са различни от техните еквиваленти с малки букви. Причината да правим това е, че ако дадена стойност е същата като нейния еквивалент с малки букви, тогава тя вече е била с малки букви (и не искаме да я връщаме).
Ние също така използваме COLLATE Latin1_General_CS_AS
за изрично уточняване на съпоставяне, чувствително към малки и големи букви (и акценти). Без това бихте могли да получите неочаквани резултати в зависимост от съпоставянето, което се използва във вашата система.
Опция 2:Сравнете с действителните знаци
Друга възможност е да използвате LIKE
оператор и посочете действителните главни букви, които искаме да съпоставим:
SELECT c1 FROM t1
WHERE c1 LIKE '%[ABCDEFGHIJKLMNOPQRSTUVWXYZ]%'
COLLATE Latin1_General_CS_AS;
Резултат:
+----------------+ | c1 | |----------------| | CAFÉ | | Café | | eCafé | | James Bond 007 | | JB 007 | +----------------+
В този случай се връщат по-малко редове, отколкото в предишния пример. Това е така, защото не посочих знаци като É
и Ø
, които бяха върнати в предишния пример. Нашият резултат съдържа É
но този ред беше върнат само защото съдържа и други главни букви, които правят съвпадение.
Следователно тази опция е по-ограничена от предишната, но ви предоставя повече контрол върху знаците, които искате да съпоставите.
Опция 3:Сравнете с набор от знаци
Алтернативно можем да посочим диапазона от знаци, които искаме да съпоставим:
SELECT * FROM t1
WHERE c1 LIKE '%[A-Z]%'
COLLATE Latin1_General_100_BIN2;
Резултат:
+----------------+ | c1 | |----------------| | CAFÉ | | Café | | eCafé | | James Bond 007 | | JB 007 | +----------------+
В този случай използвах двоично съпоставяне (Latin1_General_100_BIN2
). Направих това, защото двоичните съпоставяния сортират всеки случай поотделно (като това:AB....YZ...ab...yz
).
Други съпоставяния са склонни да смесват главни и малки букви (като това:AaBb...YyZz
), което следователно ще съответства както на главни, така и на малки букви.
Вариант 4:Намерете първия екземпляр на главни букви
Друг начин да го направите е да използвате PATINDEX()
функция:
SELECT * FROM t1
WHERE PATINDEX('%[ABCDEFGHIJKLMNOPQRSTUVWXYZ]%', c1
COLLATE Latin1_General_CS_AS) > 0;
Резултат:
+----------------+ | c1 | |----------------| | CAFÉ | | Café | | eCafé | | James Bond 007 | | JB 007 | +----------------+
В този пример ние указваме точните знаци, които искаме да съпоставим, и така в този случай не получихме редовете със знаци като É
и Ø
(освен този, който съдържа и други знаци, които са били съвпадащи).
Едно от предимствата на тази техника е, че можем да я използваме, за да игнорираме първия знак (или определен брой знаци), ако желаем:
SELECT * FROM t1
WHERE PATINDEX('%[ABCDEFGHIJKLMNOPQRSTUVWXYZ]%', c1
COLLATE Latin1_General_CS_AS) > 1;
Резултат:
Time: 0.472s +-------+ | c1 | |-------| | eCafé | +-------+
Следователно можем да върнем всички редове, които съдържат главни букви, но където първият символ не е главни.
Това е така, защото PATINDEX()
връща началната позиция на първото появяване на шаблона (в нашия случай шаблонът е списък с главни букви). Ако началната позиция на първото появяване е по-голяма от 1, тогава първият знак не е в нашия списък с главни букви.
Опция 5:Намерете първия екземпляр въз основа на диапазон
Можем също да използваме PATINDEX()
с диапазон:
SELECT * FROM t1
WHERE PATINDEX('%[A-Z]%', c1
COLLATE Latin1_General_100_BIN2) > 1;
Резултат:
+-------+ | c1 | |-------| | eCafé | +-------+
Отново използвах двоично съпоставяне (както с другия пример за диапазон).