След като направих някои може би злобни коментари, този проблем остана в мозъка ми цяла вечер и в крайна сметка стигнах до следния подход, базиран на набори. Вярвам, че определено се квалифицира като "елегантен", но също така мисля, че се квалифицира като "малко тъпо". Вие извършвате обаждането.
Първо, настройте някои таблици:
-- For testing purposes
DROP TABLE Source
DROP TABLE Numbers
DROP TABLE Results
-- Add as many rows as need be processed--though note that you get N! (number of rows, factorial) results,
-- and that gets big fast. The Identity column must start at 1, or the algorithm will have to be adjusted.
-- Element could be more than char(1), though the algorithm would have to be adjusted again, and each element
-- must be the same length.
CREATE TABLE Source
(
SourceId int not null identity(1,1)
,Element char(1) not null
)
INSERT Source (Element) values ('A')
INSERT Source (Element) values ('B')
INSERT Source (Element) values ('C')
INSERT Source (Element) values ('D')
--INSERT Source (Element) values ('E')
--INSERT Source (Element) values ('F')
-- This is a standard Tally table (or "table of numbers")
-- It only needs to be as long as there are elements in table Source
CREATE TABLE Numbers (Number int not null)
INSERT Numbers (Number) values (1)
INSERT Numbers (Number) values (2)
INSERT Numbers (Number) values (3)
INSERT Numbers (Number) values (4)
INSERT Numbers (Number) values (5)
INSERT Numbers (Number) values (6)
INSERT Numbers (Number) values (7)
INSERT Numbers (Number) values (8)
INSERT Numbers (Number) values (9)
INSERT Numbers (Number) values (10)
-- Results are iteratively built here. This could be a temp table. An index on "Length" might make runs
-- faster for large sets. Combo must be at least as long as there are characters to be permuted.
CREATE TABLE Results
(
Combo varchar(10) not null
,Length int not null
)
Ето рутината:
SET NOCOUNT on
DECLARE
@Loop int
,@MaxLoop int
-- How many elements there are to process
SELECT @MaxLoop = max(SourceId)
from Source
-- Initialize first value
TRUNCATE TABLE Results
INSERT Results (Combo, Length)
select Element, 1
from Source
where SourceId = 1
SET @Loop = 2
-- Iterate to add each element after the first
WHILE @Loop <= @MaxLoop
BEGIN
-- See comments below. Note that the "distinct" remove duplicates, if a given value
-- is to be included more than once
INSERT Results (Combo, Length)
select distinct
left(re.Combo, @Loop - nm.Number)
+ so.Element
+ right(re.Combo, nm.Number - 1)
,@Loop
from Results re
inner join Numbers nm
on nm.Number <= @Loop
inner join Source so
on so.SourceId = @Loop
where re.Length = @Loop - 1
-- For performance, add this in if sets will be large
--DELETE Results
-- where Length <> @Loop
SET @Loop = @Loop + 1
END
-- Show results
SELECT *
from Results
where Length = @MaxLoop
order by Combo
Общата идея е:когато добавяте нов елемент (да речем "B") към който и да е низ (да речем, "A"), за да хванете всички пермутации, вие ще добавите B към всички възможни позиции (Ba, aB), което води до нов набор от струни. След това повторете:Добавете нов елемент (C) към всяка позиция в низ (AB става Cab, aCb, abC), за всички низове (Cba, bCa, baC) и имате набора от пермутации. Итерирайте всеки набор от резултати със следващия знак, докато не ви свършат знаците... или ресурси. 10 елемента са 3,6 милиона пермутации, приблизително 48MB с горния алгоритъм, а 14 (уникални) елемента биха достигнали 87 милиарда пермутации и 1,163 терабайта.
Сигурен съм, че в крайна сметка може да се вклини в CTE, но в крайна сметка всичко, което ще бъде, е прославен цикъл. Така логиката е по-ясна и не мога да не мисля, че планът за изпълнение на CTE би бил кошмар.