има филтър за .htm и .html файлове.
за да видите дали имате инсталиран филтър, изпълнете този sql:
SELECT * FROM sys.fulltext_document_types
трябва да видите:
.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation
.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation
така че, ако можете да преобразувате колоната си със статии във varbinary(max), тогава можете да добавите пълен текстов индекс към нея и да посочите тип документ на „.html“
след като индексът се попълни, можете да проверите ключовите думи, като използвате този sql:
SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table'))