Mysql
 sql >> база данни >  >> RDS >> Mysql

База данни за пълнотекстово търсене и 200 милиона+ записи

Вярвам, че поддържането на първични записи в SQL база данни и дублирането им в noSQL база данни е много често срещан подход.

ElasticSearch има текуща страница за състоянието за тяхната устойчивост . Дори в най-новата версия ElasticSearch може да загуби данни в различни ситуации . Голяма промяна в структурата на индекс на ElasticSearch (като добавяне на анализатори) изисква от преиндексиране всички документи. Този процес е по-безопасен, ако имате друг източник за документите. В края на краищата, ElasticSearch не е проектиран да съхранява последователно документи – бих избрал да използвам ElasticSearch като основно хранилище само в ситуации, при които случайната загуба на данни не е бедствие.

За разлика от ElasticSearch, MongoDB е проектиран да бъде устойчив . Трябва да можете безопасно да съхранявате документи в MongoDB. Открих, че опитите за търсене в пълен текст в MongoDB могат да бъдат малко болезнени, поне в сравнение с ElasticSearch. Според мен за текстово търсене единственото предимство на MongoDB пред ПЪЛЕН ТЕКСТ е, че се разпространява.

В момента изпълняваме ElasticSearch и MySQL - и ползите значително надвишават проблемите с допълнителната инфраструктура и справянето с репликацията между двете. Преди това се опитахме да използваме noSQL решение като основно хранилище на данни с катастрофални резултати. Изпълнението на ES във връзка с MySQL ви дава най-доброто от двата свята - последователност и безопасност на данните в SQL, с мащабируемото, ефективно пълно текстово търсене в ES.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Услугата Apache Olinge OData хвърля EdmSimpleTypeException, когато колоната в базата данни е от тип TEXT или BLOB

  2. Как да заредите динамично стойности в контекстния XML файл на Tomcat

  3. разделено със запетая поле за сравнение в mysql

  4. Селективно изтривайте предимно дублиращи се записи от MySQL

  5. как да оптимизирате тази заявка (включени са 4 mm таблици)