Mysql
 sql >> база данни >  >> RDS >> Mysql

mySQL:Използване на разстоянието на Левещайн за намиране на дубликати в 20 000 реда

Знам поне една оптимизация, която може да намали времето за работа наполовина:

AND a.id < b.id

Това ви пречи да тествате a=1, b=2, когато вече сте тествали a=2, b=1.

Все пак ще бъде O(n^2), но не виждам как можете да направите много по въпроса.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Кой DATATYPE е по-добре да се използва TEXT или VARCHAR?

  2. mysql заявка изберете като с диакритични турски букви

  3. Бутонът за избор не публикува стойност в базата данни на MySQL

  4. Свържете Django към отдалечен mysql сървър в локална мрежа

  5. Синхронизиране на данни между MySQL и MongoDB