Mysql
 sql >> база данни >  >> RDS >> Mysql

Ефективен начин за изчисляване на процента на сходство между наборите от данни

Стандартният начин да направите това е сходството на Жакард. Ако A е наборът от цели на първия потребител и B е наборът от цели на втория потребител, сходството на Jaccard е:

#(A intersect B)/#(A union B)

Това е броят на целите, които споделят, разделен на общия брой гласове, които двамата имат заедно (като се броят цели, които споделят само веднъж). Така че, ако първият потребител има цели A={1,2,3}, а вторият потребител има цели B={2,4}, това е следното:

A intersect B = {2}
A union B = {1,2,3,4}

#(A intersect B)/#(A union B) = 1/4

Приликата на Jaccard винаги е между 0 (те нямат общи цели) и 1 (те имат еднакви цели), така че можете да получите процент, като го умножите по 100.

http://en.wikipedia.org/wiki/Jaccard_index




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Спрете MySQL да толерира множество NULL в ограничение UNIQUE

  2. Как да прехвърля моята MySQL база данни на друг компютър?

  3. Потърсете цяла таблица в mySQL за низ

  4. Показване на всички данни от MySQL таблицата в html таблица

  5. Получавам грешка Грешка при преобразуване на тип данни nvarchar в реален.