PostgreSQL
 sql >> база данни >  >> RDS >> PostgreSQL

Защо различни резултати от преброяване при последователни четения?

Освен ако Dataset се cached използвайки надеждно хранилище (стандартен cache на Spark ще ви даде само слаби гаранции) базата данни може да бъде достъпвана многократно, като всеки път показва текущото състояние на базата данни. От

виждането на различни преброявания е очаквано поведение.

Освен това, ако източникът на JDBC се използва в разпределен режим (с колона за разделяне или predicates ), тогава всяка изпълнителна нишка ще използва своя собствена транзакция. В резултат на това състоянието на Dataset може да не съответстват напълно.

Не използвайте JDBC. Можете например

  • COPY данни във файлова система и да ги заредите от там.
  • Използвайте решение за репликация по ваш избор, за да създадете реплика, предназначена за анализи, и задайте и поставете на пауза репликацията, докато използвате анализ на данните.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Разделете дадения низ и подгответе изявление за case

  2. ГРЕШКА:входните параметри след един със стойност по подразбиране също трябва да имат стойности по подразбиране в Postgres

  3. Postgres подреждане на UTF-8 символи

  4. PostgreSQL, брой редове между мин. и макс. дати

  5. Опции за мултинаемане за PostgreSQL