PostgreSQL
 sql >> база данни >  >> RDS >> PostgreSQL

SparkSQL PostgresQL Dataframe дялове

По същество долната и горната граница и броят на дяловете се използват за изчисляване на увеличението или разделянето за всяка паралелна задача.

Да приемем, че таблицата има разделителна колона „година“ и има данни от 2006 до 2016 г.

Ако определите броя на дяловете като 10, с долна граница 2006 и по-висока граница 2016, всяка задача ще извлича данни за собствената си година – идеалният случай.

Дори ако неправилно посочите долната и/или горната граница, напр. задайте по-ниска =0 и по-висока =2016, ще има изкривяване в трансфера на данни, но няма да „загубите“ или да не успеете да извлечете каквито и да е данни, защото:

Първата задача ще извлече данни за година <0.

Втората задача ще извлече данни за година между 0 и 2016/10.

Третата задача ще извлече данни за годината между 2016/10 и 2*2016/10.

...

И последната задача ще има условие where с година->2016.

Т.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Извличане на секунди от таблицата с интервали / Прехвърляне на запис към интервал?

  2. Създайте голямо цяло число от големия край на uuid в PostgreSQL

  3. „Твърде много връзки“, създадени в postgres при създаване на табло за управление в Pentaho

  4. ГРЕШКА:трябва да бъде член на роля при създаване на схема в PostgreSQL

  5. Как да направя запитване за дължината на Django ArrayField?