Mysql
 sql >> база данни >  >> RDS >> Mysql

Spark JoinWithCassandraTable на ключа на дяла TimeStamp ЗАПЯНА

С помощта на:

sc.parallelize(startDate to endDate)

С началните данни и крайната дата като дълги, генерирани от дати във формата:

("yyyy-MM-dd HH:mm:ss")

Направих spark, за да създам огромен масив (100 000+ обекта), който да се присъедини към таблицата C* и тя изобщо не остана - C* работи усилено, за да осъществи свързването и да върне данните.

Накрая промених диапазона си на:

case class TableKey(created_dh: String)
val data = Array("2015-10-29 12:00:00", "2015-10-29 13:00:00", "2015-10-29 14:00:00", "2015-10-29 15:00:00")
val snapshotsFiltered = sc.parallelize(data, 2).map(TableKey(_)).joinWithCassandraTable("listener","snapshots_tnew")

И сега е добре.




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Neo4j език за заявки - Cypher

  2. Пивотна таблица с помощта на MySQL

  3. Как да използвате GROUP_CONCAT в CONCAT в MySQL

  4. Как да получите множество резултати от един CallableStatement?

  5. Как да json_encode масив с френски акценти?