Mysql
 sql >> база данни >  >> RDS >> Mysql

Как да конвертирате 500GB SQL таблица в Apache Parquet?

Apache Spark може да се използва за това:

1.load your table from mysql via jdbc
2.save it as a parquet file

Пример:

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = spark.read.jdbc("YOUR_MYSQL_JDBC_CONN_STRING",  "YOUR_TABLE",properties={"user": "YOUR_USER", "password": "YOUR_PASSWORD"})
df.write.parquet("YOUR_HDFS_FILE")


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Намерете знака % в заявка LIKE

  2. Как да инсталирате MySQL на CentOS 6

  3. Заявката за MySQL Insert не работи с клауза WHERE

  4. Как е получена тази логика на записите/разклоненията за случая без статистически данни в MySQL Query Planner?

  5. В MySQL:Как да предам име на таблица като аргумент за съхранена процедура и/или функция?