sql >> Database >  >> RDS >> Mysql

Hoe converteer ik een 500GB SQL-tabel naar Apache Parquet?

Apache Spark kan hiervoor worden gebruikt:

1.load your table from mysql via jdbc
2.save it as a parquet file

Voorbeeld:

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = spark.read.jdbc("YOUR_MYSQL_JDBC_CONN_STRING",  "YOUR_TABLE",properties={"user": "YOUR_USER", "password": "YOUR_PASSWORD"})
df.write.parquet("YOUR_HDFS_FILE")


  1. JDeveloper gebruiken met MySQL Database en Oracle Database op AWS RDS, deel 3

  2. Optimaliseer PostgreSQL voor snel testen

  3. Veroorzaakt door:java.time.DateTimeException:Conflict gevonden:veld DayOfWeek 6 verschilt van DayOfWeek 2 afgeleid van 30-01-2016

  4. SQL-groep op datumbereik