sql >> Database >  >> RDS >> PostgreSQL

Spark SQL 2.0:NullPointerException met een geldige PostgreSQL-query

Ik heb in plaats daarvan vergelijkbare problemen met een Teradata-gegevensbron, en het kwam erop neer dat de nullabiliteit van de kolom op het DataFrame niet overeenkwam met de onderliggende gegevens (de kolom had nullable=false, maar sommige rijen hadden null-waarden in dat specifieke veld). De oorzaak in mijn geval was dat het Teradata JDBC-stuurprogramma niet de juiste kolommetagegevens retourneerde. Ik moet hier nog een oplossing voor vinden.

Om de code te zien die wordt gegenereerd (waarbinnen de NPE wordt gegooid):

  • org.apache.spark.sql.execution.debug._ importeren
  • aanroep .debugCodegen() op de DataSet/DataFrame

Ik hoop dat dit helpt.



  1. MySQL Selecteer Top N Rijen

  2. Hoe de MATCH()-functie werkt in MySQL

  3. Groepsgegevens invullen voor een bepaalde serie op Highcharts

  4. execSQL:is bindargs beter?