De mongoimport
tool heeft een optie:
--jsonArray
behandel invoerbron als een JSON-array
Of het is mogelijk om te importeren uit een bestand met hetzelfde gegevensformaat als het resultaat van db.collection.find()
opdracht. Hier is een voorbeeld van courseware van university.mongodb.com, wat inhoud van grades.json
:
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb577" }, "student_id" : 0, "type" : "exam", "score" : 54.6535436362647 }
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb578" }, "student_id" : 0, "type" : "quiz", "score" : 31.95004496742112 }
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb579" }, "student_id" : 0, "type" : "homework", "score" : 14.8504576811645 }
Zoals je kunt zien, wordt er geen array gebruikt en ook geen komma-scheidingstekens tussen documenten.
Ik ontdek onlangs dat dit in overeenstemming is met the JSON Lines text
formaat.
Zoals een gebruikt in apache.spark.sql.DataFrameReader.json()
methode.