sql >> Database >  >> NoSQL >> MongoDB

Hoe verwijder ik de lege tweets met filter() in pyspark?

Als uw gegevens zo zijn

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

je kunt len(x) . gebruiken als de filtervoorwaarde:

tweets.filter(lambda x: len(x) > 0).count()



  1. Redis afsluiten

  2. Is GridFS snel en betrouwbaar genoeg voor productie?

  3. MongoDB-probleemoplossing op Windows (C#) (Wat te doen?)

  4. C# MongoDB LINQ gebruiken met discriminator