MongoDB
 sql >> база данни >  >> NoSQL >> MongoDB

Как да премахна празните туитове с помощта на filter() в pyspark?

Ако вашите данни са като тези

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

можете да използвате len(x) като условието на филтъра:

tweets.filter(lambda x: len(x) > 0).count()



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Spring Data mongo за вмъкване на нулеви стойности в DB

  2. MongoDB $lookup стойност обратно в масив

  3. Кое трябва да бъде сингълтон в едно приложение? MongoClient или MongoDatabase или MongoCollection?

  4. Неразпознато поле:грешка „ntoreturn“ в documenDB

  5. Неуспешно удостоверяване на MongoDB Atlas на Python