MongoDB
 sql >> база данни >  >> NoSQL >> MongoDB

Повторно вземане на проби от времеви редове с помощта на Javascript и Mongodb

Донякъде е възможно. Имайте предвид, че Pandas е библиотека, създадена изрично за този вид задачи, и е звяр в това, докато MongoDB е предназначена да бъде база данни. Но има големи шансове следното да отговаря на вашите нужди, ако пренебрегнете вероятната си нужда от използване на интерполация:

Ако приемем, че имате следните данни, съхранени в колекция MongoDB, наречена devices

/* 0 */
{
    "_id" : ObjectId("543fc08ccf1e8c06c0288802"),
    "t" : ISODate("2014-10-20T14:56:44.097+02:00"),
    "a" : "192.168.0.16",
    "i" : 0,
    "o" : 32
}

/* 1 */
{
    "_id" : ObjectId("543fc08ccf1e8c06c0288803"),
    "t" : ISODate("2014-10-20T14:56:59.107+02:00"),
    "a" : "192.168.0.16",
    "i" : 14243,
    "o" : 8430
}

and so on...

което в този случай се взема на около всеки 15 секунди, но може и да е нередовно. Ако искате да го преобразувате до граница от 5 минути за определен ден, тогава трябва да направите следното:

var low = ISODate("2014-10-23T00:00:00.000+02:00")
var high = ISODate("2014-10-24T00:00:00.000+02:00")
var interval = 5*60*1000;
db.devices.aggregate([
  {$match: {t:{$gte: low, $lt: high}, a:"192.168.0.16"}},
  {$group: {
     _id:{
       $subtract: ["$t", {
         $mod: [{
           $subtract: ["$t", low]
         }, interval]
       }]
     },
     total: {$sum: 1},
     incoming: {$sum: "$i"},
     outgoing: {$sum: "$o"},
    }
  },
  {
    $project: {
      total: true,
      incoming: true,
      outgoing: true,
      incoming_avg: {$divide: ["$incoming", "$total"]},
      outgoing_avg: {$divide: ["$outgoing", "$total"]},
    },
  },
  {$sort: {_id : 1}}
])

Това ще доведе до нещо подобно

{
    "result" : [ 
        {
            "_id" : ISODate("2014-10-23T07:25:00.000+02:00"),
            "total" : 8,
            "incoming" : 11039108,
            "outgoing" : 404983,
            "incoming_avg" : 1379888.5,
            "outgoing_avg" : 50622.875
        }, 
        {
            "_id" : ISODate("2014-10-23T07:30:00.000+02:00"),
            "total" : 19,
            "incoming" : 187241,
            "outgoing" : 239912,
            "incoming_avg" : 9854.78947368421,
            "outgoing_avg" : 12626.94736842105
        }, 
        {
            "_id" : ISODate("2014-10-23T07:35:00.000+02:00"),
            "total" : 17,
            "incoming" : 22420099,
            "outgoing" : 1018766,
            "incoming_avg" : 1318829.352941176,
            "outgoing_avg" : 59927.41176470588
        },
        ...

Ако искате да отхвърлите общото входящо, тогава просто оставете линията навън в етапа $project. Incoming_average е само пример за това как да изчислите средната стойност, в случай че вашите съхранени данни са нещо подобно на това, което rrdtool наименува на габарит (температура, процесор, данни от сензора). Ако търсите само сумата, агрегирана в този интервал от време, което е входящото и изходящото поле, тогава можете да оставите целия етап $project извън него. Той е там само за изчисляване на средната стойност на интервала от време.

Вижте Mongo агрегиране на ISODate в 45-минутни части




  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Mongo $exists заявката не връща правилни документи

  2. MongoCursorTimeoutException за агрегатна функция

  3. Как да представим масив със смесени типове

  4. Деактивирайте филтрирането на стоп думи в текстово търсене на MongoDB

  5. mongoose geojson в схема, Грешка в гео ключовете не може да се извлече