Database
 sql >> база данни >  >> RDS >> Database

Тенденции в ScyllaDB – Как потребителите внедряват базата данни с големи данни в реално време

ScyllaDB е разпределено хранилище за NoSQL данни с отворен код, повторно имплементирано от популярната база данни Apache Cassandra. Издадена само преди четири години през 2015 г., Scylla има средно над 220% годишен ръст на популярността според DB-Engines. Чухме много за тази нарастваща база данни от DBA общността и нашите потребители и решихме да станем спонсор на тази година Scylla Summit, за да научим повече за тенденциите на внедряване от нейните потребители. В тази публикация разбиваме ScyllaDB в облак спрямо локално внедряване, най-популярните доставчици на облак, SQL и NoSQL бази данни, използвани със ScyllaDB, повечето отнемащи време задачи за управление и защо трябва да използвате ScyllaDB срещу Cassandra.

  • ScyllaDB срещу Cassandra
  • ScyllaDB Cloud срещу ScyllaDB On-Premises
  • Най-популярните облачни доставчици за ScyllaDB
  • Бази данни, които най-често се използват със ScyllaDB
  • Най-отнемащите време задачи за управление на ScyllaDB

ScyllaDB срещу Cassandra – кое е по-добро?

Чудите се кое хранилище с широки колони да използвате за внедряванията си? Докато Cassandra все още е най-популярната, ScyllaDB се набира бързо като 7-ия най-популярен магазин с широки колони според DB-Engines. И така, какви са някои от причините, поради които потребителите биха избрали ScyllaDB срещу Cassandra?

ScyllaDB предлага значително по-ниска латентност, което ви позволява да обработвате голям обем данни с минимално забавяне. Всъщност, според доклада за сравнителния анализ на производителността на ScyllaDB, тяхната 99,9 персентилна латентност е до 11 пъти по-добра от Cassandra на AWS EC2 gole metal. Така че този тип изпълнение трябва да има цена, нали? Така е, но те твърдят в този доклад, че това е 2,5 пъти намаление на разходите в сравнение с управлението на Cassandra, тъй като те могат да постигнат тази производителност само с 10% от възлите.

Има десетки качествени статии за ScyllaDB срещу Cassandra, така че ще спрем накратко тук, за да можем да стигнем до истинската цел на тази статия, разбивайки потребителските данни на ScyllaDB .

ScyllaDB Cloud срещу ScyllaDB On-Premises

ScyllaDB може да се изпълнява както в публичния облак, така и на място. Всъщност ScyllaDB е най-популярно внедрява както в публичен облак, така и в локални среди в рамките на една организация. 44% от внедряванията на ScyllaDB, използващи както облачни, така и локални изчисления, могат да бъдат или чрез хибридна облачна среда, използваща както за конкретно приложение, така и чрез използване на тези среди поотделно за управление на различни приложения.

Разгръщанията на място на ScyllaDB и облачните внедрявания на ScyllaDB бяха мъртви дори при 28% всяко. Можете да стартирате както безплатния отворен код ScyllaDB, така и ScyllaDB Enterprise в облака или на място, а лицензът на ScyllaDB Enterprise започва от $28,8k/година за общо 48 ядра.

Кой е най-добрият начин за внедряване на #ScyllaDB? Облак срещу On-PremiseClick To Tweet

Най-популярните облачни доставчици за ScyllaDB

Тъй като 28% от клъстера ScyllaDB се разгръща изключително в облака и 72% използват облака в някакъв капацитет, ни беше интересно да видим кои доставчици на облак са най-популярни за работни натоварвания на ScyllaDB .

#1. AWS

Открихме, че 39,1% от всички облачни внедрявания на ScyllaDB се изпълняват на AWS от участниците в нашето проучване. Въпреки че очаквахме AWS да бъде доставчик на облак номер 1 за ScyllaDB, процентът беше значително по-нисък от отговорите от всички типове облачни бази данни в това проучване, които съобщават, че 55% са внедрили в AWS. Това число е в по-голяма степен в съответствие с нашия скорошен доклад за тенденциите в базата данни с отворен код за 2019 г., където се съобщава, че 56,9% от внедряванията в облак работят на AWS. Това може да се дължи на факта, че AWS не поддържа ScyllaDB чрез техните услуги за релационни бази данни (RDS), така че бихме могли да предположим, че тъй като все повече организации продължават да мигрират своите данни към ScyllaDB, AWS може да изпита спад в клиентската си база.

#2. Google Cloud

Google Cloud Platform (GCP) беше вторият най-популярен доставчик на облачни услуги за ScyllaDB, с 30,4% от всички облачни внедрявания. Google Cloud предлага собствено хранилище с широки колони и база данни с големи данни, наречена Bigtable, която всъщност е класирана на #111, една под ScyllaDB на #110 в DB-Engines. Ниската цена и възможностите за висока производителност на ScyllaDB го правят привлекателна опция за потребителите на GCP, особено след като е с отворен код в сравнение с Bigtable, който се предлага само в търговската мрежа в GCP.

#3. лазурен

Azure следва на трето място, което представлява 17,4% от всички внедрявания на ScyllaDB в облака от респондентите в нашето проучване. Azure е атрактивен доставчик на облак за организации, които използват пакета от услуги на Microsoft.

Кой облачен доставчик е най-популярен за #ScyllaDB? AWS срещу Azure срещу GCPClick To Tweet

Останалите 13,0% от облачните внедрявания на ScyllaDB бяха установени, че се изпълняват в услугите за изчисления в облак DigitalOcean, Alibaba и Tencent.

Техната управлявана услуга Scylla Cloud понастоящем е достъпна само в AWS и трябва да използвате версията ScyllaDB Enterprise, за да използвате техния DBaaS. Scylla Cloud планира да добави поддръжка за GCP и Azure в бъдеще, но с само 39% отчитане на AWS, можем да предположим, че над 60% от внедряванията на ScyllaDB се управляват самостоятелно в облака.

Бази данни, които най-често се използват със ScyllaDB

Както открихме и от доклада за база данни с отворен код за 2019 г., организациите средно използват 3.1 различни типа бази данни. Но в това проучване организациите, използващи ScyllaDB, съобщават, че използват само 2,3 различни типа бази данни средно, 26% намаление в сравнение с нашите резултати от всички потребители на база данни с отворен код. Открихме също, че 39% от внедряванията на ScyllaDB използват само ScyllaDB и не използват друг тип база данни в своите приложения.

И така, кои бази данни се използват най-често във връзка със ScyllaDB? Открихме, че потребителите на ScyllaDB също използват SQL бази данни MySQL 20% от времето и PostgreSQL 20% от времето. Втората най-често използвана база данни със ScyllaDB беше Cassandra, представена в 16% от внедряванията и можем да предположим, че това е от организации, които тестват ScyllaDB като алтернатива на Cassandra в своите приложения, тъй като и двата типа бази данни са магазини с широки колони.

MongoDB беше четвъртата най-популярно внедрена база данни със ScyllaDB с 12%. Redis и Elasticsearch бяха изравнени на пето място, като и двете бяха с ливъридж в 8% от времето с внедряването на ScyllaDB.

Открихме също, че 20% от внедряванията на Scylla използват други типове бази данни, включително Oracle, Aerospike, Kafka (която сега се трансформира в база данни за поточно предаване на събития), DB2 и Tarantool.

Най-отнемащи време задачи за управление на ScyllaDB

Знаем, че ScyllaDB е много мощен, но колко лесен е за използване? Попитахме потребителите на ScyllaDB коя е тяхната най-отнемаща време задача за управление и чухме от 28%, че Scylla Repair е най-дългата задача за управление. Scylla Repair е процес на синхронизация, който се изпълнява във фонов режим, за да се гарантира, че всички реплики в крайна сметка съхраняват едни и същи данни. Потребителите трябва редовно да изпълняват командата за ремонт на nodetool, тъй като няма начин да се автоматизират поправките във версиите с отворен код на ScyllaDB или ScyllaDB Enterprise, но можете да настроите график за ремонт чрез Scylla Manager.

Бавният анализ на заявки на ScyllaDB обвърза архивирането и възстановяването на ScyllaDB за второ място с 14% всяко за най-отнемащата време задача за управление. Не изглежда, че ScyllaDB в момента има наличен анализатор на заявки за идентифициране на заявки, които се нуждаят от оптимизиране, но потребителите могат да използват своето бавно регистриране на заявки, за да видят кои заявки имат най-дълго време за отговор. Архивите на ScyllaDB също не могат да бъдат автоматизирани чрез версиите с отворен код и корпоративните, но те заявяват, че повтарящи се архиви ще бъдат налични в бъдещите издания на Scylla Manager. Също така няма автоматизиран начин за възстановяване на резервно копие на ScyllaDB, тъй като те трябва да се извършват ръчно във всички версии.

10% от потребителите на ScyllaDB съобщават, че добавянето, премахването или подмяната на възли е най-отнемащата време задача, като е на четвърто място. Това са ръчни процеси, които могат да отнемат доста време, особено ако имате работа с голям размер на данни. Добавянето на възли се използва за мащабиране на разгръщане, докато премахването им намалява вашето разполагане. Възлите трябва да бъдат заменени, ако не работят или не работят, въпреки че клъстерът все още може да бъде наличен, когато повече от един възел не работи.

На пето място при 7% бяха надстройки и отстраняване на неизправности. ScyllaDB Enterprise и с отворен код изискват обширни стъпки за надграждане на клъстер. Препоръчителните методи са чрез непрекъсната процедура, така че няма престой, но това е ръчен процес, така че потребителят трябва да сваля един възел надолу, да изпълнява всички стъпки за надграждане, рестартира и валидира възела, преди да премине към извършване на същите стъпки за останалите възли в клъстера. Наистина отнема много време, но за щастие не е ежедневна задача! Разбира се, отстраняването на неизправности е дълбока заешка дупка, в която трябва да се потопите, но клиентите на ScyllaDB Enterprise получават 24/7 критична поддръжка, а потребителите с отворен код имат достъп до множество ресурси, включително документация, пощенски списъци, университет Scylla и свободен канал за потребителите дискусии.

Коя е най-отнемащата време задача за управление на #ScyllaDB? Щракнете за Tweet

Останалите 21% от отнемащите време задачи, докладвани от потребителите на ScyllaDB, включват наблюдение, миграции, обезпечаване, балансиране на части, уплътняване и корекция.

И така, как тези резултати се сравняват с вашите внедрявания на ScyllaDB? Търсите ли начин да автоматизирате тези отнемащи време задачи за управление? Въпреки че днес поддържаме MySQL, PostgreSQL, Redis™* и MongoDB® Database, ние винаги търсим обратна връзка за коя база данни да добавим поддръжка за следващата чрез нашите DBaaS планове. Уведомете ни в коментарите или в Twitter на @scalegridio, ако търсите по-лесен начин за управление на вашите ScyllaDB клъстери в облака или на място!


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Продължение №1 за водещи търсения с заместващи знаци

  2. SQL EXISTS оператор за начинаещи

  3. Salesforce SOQL от Windows PowerShell

  4. Специална съхранена процедура за получаване на най-новото състояние на архивиране на база данни

  5. SQL SELECT AND оператор