Database
 sql >> база данни >  >> RDS >> Database

Обединяване на файлове с данни със Statistica, част 2

В по-ранен урок, „Сливане на файлове с данни със Statistica, част 1“, ние представихме използването на Statistica за обединяване на електронни таблици. Обсъдихме режима на сливане на конкатенация. В този урок ще обсъдим два други режима:използване на имена на случаи и имена на променливи. Този урок има следните раздели:

  • Използване на имена на случаи за обединяване на файлове с данни
  • Използване на имена на променливи за обединяване на файлове с данни
  • Заключение

Използване на имена на случаи за обединяване на файлове с данни

След това ще обединим файлове с данни (електронни таблици), като съпоставим редовете (наричани още случаи ). Ако редовете имат еднакви имена на случаи, данните в редовете от двата файла с данни се обединяват. Примерните файлове с данни, които използвахме в предходната статия, не включват име на случай. Името на случая е посочено в колона 1, колоната преди колоните с данни. Използвайки същите данни като за конкатениране на файлове с данни, добавете имената на случаите (log1 към log6 ) към редове в wlslog1.sta електронна таблица, както е показано на фигура 1.


Фигура 1: Електронна таблица wlslog1

По същия начин добавете имена на случаи (log1 към log6 ) към всеки ред в wlslog2.sta , както е показано на фигура 2.


Фигура 2: Електронна таблица wlslog2

Изберете Данни>Обединяване и в Опции за сливане , изберете Режим като Съответствие на имената на регистрите , както е показано на фигура 3. Щракнете върху OK .


Фигура 3: Обединяване на wlslog1 и wlslog2

Данните в wlslog1.sta електронната таблица се обединява с данните в wlslog2.sta електронна таблица, както е показано в получената електронна таблица на фигура 4.


Фигура 4: Обединен файл

Когато се обединява чрез съвпадение на имена на случаи, всеки от файловете с данни за обединяване трябва да включва имена на случаи или грешката, показана на фигура 5, се показва.


Фигура 5: Имената на случаи се изискват при обединяване чрез съвпадение на имена на случаи

Една електронна таблица може да има повече случаи (или редове) от другата. Като пример добавете 7 ред към wlslog1.sta (виж Фигура 6). Щракнете върху Обединяване за да обедините електронните таблици.


Фигура 6: Обединете със 7-ми ред в wlslog1.sta

Обединяване чрез съпоставяне на имена на случаи с wlslog2.sta , което е същото като преди с 6 случая (реда), както е показано на Фигура 28. Електронните таблици за сливане имат несъвпадащи случаи (една електронна таблица има повече случаи от другата). Несъответстващите случаи се обединяват чрез попълване с липсващи данни по подразбиране, което предполага, че стойностите на данните са празни. В получената електронна таблица има празни липсващи данни за несъвпадащи случаи, както е показано на фигура 7.


Фигура 7: В получената електронна таблица има празни липсващи данни

Опции за сливане предоставя някои опции за Несъответстващи случаи освен попълване с липсващи данни. За да демонстрирате, използвайте електронна таблица, wlslog1.sta , с допълнителен ред и дублирано име на случай (log2 ), както е показано на Фигура 8.


Фигура 8: Електронна таблица с дублирано име на дело

Несъответстващите случаи могат да бъдат изтрити, като изберете Изтриване на случаи в Файл 1 Несъответстващи случаи , както е показано на Фигура 9. Множество случаи се коригират, като се избере „Drop File 1 multiples“. С Режим на обединяване като Съвпадение на имената на казуси , щракнете върху OK .


Фигура 9: Файл 1 Unmatched Cases>Изтриване на случаи

Получената електронна таблица има отстранени и двата проблема. Несъответстващият случай се изтрива и дублираният случай се отпада, както е показано на фигура 10.


Фигура 10: Резултатна електронна таблица с изтрит несъответстващ случай и отпаднал дублиран случай

Използване на имена на променливи за обединяване на файлове с данни

След това ще обединим електронните таблици, като съпоставим имена на променливи. Започнете с две електронни таблици, wlslog1.sta и wlslog2.sta , всяка с имената на колоните, показани на фигура 11.


Фигура 11: Имена на колони в wlslog1 и wlslog2

Добавете следните данни към wlslog1.sta .

4-8-2014-7:06:16,Notice,WebLogicServer,AdminServer,BEA-000365,
   STANDBY
4-8-2014-7:06:17,Notice,WebLogicServer,AdminServer,BEA-000365,
   RESUMING
4-8-2014-7:06:18,Notice,WebLogicServer,AdminServer,BEA-000365,
   ADMIN

wlslog1.sta електронната таблица е показана на фигура 12.


Фигура 12: Електронна таблица wlslog1.sta

Добавете следните данни към wlslog2.sta .

4-8-2014-7:06:20,Notice,WebLogicServer,AdminServer,BEA-000331,
   STARTING
4-8-2014-7:06:21,Notice,WebLogicServer,AdminServer,BEA-000365,
   STARTED
4-8-2014-7:06:22,Notice,WebLogicServer,AdminServer,BEA-000360,
   RUNNING

wlslog2.sta е показано на Фигура 13. Изберете Data>Merge както преди.


Фигура 13: Електронна таблица wlslog2.sta

В Опции за сливане , изберете Режим като Променливи за съвпадение , както е показано на Фигура 14. Изберете Файл 1 като wlslog1.sta и Файл 2 като wlslog2.sta . Редът е важен, защото електронната таблица, която трябва да се добави в долната част на другата, трябва да е Файл 2 . Запазете Критериите за съвпадение като Автоматично , който автоматично избира най-подходящите критерии за сливане. Другите опции за критерии за съвпадение са По текст , който сравнява данни чрез сравняване на текст; и Чрез числа , който сравнява данни чрез сравняване на числовите стойности. След това щракнете върху Избор за да изберете променливите за съвпадение.


Фигура 14: Режим на сливане като променливи за съвпадение

Първо изберете съвпадащи променливи за текущия файл (Файл 1). Кликнете върху Избор на всички и щракнете върху OK, както е показано на фигура 15.


Фигура 15: Избиране на променливи в текущия файл

По същия начин изберете всички променливи за файл за сливане (Файл 2) и щракнете върху OK (вижте Фигура 16).


Фигура 16: Избиране на променливи във файл за сливане

Щракнете върху OK в Опции за сливане, както е показано на Фигура 17.


Фигура 17: Обединяване с режим като променливи за съвпадение

Двете електронни таблици се обединяват чрез съвпадение на имена на променливи, както е показано на Фигура 18.


Фигура 18: Резултатна електронна таблица от обединяване чрез съвпадение на имена на променливи

При обединяване на електронни таблици чрез съвпадение на имена на променливи, стойностите на данните се сортират числово и текстово. Като пример, обединете две електронни таблици с 1 електронна таблица, показана на Фигура 19.


Фигура 19: Първа електронна таблица за сливане

Втората електронна таблица е показана на фигура 20. Добавена модификация е, че името на променливата е леко променено във файл 1:„ServerType“ вместо „servername“, „MessageCode“ вместо „code“ и „Message“ вместо „ съобщение“.


Фигура 20: Втора електронна таблица за сливане

Щракнете върху Избор, за да изберете променливите, които да се използват за съвпадение. Във файл 1 изберете всички променливи (вижте фигура 21).


Фигура 21: Избиране на съвпадащи променливи за текущ файл

Във файл 2 също изберете всички променливи, както е показано на фигура 22.


Фигура 22: Избиране на съвпадащи променливи за файл за сливане

Обединете двете електронни таблици както преди. „Име на сървъра“ или „ServerType“ е едно и също за всички редове и не допринася за сортирането на данните в получената електронна таблица. Стойностите на данните в колоната “code” или “MessageCode” се сортират като без значение за главни и малки букви; BEA-000331 е сортиран преди BEA-000360, който е сортиран преди BEA-000365. За същата стойност за код BEA-000365, данните в колоната „msg“ или „Message“ се сортират и по Текст—АДМИНИСТРИРАНЕ->ВЪЗОБНОВЯВАНЕ->В РЕЖИМ В РЕЖИМ СТАРТ—както е показано на Фигура 23.


Фигура 23: Получена електронна таблица

При избора на променливи трябва да се прилагат определени условия. За съвпадение трябва да бъде избрана поне една променлива или грешката, показана на фигура 24, ще се генерира.


Фигура 24: Трябва да бъде избрана минимум 1 променлива

Броят на избраните променливи трябва да е еднакъв във Файл 1 и Файл 2, или грешката, показана на Фигура 25, ще бъде генерирана.


Фигура 25: Същият брой променливи трябва да бъде избран в електронни таблици за обединяване

Типът данни на избраните променливи трябва да е един и същ за избраните променливи. Като пример, променливите „име на сървър“ и „ServerType“ съответно във файл 1 и файл 2 трябва да имат един и същ тип данни, или грешката, показана на фигура 26, се генерира.


Фигура 26: Типовете променливи трябва да са еднакви при сливане чрез съвпадение на променливи

Заключение

В този урок обсъдихме обединяването на файлове с данни (наричани още електронни таблици) в Statistica Platform с помощта на режими:Съпоставяне на имена на случаи и Съответствие на променливи.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Как да инсталирате и конфигурирате ClickHouse на Ubuntu 20.04

  2. Как да преименувате таблица в SQL

  3. Използване на Trace Flag 3226 за потискане на регистрирането на архивиране на регистрационни файлове

  4. Обявяване на общата наличност на SQL Secure 4.0

  5. Премахване на следата по подразбиране – част 2