Kā vizualizēt sarežģītus datus Linux

Satura rādītājs:

Anonim

Jūs, iespējams, esat dzirdējuši par Elasticsearch - meklētājprogrammu, kas ļauj indeksēt un pēc tam ātri meklēt datus. Iespējams, esat izveidojis dažas vizualizācijas Kibanā, Elasticsearch GUI, norādot un noklikšķinot uz gludā interfeisa.

Iespējams, ka neesat izmantojis mazāk pazīstamu vizualizācijas spraudni ar nosaukumu Timelion.

Timelion ir fantastisks vizualizācijas veidošanas rīks, kas ļauj rakstīt vaicājumus vienkāršā un spēcīgā izteiksmes valodā, lai parādītu grafikus. To izmanto, lai parādītu laikrindu datus, piemēram, populācijas pieaugumu vai trāpījumus jūsu vietnē.

  • Šeit ir saraksts ar labākajiem izstrādātājiem paredzētajiem klēpjdatoriem
  • Pārbaudiet šos labākos izstrādātāju rajonus
  • Šajās labākajās darbstacijās viegli grieziet numurus
Par šo rakstu

Šis raksts pirmo reizi parādījās Linux formāta žurnālā Nr. 269, kas publicēts 2022-2023. gada novembrī.

Izmantojot Timelion, mēs varam aprēķināt slīdošos vidējos rādītājus, parādīt starpību starp pagājušās nedēļas un šodienas datiem un veikt dažas pamata anomāliju noteikšanas. Tas ir noderīgs rīks, lai uzzinātu, kā strādāt. Sāksim.

Uzstādīšana

Ja esat parasts Linux formāta lasītājs, ir docker sastādīšanas piemēri klastera iestatīšanai LXF261.

Pretējā gadījumā Elasticsearch un Kibana instalēšana ir samērā vienkārša. Vienīgā prasība ir Java, kuru, iespējams, jau esat instalējis.

Ja tas nav vienkāršs, sudo apt install default-jre to instalē Debian balstītos distros vai sudo dnf install java vajadzētu darīt to pašu Red Hat distros saimei.

Tad jums vienkārši jālejupielādē jaunākā Elasticsearch un Kibana versija jūsu vēlamajai operētājsistēmas gaumei.

Rakstīšanas laikā jaunākā versija ir kibana-7.8.1-linux-x86_64.tar.gz.

Varat to iegūt ar tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, pārslēgties uz izvilkto direktoriju un palaist ./bin/kibana &, lai aktivizētu Kibana instanci.

Kad esat izdarījis tieši tās pašas darbības, lai iestatītu Elasticsearch, aizstājot “kibana” par “elasticsearch”, jums vajadzētu būt iespējai savā iecienītākajā pārlūkprogrammā pāriet uz vietni http: // localhost: 5601 un redzēt jaunu, spīdīgu Kibana interfeisu apkārt ar.

Ja vēlaties instalēt paketes ar pakotņu pārvaldnieku, tajā pašā saitē kā iepriekš ir informācija par Elastic repo pievienošanu jūsu sistēmai un Kibana un Elasticsearch pakotņu instalēšanu šādā veidā.

Jūs varat uzlikt diagrammas viena virs otras un izmantot formatējumu, lai diagrammas izskatītos pēc iespējas labāk.

Iegūstiet dažus datus

Jaunākās Kibana versijas ļauj automātiski ievadīt datu kopas mūsu klasterī, izmantojot Data Visualizer, nevis jāizveido skripts vai Logstash konfigurācija. Tas var tikt galā ar datu kopām JSON vai CSV formātā, kā arī ar dažiem standarta žurnāla failiem, piemēram, Apache žurnāliem. Vienīgais ierobežojums ir tāds, ka to lielums ir mazāks par 100 MB. Tas ir vairāk nekā pietiekami mūsu mērķiem.

Mēs izmantosim Covid-19 lietu globālo datu kopu no ES atvērto datu portāla. Mēs lejupielādējām CSV failu no lapas sadaļas Resursi.

Ja jums ir problēmas, varat izvēlēties lejupielādēt Excel .xlsx versiju, atvērt ar LibreOffice Calc un saglabāt to kā teksta CSV (.csv) formātu. Lejupielādei ir pieejama arī JSON versija, kuru varat izmantot kā alternatīvu.

Lai nokļūtu Datu vizualizatorā Kibanā, augšējā kreisajā stūrī noklikšķiniet uz hamburgera ikonas, pēc tam - Machine Learning un visbeidzot - Data Visualizer. Kad datu importēšanas lodziņā noklikšķiniet uz Augšupielādēt failu, pēc tam atlasiet vai velciet un nometiet failu un izvēlieties uzņemamo csv failu.

Pēc nelielas īsas analīzes tas parādīs statistiku, kas atklāta no CSV faila pirmajām 1000 rindām. Tas būs formāts, kādā, pēc viņa domām, ir katrs lauks, piemēram, teksts, datums vai numurs, un izceliet laukos atrastās galvenās vērtības.

Parasti tas mums labi izdodas to izdomāt. Ja jums vajadzēja veikt kādas korekcijas, varat noklikšķināt uz Ignorēt iestatījumus, lai labotu, piemēram, lauka nosaukumu, kā tas tiks iestatīts Elasticsearch.

Viens lauka nosaukums, kuru mums vajadzētu ignorēt, ir dateRep, kas apzīmē aprēķinātā skaitļa datumu mūsu datu kopā. Timelion nezinās, kā to pēc noklusējuma izmantot kā laika lauku, tāpēc mēs vēlāk varam vienkāršot savu dzīvi, pārdēvējot šo lauku tagad par kaut ko tādu, ko tā atpazīs.

Labs kandidāts ir laika zīmogs. Noklikšķiniet uz Lietot, lai to iestatītu. Kad esat apmierināts ar to, kā izskatās pārējais, apakšdaļā noklikšķiniet uz Importēt, norādiet indeksam nosaukumu - mēs izvēlējāmies covid - un pēc tam vēlreiz noklikšķiniet uz Importēt, lai datus ievadītu savā kopā.