Sie haben wahrscheinlich schon von Elasticsearch gehört - der Suchmaschine, mit der Sie Ihre Daten indizieren und dann schnell durchsuchen können. Möglicherweise haben Sie einige Visualisierungen in Kibana, der GUI für Elasticsearch, erstellt und zeigen und klicken sich durch die elegante Benutzeroberfläche.
Was Sie möglicherweise nicht verwendet haben, ist ein weniger bekanntes Visualisierungs-Plugin namens Timelion.
Timelion ist ein fantastisches Tool zur Erstellung von Visualisierungen, mit dem Sie Ihre Abfragen in seiner einfachen und leistungsstarken Ausdruckssprache schreiben können, um Diagramme anzuzeigen. Es wird zum Anzeigen von Zeitreihendaten wie Bevölkerungswachstum oder Zugriffen auf Ihre Website verwendet.
- Hier ist eine Liste der besten Laptops für Entwickler
- Überprüfen Sie diese besten Distributionen für Entwickler
- Mit diesen besten Workstations können Sie mühelos Zahlen knacken
Dieser Artikel erschien erstmals im Linux Format Magazine, Ausgabe Nr. 269, veröffentlicht im November 2022-2023.
Mit Timelion können wir gleitende Durchschnitte berechnen, die Differenz zwischen den Daten der letzten Woche und heute anzeigen und einige grundlegende Anomalieerkennungen durchführen. Es ist ein nützliches Werkzeug, um zu wissen, wie man damit arbeitet. Lass uns anfangen.
Installation
Wenn Sie ein normaler Linux-Format-Reader sind, gibt es Docker-Kompositionsbeispiele zum Einrichten eines Clusters in LXF261.
Ansonsten ist die Installation von Elasticsearch und Kibana relativ einfach. Die einzige Voraussetzung ist Java, das Sie möglicherweise bereits installiert haben.
Wenn nicht, installiert eine einfache sudo apt-Installation default-jre sie auf Debian-basierten Distributionen, oder eine sudo dnf-Installations-Java sollte dasselbe für die Red Hat-Familie von Distributionen tun.
Dann müssen Sie nur noch die neueste Version von Elasticsearch und Kibana herunterladen, um die gewünschte Betriebssystemversion zu erhalten.
Zum Zeitpunkt des Schreibens ist die neueste Version kibana-7.8.1-linux-x86_64.tar.gz.
Sie können es mit tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz extrahieren, in das extrahierte Verzeichnis wechseln und ./bin/kibana & ausführen, um die Kibana-Instanz zu starten.
Wenn Sie genau die gleichen Schritte zum Einrichten von Elasticsearch ausgeführt haben und "kibana" durch "elasticsearch" ersetzt haben, sollten Sie in Ihrem bevorzugten Browser zu http: // localhost: 5601 navigieren und eine glänzende neue Kibana-Oberfläche zum Spielen sehen können herum mit.
Wenn Sie Pakete lieber mit einem Paketmanager installieren möchten, finden Sie unter demselben Link wie zuvor Informationen zum Hinzufügen des Elastic-Repos zu Ihrem System und zum Installieren der Kibana- und Elasticsearch-Pakete auf diese Weise.
Sie können Diagramme übereinander legen und mithilfe der Formatierung Ihre Diagramme optimal aussehen lassen.Holen Sie sich einige Daten
Neuere Versionen von Kibana ermöglichen es, Datensätze mit dem Data Visualizer automatisch in unseren Cluster aufzunehmen, anstatt ein Skript oder eine Logstash-Konfiguration erstellen zu müssen. Es kann Datensätze im JSON- oder CSV-Format sowie einige Standardprotokolldateien wie Apache-Protokolle verarbeiten. Die einzige Einschränkung besteht darin, dass sie weniger als 100 MB groß sind. Dies ist mehr als genug für unsere Zwecke.
Wir werden den weltweiten Covid-19-Falldatensatz aus dem EU Open Data Portal verwenden. Wir haben die CSV-Datei aus dem Bereich Ressourcen der Seite heruntergeladen.
Wenn Sie Probleme haben, können Sie stattdessen die Excel-XLSX-Version herunterladen, mit LibreOffice Calc öffnen und als CSV-Format (CSV) speichern. Es steht auch eine JSON-Version zum Download zur Verfügung, die Sie alternativ verwenden können.
Um zum Datenvisualisierer in Kibana zu gelangen, klicken Sie oben links auf das Hamburger-Symbol, dann auf Maschinelles Lernen und schließlich auf Datenvisualisierer. Klicken Sie dort im Feld Daten importieren auf Datei hochladen, wählen Sie eine Datei aus, ziehen Sie sie und legen Sie sie ab.
Nach einer kurzen Analyse werden einige Statistiken angezeigt, die aus den ersten 1.000 Zeilen der CSV-Datei ermittelt wurden. Dies ist das Format, in dem sich die einzelnen Felder befinden, z. B. Text, Datum oder Nummer, und die in den Feldern gefundenen Spitzenwerte werden hervorgehoben.
Normalerweise macht es einen guten Job, dies für uns herauszufinden. Wenn Sie Anpassungen vornehmen müssen, können Sie zum Ändern auf Einstellungen überschreiben klicken, z. B. auf den Namen des Felds, wie er in Elasticsearch festgelegt wird.
Ein Feldname, den wir überschreiben sollten, ist dateRep, das das Datum für die berechnete Zahl in unserem Datensatz darstellt. Timelion weiß nicht, wie dies standardmäßig als Zeitfeld verwendet werden soll. Daher können wir unser Leben später vereinfachen, indem wir dieses Feld jetzt in etwas umbenennen, das es erkennt.
Ein guter Kandidat ist Zeitstempel. Klicken Sie auf Übernehmen, um dies festzulegen. Wenn Sie mit dem Rest zufrieden sind, klicken Sie unten auf "Importieren", geben Sie dem Index einen Namen - wir haben covid ausgewählt - und klicken Sie dann erneut auf "Importieren", um die Daten in Ihren Cluster zu übertragen.