Hilfe
Ein Dataset ist der Haupteintrag in ckan. Zu einem Dataset können untergeordnet beliebig viele Data Resources, d.h. Dateien hinzugefügt werden.
Die CKAN Seite "Create Dataset" kann auf zwei Wegen aufgerufen werden:
-
von jeder Seite aus kann über den Link "Datasets" in der Menüleiste die Datasets Übersichtsseite aufgerufen werden. Auf dieser Seite kann dann über die Schaltfläche "Add Dataset" oberhalb der Suchleiste ein neues Dataset hinzugefügt werden.
-
Alternativ findet sich die Schaltfläche "Add Dataset" auch auf der Übersichtsseite einer Organization, ebenfalls oberhalb der Suchleiste
Beim Hinzufügen des Dataset fragt CKAN nachfolgende Metadaten zur Beschreibung des Datasets ab.
Hinweis: Planen Sie mehrere zusammengehörige Dateien als Dataset hochzuladen, so sollten Sie dies in der Description beschreiben. z.B. "Dieser Datensatz beschreibt das Experiment XY. Dabei wurden Messdaten zu AB, CD, ED erhoben, die in den Dateien DATEINAME2, DATEINAME3, zu finden sind."
-
Title: Der Titel ist in CKAN eindeutig und wird nur einmal vergeben, daher sollte er kurz, aber spezifisch sein. Z.B. "Messung der Oxidschichtdicke auf Aluminiumbauteil XY" ist besser als "Oxidschichtdicke ".
-
Description: Hier können Sie eine längere Beschreibung des Datensatzes hinzufügen, einschließlich Informationen wie z. B. woher die Daten stammen und alle Informationen, die für die Verwendung der Daten erforderlich sind. Versuchen Sie sich beim Verfassen der Beschreibung in die Lage eines späteren Datennachnutzers zu versetzen. Welche Informationen bräuchten Sie, um diese Daten leicht zu verstehen und nachzuvollziehen.
Hinweis: Planen Sie mehrere zusammengehörige Dateien als Dataset hochzuladen, so sollten Sie dies in der Description beschreiben. z.B. "Dieser Datensatz beschreibt das Experiment XY. Dabei wurden Messdaten zu AB, CD, ED erhoben, die in den Dateien DATEINAME2, DATEINAME3, zu finden sind."
-
Tags: Hier können Sie Tags (Schlagwörter) hinzufügen, die das Auffinden der Daten erleichtern und sie mit anderen verwandten Daten verknüpfen. Beispiele könnten sein: "Aluminium", "Kupfer", "Silan". Drücken Sie die Taste zwischen den Tags. Wenn Sie ein Schlagwort falsch eingegeben haben, können Sie es mit der Schaltfläche "Löschen" entfernen, bevor Sie den Datensatz speichern.
-
License: ist es wichtig, Lizenzinformationen anzugeben, damit spätere Nutzer wissen, wie sie die Daten verwenden können. Wir empfehlen die Verwendung der Creative Commons Attribution License (cc-by). http://opendefinition.org/licenses/cc-by/
-
Visibility: Öffentlich (jedes SFB Mitglied kann den Datensatz sehen) ODER Privat (nur die Mitglieder der Organization, d.h. ckan-Nutzer, die ihrem Institut zugeordnet sind)
-
Source: URL des Datensatzes (wenn dieser nicht in ckan hochgeladen wird, sondern woanders abgelegt wurde) (Beispiel: http://www.example.com/dataset.json)
-
Version: Version des Datasets. Wenn Sie nachträglich die Metadaten ändern odereine weitere Datei als data resource hinzufügen / entfernen, können Sie eine neue Version vergeben
-
Author Name and Email: Sie haben die Möglichkeit zwischen dem Datenerzeuger und Daten-Kurator (Person die Daten hochgeladen hat) zu differenzieren
-
Maintainer Name and Email: Sie haben die Möglichkeit zwischen dem Datenerzeuger und Daten-Kurator (Person die Daten hochgeladen hat) zu differenzieren
-
Custom field(s): Möglichkeit individuelle Metadaten als Key, Value einzutragen
Hinweis: Das einzige Pflichtfeld ist der Titel des Datensatzes. Es ist jedoch eine gute Praxis, Beschreibung, Lizenz und Tags anzugeben.
Hinweis: Wenn Sie auf die Schaltfläche "Next: Add Data" klicken, speichern Sie den Datensatz. Sie können die Daten im nächsten Schritt hinzufügen. Weitere Informationen finden Sie im nächsten Abschnitt.
Dateien gehören immer zu einem Dataset. Daher ist zuerst ein Dataset anzulegen, in dessen Verlauf eine Datei hochgeladen wird. Man kann auch später noch eine Datei einem Dataset hinzufügen.
Nach Eingabe der Metadaten zu einem Dataset erfolgt im nächsten Schritt das Hochladen der zugehörigen Dateien. Alternativ kann auch der Link auf eine Datei angegegeben werden, die bereits andernorts im Netz abgelegt wurde.
-
Dateien können durch Drag&Drop in die Ablagefläche des Upload-Formulares hochgeladen werden
-
Dateien können durch Anklicken der Schaltfläche "Upload" und Auswahl aus den Verzeichnissen des Computers hochgeladen werden
-
Alternativ kann ein Link auf eine Datei durch Anklicken der Schaltfläche "Link" und Angabe einer URL bereit gestellt werden
Hinweis: Sie können für jede Datei eine Beschreibung eingeben. Falls Sie mittels Drag&Drop mehrere Dateien auf einmal hochladen, wird für alle Daten dieselbe Beschreibung verwendet. Sie können diese später bei Bedarf durch Bearbeiten des Datasets individuell anpassen.
Sie können von Ihnen angelegte Datasets nachträglich bearbeiten. Rufen Sie dazu die Ansicht des Datasets auf und klicken Sie im oberen rechten Bereich der Seite auf die Schaltfläche "Manage". Sie können dann die Metadaten des Datasets anpassen.
Hinweis: Wenn Sie umfangreiche Änderungen am Dataset durchführen und z.B. Data Resources ändern, hinzufügen oder entfernen empfiehlt es sich dies im Eingabefeld Version durch z.b. Version 1.1 auszudrücken.
Sie können eine Data Resource (Datei) auf zwei Arten bearbeiten::
- Klicken Sie auf der Seite des Datasets auf die Schaltfläche "Explore" neben dem Titel der Datenressource. In der eingeblendeten Auswahlliste klicken Sie dann auf "Edit".
- Klicken Sie auf der Seite des Datasets auf den Titel der Datenressource. Auf der Detailseite der Daten Resource klicken Sie im oberen rechten Fensterbereich auf "Manage"
Sie können dann alle Metadatenfelder, u.a. auch die Beschreibung, der Data Resource bearbeiten
Hinweis: Sie können die Geräteverknüpfungen für Data Resources auf der Seite Datasets bearbeiten. (Dataset--> Schaltfläche "Manage" --> unter der Registerkarte "Equipment")
Die Nutzung des ckan Daten Repositories ist auf Mitglieder des SFB beschränkt. Vor der ersten Benutzung erscheint eine Login-Seite.
Darüberhinaus kann ein Data Set drei Einstellungen der Sichtbarkeit haben
- Public: Jedes Mitglied des SFB kann das Dataset sehen und auf die Dateien zugreifen.
- Private: Nutzer, die derselben ckan-Organisation (Institut) zugeordnet sind, können das Dataset sehen und auf die Dateien zugreifen.
- Private with collaborator(s): Das Dataset ist privat, aber eine Anzahl von Kooperationspartner außerhalb Ihrer ckan-Organisation (Institut) hat Zugriff.
Hinweis: Mit der Lizenz geben Sie die Nutzungsbedingungen für Ihre Daten an. Im Falle eines öffentlichen Daten Repositoriums bedeutet z.B. CC-BY, dass Nachnutzer Ihren Datensatz zitieren müssen.
Wenn ein Data Set privat ist, können nur Personen innerhalb Ihrer Organisation darauf zugreifen. Wenn Sie externen Nutzern Zugang gewähren möchten, können Sie sie als Kooperationspartner hinzufügen.
Um Kooperationspartner hinzuzufügen, öffnen Sie die Seite des betreffenden Datasets zur Bearbeitung und fügen Sie Kooperationspartner auf der Registerkarte Collaborators hinzu. Ein Kooperationspartner kann folgende Rollen und Rechte haben:
- Member: sieht den Datensatz nur
- Editor: kann den Datensatz sehen und bearbeiten
Sie können Ihrem Data Set eine Referenz auf eine Literaturquelle, z.b. die Publikation in der der Datensatz verwendet wird, hinzufügen. Die Referenz kann aber auch eine andere Veröffentlichung oder ein anderer Datensatz sein.
Um eine Referenz hinzuzufügen, gehen Sie zum Data Set und klicken Sie auf die Schaltfläche "Add Reference" im oberen rechten Bereich der Seite. Die Referenz wird auf der Seite des Datensatzes oberhalb der Tabelle zusätzliche Informationen" angezeigt.
Sie können eine Referenz auf drei Arten hinzufügen:
- Angabe einer Doi-URL / ID
- Bibtex-Zitierdaten
- Manuell
Ckan unterstützt zwei Suchmodi:
- Einfache Suche
- Erweiterte Suche
Regel einfache Suche::
-
Die Suchbegriffe sind standardmäßig optional
Beispiel: Sauerstoff → alle Datensätze, die das Wort "Sauerstoff" enthalten -
Obligatorisches Wort → +
Bsp: oxygen +free → Datensätze, die "oxygen" enthalten und das Wort "free" enthalten müssen -
Verbotenes Wort → -
Bsp: oxygen -free → Datensätze, die "oxygen" enthalten und diejenigen mit dem Wort "free" ausschließen -
Phrase → " "
Bsp: "sauerstofffrei" → Datensätze, die "sauerstofffrei" als Phrase enthalten -
Stemming. Die Ckan-Suchmaschine (Solr) verwendet Stemming für eine Suchanfrage
Beispiel: Suche nach "produce" sucht auch nach "producing" und "production" -
ckan unterstützt KEINE Wildcard-Suche
Regeln erweiterte Suche::
-
Die erweiterte Suche wird aktiviert, wenn der Benutzer einen Doppelpunkt in der Suchanfrage verwendet
title:Chemie → alle Datensätze, die das Wort "Chemie" im Titel haben -
Platzhaltersuche → *
title:chem* → alle Datensätze, die Wörter enthalten, die mit "chem" beginnen, z. B. "Chemistry" oder "Chemical" -
OR → ||
title:chemistry || title:bio → alle Datensätze, die das Wort "chemistry" ODER "bio" im Titel haben -
Annäherung → ~
title: "chemistry bio" ~ 4 → alle Datensätze, die das Wort "chemistry" und "bio" in ihrem Titel mit 4 Wörtern dazwischen enthalten (chemistry XX AA BB KK bio) -
Unscharfe Suche auf der Grundlage der Levenshtein-Distanz:
author: powell~ → sucht nach Wörtern, die einen geringen Abstand zum Suchbegriff haben, wie "jowell" oder "pomell"