Archiv für die Kategorie ‘Wissenschaft’

Konferenzzusammenfassung

Montag, 15. Juni 2009

Konferenzzusammenfassung

 

Citing data – the dataverse network project

Sonntag, 02. November 2008

Heute mal ein sehr kurzer, oberflächlicher, aber doch sehr wichtiger Beitrag über ein Projekt, das sich mit dem folgenden Problem beschäftigt:

Für Artikel und Bücher existieren

  • Bibliotheken und Online-Archive,
  • Systematiken und Kataloge, um schnell das Gesuchte zu finden,
  • sowie Regeln zum Zitieren.

Quantitative Daten

  • finden sich eventuell auf den Webseiten einzelner Forscher,
  • jedoch ist die Erlaubnis zur Verwendung oft unklar,
  • URLs veralten schnell oder die Daten verschwinden ganz nach einiger Zeit,
  • Formate sind eventuell inkompatibel,
  • Änderungen an Daten können nicht nachvollzogen werden bzw. Daten sind nicht verifizierbar.
  • Und wie zitiert man solche Daten?
Auch bzw. gerade für vertrauliche oder gesetzlich geschützte Daten gilt es diese Probleme zu lösen.

UNF

Um die Validität von Daten zu gewährleisten, wurde der Universelle Numerische Fingerabdruck (UNF) von Altman & King eingeführt. Dieser Algorithmus wandelt den Datensatz in einen Unicode-Zeichen-String um und wendet eine Hash-Funktion auf diesen an.

Neben C++-Bibliotheken steht auch das R-Package UNF ``Tools for creating universal numeric fingerprints for data'' zur Verfügung. (http://cran.r-project.org/web/packages/UNF/index.html)

Der Methodenaufruf unf(data, digits=8) berechnet z.B. einen numerischen Fingerabdruck für den Datensatz data, wobei die jeweils ersten acht Stellen der Daten berücksichtigt werden.

Der Universelle Numerische Fingerabdruck

  • lässt Anderungen an Daten erkennen.
  • ist formatunabhängig. Direkt auf Dateien angewendete kryptographische Hash-Funktionen würden im Gegensatz zu ihm für einen Datensatz als SAS Datei andere Werte liefern als für R Binary oder CVS Dateien. (Noch schlimmer wenn in den Dateien wie bei Excel nicht nur die reinen Daten, sondern auch noch Zugriffszeiten oder Pfadangaben gespeichert werden...)
  • ist robust gegen insignifikante Rundungsfehler, also insbesondere plattformunabhängig.
  • zeigt ebenso falsch eingelesene Daten in Statistikprogrammen auf.
Quelle: Reference Manual des Packages UNF.

Zitieren von Daten

Minimal werden beim Zitieren Autor, Jahr und Titel angegeben, gefolgt von einem ``Unique global identifier'', über den die Daten gefunden werden können, sowie den UNF-Wert:

GARY KING; LANGCHE ZENG, 2006, "Replication Data Set for 'When Can History be Our Guide? The Pitfalls of Counterfactual Inference'" hdl:1902.1/DXRXCFAWPK UNF:3:DaYlT6QSX9r0D50ye+tXpA== Murray Research Archive [distributor]

Optionale Zitatelemente wie [producer] oder [distributor] können durch Paare ``Wert [Feldname]'' angehängt werden.

TheData.org

Für das Halten der Daten ist die Dataverse Network OpenSource-Software (http://thedata.org/) frei verfügbar. Als Web Applikation wird für die meisten jedoch kein Grund vorhanden sein, die Software lokal zu installieren, sondern man meldet ein eigenes, sogenanntes "Dataverse" bei einem der Data Repositories an.

Dataverse Überblick

  • Das eigene Dataverse lässt sich unproblematisch in die eigene Homepage unter Berücksichtung des Designs einbauen.
  • Die Daten werden persistent, zitatfähig und
  • automatisch in verschiedenen Datenformaten zur Verfügung gestellt.
  • Für jeden Datensatz können Nutzungsbedingungen festgelegt werden.
  • Eine Auswahl statistischer Methoden kann online auf die Daten angewendet werden.

Bibliography

Altman & King2007

Altman, M., & G. King. 2007. A Proposed Standard for the Scholarly Citation of Quantitative Data. D-Lib 13(3/4), http://dlib.org/dlib/march07/altman/03altman.html

Projekt vorbei

Montag, 14. Juli 2008

Das große Projekt bei uns am Institut ist nun vorbei.

Unser GUI

Vorstellen werden wir das Framework des GUI-Teilprojektes unter dem Titel “Towards a Java Framework for Rapid Development of Graphical User Interfaces for Statistical Applications based on R” auf der UseR im August.

Jemand Interesse?

Die Hilfe

Wer kommt uns besuchen?

Dienstag, 01. Juli 2008

Wer von den Statistikern kommt uns nächsten März in Hannover besuchen?

Flyer

Macht euch keine Mühe, die Domain auf dem Flyer ins Adressfeld einzugeben – soweit sind wir noch nicht… ;-)

Friedhof des Lichts – wenn Photonen sterben

Donnerstag, 21. Februar 2008

Friedhof des Lichts

Ich erinnere mich an folgendes Gespräch zweier Physik-Erstsemestler in der Mensa über Photonen:

Ich finde es immer noch unglaublich, dass Photonen keine Ruhemasse besitzen. Dass heißt, wenn man sie anhält, sind sie einfach weg?

Das ist auch gut so. Stell dir mal vor, hier auf den Mensatischen würden all die Unmengen von Photonen aus den darüberhängenden Lampen rumliegen…

Arena-Versuche

Sonntag, 14. Oktober 2007

Marcus sollte seine Berufswahl nochmal überdenken.

Haben wir früher immer gescherzt, dass er die meisten Insekten zwar nicht benennen konnte, jedoch genau wusste wie sie vom Kampfverhalten her einzuordnen waren (“Zwei kleine rote Ameisen schaffen eine schwarze Ameise.”, “Die Spinne schafft locker den grünen Käfer.”), so habe ich von meinem Zimmernachbarn in der Biostatistik erfahren, dass sie tatsächlich im Gartenbau sogenannte “Arena-Versuche” durchführen, wo Nützlinge gegen Schädlinge antreten.

Seine Ausführungen, dass sie kleine Amphitheater aufbauen und die Bänke mit Blattläusen besetzen, mögen etwas übertrieben sein, aber es scheint wirklich sowas bei denen zu geben… ;-)

Blattläuse

Also Marcus, das ist doch sicher viel mehr deine Bestimmung als das Dasein als Elektrotechniker.

Warum immer gerade dann?

Montag, 17. September 2007

Nein, im Endeffekt haben weder der Computerausfall, noch das eine fehlerhafte Programmupdate viel Mitverschulden an dem Stress in der letzten Woche. Es war reine Prioritätenverteilung im Vorfeld von mir – vielleicht manchmal eine unvernünftige, aber so war es und so waren die Umstände nunmal.

Würde ich alles auf kleinere äußere Umstände schieben, müsste ich zu den Günstigen sonst bemerken, dass der von mir regelmäßig gelesene Webcomic Order of the Stick immerhin extra in dieser Zeit eine Schaffungspause durchlief, um mich nicht von den wichtigen Dingen abzulenken… ;-) Heute ist der erste neue Comic wieder da.

Und nein, ich glaube aber nicht, dass etwas “immer gerade dann” passiert, wenn man es gerade besonders oder auch gerade besonders nicht brauchen kann. Man merkt sich halt nur diese Fälle und beachtet alle anderen nicht im außreichenden Maße.

Wer dieses Phänomen viel ausführlicher und unterhaltsamer dargestellt lesen möchte, sollte in das Buch “Was soll das alles?” schauen, in welchem die Niederschriften dreier Vorlesungen einer Reihe von Richard Feynman veröffentlicht wurden (- und zwar dort in die dritte Vorlesung “Unser unwissenschaftliches Zeitalter“).

Nichtnewtonsche Flüssigkeit oder Shoggies im Eigenbau

Montag, 30. Juli 2007

Ich stolperte über folgendes Video, das zeigt, wie Normalmenschen über eine Flüssigkeit laufen können:

Von http://www.youtube.com/watch?v=f2XQ97XHjVw

Was mag das für eine besondere Zauberflüssigkeit sein?

Speisestärke und Wasser

Nicht sehr magisch, dafür eine nicht-newtonsche Flüssigkeit und großartig zum damit herumspielen:

Get the Flash Player to see the wordTube Media Player.

Lena spielt in unserer Küche mit Stärke und Wasser.

Und mit diesen beiden Substanzen kann man sich auch leicht einen eigenen Shoggoth (wenn auch nicht auf dem Dach) basteln:

Shoggie

Von http://www.youtube.com/watch?v=WnDKOc0Ag28

Von http://www.youtube.com/watch?v=vCHPo3EA7oE

Wer ist dabei gemeinsam Stärke zu sammeln und in eine alte Badewanne mit Wasser zu füllen? :-)