Wie sagte Paule? Der Trend geht zum Zweitblog:
Englisch und über langweiligen Mathe-, Statistik- und Programmierkram, daher ist er nun abgetrennt von diesem hier.
Mit ‘Statistik’ getaggte ArtikelZweitblogSonntag, 16. August 2009Wie sagte Paule? Der Trend geht zum Zweitblog: Englisch und über langweiligen Mathe-, Statistik- und Programmierkram, daher ist er nun abgetrennt von diesem hier. Nein, nicht BiostatikMittwoch, 10. Dezember 2008Auch wenn es oft auf unserer Post steht: Wir sind nicht das Institut für Biostatik. Jetzt scheinen sie aber gegen diese häufig vorkommende Verwechslung vorgehen zu wollen:
Citing data – the dataverse network projectSonntag, 02. November 2008Heute mal ein sehr kurzer, oberflächlicher, aber doch sehr wichtiger Beitrag über ein Projekt, das sich mit dem folgenden Problem beschäftigt: Für Artikel und Bücher existieren
Quantitative Daten
UNFUm die Validität von Daten zu gewährleisten, wurde der Universelle Numerische Fingerabdruck (UNF) von Altman & King eingeführt. Dieser Algorithmus wandelt den Datensatz in einen Unicode-Zeichen-String um und wendet eine Hash-Funktion auf diesen an. Neben C++-Bibliotheken steht auch das R-Package UNF ``Tools for creating universal numeric fingerprints for data'' zur Verfügung. (http://cran.r-project.org/web/packages/UNF/index.html) Der Methodenaufruf unf(data, digits=8) berechnet z.B. einen numerischen Fingerabdruck für den Datensatz data, wobei die jeweils ersten acht Stellen der Daten berücksichtigt werden. Der Universelle Numerische Fingerabdruck
Zitieren von DatenMinimal werden beim Zitieren Autor, Jahr und Titel angegeben, gefolgt von einem ``Unique global identifier'', über den die Daten gefunden werden können, sowie den UNF-Wert:
GARY KING; LANGCHE ZENG, 2006, "Replication Data Set for 'When Can History be Our Guide? The Pitfalls of Counterfactual Inference'" hdl:1902.1/DXRXCFAWPK UNF:3:DaYlT6QSX9r0D50ye+tXpA== Murray Research Archive [distributor]
Optionale Zitatelemente wie [producer] oder [distributor] können durch Paare ``Wert [Feldname]'' angehängt werden.
TheData.orgFür das Halten der Daten ist die Dataverse Network OpenSource-Software (http://thedata.org/) frei verfügbar. Als Web Applikation wird für die meisten jedoch kein Grund vorhanden sein, die Software lokal zu installieren, sondern man meldet ein eigenes, sogenanntes "Dataverse" bei einem der Data Repositories an.
Bibliography
CyStats StatisticsSamstag, 01. November 2008Vor einem Monat habe ich das CyStats WordPress Plugin installiert und nun ist es Zeit für eine kleine statistische Auswertung. 31. Oktober 2008: You have approximately 33 visits to your feeds and 271 human visitors to your website today, the average bounce rate is 58.42%, 34 visitors came via search engines. Der Blog läuft seit 516 Tagen mit durchschnittlich 1.06 Beiträgen und 1.95 Kommentaren pro Tag und im Regelfall kommen zwischen 200 und 300 Leute (ohne Bots) zu Besuch. Und was interessierte die Leute am meisten?
Das Plugin listet mir 547 Suchanfragen für diesen Monat (was sehr wenig ist - werden nicht alle angezeigt?). Im folgenden finden sich die häufigsten Suchanfragen, die nicht wie z.B. "Matheaufgabe Tentakeln" nur einmal eintrafen: Wie man sieht war der Tintenfisch-Ausnehmen-und-Braten-Beitrag trotz Kritik meiner Stammleser ein voller Erfolg. Statistische DatenMontag, 15. September 2008Wer gerne mal mit statistischen Daten spielt – hier ein paar Links:
Nicht wundern über den Blogeintrag Btw. (aus Wikipedia – Statistik):
Vortrag in DortmundMontag, 18. August 2008Wir haben in der letzten Woche auf der in Dortmund einen Vortrag gehalten. Einen Vortrag an den man sich erinnern wird… – vielleicht nicht wegen dem Inhalt, sondern weil sich Bernds vorbereiteter Computer im Talk vor uns ausgeschaltet hat. Von unseren 15 Minuten Vortragszeit warteten wir 10 Minuten darauf, dass der Computer startete. Emule, Antivir, Windows Sicherheitscenter, diverse Mediacenter und andere Programme mussten sich erst starten und mit Informationen versorgen, bevor wir endlich mit Folien weitermachen konnten. Trotz allem haben wir zu drei Leuten neuen, vielversprechenden Kontakt bekommen und inhaltlich war der Vortrag trotz allem gut. An uns ran kamen von der Präsentation sonst nur zwei Vorträge: In dem einen wurde nach 3 Minuten Einleitung einfach ein Präsentationsvideo abgespielt und im anderen Vortrag hatte der Vortragende sich so erkältet, dass er die Folien ohne Kommentar durchging. Btw.: Wo kann man in Dortmund sinnvoll übernachten? Ich habe 70€/Nacht für ein Hotel mit dreckigen Handtüchern und ohne WLAN bezahlt! (Wenn ich es selber zahlen müsste, hätte ich sonst in der Uni übernachtet – Ich konnte nicht bei meinem Kollegen übernachten, da wegen Wasserschäden schon seine Freundin notdürftig bei ihm untergekommen war…) Das Hostel in München für 20€/Nacht war in jeder Hinsicht (nagut, es gab kein Frühstück) um Meilen angenehmer… Projekt vorbeiMontag, 14. Juli 2008Das große Projekt bei uns am Institut ist nun vorbei. Vorstellen werden wir das Framework des GUI-Teilprojektes unter dem Titel “Towards a Java Framework for Rapid Development of Graphical User Interfaces for Statistical Applications based on R” auf der UseR im August. Jemand Interesse? Wer kommt uns besuchen?Dienstag, 01. Juli 2008SternenhimmelMittwoch, 14. Mai 2008
Man schaut in den Himmel und nach einiger Zeit erscheinen die Figuren… bloß der Mond ist heute in Wirklichkeit zu hell. @Schmooke: Wo ich gerade bei Projekten war – wann programmieren wir die Stereoskopie-3D-Version von Celestia? Random Correlation MatricesDienstag, 19. Februar 2008 |