- OT (statistisches zum Forum): Wenn man denn nichts anderes zu tun hat,.... - Uwe, 13.08.2005, 00:36
- Kleine Statistik zwecks etwaiger Gegenrechnung ;-) - Gundel, 13.08.2005, 10:13
- Re: Kleine Statistik zwecks etwaiger Gegenrechnung ;-) - Uwe, 15.08.2005, 00:34
- Re: Kleine Statistik zwecks etwaiger Gegenrechnung ;-) - Uwe - nereus, 15.08.2005, 08:18
- Re: @nereus: Zur Justierung des Bauchgefühls... - Uwe, 15.08.2005, 10:04
- Re: @nereus: Zur Justierung des Bauchgefühls... - Uwe, Danke (o.Text) - nereus, 15.08.2005, 12:46
- Re: @nereus: Zur Justierung des Bauchgefühls... - Uwe, 15.08.2005, 10:04
- Die Kommunisten verderben den Schnitt ;-) - Histrio, 16.08.2005, 05:02
- Re: Kleine Statistik zwecks etwaiger Gegenrechnung ;-) - Uwe - nereus, 15.08.2005, 08:18
- Re: Kleine Statistik zwecks etwaiger Gegenrechnung ;-) - Uwe, 15.08.2005, 00:34
- Re: OT (statistisches zum Forum): WOW..... - Elli (Boardmaster)--, 13.08.2005, 12:48
- Kleine Statistik zwecks etwaiger Gegenrechnung ;-) - Gundel, 13.08.2005, 10:13
Re: Kleine Statistik zwecks etwaiger Gegenrechnung ;-)
-->Danke für das Gegenrechen, Gundel,
das für mich - zeitlich gesehen - eher ein Vorrechnen ist, da ich - gemeint ist natürlich das Programm; wer übernimmt schon gern Verantwortung für die Trägheit"anderer"? ;) - erst bei den Beiträgen aus November 2001 bin bzw. ist.
Allerdings kann ich nicht nachvollziehen, wie Deine Zählung für"Kommunismus" bis zum 4.10. 2001 auf 1000 Einträge gekommen ist, wo ich doch gerade einmal auf 17 (siebzehn!) Stück kommen. Kann es sein, dass Du den Zeitraum ab 4.10.2001 bis heute meinst?
Jedoch werde ich wohl Gelegenheit haben, mein Zählsystem nochmals modifizieren zu können, da mein Ansatz, alles in einem Zug zu erledigen (Daten lesen, sortieren und Häufigkeit zählen), zwar einfach gedacht ist, aber nicht berücksichtigt, dass es Datentypen-Grenzen gibt, die, wenn sie im Vorfeld nicht korrekt festgelegt werden, standardmäßig an Grenzen stoßen (Überlauf).
Derzeit ist nach zwei"Computer-Arbeitstagen" ein Volumen von 20% der zu untersuchenden Bytes erledigt. Dabei ergeben sich bereist annähernd 30.000 Worte für den Wortschatz, die mit dem Buchstaben"S" beginnen. Datentypmäßg wird die"funktionsfähigkeit" des Programms sich bei 32.768 entscheiden, da ich an einer Stelle nicht sauber deklariert habe.
Es zeigt sich allerdings bereits, dass sich die Wortschatzverteilung auf die Buchstabengruppe annähernd mir der Wortschatzverteilung des Dudens deckt.
<pre> Verteilung im
Duden Forum
A 7,24% 7,98%
B 5,38% 6,48%
C 1,64% 2,64%
D 4,92% 4,94%
E 4,51% 5,56%
F 3,49% 4,21%
G 4,36% 6,42%
H 4,12% 4,38%
I 2,38% 2,44%
J 0,85% 1,22%
K 7,20% 4,77%
L 3,27% 2,89%
M 5,50% 4,96%
N 2,60% 2,81%
O 1,68% 1,66%
P 6,87% 4,22%
Q 0,49% 0,27%
R 4,23% 4,03%
S 11,99% 9,66%
T 4,04% 3,57%
U 3,46% 3,77%
V 3,90% 4,20%
W 2,95% 4,11%
X 0,06% 0,08%
Y 0,11% 0,15%
Z 2,76% 2,57%</pre>
Die Wortverteilung nach dem Duden (1996) wurde grob ermittelt, indem die Anzahl der Seiten - unter Berücksichtigung der"Teilseiten" -, die für die einzelnen Buchstaben gebraucht werden.
[img]" alt="[image]" style="margin: 5px 0px 5px 0px" />
Die"Wortschatztabelle des Forums" (Zwischenstand):
[img]" alt="[image]" style="margin: 5px 0px 5px 0px" />
So, nun hoffe ich, dass Du, Gundel, als verläßliche Gegenrechnerin hier nicht ausfallen möchtest.
Gruß,
Uwe

gesamter Thread: