|
tfStop
Hinzugefügt in advas-0.0.3, erweitert für advas-0.2.5
Berechnet die Häufigkeit, mit der die einzelnen Worte in einem
angegebenen Text enthalten sind (Term Frequency) unter
Berücksichtigung der Einträge aus der Stopliste -- diese
werden nicht mit gezählt. Grundlage der Häufigkeitsanalyse bilden alle registrierten Dokumente.
In: |
|
|
Out: |
dictionary |
eine Liste aus Paaren, wobei das Wort den Schlüssel
darstellt und der Wert die Häufigkeit des Wortes in den
registrierten Dokumenten. |
|
|