Korrektur #1

  • E-Mails mit genau dem gleichen Text werden nicht als Spam erkannt.
  • Die Zeile "return true ? spamProbabilityFinal > 0.5 : false;" kann man viel einfacher schreiben.
  • Du nimmst nicht den Durchschnitt der Similarities zu allen anderen E-Mails, sondern nur das Maximum. Was hat das für einen Einfluss auf die Ergebnisse?