Die Entwickler von Apache Mahout haben die Version 0.4 der Bibliothek skalierbarer Algorithmen für maschinelles Lernen veröffentlicht. Mahout 0.4 enthält eine Reihe neuer Algorithmen, darunter Spectral Clustering, MinHash Clustering und ein neuer Naive-Bayes-Klassifikator, sowie neue Möglichkeiten zur Bewertung der Qualität von Clustering-Ergebnissen. Viele bestehende Codeteile wurden überarbeitet, in der Performance verbessert und in ihrer Funktionalität erweitert. Weitere Neuerungen nennt die Ankündigung, alle Details finden sich in den Release Notes.
Apache Mahout bietet stabile Implementierungen von Algorithmen zum maschinellen Lernen mit einem Schwerpunkt auf der Verarbeitung großer Datenmengen, auch verteilt über mehrere Rechner. Typische Anwendungsfälle sind die Analyse der Logs eines Webshops zur Generierung individueller "Das könnte Sie auch interessieren"-Listen, die Gruppierung von Texten anhand ihres Inhalts, die Klassifizierung von Dokumenten in vordefinierte Kategorien und das Auffinden von Zusammenhängen in großen Datensets. Mahout startete als Unterprojekt der Such-Engine Lucene und ist seit dem Frühjahr Top-Level-Projekt bei Apache.
Quelle:
*
http://www.heise.de/developer/meldung/Ap…en-1129987.html
Weiterführende Links:
*
http://mail-archives.apache.org/mod_mbox…10.mbox/browser
*
https://issues.apache.org/jira/secure/Re…ersion=12314281