Ein Team von Forschern der National Research Nuclear University, des National Research Centre Kurchatov Institute und der Woronesch State University hat einen neuen Algorithmus entwickelt, der es einem neuronalen Netzwerk ermöglicht, das Geschlecht eines Schreibers anhand von selbst verfasstem Text mit einer Treffsicherheit bis zu 80 % zu identifizieren.

Dies ist ein Beispiel von ANI (Artificial Narrow Intelligence) bzw. schwacher KI, die in einem Spezialgebiet die Leistungen des menschlichen Gehirns deutlich übertrifft, ähnlich den Programmen zu Spielen von Schach oder anderen Spielen bis hin zu Jeopardy. Das Projekt wurde von der Russian Science Foundation gefördert. Die Ergebnisse wurden in der Fachzeitschrift Procedia Computer Science veröffentlicht.

Viele wissenschaftliche Untersuchung zeigen, dass der geschriebene Text bestimmte Eigenschaften des Schreibenden widerspiegeln kann, darunter Geschlecht, physiologische Persönlichkeitsmerkmale und Bildungsniveau. Sprachmuster scheinen ebenfalls brauchbare psychodiagnostische Information zu transportieren und werden neben Handschriftenanalysen gelegentlich bei Einstellungen insbesondere bei Sicherheitsdiensten verwendet. Bislang konnte aus der Analyse der Sprache sogar schon auf bestimmte Krankheiten wie Demenz, Depression oder Suizidalität geschlossen werden. Auch die Extraktion von Personenmerkmalen aus dessen Schrift ist von potentiellem Interesse.
Daher versuchen Forscher, bestimmte Merkmale der Persönlichkeit aus Text zu extrahieren. Hierzu wurde auf der Basis neuronaler Netzwerke die Effektivität verschiedener Algorithmen des maschinellen Lernens für die Textanalyse analysiert.

Es zeigte sich dabei, dass die Verwendung von CNNs (Convolutional Neuronal Networks) und Deep Learning bei der Identifizierung des Geschlechts eines Autors am besten funktioniert. Derzeit arbeitet das Forscherteam daran, das Alter eines Autors aus Texten zu ermitteln.