Wer singet, der findet


Auf der Suche nach einem Song kann der Computer dank der Website Midomi.com (manchmal) behilflich sein.

Neulich vor der Glotze (eine wahre Geschichte): Beim Zappen stolpere ich direkt in eine Szene, in der das Ende eines Disco-Klassikers – das letzte, aller-, allerletzte Ende – verklingt. Was war das? Ich steh auf dem Schlauch. Wie geht noch der Refrain? „Lala-la-la… irgendwas… ,Heart Stop‘? Da fällt mir eine Website ein, die ich vor einem guten halben Jahr erfolglos getestet und nie wieder besucht habe. Ich öffne www.midomi.com , wähle „Suche per Singen“ und lalle genau den lächerlichen „Text“ in das Mikrophon meines Laptops: „La-lala-la-HEART STOP, di-da-da-da.“ „Daten werden hochgeladen.“ Zehn Sekunden später bietet Midomi „Hot Stuff“ von Donna Summer an. Ich schäme mich. Und freue mich. Natürlich ist das der Song, den ich suche. „Dass es vor einem halben Jahr nicht geklappt hat, hat einen guten Grund“, sagt Midomi-Gründer Keyvan Mohajer, als ich ihn am nächsten Tag in seinem Büro in Silicon Valley anrufe. „Damals hatten wir 12.000 Songs in unserer Datenbank. Heute sind es mehrere hundertausend in 33 Sprachen.“ Mohajer war als Informatiker über Jahre an der Stanford University mit Spracherkennung beschäftigt ein Forschungsfeld mit hochkomplexen Problemen, an denen sich Wissenschaftler auf der ganzen Welt seit Jahrzehnten die Zähne ausbeißen. „40 oder so Projekte“, die sich an Sing-Erkennung versucht haben, seien bereits gescheitert, sagt Mohajer. Dass Midomi als Erfolg gewertet werden kann – zumindest wenn man den hohen Schwierigkeitsgrad der Aufgabe in Betracht zieht – begründet Mohajer so: „Erstens: All die anderen haben bei der Melodieerkennung lediglich ,auf‘ oder ,ab‘ registriert. Wird bei uns etwas eingesungen, beobachtet die Software auch das Tempo, den Rhythmus, die Pausen und den Text. Dabei passt sich die Maschine an den Menschen an: Wenn du summst, achtet das Programm nicht auf den Text, sobald du aber Worte singst, wird das mit einbezogen. Und zweitens: Es ist schwer, einen Computer zu einer schief eingesungenen Melodie ein voll instrumentiertes Original suchen zu lassen deshalb werden neue Suchanfragen in unserem Datei-Archiv als erstes mit anderen Singproben von Benutzern verglichen.“ Ohne Zweifel hat Midomi seine Trefferquote dramatisch erhöht. Mohajers Behauptung aber, dass die Website in 95 Prozent der Fälle richtig liege, ist schwer zu glauben. Bei Versuchen im Februar spuckt die Seite Minuten lang kein richtiges Ergebnis aus: Singt man „If You Find Yourself Caught In Love“ von Belle & Sebastian nur mit „Lala-la“ ein, schlägt Midomi unter anderem „Hotel California“ von den Eagles und „Patience“ von Guns ‚N Roses vor.

„We are your friends, you will never be alone again“ führt zu „We Can Work It Out“ von den Beatles. Selbst die Melodie von „Feelings“ (leidenschaftlich gesungen in der sensationellen „Mimü“-Version von Beaker aus der Muppet Show (www.you tube. com/watch?v=Jt8Q7Fsa_Vs) hält Midomi für Roger Millers „King Of The Road“ und „Show Me Love“ von t.A.T.u. Die Seite wird mit jeder eingesungenen Melodie potenziell besser, der Weg zu einem perfekten Service aber ist wohl noch weit. Die Entwickler sind längst auch mit anderen Aufgaben beschäftigt: „Unser Motto heißt Breaking The Silence'“, sagt Keyvan Mohajer. „Die Mensch-Computer-Interaktion ist ein weites Feld: Eines Tages wirst du über Sprache dein Telefon steuern und Adressen auf einer Karte finden…“