Fragen? Antworten! Siehe auch: Alternativlos
Ich war mal zu einem Vorstellungsgespräch bei Google (ist nichts geworden, weil ich nach Zürich wollte, aber die mich in Mountain View haben wollten, und wer will schon in den USA leben), und u.a. ging es darum, wie man eine Suchmaschine baut. Weil ich das ja auch schon mal gemacht habe, haben wir uns über Details unterhalten, wie z.B. wie man das Ranking der Ergebnisse macht, oder wie man Schlüsselwörter extrahiert.
Ich hatte mir damals einen total trivialen Ad-Hoc Hack ausgedacht: zähle die Worthäufigkeiten in dem Artikel. Teile die Häufigkeiten jeweils durch die Anzahl der Wörter in dem Artikel. Habe eine Datenbank, wo für alle Wörter dieser Quotient über den gesamten Korpus als Durchschnitt steht. Die Schlüsselwörter des Artikels sind die Wörter, bei denen der Quotient größer als der Durchschnitt sind. Z.B. die fünf mit dem höchsten Quotienten.
Fand ich damals total offensichtlich, hatte keinerlei Literatur zum Thema gelesen (so gehe ich übrigens auch heute an die meisten Sachen heran; wenn man sich vorher durchliest, wie andere das machen, entgeht einem der Großteil der Erkenntnis, und man hat am Ende nicht verstanden, wieso das funktioniert, was man da gerade getan hat), und es funktionierte. Es gibt da noch so Details wie daß mit diesem Verfahren Typos ein hohes Rating kriegen. Und man kann das Verfahren noch tunen, indem man z.B. großgeschriebene Wörter höher bewertet, oder indem man Wörter höher bewertet, die näher am Anfang des Artikels sind. Und es ist auch sinnvoll, sehr kurze Artikel nicht zu werten. Diese ganzen Tweaks hab ich damals bei Google aber gar nicht erwähnt, obwohl sie am Ende das sind, was die Qualität des Verfahrens ausmacht.
Wieso ich das alles erzähle: der Google-Mensch meinte darauf zu mir sinngemäß: "ja, genau so machen das auch alle anderen." Und er nannte dann noch den Namen, den dieses Verfahren in der Literatur hat.
Ich stand da wie vom Blitz getroffen. Aha, mein kleines Ad-Hoc Verfahren ist also das, was auch alle anderen nehmen? Und so einen Moment, meine lieben Leser, gönne ich euch auch von ganzem Herzen. Die anderen kochen auch alle nur mit Wasser. Gebt euch selbst eine Chance, mal etwas großes zu erfinden, und wenn ihr das nächste Mal ein Problem habt, guckt nicht gleich in die Lösung, äh, Literatur, sondern denkt erst mal selbst eine Runde nach. Kreativität muss man eben auch pflegen, immer schön gießen, in die Sonne stellen. Gelegentlich düngen mit einem Blick in die Literatur ist bei allen außer den größten Genies natürlich auch notwendig, aber traut euch doch auch mal, Sachen einfach selber zu erfinden. Wer weiß, vielleicht kommt dabei etwas großartiges raus?
BTW: Es gibt da eine Urban Legend von einem Studenten, der nie zur Vorlesung gegangen ist, sich immer nur die Übungszettel abgeholt hat, und die dann gelöst hat. Eines Tages war eine unlösbare Aufgabe darunter, was der Prof zwar dazu sagte, aber nicht dran schrieb, und unser Student löste das. Ich habe mal einen solchen Studenten kennen gelernt. Der hat eine Aufgabe im Datenbankpraktikum dann über schlecht dokumentierte Extensionen in der für die Übung eingesetzten Datenbanksoftware gelöst. Der Tutor hat die Lösung nicht verstanden und keine Punkte gegeben.