TagCloud

Googlezwerg

Januar 4th, 2008 von buergermeister

Auweia, was fällt Spon ein meinen Stuß von gestern zu verlinken. So besonders ist das nun auch wieder nicht, da gibts noch viele andere Dinge z.B. kann man ja auch mit Hilfe von privoxy seinen Useragent tauschen, man kann das sogar automatisieren und ständig wechseln mit einem Skript von Fabian Keil, aber egal. Scheisse, wenn unsere selbsternannten Profiblogger das geahnt hätten, das so etwas derzeit gesucht ist, statt dessen versuchen die Deppen auf Redtube und Timtube rumzureiten…..

Hab mich schon gewundert was diese Trafficspitze verursacht, ich muss ja zu geben, ich les eben Spon nicht. Aber nach dem der Herr Einsteiger den Link zur Ursache gepostet hat, war ich schon mal da. Und da begenet mir doch ein Artikel, just jener hier. Also nicht das ich den besonders gut finde, ne der ist sogar scheisse: “Seine eigene Engine “Wikia” geht am kommenden Montag mit einem Suchindex zwischen 50 und 100 Millionen Seiten an den Start“, nur mal so für den Journalisten, der den Artikel so sensationell recherchiert hat. Die “Engine” also der “Motor der Software ist nicht von Jimbo. Da hat es letzten Sommer so etwas wie ein nennen wir es Auschreibung gegeben. Tja und da Jimbos Wikia eine Firma ist, die nachher natürlich auch schwarze Zahlen schreiben will, hat man sich das gleich was gekauft oder gleich die ganze Firma. Zum Einsatz wird Grub (nein nicht der Grand Unified Bootloader) der Firma Looksmart kommen. Naja von Grub war ich weniger begeistert, als Gegenleistung meine Maschine als Crawler zur Verfügung zu stellen, hätte ich nen Superbildschirmschoner bekommen. Wow…

Mal davon abgesehen war nur der Client Open Source, der Server nicht. Also nix für mich. Richtig wir sollen also die Hardware für Jimmy Wales stellen und er verdient das Geld. :D Ja die Hardwareanforderungen sind das woran alle knabbern, das Crawlen, das Auswerten, das Cachen kostet einfach mal Ressourcen. Michael Nebel, der sich da ja selbst an einer freien Suchmaschine versucht hat da mal eine kleine Rechnung aufgemacht.

Das Wikia mit einem kleinen Datenbestand starten wird, war absolut klar. Noch crawlt ja keiner für sie ;) Naja Jimmy will ja nur ” Nicht rütteln, sondern vorerst nur kratzen“. Nur rütteln tun schon viele und keinem gelingt der Durchbruch. Die Nutzung von P2P stellt schon mal einen vernünftigen Lösungsansatz dar. Da ist Grub aber nicht die einzige Lösung. Da wäre ja noch YaCy, die sich ja letzten Sommer noch die Hoffnung machten von Jimmy ins Boot geholt zu werden. Mmh installieren liess sich das damals kinderleicht, aber ich hab wirklich vergeblich nach dem”Go Online”-Button gesucht, davon stand jedenfalls etwas in der Doku. Nach vergeblicher Suche im Netz, bin ich dann in den IRC von YaCy getrabt. Kinders, mir zur Antwort zu geben das ihr vergessen habt aus der Doku zu nehmen ist ja schon mal heavy (aber durchaus verzeihlich), aber mich dann für doof hinstellen, wenn ich feststelle, dass ich gern die Kontrolle darüber hätte ob das Ding online ist oder nicht…..

Naja schließlich hab ich dann auch von anderen derartige Berichte gehört hab, ist das wieder von meiner Maschine entfernt worden. Nach dem ich ca. 60.000 Seiten indiziert hatte und mal ehrlich beim herumprobieren, nicht ein vernünftiges Suchergebnis bekommen habe. Eine Suche in einem P2P-Netzwerk dauert auf jeden Fall viel länger als bei der Datenkrake ;)

Das Javateilchen hat ja auch nicht mal wenig Ressourcen gefressen, das indizierte nur wenn ich ausser Hause war (arbeiten war nicht drin) und ganz nebenbei, schluckt das Ganze auch mal massiv Festplattenplatz (laut Doku ca. 25GB).

Tja das Crawlen ist nur die eine Sache, wenn das dann ausschliesslich im P2P-Netzwerk bleibt mit dem Cachen werden keine vernünftigen Ergebnisse herumkommen. Nun ich hoffe da noch auf Wikia, wenn die dann noch Platz für Cache bereitstellen, gehen die Suchanfragen schon mal schneller. Was dann noch fehlt ist ein vernünftiger Wertungsalgorythmus und den will ja Wales offenlegen. Da bin ich schon tierisch gespannt, wie der das dann vor den oben genannten Youporn, Redtube und Timtube-Super-SEO-Typen schützen will. Irgendwann hat er ja mal was von wikiartiger Suchmaschine gesprochen, soll etwa die Community für die Reinhaltung der Ergebnisse sorgen? Na da bin ich auf den Lösungsansatz gespannt, wenn da nix vernünftiges am Start ist geb ich wikia nur den Wikipediagründerbonus um Nutzer zu gewinnen, aber durchsetzen wird es sich dann nicht. Und ich werd mich wieder mit YaCy auseinandersetzen, die haben zwar Ärger unter den Entwicklern gehabt und dicke Peers (einer davon mit 7Mill. Indexseiten) verloren, aber trotzdem sind es mehr Peers (von 133 auf knapp 500) geworden.

Nun warten wir ab was der Montag bringt

Geschrieben in Killer Application, Wundersame Webwelt | 2 Kommentare »

ähnliche Artikel: FUDCon APAC Phnom Penh 2016 |

2 Kommentare

  1. paul Sagt:

    hab vor ein paar Tagen mich im bloggen geübt und über das gleiche Thema geschrieben. Wenn du magst kannst ja vorbeischauen und dein Senf abgeben.
    http://sidelnikow.de/blog/?p=53

  2. Julian Sagt:

    Also Wikia ist wirklich mal sehr daneben gegangen. Das Konzept k̦nnte aufgehen, aber es stehen riesige Gegner einem Erfolg entgegen. Ich perșnlich finde, dass es mit dem Web2.0 langsam mal reicht Рman muss ja auch nicht alles den User bestimmen lassen! :-)

Einen Kommentar abgeben

Bitte beachte: Die Kommentare werden moderiert. Dies kann zu Verzögerungen bei Deinem Kommentar führen. Es besteht kein Grund den Kommentar erneut abzuschicken.