an die Redaktion von boinc
ich möchte ihnen eine Vorschlag für ein
internationales Projekt für Boinc machen.
eine Suchmaschine mir verteilten Datenspeichern
und Crawlern, die in den Internetseiten und Archiven
nur die ganzen Sätze sucht und verarbeitet.
Das Ergebnis ist ein riesiges Satzarchiv in dem die User frei
suchen können.
Also ein verteilter Massenspeicher mit vielen Aktivitäten :
crawlen , indizieren,
vergleichen, parsen, intern suchen, privat oder allgemein
speichern, ausgeben, übersetzen strukturieren, usw
Bild
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
next Satz | next |
Fragen ?http://www.majdaj.de/communer1.htm
Der Unterschied zu "normalen"
Suchmaschinen ist:
es werden nur Sätze gespeichert, keine ganzen Seite mit Layout,
Bildern etc. die Sätze werden später in strukturierte Sätze
umgewandelt.
die Sätze werden von den Usern gewertet
die User haben die Möglichkeit, eigen Sätze oder Veränderungen
einzubringen, ohne ein eigene Seite zu haben
die Maschine ist unabhängig, opensource,
die Sätze sind frei die Einweg-suche wird erweitert durch eine
weltweite echte Kommunikation mittels strukturierter Sätze
Def.::
Sätze sind sinnvolle Anreihungen von bekannten Wörtern
Sätze sollten eine Datenstruktur haben , etwas so: Satznummer,
Satzart, Satz(text) max 500B, Quelle, Rankzahl, Link auf
nächsten Satz.
Es braucht dann noch eine Liste: Suchwort zu Satznummer.
Vorteile
-für Boinc wären: weltweite Aktivität vor Tausenden von
Computern
-für die User: gleichzeitige Nutzung als Satzsuchmaschine und
persönlicher Satzspeicher
Spielmöglichkeiten for die User (neue Sätze eingeben oder
verändern)
für die Forschung : alle Sätze überprüfen, vergleichen,
strukturieren, übersetzen
für alle: ein grosser Wissensspeicher, von Menschen editiert und
aktualisiert
notwendige Teile für
die Realisierung dieses Projekts wären:
Crawler (sucht Sätze im Internet und in Archiven, texten.)
Indexer (jedes Wort des Satzes wird analysiert )
Satztrenner (nach Methoden von natural language parsing)
Massenspeicher verteilt auf User mit Redundanzen
Datentransfer an andere User
Suchfenster für User Ausgabefeld von drei besten Sätzen mit
Link auf nächsten besten
Editiermöglichkeit für User
Archivrechner findet Logiken Unterschiede übersetzt
Fun-features : history der gesuchten und gefundenen Sätze ergibt
Roman
Wettbewerb: wer findet oder editiert die besten oder meisten
Sätze
die nächsten Schritte wären erstmal (auch mit
anderen), zu überlegen, wie so eine Datensammlung und Verteilung
zu organisieren ist spezielle Such-, crawl- und transfermethoden
müssten erfunden werden, ich kann das nicht.
jetzt zu meiner Bitte um Zusammenarbeit: wäre
es möglich, die Programmierung vollständig in ihren Händ zu
geben, oder soll ich erst einige Programmteile liefern oder eine
ausführliche Funktionsbeschreibung?
Vergleichbare lauffähige Software gibt es bei Yacy, ein OS
-Projekt aber nur für ganze websites.
ich würde mich freuen, wenn sie auch anderen Boninc-Teams
(übersetzt?) meine Idee vorlegen könnten und eine schönen
Namen für das Projekt fänden, und dass alle meine Wünsche in
Erfüllung gehen .
an Dankwart, ich schätze ihre Bemühungen um
den organisierten Frohsinn. ich möchte, um die Ein- ausgabe zu
testen, ihren Dankwart-bot mitbenutzen, wenns geht mit eigenem
freien Speicher und mit eigener Ausgabe: 3 beste Sätze mit
Bewertungsknopf + und minus (ohne "du" "bot")
und etl. einen Satzeditor und und und ..
an Andere:: könnten sie auch ihre KollegInnen
informieren und über eine Realisierung diskutieren und mir eine
nicht zu harte Kritik zukommen lassen
ich hoffe auf eine freundliche Antwort und eine milde Kritik