Opera: Kurze Einführung in die eingebaute URL-Filterliste

JensusUT

Senior Member
Das Opera eine eigene Filterliste unterstützt ist überaus interesannt nur wo finde ich diese ?

Nach dieser Anfrage aus dem CCB bin ich in mich gegangen; wozu eine Opera-Filterliste? Was kann die eigentlich? Ich habe Google dann mal nach Infos über die URL-Filterliste suchen lassen, ein Feature, was von Opera seit der Version 1078 unterstützt wird, aber noch keinen offiziellen Support bekommt (ähnlich wie die Search.ini). Allzuviele Infos darüber gibt's noch nicht, wohl weil dieses Feature (it's not a bug;)) noch recht neu ist und andererseits Programme auf dem Markt existieren, die diese Aufgabe wesentlich differenzierter lösen...
Egal, hier nun die Infos, welche ich aus dem Changelog und Beiträgen aus der Beta-NewsGroup herausgefiltert habe (Ausserdem brauche ich diesen Thread, um mein Tutorial nicht allzusehr aufzublähen ;))
Bei Bekanntwerden weiterer Infos oder Vorschlägen von Seiten der User wird diese Einführung natürlich gepflegt, bietet allerdings nicht allzu grossen Freiraum :)

Sue Sims schreibt indem Changelog zur Version 1078:

* url filtering is now functional; exclude list has precedence over include
example under will block loading of , jpg, gif and png pictures.

====example====
[include] http://*.*
[exclude] http://*.gif http://*.jpg http://*.png

url-filter file is defined in opera.ini [Adv User Prefs] URL Filter File= which is a standard ini-file with [exclude] and [include], supports * and ? as wildcards
* added priorityflag to url include and exclude lists; in the filterblock ini-file: [prefs] prioritize excludelist=0 ; if 1; exclude rules will have precedence, which is the default

Was sagt uns das :)? Ich werde es mal kurz (so gut ich kann) eindeutschen:
Ab der Version 6.02 Build 1078 funktioniert nun auch die "URL-Filterung". Die Ausschlussliste hat Vorrang vor der Einbeziehenliste (oh jeh, was für ein eingedeutschtes Wort... soll ich Includeliste sagen?). Die Filterdatei wird definiert in der Opera6.ini unter [Adv User Prefs] URL Filter File=urlfilter.ini (oder sonst ein Dateiname, Hauptsache sie liegt im Operaprogrammverzeichnis). Diese Datei ist eine Standard-INI-Textdatei, die mit exclude- und include-Regeln arbeitet und * und ? als Jokerzeichen unterstützt. Die INI-Datei bestimmt dann das Verhalten des Filters, hier noch einmal einige Beispiele:
Das oben genannte Beispiel erlaubt alle http-Links, unterdrückt jedoch die in der Priorität zuerst ausgewerteten, in der Filterdatei mit [exclude] definierten Inhalte der Ausschlussliste. Somit würden Gif's, JPG's und PNG-Bilddateien komplett geblockt werden. Das Beispiel ist aber schlecht gewählt, da z.B. ftp-Anfragen geblockt werden würden, die [include]-Liste sollte daher immer so aussehen: *
Über ein "Priorityflag" kann die INI-Textdatei noch angepasst werden, [prefs] prioritize excludelist=0 würde die Includeliste (ich nutze doch mal das denglisch) Vorrang vor der Excludeliste bekommen, [prefs] prioritize excludelist=1 ist die Standardeinstellung und gibt der Excludeliste Vorrang vor der Includeliste.

Mit diesen Filterregeln ist es jetzt also möglich, Werbeeinblendungen von diversen bekannten Anbietern wie AD und Advert vor dem erreichen des eigenen Rechners über die enge Telefonleitung :)hallo Tim!!) zu blocken, ähnlich wie dasProxomitron oder der WebWasher. Ich gebe zu, die Lösung mutet im Vergleich zu diesen Programmen recht spartanisch an, aber immerhin kann man so einige Banner ohne eben diese Zusatzprogramme ausfiltern, und manchen Leuten ist die Konfiguration z.B. des Proxomitrons doch etwas zu hoch ;). Zudem spart man wieder ein wenig RAM (...ich weiss, ist momentan ein schwaches Argument :D)
A propos Proxomitron; Operas URL-Filterliste und Proxomitron machen nicht das Gleiche; Opera 'ignoriert' die URL's in der URLFilter.ini, wärend Proxomitron URL's in "irgendetwas" konvertiert.
Hier eine Verständniserklärung (aus der NG übersetzt, danke an Tommy A. Olsen):
Wenn man *.doubleclick.net in Operas Filterliste einfügt, wird Opera schon den DNS-Server nicht mehr nach dieser IP-Adresse fragen. Wenn man 187.255.199.11 (die IP-Addresse) in die Filterliste einfügt, sendet Opera nicht mal mehr eine Anfrage an diese IP.
Proxomitron dagegen konvertiert die gesamte Bildadresse in etwas anders, z.B. in den Text, der im Browser als [klick hier] auftaucht. Und wenn Opera eine Fenster zur Adresse *.doubleclick.net öffnen möchte, stopt Proxomitron diese Anfrage (sie wird nicht "nach draussen" gesendet) und öffnet nur eine leere Seite mit dem Hinweis "URL killed" oder ähnlichem Text.
"Der URL Filter und Proximitron in Kombination sind eine richtig effektiv, da man mit Proximitron etwas feinfühliger einstellen, andere Sachen, wie z.B. die Browserkennung "verbiegen" kann und die Opera Filterliste die Anfragen an Proxinitron verringert, was der Verarbeitungsgeschwindigkeit auch zugute kommt." :) (Zitat R. Reck)

Nochmal genau die Vorgehensweise:
Man muss zuerst mal, wie immer bei Arbeiten an der ini-Datei, Opera (ab 1078!) beenden und dann folgende Zeile zur opera6.ini unter [Adv User Prefs] hinzufügen:

URL Filter File=urlfilter.ini

Der Inhalt dieser (willkürlich gewählten) urlfilter.ini, welche im Operaverzeichnis liegen muss, bestimmt dann das Verhalten des Filters, hier noch einmal einige Beispiele:

===== Begin urlfilter.ini
[include]
* <- Hier sollte nur ein * stehen, ansonsten werden auch ftp- und weitere Webextensions wie "file" oder "opera" (<- wichtig für z.B. die Operahistory!) geblockt!!

[exclude]
; Filename wildcard type expressions
http://*.humanclick.com/*

===== End urlfilter.ini

Das Gute an der Sache: Es gibt schon vorgefertigte Filterlisten von z.B. Waldherr, die findige User der Betanewsgroup bearbeitet und an das Operaformat angepasst haben. Unter folgenden Adressen habt ihr die Auswahl zwischen drei Textdateien:

http://home.arcor.de/omalilli/blocklist.ini <- Ziemlich gut, wurde aber schon länger nicht mehr gepflegt, Selbsteinträge evtl. nötig..(Orginal-HP:http://scorpius.spaceports.com/~opera/blocklist.ini, ist aber öfter down)

http://home.arcor.de/omalilli/urlfilter.ini.txt <- 144 kb grosse Filterdatei, ziemlich umfangreich, erschlägt fast alles. Manche Seiten werden dadurch aber evtl. nicht dargestellt, da geblockt...(Orginal-HP:http://www.geocities.com/u82011729/urlfilter.ini.txt

http://home.arcor.de/omalilli/block.ini <- Und noch eine kleine Liste von Partiallycorrect@operamail.com, welche nicht allzu gross ist und mehr Hostspezifisch arbeitet (Orginal-HP: http://scorpius.spaceports.com/~opera/block.ini)

Da ich vergessen hatte, dass Anhänge nur von registrierten Usern genutzt werden können, hier noch einmal
das Komplettpaket als .zip: http://home.arcor.de/omalilli/blocklisten.zip

Wenn ihr euch diese Listen anschaut, werdet ihr auch schnell verstehen, wie nützlich die Jokerzeichen sind :) Ich werde hier in der Firma mal die "grosse" ausprobieren, da Programme wie der WebWasher hier nicht gerne gesehen sind bzw. sich aus Lizenzgründen gar nicht erst installieren lassen. Am Ende gibt's alle 3 Dateien auch noch mal als Anhang, falls ihr Schwierigkeiten habt, sie aufzurufen (soll schon passiert sein)
Evtl. wird man in der bald kommenden Final 6.02 dieses Feature noch verbessert finden, ich wüsste aber nicht, was man nun noch verändern sollte. Wenn es läuft: OK, wenn es Probleme gibt: Posten!

Hier noch eine aktuelle Frage aus der c't-FAQ:
Mein Rechner unterdrückt seit kurzem bestimmte Meldungen aus dem Heise-News-Ticker, interessanterweise nur solche der Form www.heise.de.de/data/ad-... Woran kann das liegen?

Höchstwahrscheinlich an einem Personal Firewall oder einen Werbeblocker. Norton Internet Security filtert beispielsweise bei aktiviertem Werbeblocker unter anderem alle URLs als potenzielle Werbung aus, die den Teilstring ‘/ad-’ enthalten, sprich: alle Meldungen von c't-Redakteur Axel Kossel.

Es gibt keine Lösung, die das ungestörte Lesen aller Heise-NewsTicker-Meldungen und vollständigen Schutz gegen Werbeeinblendungen gewährleistet. Als dauerhaften Ausweg gegen die Ticker-Blockade empfiehlt es sich, die betreffende Regel des Werbeblockers zu deaktivieren. Bei Norton Internet Security muss man dazu in den erweiterten Optionen die Regel ‘Blockieren /ad-’ löschen. Danach werden allerdings Werbebanner, in deren Dateipfad die betreffende Zeichenfolge auftaucht, zukünftig angezeigt.
:D:D

Update 1!
Martin Schrode hat auf seiner Homepage auch schon vor mir eine nette kleine Beschreibung ins Netz gestellt. Ist für englischsprachige User, aber netter aufgemacht als hier (bin leider noch kein WebPageprogrammierer :))
Ausserdem hat er eine ziemlich interessante Mainpage, welche mehr auf Linux und Opera eingeht... auch die Funktionsweise der Search.ini ist dort gut erläutert. Schaut mal vorbei!

Update 2!
Auf der Opera-Homepage gibt es nun auch eine offizielle Beschreibung des "URL Filtering"-Features. Es wird dort so erklärt:
Filtering is used to limit browsing to certain sites, or to exclude file types.
Schaut mal dort vorbei, wenn ihr noch weitere Infos braucht (viel mehr gibt's aber auch dort nicht ;)), wenn ihr auf Kioskmode klickt, bitte ganz runterscrollen...

Update 3!
Auch hier im Board gibt es einen Thread, der sich Spy- und Werbeblocker selbstgebaut nennt und einen ähnlichen Ansatz verfolgt. Gemeint ist die lokale Host-Datei, über die verschiedene Pages auf die IP 0.0.0.0 umgeleitet werden und so auch nicht zur Anzeige kommen. Ist zwar nicht ganz so flexibel, aber schnell erledigt und auch recht nützlich. Und: Mann kann beides gleichzeitig einsetzen, Filterliste und Host-Dateieinträge.
 

Anhänge

  • blocklisten.zip
    29,4 KB · Aufrufe: 557
Zuletzt bearbeitet:
WWuuuuppppp..... da taucht er wieder auf, der Thread :D

Gerade eben im Operaforum gefunden, eine Wishlist, um die oben beschriebene Funktionalität richtig nutzen zu können. Nachdem ich vor ca. 1 Woche die Filterliste auf meinem Arbeitsplatz-PC wieder aktiviert habe, zeigten sich schnell einige nervige Verhaltensweisen dieser Lösung.
Diplo, ein User des Operaforums, hat es sehr schön in Worte gefasst, nachzulesen hier, ich zitiere:

Diplo schrieb:
One of the potentially great and overlooked features of Opera is the fact that it can filter out URLs using a filter.ini file. This was broken in 7.11 but now works again in 7.20. For instance, if you create a filter files like the following all URL's that match the exclude list will be ignored by Opera :


(For more information on this see Mark Schrode's excellent page)

In other words, Opera has a built in method of blocking many adservers, tracking cookies and sites with questionable content (ie. porn sites). What a brilliant and useful feature, I hear you say! Well, it would be, if only they fixed these glaring problems :

Problem A: - The filter works fine for normal HTML, but if a URL (typically a banner ad) is generated using JavaScript then Opera freezes up, and won't load the rest of the page. This flaw makes URL filtering mostly useless, considering a lot of banner ads are dynamically written using JavaScript. Surely this could be fixed?

Problem B: - Unlike all other Opera.ini files, which have been moved to the user profile directory, the filter.ini file MUST go in the main Opera directory where you installed Opera. In other words, you can only have one global filter file, and not different ones for different users. This is a real shame, since parents who let their children use the browser cannot filter 'dodgy' URLs just for the user the child logs on as. Imagine what a good selling point being able to filter-out sites for your children would be?

Problem C: - The progress bar never goes away if a page contains any URLs that were filtered - you have to manually press escape to finish the page loading. This is a minor annoyance, but another small thing that could be easily fixed, I'm sure.

Now, I know people are going to say you can use Proxomitron or AdMuncher, but why do we need a 3rd party tool to do what Opera can almost do now? I don't really want yet another program running in the background all the time, I just want something simple that can filter out most URLs that only loads when the browser does. The functionality is almost there, it just needs a little more work, and would be a GREAT feature and selling-point that I'm sure would be another feather to Opera's cap. C'mon, do the job properly! :)

Als Fazit muss man momentan leider folgende Tatsache ziehen: Die URL-Filterliste als Lösung ist nicht praktikabel.

Ob Opera ASA noch Bugfixing betreibt, kann ich nicht sagen. Haavard (Opera Customer Service) schreibt dazu:
ear in mind that URL filtering is really a kiosk mode feature and not supposed to be very advanced or used extensively for ad blocking etc.

Hört sich für mich an, als sei kein Feintuning geplant :(
Wenn es anderslautende Neuigkeiten gibt, wird es natürlich hier stehen....

H-O,

Jensus
 
@Quhno:
Postest du deinen Kommentar zu Problem B auch im Opera-Forum?
(Oder hab' ich jetzt dort nur nicht ausführlich genug gelesen?)

Grüße
 
So, auch dieser Thread erfreut sich meiner gesteigerten Aufmerksamkeit aus einem bestimmten Grund... Es gibt inzwischen ein Tool: OperaADFilter.
Besonders die Homepage ist ein Besuch wert, das Tutorial ist klasse :)
Was ich noch nicht getestet habe und was auch der Haupt-Hinderungsgrund zum Einsatz dieses Tools sein kann, steht oben unter Punkt C. oder hier.
Weiterführende Links:
ADFilter im Operaforum (engl.)
 
Zuletzt bearbeitet:
Sers,

hab das Tool auch kurz getestet... mich nervt aber schon allein, dass ich es zusätzlich im Hintergrund laufen lassen muss und es sich nicht einfach in Opera integriert.
Und da wohl Punkt C meines Erachtens so nicht behoben werden kann, da das Programm nur zum Abändern der filter.ini, nicht jedoch des Opera-Verhaltens bei der Filterung, dient, werde ich es wohl auch nicht weiter nutzen.

Sollte ich mit meiner Vermutung bzgl. Punkt C falsch liegen bitte hier posten! ;)
 
Oben