PHP-Thema zum schwarzen Index powered by smf. Lektion drei. Die besten Datenbanken sammeln wir selbst. Themen und Installation des russischen Sprachpakets
Organisiert von Botmaster Labs, nicht geplant. Es fehlt die Zeit, das Video wird für den Wettbewerb benötigt, wie ein neumodischer Trend, obwohl es mit guten Screenshots (mein IMHO) einfacher ist, alles zu erklären, und ich wirklich nichts drehen möchte. Es bleiben also nur noch sehr wenige lukrative übrig, dummer Spam regiert gar nicht mehr, hier muss man nachdenken und niemand wird das Thema verbrennen, wenn nur die veralteten versuchen, ein wenig in eine schöne Hülle zu schieben und zu pudern. :) Aber hier geht es nicht um uns. Im Allgemeinen sind diese 3 "nicht", denke ich, im Grunde und wurden für die Mehrheit der potenziellen Teilnehmer zu Hindernissen für die Teilnahme am Wettbewerb. Es ist wie ein Auto von drei zu reparieren: Günstig, hochwertig, schnell - im Service können nur 2 Bedingungen gleichzeitig erfüllt werden. setz dich hin und wähle, was dir näher ist. :) Der Wettbewerb ist der gleiche: Ich habe Zeit, ich kann Videos machen, aber ich habe kein Thema, oder ich kann ein Video machen, ich habe ein Thema, aber ich habe überhaupt keine Zeit, oder ich habe Freizeit und ich habe ein wenig Temka, aber das Video ist beängstigend. Aber das ist gut, wenn 2 Bedingungen gleichzeitig erfüllt sind. Okay, lassen Sie uns die Texte fallen. Ich werde für mich weitermachen. Ich habe es nicht geplant, das heißt ich habe am Wettbewerb teilgenommen, ich habe sogar selbst entschieden, für welchen Artikel ich stimmen würde. Sagen Sie, was Sie wollen, aber Doz kennt die Software sehr gut und weiß, wie man sie sehr vernünftig einsetzt. Aber heute habe ich herausgefunden, dass Intrigen im Wettbewerb aufgetaucht sind. Es stellt sich heraus, dass ich nicht abstimmen kann, aber nur Anfänger, die die Software 2011 gekauft haben und der Wettbewerb für sie konzipiert ist, können dies tun. Ich war ein wenig überrascht, aber der Besitzer ist ein Meister. Der Wettbewerb ist eine Werbekampagne und Alexander weiß besser, wie man sie durchführt. Im Allgemeinen habe ich dann beschlossen, einen Artikel zu veröffentlichen, der etwas einfacher zu schreiben ist, wenn klar ist, für wen, für die gesamte Kolchos, dies tatsächlich unmöglich ist. Die lange Einführung ist vorbei, jetzt kommt es auf den Punkt. Was braucht ein Anfänger, wenn er einen solchen Super-Harvester, den Xrumer + Hrefer-Komplex, erworben hat? Das ist richtig, lernen Sie, wie man daran arbeitet und verwerfen Sie die Illusion, dass Sie Geld verdienen können, indem Sie anfangen, mit Blättern zu spammen. Wenn Sie so denken, spenden Sie Ihr Geld sofort für wohltätige Zwecke. Sie müssen lernen, die Werkzeuge des Komplexes zu verwenden, vorzugsweise indem Sie sie selbst schärfen. Die Zeit "mehr nehmen - mehr werfen" ist vorbei. Quantität weicht Qualität. Also sammeln wir die Basis für uns selbst, lernen Sie nicht, wie das geht - Sie werden dem Zug hinterherhinken. Hrefer wird uns dabei natürlich helfen. Wenn Sie Ihre Ressourcen bei Google bewerben möchten, müssen wir auch über Google nach Spenderseiten suchen. Ich denke, das ist klar und logisch. Doch Google als Besitzer des Kupferbergs verschenkt seinen Reichtum nicht an alle. Sie brauchen eine Herangehensweise daran. Ich möchte gleich sagen, dass Sie nicht hoffen, dass Sie anhand der Schilder, die Sie in der Öffentlichkeit finden, etwas sammeln können. Deshalb sind sie der Öffentlichkeit zugänglich, weil sie wertlos sind. Ich werde das Thema nicht weiter entwickeln. Ich sage Ihnen lieber, wie Sie es richtig zusammenbauen, damit Sie das Ergebnis sehen, den Rest erledigen Sie selbst, Hauptsache, Sie verstehen das Prinzip. Es ist notwendig, auf der Grundlage von spezifischen Engines, die wir benötigen, auf der richtigen Grundlage zu sammeln und nicht auf der Grundlage von Foren im Allgemeinen. Dies ist der Hauptfehler von Anfängern - sich nicht auf das Besondere zu konzentrieren, sondern zu versuchen, alles in seiner Gesamtheit abzudecken. Wenn Sie jedoch eine mehr oder weniger normale Basis analysieren möchten, lehnen Sie es ab, sie in Operatorabfragen zu verwenden. Kein "inurl:", "site:", "title" usw. Google wird Sucher wie Sie sofort sperren. Daher studieren wir sorgfältig die Motoren, mit denen Hrumer derzeit arbeitet:
Unterstützt von php-Fusion
In der Version Hrumer 7.07 wird das Programm in mehreren neuen Engines trainiert:
Und der Prozess des Erlernens neuer Dinge geht kontinuierlich weiter. Im Allgemeinen müssen wir die richtigen Abfragen für das Parsen durch Hrefer vorbereiten. Nehmen wir als Beispiel einen Forum-Djok. SMF-Foren... Und fangen wir an, es zum Analysieren in Teile zu zerlegen. Unser geliebtes Google wird uns dabei helfen. Anfrage in Google eingeben SMF-Foren- es gibt viel Müll in den Suchergebnissen, wir spulen auf die 13. Seite zurück und wählen einen beliebigen Link aus. Ich bin auf diesen gestoßen: http://www.volcanohost.com/forum/index.php?topic=11.0. Wir öffnen es und untersuchen es. Wir müssen etwas charakteristisches auf der Seite finden, das auf die Suche nach anderen Seiten in dieser Suchmaschine angewendet werden kann. In der Fußzeile bemerken wir die folgende Inschrift Angetrieben von SMF 1.1.14, wir zitieren es und geben es in Google ein, es zeigt uns, dass es für diese Anfrage etwa 59 Millionen Optionen kennt. Wir schauen uns schnell die Links an, fügen diesem Keyword ein oder zwei weitere Optionen hinzu, zum Beispiel, "Powered by SMF 1.1.14" Pappel oder "Powered by SMF 1.1.14" viagra... Wir sind davon überzeugt, dass die Anfrage hinreißend ist, nur Foren angezeigt werden und es fast keinen Müll für Sie gibt.
Außerdem geht es uns nicht um Quantität, sondern um Qualität, wie ich oben schon sagte. Weitergehen. Aus demselben Forum nehmen wir einen weiteren Satz aus der Fußzeile: , wir zitieren es auch und füttern es an Google. Als Antwort verrät er, dass er mehr als 13 Millionen Ergebnisse kennt. Wir überfliegen erneut die Suchergebnisse, fügen zusätzliche Wörter hinzu und überprüfen die Ergebnisse damit. Wir sorgen dafür, dass die Abfrage super ist und auch fast kein Müll entsteht. Generell gibt es bereits 2 Eisenanfragen. Ich schlage vor, das erste Forum vorerst in Ruhe zu lassen und weiterhin Anfragen für andere Foren zu sammeln. Zum Glück ist Google auf Anfrage geöffnet 2006-2008, Simple Machines LLC... Aus den Ergebnissen entnehmen wir beispielsweise diese Foren: http://www.snowlinks.ru/forum/index.php?topic=1062.0 und http://litputnik.ru/forum/index.php?action=printpage; topic=380.0 in ihren Fußzeilen nehmen wir die folgenden Abfragen: "Powered by SMF 1.1.7" und "Powered by SMF 1.1.10" (Ich rate immer, Abfragen für Hrefer in Anführungszeichen zu setzen, da wir in erster Linie Qualität brauchen ). Ich denke, es ist klar, was wir tun, am Ende werden wir eine gewisse Basis von Abfragen haben, um nach Foren auf der SMF-Engine zu suchen (sie ist als Beispiel ausgewählt, mit den anderen Engines ist es dasselbe). Es wird ungefähr so aussehen:
"Unterstützt von SMF 1.1.2"
"Angetrieben von SMF 1.1.3"
"Angetrieben von SMF 1.1 RC2"
"Unterstützt von SMF 1.1.4"
"Angetrieben von SMF 1.1.8"
"Unterstützt von SMF 1.1.7"
"2006-2008, Simple Machines LLC"
Und das ist nicht alles. Beim Sammeln der Versionen der Engines finden wir in einigen SMF-Foren in der Fußzeile den Nadvis "2001-2006, Lewis Media". Wir prüfen diesen Wunsch, er erfüllt uns auch vollumfänglich. Wir finden eine ähnliche Abfrage: "2001-2005, Lewis Media". Wenn wir die Fußzeilen durchgehen, finden wir die folgende Abfrage: "SMFone design by A.M.A, ported to SMF 1.1". Wir prüfen - ausgezeichnet. Usw. Eine halbe Stunde Arbeit und Sie haben eine wunderbare Datenbank mit Abfragen für die Engine, und Google wird für diese Abfragen viel seltener gesperrt, als wenn Sie darin Operatoren verwenden. Und gleichzeitig wird Ihre Datenbank viel sauberer, als wenn Sie Abfragen wie „index.php? ein Link zum Forumsthema. Sie mögen argumentieren, sagen sie, was ist daran falsch? Andere haben einen Link hinterlassen, was bedeutet, dass wir es können. Aber! Links können nicht nur von Hrumer, sondern auch von anderen Programmen hinterlassen werden. Darüber hinaus können sie speziell geschärft werden, um Kommentare in einer bestimmten Ressource, der sogenannten hochspezialisierten Software, zu hinterlassen, und solche Links könnten von Hand hinterlassen werden. Nochmals, ich wiederhole, uns ist nicht die Menge an Müll wichtig, sondern die Qualität, die Basis mit den richtigen Anforderungen, und so werden wir sammeln. Der Vorteil dieser Methode ist, dass Sie praktisch nicht in Href konfigurieren müssen Sieb -Filter
, können Sie es einfach ausschalten, denn Google wird Ihnen praktisch keinen Müll geben.
Ich glaube, dass es sehr wichtig ist, in der Anfangsphase den richtigen Umgang mit Hrefer zu lernen, denn wenn Sie dies gelernt haben, können Sie Hrumer immer verwenden, egal wie sich die Situation ändert. Der Schutz wird komplizierter, und wenn bei einigen Motorentypen der Schutz verstärkt wurde und Hrumer damit im Moment nicht zurechtkommt, dann macht es keinen Sinn, Ressourcen für das Sammeln dieser Links und die anschließende Arbeit mit Hrumer aufzuwenden. es ist besser, sich auf das zu konzentrieren, was das Ergebnis liefert ... Und gleichzeitig, wenn das Botmaster Labs-Team Hrumer etwas Neues beigebracht hat, können Sie schnell einen neuen Patienten sezieren und eine Basis für Hrumer vorbereiten, während der Patient noch lauwarm ist. Zeit ist Geld, die Ressource ist beim Kauf der Basis möglicherweise nicht mehr relevant. von jemandem gesammelt. Darüber hinaus erweitert die richtige Sammlung von Basen für sich selbst den "weißen" Einsatz von Hrumer erheblich. Und genau hier bewegt sich alles, ob es uns gefällt oder nicht, und der Prozess des Aufhellens oder Vergrauens geht weiter. Schwarze Laken gehören der Vergangenheit an. Alle anderen, bereits technischen Aspekte der Arbeit mit Hrefer, können in der Hilfe eingesehen werden und es macht keinen Sinn, darauf einzugehen, alle Tore-Punkte-Sekunden werden empirisch für jedes Auto individuell festgelegt. Als Bonus poste ich hier eine Vorlage zum Parsen der chinesischen Suchmaschine Baidu, neulich wurde ich danach gefragt, also habe ich es zwischendurch gemacht, sorry für das Wortspiel. :)
Ich habe versucht, sie mit einem Test zu parsen, es gab kein Verbot, Hrefer sammelte lebhaft Ressourcen, alle Anfragen zum Parsen waren denen von Google ähnlich, aber chinesische Ressourcen waren ein Meer, und mit einer hohen PR, und außerdem gab es viele Orte, an denen die Europäer trat nicht. Es ist besser, mit chinesischen Anfragen zu parsen. Dies wird Google beim Übersetzen helfen, eine Liste von Schlüsselwörtern auf Russisch eingeben und ins Chinesische übersetzen. Wahrheit in " Wörter"Hrefer können keine Wörter auf Chinesisch hinzugefügt werden, Sie müssen sie neu codieren. Statt Chinesisch:
伟哥 - viagra
吉他 - Gitarre
其他 - ausruhen
保险公司 - Versicherung
Fügen Sie diese Codes ein, um sie in der Word-Datei zu ersetzen:
% E4% BC% 9F% E5% 93% A5
% E5% 90% 89% E4% BB% 96
% E5% 85% B6% E4% BB% 96
% E4% BF% 9D% E9% 99% A9% E5% 85% AC% E5% 8F% B8
Wenn Sie für eine Website für Versicherungen werben, dann durch die Platzierung eines Links in Ihrem Profil auf ein thematisches (!) sogar chinesisches Forum auf Anfrage " Forum SMF "保险公司 wird sehr nett sein. Abschließend möchte ich sagen, dass ich nie Leute verstanden habe, die sich beschwert haben, dass die Khrefers schlecht oder nicht gekratzt sind, ich wollte das immer sagen, man kann sie einfach nicht kochen. Besser als ein hrefer, kein Parser weiß, wie man Ergebnisse sammelt, nur die Anfragen müssen korrekt sein. Hrefer ist ein Auto: gut, solide, made in German, aber eine Person fährt es und es hängt alles davon ab, wie intelligent es gefahren wird, man kann das Auto nicht gleichzeitig zwingen, nach rechts und links zu fahren. Ein separates Thema ist die Reinigung von Basen, die ich vor 3 Jahren einmal für den vorherigen Wettbewerb gemacht habe. Bei mehr ist immer noch alles relevant, aber jetzt kann man die Prüfung auf 200 ablehnen OK, dieser Vorgang hat mir wirklich nicht gefallen, die Fehler waren sehr groß, es wurden viele unnötige Dinge herausgefiltert. Dies kann nun fast automatisch im Prozess von Hrumers Arbeit erfolgen, obwohl dieser Prozess kein vollständiges Analogon zur Überprüfung auf "200 OK" ist. Im Allgemeinen auf den Punkt gebracht: Vor nicht allzu langer Zeit bot sich in Hrumer eine wunderbare Gelegenheit - zum Zeitpunkt des Projektlaufs Informationen aus Ressourcen zu rauben. Es sieht aus wie das. Sie fahren eine Vorlage ein, die dabei verarbeitet wird, und die aus der Vorlage gesammelten Informationen werden in die Datei xgrabbed.txt im Ordner Logs eingetragen. Sie können diese Funktion für alles verwenden, die Fantasie ist riesig. Ich benutze diese Funktion einmal pro Woche, um die "abgelaufenen" Links aus der Arbeitsdatenbank zu entfernen. Es ist kein Geheimnis, dass jeden Tag Foren sterben, um die Basis von solchen Ressourcen zu befreien und das Tool "Autograbbing" hilft uns in diesem Fall. Immerhin müssen Sie zugeben, wenn Sie oft zum Beispiel http://www.laptopace.com/index.php eingeben, sehen wir, dass diese Domain beispielsweise bereits ein Gaddyad ist, aber es gibt dort kein Forum. Um diese Schlacke aus der Basis zu werfen, werden wir also plündern. :) Öffnen Sie den Quellcode der Seite und sehen Sie sich diesen Eintrag dort an:
laptopace.com
Verwandeln Sie es zum Greifen in
[...]
Jetzt werden uns alle "Toten" der Goudaddi namentlich bekannt sein. Hier eine kleine Auswahl für das Tool "Autograbbing", wenn Sie die Datenbank von verschiedenen "abgelaufenen" Domänen bereinigen möchten: