Siyah dizin php konusu smf tarafından desteklenmektedir. Ders üç. En iyi veritabanlarını kendimiz topluyoruz. Rusça dil paketinin temaları ve kurulumu
Botmaster Labs tarafından organize edildi, planlanmadı. Zaman yok, yeni çıkmış bir trend gibi yarışma için videoya ihtiyaç var, ancak her şeyi iyi ekran görüntüleri (IMHO'm) ile açıklamak daha kolay ve gerçekten hiçbir şey çekmek istemiyorum. Yani çok az karlı olan kaldı, aptal spam artık hiç kural değil, burada düşünmeniz gerekiyor ve sadece eski olanlar güzel bir pakette biraz itip tozlamaya çalışırsa, hiç kimse konuyu yakmaz. :) Ama bu bizimle ilgili değil. Genel olarak, bu 3 "değil", bence, potansiyel katılımcıların çoğunluğu için rekabete katılımın önündeki engeller haline geldi. Üçte bir araba tamir etmek gibi: ucuz, yüksek kaliteli, hızlı - hizmette aynı anda sadece 2 koşul yerine getirilebilir. otur ve sana daha yakın olanı seç. :) Rekabet aynı: Vaktim var, video yapabilirim ama konu yok veya video yapabilirim, konu var ama hiç zamanım yok ya da boş zamanım var ve biraz temka var ama video ürkütücü. Ancak aynı anda 2 koşul karşılanırsa bu iyidir. Peki, tamam, sözleri bırakalım. kendime devam edeceğim. Planlamadım, yani yarışmaya katıldım, hangi makaleye oy vereceğimi bile seçtim. Ne istersen söyle, ama Doz yazılımı çok iyi biliyor ve onu çok mantıklı kullanmayı biliyor. Ama bugün entrikanın yarışmada ortaya çıktığını öğrendim. Görünüşe göre oy kullanamayacağım, ancak yalnızca 2011'de yazılımı satın alan ve yarışma onlar için tasarlanmış yeni başlayanlar bunu yapabilecek. Biraz şaşırdım ama sahibi bir usta. Yarışma bir reklam kampanyasıdır ve Alexander bunun nasıl yürütüleceğini daha iyi bilir. Genel olarak, bir makale yayınlamaya karar verdim, kimin için açık olduğu zaman yazmak biraz daha kolay, tüm toplu çiftlik için, aslında bunu yapmak imkansız. Uzun tanıtım bitti, şimdi konuya. Yeni başlayanlar, Xrumer + Hrefer kompleksi olan böyle bir süper hasat makinesini edindiğinde neye ihtiyaç duyar? Bu doğru, üzerinde nasıl çalışacağınızı öğrenin ve sayfalarla spam göndermeye başlayarak para kazanabileceğiniz yanılsamasını atın. Böyle düşünüyorsanız, paranızı hemen hayır kurumlarına bağışlayın. Kompleksin araçlarını nasıl kullanacağınızı, tercihen kendiniz için keskinleştirerek öğrenmeniz gerekir. "Daha fazla al - daha fazla at" zamanı geçti. Nicelik kaliteye yol açar. Bu yüzden üssü kendimiz için toplayacağız, bunu nasıl yapacağımızı öğrenmeyin - trenin gerisinde kalacaksınız. Elbette Hrefer bu konuda bize yardımcı olacaktır. Kaynaklarınızı Google'da tanıtmayı planlıyorsanız, Google üzerinden bağış siteleri de aramamız gerekir. Bence bu açık ve mantıklı. Ancak Google, bakır dağın sahibi olarak servetini herkese dağıtmıyor. Bunun için bir yaklaşıma ihtiyacınız var. Hemen söylemek isterim ki, halkta bulduğunuz işaretlere dayanarak bir şeyler toplayacağınızı ummayın. Bu yüzden halka açıktırlar, çünkü değersizdirler. Konuyu daha fazla geliştirmeyeceğim. Size nasıl doğru bir şekilde monte edeceğinizi söylesem iyi olur, böylece sonucu görürsünüz, gerisini kendiniz bitirirsiniz, asıl mesele prensibi anlamaktır. Genel olarak forum bazında değil, ihtiyacımız olan belirli motorlar bazında doğru bazında toplama yapmak gerekiyor. Bu, yeni başlayanların ana hatasıdır - spesifik olana odaklanmak değil, her şeyi bütünüyle kapsamaya çalışmak. Yine de, aşağı yukarı normal bir tabanı ayrıştırmak istiyorsanız, bunu operatör sorgularında kullanmayı reddedin. "inurl:", "site:", "başlık" vb. Google, sizin gibi arama yapanları anında yasaklayacaktır. Bu nedenle, Hrumer'in şu anda çalıştığı motorları dikkatlice inceliyoruz:
php-Fusion tarafından desteklenmektedir
Hrumer 7.07 sürümünde, program birkaç yeni motorda eğitilmiştir:
forumi.biz, forumb.biz, 1forum.biz, 7forum.biz vb.
phpBB-fr.com, Solaris phpBB teması
Ve yeni şeyler öğrenme süreci sürekli devam ediyor. Genel olarak Hrefer tarafından ayrıştırma için doğru sorguları hazırlamamız gerekiyor. Örnek olarak bir forum djok'u ele alalım. SMF Forumları... Ve ayrıştırmak için parçalara ayırmaya başlayalım. Sevgili Google'ımız bu konuda bize yardımcı olacaktır. Google'a bir istek girme SMF Forumları- arama sonuçlarında çok fazla çöp var, 13. sayfaya geri sarıyoruz ve herhangi bir bağlantıyı seçiyoruz. Buna rastladım: http://www.volcanohost.com/forum/index.php?topic=11.0. İçini açıp inceliyoruz. Sayfada, bu motordaki diğer sayfaları aramak için uygulanabilecek karakteristik bir şey bulmamız gerekiyor. Altbilgide, aşağıdaki yazıyı fark ediyoruz SMF 1.1.14 tarafından desteklenmektedir, alıntı yapıyoruz ve Google'a giriyoruz, bize bu istek için yaklaşık 59 milyon seçenek bildiğini gösteriyor. Bağlantılara hızlıca bakarız, bu anahtar kelimeye birkaç veya iki seçenek daha ekleriz, örneğin, "SMF 1.1.14 tarafından desteklenmektedir" kavak veya "SMF 1.1.14 tarafından desteklenmektedir" viagra... İsteğin muhteşem olduğuna, yalnızca forumların görüntülendiğine ve sizin için neredeyse hiç çöp olmadığına ikna olduk.
Ayrıca yukarıda da belirttiğim gibi nicelik değil nitelikle ilgileniyoruz. Devam et. Aynı forumdan, altbilgiden başka bir ifade alıyoruz: , biz de alıntılayıp Google'a besliyoruz. Yanıt olarak, 13 milyondan fazla sonucu bildiğini ortaya koyuyor. Yine kısaca konuyu inceliyoruz, ek kelimeler ekliyoruz ve sorunu onlarla kontrol ediyoruz. Sorgunun harika olmasını ve neredeyse hiç çöp olmamasını sağlıyoruz. Genel olarak, zaten 2 demir talebi var. İlk forumu şimdilik yalnız bırakmanızı ve diğer forumlar için istek toplamaya devam etmenizi öneririm. Neyse ki, Google istek üzerine açıktır 2006-2008, Simple Machines LLC... Sonuçlardan örneğin şu forumları alıyoruz: http://www.snowlinks.ru/forum/index.php?topic=1062.0 ve http://litputnik.ru/forum/index.php?action=printpage; topic=380.0 onların altbilgilerinde şu sorguları alıyoruz: "Powered by SMF 1.1.7" ve "Powered by SMF 1.1.10" (Hrefer için her zaman tırnak içinde sürmenizi tavsiye ederim, çünkü her şeyden önce kaliteye ihtiyacımız var). Ne yaptığımızın açık olduğunu düşünüyorum, sonunda SMF motorunda forum aramak için belirli bir sorgu veritabanına sahip olacağız (örnek olarak seçildi, motorların geri kalanı aynı). Bunun gibi bir şey görünecek:
"SMF 1.1.2 tarafından desteklenmektedir"
"SMF 1.1.3 tarafından desteklenmektedir"
"SMF 1.1 RC2 tarafından desteklenmektedir"
"SMF 1.1.4 tarafından desteklenmektedir"
"SMF 1.1.8 tarafından desteklenmektedir"
"SMF 1.1.7 tarafından desteklenmektedir"
"2006-2008, Simple Machines LLC"
Ve hepsi bu değil. Bazı SMF forumlarında motorların versiyonlarını toplarken, alt bilgide "2001-2006, Lewis Media" nadvisini buluyoruz. Bu talebi kontrol ediyoruz, bizi de tam anlamıyla tatmin ediyor. Benzer bir sorgu buluyoruz: "2001-2005, Lewis Media". Altbilgiler arasında dolaşırken şu sorguyu buluyoruz: "SMFone design by A.M.A, SMF 1.1'e taşındı". Kontrol ediyoruz - mükemmel. Vesaire. Yarım saatlik bir çalışma ve motor için harika bir sorgu veritabanınız var ve Google, bu sorgular için operatörleri kullanmaktan çok daha az yasaklanacak. Ve aynı zamanda, veritabanınız "index.php? Topic =" gibi sorgular kullanmaktan çok daha temiz olacaktır, çünkü burada Google sadece ihtiyacımız olan forumları değil, aynı zamanda başarılı olduğumuz birçok kaynak bırakacaktır. Forum konusuna bir bağlantı. Tartışabilirsin, derler ki, bunda yanlış olan ne? Diğerleri bir bağlantı bıraktı, böylece yapabiliriz. Fakat! Linkler sadece Hrumer tarafından değil, diğer programlar tarafından da bırakılabilir. dahası, belirli bir kaynakta, sözde son derece uzmanlaşmış yazılımda yorum bırakmak için özel olarak keskinleştirilebilirler, ayrıca bu tür bağlantılar elle bırakılabilir. Tekrar ediyorum, bizim için önemli olan çöpün miktarı değil, kalitesi, doğru taleplerle temel ve böylece toplayacağız. Bu yöntemin avantajı, pratik olarak Hrefer'de yapılandırmanıza gerek kalmamasıdır. elek-filtre
, basitçe kapatabilirsiniz, çünkü Google pratikte size çöp vermeyecektir.
Hrefer'i ilk aşamada doğru kullanmayı öğrenmenin çok önemli olduğuna inanıyorum, çünkü bunu öğrendikten sonra durum nasıl değişirse değişsin Hrumer için her zaman bir kullanım bulabilirsiniz. Korumalar daha karmaşık hale gelir ve eğer bazı motor türlerinde koruma güçlendirilirse ve Hrumer şu anda bununla başa çıkamıyorsa, o zaman bu bağlantıları toplamak ve ardından Hrumer ile bunlar üzerinde çalışmak için kaynak harcamanın bir anlamı yoktur, sonucu verene odaklanmak daha iyidir ... Aynı zamanda, Botmaster Labs ekibi Hrumer'a yeni bir şey öğrettiyse, yeni bir hastayı hızla parçalara ayırabilir ve hasta henüz ılıkken Hrumer için bir temel hazırlayabilirsiniz. Vakit nakittir, üssü satın aldığınızda kaynak artık alakalı olmayabilir. birisi tarafından toplanmıştır. Ek olarak, kendiniz için doğru baz koleksiyonu, Hrumer'in "beyaz" kullanımını önemli ölçüde genişletir. İşte tam da bu noktada, hoşumuza gitsin ya da gitmesin her şey hareket ediyor ve beyazlaşma ya da grileşme süreci devam ediyor. Siyah sayfalar geçmişte kaldı. Geri kalan her şey, zaten Hrefer ile çalışmanın teknik yönleri, yardımda görülebilir ve bunlar üzerinde durmanın bir anlamı yoktur, tüm hedefler-puan-saniyeler her araba için ayrı ayrı ampirik olarak belirlenir. Bonus olarak, buraya Çin arama motoru Baidu'yu ayrıştırmak için bir şablon göndereceğim, geçen gün bana sorulmuştu, bu yüzden arada yaptım, kelime oyunu için özür dilerim. :)
Bunları test ederek ayrıştırmaya çalıştım, yasak yoktu, Hrefer kaynakları canlı topladı, tüm ayrıştırma istekleri Google'ınkine benziyordu ama Çin kaynakları bir denizdi ve PR'ı yüksekti ve bunun yanında Avrupalıların yaptığı birçok yer vardı. ayak gitmedi. Çince isteklerle ayrıştırmak daha iyidir. Bu, Google'ın çeviri yapmasına, Rusça bir anahtar kelime listesi yazmasına ve onu Çince'ye çevirmesine yardımcı olacaktır. Gerçek" kelimeler"Çince kelimeler eklenemez, yeniden kodlamanız gerekir. Çince yerine:
伟哥 - viagra
吉他 - gitar
其他 - dinlenme
保险公司 - sigorta
Bunları word dosyasında değiştirmek için bu kodları koyun:
% E4% BC% 9F% E5% 93% A5
% E5% 90% 89 E4% BB% 96
% E5% %85 B6% E4% BB% 96
% E4% BF% 9D% E9 %99 A9 E5% %85 AC% E5% 8F% B8
Sigorta için bir web sitesini tanıtıyorsanız, o zaman profilinize bir tematik (!) Çin forumunda bile istek üzerine bulunan bir bağlantı yerleştirerek " Forum SMF "保险公司çok güzel olacak. Sonuç olarak şunu söylemek isterim ki, Khreferlerin kötü olduğundan ya da ayrıştırmadığından şikayet edenleri hiç anlamadım, hep şunu söylemek istedim, sadece nasıl pişireceğinizi bilmiyorsunuz. Bir hreferden daha iyi, hiçbir ayrıştırıcı sonuçların nasıl toplanacağını bilemez, yalnızca isteklerin doğru olması gerekir. Hrefer bir araba: iyi, sağlam, Almanca yapılmış, ancak bir kişi kullanıyor ve her şey ne kadar akıllı kullanıldığına bağlı, arabayı aynı anda sağa ve sola gitmeye zorlayamazsınız. Ayrı bir konu üslerin temizliği, bir önceki yarışma için 3 yıl önce yapmıştım. Daha fazlası ile, her şey hala alakalı, ancak şimdi 200'ü kontrol etmeyi reddedebilirsiniz Tamam, bu süreci gerçekten beğenmedim, hatalar çok büyüktü, birçok gereksiz şey filtrelendi. Şimdi bu, Hrumer'in çalışması sürecinde neredeyse otomatik olarak yapılabilir, ancak bu süreç "200 OK" kontrolünün tam bir analogu değildir. Genel olarak, şu noktaya kadar: çok uzun zaman önce Hrumer'de harika bir fırsat ortaya çıktı - proje çalışması sırasında kaynaklardan bilgi çalmak. Şuna benziyor. Süreçte işlenecek bir şablonda sürüyorsunuz ve şablondan toplanan bilgiler Günlükler klasöründeki xgrabbed.txt dosyasına girilecek. Bu işlevi her şey için kullanabilirsiniz, hayal gücünün uçuşu çok büyük. Bu işlevi, "süresi dolmuş" bağlantıları çalışan veritabanından kaldırmak için haftada bir kez kullanıyorum. Tabanı bu tür kaynaklardan temizlemek için forumların her gün öldüğü bir sır değil ve "Autograbbing" aracı bu durumda bize yardımcı olacak. Ne de olsa, genellikle http://www.laptopace.com/index.php yazarak, bu alanın zaten bir gaddyad olduğunu görüyoruz, ancak orada bir forum yok. Yani bu cürufu tabandan atmak için yağmalayacağız. :) Sayfanın kaynak kodunu açın ve oradaki şu girişi görün:
dizüstü bilgisayar.com
Kapmak için, onu dönüştürün
[...]
Şimdi goudaddi'den gelen tüm "ölüler" bize ismen bilinecek. Veritabanını farklı "süresi dolmuş" etki alanlarından temizlemek istiyorsanız, "Otomatik Yakalama" aracı için küçük bir seçim: