Nasıl kıvrılıp veya bir web sayfasını wget?

oy
16

Benim stackoverflow sayfası getirilir ve önceki günün sayfasından diffs gece bir cron işi yapmak istiyorum, bu yüzden benim sorular, cevaplar, sıralama, vb değişikliği özetini görebilirsiniz

Ne yazık ki, bu işi yapmak için vb çerezler, set hakkını alamadı. Herhangi bir fikir?

Ayrıca, beta bittiğinde, benim durumu sayfası giriş yapmadan erişilebilir olacak?

Oluştur 05/08/2008 saat 21:38
kaynak kullanıcı
Diğer dillerde...                            


5 cevaplar

oy
9

Durumunuz sayfa giriş yapmadan artık kullanılabilir (tıklayın logoutu ve deneyin). Beta-çerez devre dışı bırakıldığında, sizin ve durum sayfası arasındaki hiçbir şey kalmayacak.

wget için:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
Cevap 05/08/2008 saat 21:43
kaynak kullanıcı

oy
6

Gönderen Mark Harrison

Ve burada ne işleri var ...

-s --cookie soba = kıvırmak. https://stackoverflow.com/users

Ve wget için:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
Cevap 05/08/2008 saat 23:04
kaynak kullanıcı

oy
3

İyi fikir :)

Sana kullanılan wget 's ettik tahmin

--load-cookies (filename)

Biraz yardım edebilir ama iyi bir örümcek almak için daha tam bir tarayıcı taklit etmek (Perl veya Python) makineleştirmek gibi bir şey kullanmak daha kolay olabilir.

Cevap 05/08/2008 saat 21:43
kaynak kullanıcı

oy
2

Ve burada ne işleri var ...

curl -s --cookie soba=. http://stackoverflow.com/users
Cevap 05/08/2008 saat 22:22
kaynak kullanıcı

oy
2

Kurabiye ya da çalışmak için nasıl çözemedim, ama ben çıkış yapmış iken benim tarayıcıda benim durumu sayfasına ulaşmak mümkün, bu yüzden stackoverflow kamu gider kez bu çalışacaktır varsayalım.

Bu ilginç bir fikir, ama aynı zamanda altta yatan html kodu diffs cevap vermem? Bir html diff değil gerçek içerik ile biten önlemek için bir strateji var mı?

Cevap 05/08/2008 saat 21:46
kaynak kullanıcı

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more