WebClient トラブル調査:ヘッダーの差異を調べる

わんくま同盟さんの質問掲示板の「C++.NetでWebClientのOpenReadについて」からのネタです。

今回の事例では、IE からは閲覧できて、WebClient では 503 エラーとなるものでした。
そこで、かんたんにコードを書いて実験することにします。

var wc = new WebClient();
using (var stream = wc.OpenRead(url))
{
}

※url はリクエストを投げる URL を示す文字列変数。

実際に質問に上がっていた URL で試すと、確かに 503 エラーを内包する Exception がスローされます。

ここで、Fiddler を使って差分を見ることにします。

まずは、上記のサンプルコードで試したときの通信内容です。

左側でセッションを選択すると右側に詳細が表示されますので上のビューの Headers を確認します。

非常にシンプルなリクエストになっていることがわかります。

image

次に IE で同じ URL にアクセスしてみて、多数のセッションが表示される中で、同じ URL に対するリクエストを選択して、同じように上のビューの Headers を確認します。

(掲載画像は関係ない部分をモザイクでつぶしています)

image

Accept, Accept-Encoding, Accept-Language, User-Agent などが増えていることがわかります。

1 つのヘッダーを追加するだけで足りるかもしれませんし、複数のヘッダーを追加しないとダメなケースもあるかもしれません。組み合わせを考えて試してみましょう。

今回の事例では User-Agent を何か指定すれば OK だったみたいですので、1 個ずつ試していけばそのうち解決しますね。

なお、この方法でわかるのは、その時点の相手のページがどのようなヘッダー、値を条件にしているかだけであり、将来的に変更される恐れがあります。これは相手の方針やメンテナンス・リニューアルなどの事情によるので不確か(リスク)です。

もしも、相手側がブラウザー以外の閲覧を好ましく思っていないのであれば、無理にやらない方がいいかと思います。