关于日经中文网rss链接失效问题的调查

最近战事开始,各国的宣传机构都卯足了劲儿输出观点,正是新闻好看的时候。尤其对比着看来自美国和国内的新闻,从两种完全对立的立场上看同一件事,真是充满了戏剧色彩。

这种时候一般还要对比一下第三方的观点,我就在我的rss里翻日本媒体,发现没有了!搜索日经,才发现这个rss源早就已经失效了。

可我从chrome能正常打开日经中文网,看他今天还在更新文章啊。我又对比了一下我打开的官网上的rss链接和我 rss 阅读器里的日经中文网的 rss url,确实是一致的。甚至我在 chrome 上根本就可以打开那个 rss 链接,里面也是有效的 rss 格式!那为什么 feedly 说它失效了?

其实是不是有效的 rss 格式,我说了是不算的,还是找专业的 validator 来测测看吧。w3c 的 rss validator 测了说不行,为什么不行不知道。换了一个 rss validator 给出了具体错误信息,竟然是 403 了!

为什么?

我 wget 了一下,得到的也是 403,说明不是 ip 问题,那很可能是 user agent 的问题了。于是接着掏出 fiddler 修改了一下 chrome 发出的请求,把 user agent 改成一串随机字符,403 问题就重现了。跟随 403 一起返回的还有下面这个页面:

好吧,虽然不知道日经中文网是出于什么目的,反正他把他们自家的rss功能给废掉了。

作为对策,我写了一个简单的 php 代理,负责用特定 user agent 访问指定的 url,然后我在 feedly 上订阅包含了指向日经中文网 rss 地址的参数的 php 代理链接,就又能在 feedly 上看日经中文网啦!

Comments

发表评论

您的电子邮箱地址不会被公开。