NIKKEI NETのEFT修正と主要ニュースの取り込み

前回の更新からかなり間が空いてしまいましたが、久しぶりにPlaggerネタです。

以前からオンラインの新聞としてasahi.comRDFを購読していましたが、NIKKEI NETに変更しました。理由は日経の方が社会人っぽいから。

NIKKEIでは、RSSの提供はありませんが主要ニュースのページを見ると、もうPlaggerで処理してくださいといわんばかりの構成になっています。活用しないてはありません。


ということで、EFTの差分は以下のとおり。

assets/plugins/Filter-EntryFullText/nikkei.yaml

  author: woremacx
handle: http://www\.nikkei\.co\.jp/news/
-extract: <!--FJZONE START NAME="MIDASHI" -->(?:<!-- headline -->)?(.*?)(?:<!-- /headline -->)?<!--FJZONE END NAME="MIDASHI" --></h1>(.*?)<!--FJZONE END NAME="HONBUN" -->
+extract: <!--FJZONE START NAME="MIDASHI" -->(.*)<!--FJZONE END NAME="MIDASHI" -->\s</h1>\s<p>(.*?)&nbsp;&nbsp;
extract_capture: title body
+extract_after_hook: $data->{body} =~ s|(.*)|<p>$1</p>|s;

config.yamlには

 - module: Subscription::Config
config:
feed:
- url: http://www.nikkei.co.jp/news/main/
meta:
follow_link: http://rd.nikkei.co.jp/net/news/main/headline/u=

を追加してください。

これであなたも立派な社会人かも?