NIKKEI NETのEFT修正と主要ニュースの取り込み
前回の更新からかなり間が空いてしまいましたが、久しぶりにPlaggerネタです。
以前からオンラインの新聞としてasahi.comのRDFを購読していましたが、NIKKEI NETに変更しました。理由は日経の方が社会人っぽいから。
NIKKEIでは、RSSの提供はありませんが主要ニュースのページを見ると、もうPlaggerで処理してくださいといわんばかりの構成になっています。活用しないてはありません。
ということで、EFTの差分は以下のとおり。
assets/plugins/Filter-EntryFullText/nikkei.yaml
author: woremacx
handle: http://www\.nikkei\.co\.jp/news/
-extract: <!--FJZONE START NAME="MIDASHI" -->(?:<!-- headline -->)?(.*?)(?:<!-- /headline -->)?<!--FJZONE END NAME="MIDASHI" --></h1>(.*?)<!--FJZONE END NAME="HONBUN" -->
+extract: <!--FJZONE START NAME="MIDASHI" -->(.*)<!--FJZONE END NAME="MIDASHI" -->\s</h1>\s<p>(.*?)
extract_capture: title body
+extract_after_hook: $data->{body} =~ s|(.*)|<p>$1</p>|s;
config.yamlには
- module: Subscription::Config
config:
feed:
- url: http://www.nikkei.co.jp/news/main/
meta:
follow_link: http://rd.nikkei.co.jp/net/news/main/headline/u=
を追加してください。
これであなたも立派な社会人かも?