ゲンダイネット(日刊ゲンダイ)用EFT

Plagger夕刊フジZAKZAKも購読していますが、夕刊紙のライバルということでゲンダイも併読しようとEFTを書いて見ました。

HTMLがかなりOldでidもclassもなく、;やスペース違いが混ざっって正規表現のチェックが大変でした。

追記) otsuneさんのコメントを反映しました。 2006-11-05


assets/plugins/Filter-EntryFullText/gendai.yaml

 author: Nobuhito SATO
handle: http://gendai\.net/\?m=view
extract: <!-- 記事部 -->.*<div align="right">(\d{4}年\d\d月\d\d日)&nbsp;?掲載</div>\s<font class="size5"><b>(.*?)</b></font>.*?<span style="line-height:\s?125%;?">(.*?)</span>
extract_capture: date title body
extract_date_format:
- %Y年%m月%d日

config.yaml

 - module: Subscription::Config
config:
feed:
- url: http://gendai.net/
meta:
follow_link: /\?m=view