htmlからtableのタグを抽出+文字のみを抽出

jyozi 72views 更新:2017年2月16日

sedコマンドを使用することでhtmlから任意のタグのみを抽出することが出来る

sed -ne '/<table/,/<\/table>/p'

タグを消したければ以下のようにすれば良い

sed -e 's/<[^>]*>//g'

他にも正規表現を使うことで様々なことが出来る。 
オプションの順番が違うと上手く行かないので注意が必要。
eオプションは必ず最後!

ログイン / 新規登録してコメントする

このソースコードをストックして後で利用したり、作業に利用したソースコードをまとめることができます。

こちらもお役に立つかもしれません