htmlからtableのタグを抽出+文字のみを抽出

sedコマンドを使用することでhtmlから任意のタグのみを抽出することが出来る

sed -ne '/<table/,/<\/table>/p'

タグを消したければ以下のようにすれば良い

sed -e 's/<[^>]*>//g'

他にも正規表現を使うことで様々なことが出来る。 
オプションの順番が違うと上手く行かないので注意が必要。
eオプションは必ず最後!