JavaでHTMLを扱う時に便利なあれこれ・・・。

まぁ職業柄、Webシステム構築というより、
「与えられたASPにいかに迅速に更新をするか」を考えることが多い。


ECサイトを運営している会社ならたいてい、
楽天ショッピング、Yahooショッピングの
両モール運営しているところが多いはず。


楽天データ→Yahooデータ
Yahooデータ→楽天データ


・・・いずれにしても難しい。
簡単にするにはコストがかかる。


それを0円でかつ迅速にするのが僕の役目です。
結論、バッチファイルを量産しています。
しかもJavaで・・・・。
フレームワークも使わず・・・・。


まぁ今日は、べた書きでHTMLを置換する必殺テク的な何かをお送りします。


<String Version>
HTMLをすべて末梢する

name.replaceAll("<.+?>", "");


任意タグを末梢する
(imgタグの場合)

name.replaceAll("<img.+?>", "");

最後にid属性をいれたりすると末端が指定しやすいよ。