HTMLファイル -> テキスト変換フィルタ HtoX32 Ver.1.72 by T-Matsuo  HtoX32は、HTMLで書かれたファイルからテキストファイルを生成するフィルタソフト です。JIS,EUC,シフトJIS,Unicode,UTF-8の各文字コードを自動判別して、シフトJISに 変換して出力します。タグ情報をもとに整形も行います。 ■改変履歴■ 2004/08/08 Ver.1.72 ・「〜外は変換しない」オプションを廃止 ・タグがネストしている時に「テーブルの常に左寄せ」オプションが効かなく なるバグを修正 ・文中に半角カタカナを含むと、2バイト文字が改行で分断されることがあるバグを修正 ・強制改行後は一時的に左寄せするように修正 ・タグをsrc属性の文字列に置換できる機能を追加(BBS6223) 1999/6/21 Ver.1.71 ・希に、、を誤判定することがあるバグを修正 ・「シェル拡張」を行うと「ファイルをエディタで開く」オプションがONになってしまう バグを修正 ・インストーラとアンインストーラを追加 1999/5/30 Ver.1.70 ・HTML4.0の全ての文字実体参照(Å 等)、数値文字参照(å 等)に対応。 ただし、シフトJIS全角で表現できない文字は"??"で置換する。 ・
タグの挙動を改善
・タグに対応
・入力可能文字コードにUnicode,UTF-8を追加
・エクスプローラの右クリックメニュー拡張に対応
・「8.3形式のファイルは大文字で保存する」オプションを追加

1998/11/23 Ver.1.62
・レジストリを正しく読めないことがあるバグを再修正

1998/11/21 Ver.1.61
・レジストリを正しく読めないことがあるバグを修正
・comctl32.dll バージョン4.71以前の時、設定プロパティを表示できないバグを修正
・改行コードで分断されたタグを処理できるように改良

1998/11/09 Ver.1.60
・複数ファイルを処理したときに文字コード判別を間違えることがあるバグを修正
・<IMG>タグのALTオプションでの代替テキストが半角スペースで途切れるバグを修正
・<IMG>タグで置換される文字列をユーザー定義出来るように改良
・「リンク先のパスの挿入」で内部リンクを無視するオプションを追加

1998/10/10 Ver.1.50
・「テーブルを常に左寄せする」オプションを追加
・「リンク先のパスを挿入する」オプションを追加

1998/09/19 Ver.1.41
・「変換後にエディターで開く」オプションに相当するコマンドラインオプション"/e"を追加(拡張子連動でビューアー風な使い方が可能)
・画面のフォントが「大きいフォント」のとき、HtoX32で表示する多くのテキストがコントロールからはみ出していた不具合を修正(アプリの動作には支障ありません)

1998/08/12 Ver.1.40
・「<HTML>〜</HTML>外は変換しない」オプションをチェックできなかったバグを修正
・「指定桁で強制改行」オプションを追加

1998/05/26 Ver.1.32
・Windows95の初期バージョンで、HtoX32 設定プロパティのタブ名が文字化けするバグを修正(この手のバグまだありそうで怖い(^^;)

1998/05/25 Ver.1.31
・メニューの「変換後にエディターで開く」のチェック状態判定の誤りを修正
・メニュー文字列の誤字修正「誤:HTX32」「正:HtoX32」等
・Windows95の初期バージョンで、HtoX32 設定プロパティの下部が欠けるバグを修正

1998/05/04 Ver.1.30
・起動時に引数を伴っているときは、2重起動を禁止しないように変更
・</TH>,</TD>の無いテーブルに対応
・<CENTER>タグとALIGN属性による行揃え(<P>,<DIV>,<Hnum>)をネスティング可能に
・<HR>タグでのWIDTH,ALIGN,属性に対応
・<META>,<!-- 〜 -->でのダブルクォートの解釈を修正
・<PRE>〜</PRE>で囲まれたテキストの前後に段落を設定するように変更
・<IMG>タグを文字列("[画像]"など)に置換する機能を追加
・HTMLファイル中の改行コードは半角スペースに置換するように変更
・テーブルの区切り文字を(半角スペース)、(,)、(TAB)から選ぶオプションを追加
・変換後のファイルを自動的にエディターで開くオプションを追加
・その他細かい調整

1998/03/30 Ver.1.22
・<pre>〜</pre>で囲まれた整形済みテキストでMACの改行コードにも対応
・コマンドラインからの実行で、ワイルドカードに対応
・インストーラを少し親切に(解凍前のメッセージ追加)
・HtoX32.txt中のurlの誤りを修正
・プログラム内部でのエラーチェックを強化
・ダイアログリソースの修正

1998/03/18 Ver.1.21
・ファイル(F)→開いて変換(O)で、一つだけのファイルを開けないバグを修正

1998/03/17 Ver.1.20
・ファイル(F)→開いて変換(O)でファイルを開いたときに、検索ハンドルを解放しないバグを修正(Ver.1.10以降で発生したバグらしい)
・ファイル(F)→開いて変換(O)で複数ファイルを開くとき、一部の漢字パス名を受け付けないバグを修正
・ウインドウのデザインを多少変更
・変換中に設定ダイアログを開いたときに、それ以後の動作が不安定になるバグを修正
・バージョン情報に、WWWとE-Mailへのリンクを追加
・特殊フォント &reg;&#169;&copy;&#174;&nbsp; に対応
・";"で区切らない特殊フォントの使い方を考慮
・「EOFコードを除去する(E)」オプション追加
・「文末が改行コードでないときは改行コードを付加(F)」オプション追加

1998/03/04 Ver.1.11
・Windows95の初期バージョンで実行したとき、ダイアログの一部にしかドロップを受け付けなくなるバグを修正
・ダイアログのデザインを多少変更

1998/03/02 Ver.1.10
・長さが200バイト以上のパス名の処理で、バッファーオーバーランで落ちることがあったのを修正
・「<TITLE>〜</TITLE>間を変換する(T)」オプションが無視されるバグを修正
・ワーカースレッドの一部書き直し(信頼性向上のため)

1998/02/10 Ver.1.00
・EOF検出の誤りを修正
・</pre>後のオプションが狂うバグを修正
・タグ認識を前方一致から(半)完全一致に変更
・<title>〜</title>最大長制限を緩和=無制限
・<title>〜</title>で改行コードを除去
・新たに対応したタグ
 <BLOCKQUOTE>,</BLOCKQUOTE>
 <H1>〜<H6>
 </H1>〜</H6>
 <UL>,<OL>,<MENU>,<DIR>
 </UL>,</OL>,</MENU>,</DIR>,<LI>
 <DL>,</DL>,<DT>,<DD>
 <H>,<P>,<DIV>
 <STYLE>〜</STYLE>
 <SCRIPT>〜</SCRIPT>
 <APPLET>〜</APPLET>
 ALIGN属性による行揃え(<P>,<DIV>,<Hnum>)
・特殊フォント &lt;,&#60;,&gt;,&#62;,&amp;,&#38;,&quot;,&#34;に対応
・その他調整

1998/01/25 Ver.0.10
初版

■動作環境■
Windows95/98/Me/NT4.0/2000/XP
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~
■インストール■
 配布ファイル htox3xxx.exe(xxxはバージョン番号) を実行すると、フォルダへの解凍
(インストール)とスタートメニューへの登録を行えます。

■アンインストール■
[コントロールパネル]の[アプリケーションの追加と削除]で行って下さい。

■使い方■
 HtoX32.EXE を実行すると HtoX32 の本体(ダイアログ)が表示されますので、テキスト
ファイルに変換したい html ファイルをドラッグ&ドロップしてください。
 「オプション」で指定されたフォルダに、テキストファイルが生成されます。
 詳しい使い方はヘルプファイルをご覧ください。

■処理内容■
【タグの置換】
__________________________________________________
<A HREF="★">(新設:Ver.1.50〜)
	「★=リンク先パス(URL等)」
	リンク先パスに置換する
__________________________________________________
<IMG SRC="○" ALT="★">(変更:Ver.1.60/Ver.1.72)
	"[Image]","[(src=)]","[(alt=)]"またはユーザ定義文字列に置換する。
__________________________________________________
<PRE>〜</PRE>
<XMP>〜(追加:Ver.1.70〜)
	改行、半角スペース、タブコードを保存。
	(CR   =>CRLF)
	(LF   =>CRLF)
	(CRLF =>CRLF)
	タグで囲まれたテキストの前後に段落を設定する。
__________________________________________________

	出力テキストの先頭に挿入。
__________________________________________________
〜
	このタグの外は処理しない。
	(デフォルトでは無効)
__________________________________________________

「☆=線の長さ(ピクセル単位の指定はすべて100%とみなす)」 「★=LEFT(左揃え) or CENTER(中揃え) or RIGHT(右揃え)」 改行して、横罫線を"-"で再現する。 __________________________________________________
強制改行する。 __________________________________________________
指定桁内でセンタリングする。 (指定桁数をあふれた場合はそのまま出力) __________________________________________________
タグで囲まれたテキストの前後に段落を設定する。 __________________________________________________

「☆=LEFT(左揃え) or CENTER(中揃え) or RIGHT(右揃え)」 ALIGN属性にしたがって行揃えをする。 タグで囲まれたテキストの前後に段落を設定する。 「連続指定は無視、直前が改行のときは一行開けるだけ」 __________________________________________________

段落を設定する。 __________________________________________________ 「☆=1〜6 (数値による表現の相違は無し)」 「★=LEFT(左揃え) or CENTER(中揃え) or RIGHT(右揃え)」 ALIGN属性にしたがって行揃えをする。 タグで囲まれたテキストの前後に段落を設定する。 __________________________________________________

「☆=LEFT(左揃え) or CENTER(中揃え) or RIGHT(右揃え)」 ALIGN属性にしたがって行揃えをする。 ALIGN属性を省略したときはLEFTが指定されたとみなす。 タグで囲まれたテキストの前後で改行する。 __________________________________________________
タグで囲まれたテキストの前後に段落を設定する。 __________________________________________________
改行して、半角スペース2個でインデント。 __________________________________________________
改行する。 __________________________________________________
タグで囲まれたテキストを半角スペース2個でインデント。 タグで囲まれたテキストの前後に段落を設定する。 (ネスティング可) __________________________________________________
  • 改行する。 (
    の中では番号順リストを作成。) __________________________________________________
  • 改行する。 __________________________________________________ 削除する。 __________________________________________________ 【特殊フォントの置換】 (追加:Ver.1.70〜) HTML4.0の全ての文字実体参照(Å 等)、数値文字参照(å 等)に対応。 ただし、シフトJIS全角で表現できない文字は"??"で置換する。 __________________________________________________ 【漢字コードの変換】 (追加:Ver.1.70〜) EUC、JIS、シフトJIS、Unicode、UTF-8を自動判別してシフトJISに変換して出力。 文字コードの分布を根拠に判断します。 __________________________________________________ 【改行コード】 半角スペースに置換(
    を除く) (連続する半角スペースは1つにまとめる) __________________________________________________ 【その他】 全角スペースはそのまま 連続する半角スペース及びタブコードは1つにまとめる 行頭行末の空白を削除 文中のEOFコード(0x1a)を除去 文末が改行コードでないときは改行コードを付加 ■Win32コマンドライン(CUI)版HtoX32cについて■  以下のURLでWindowsのDOS窓で動作するWin32コマンドライン(CUI)版の HtoX32cも公開しています。 http://www.win32lab.com/ コマンドライン(CUI)ベースのプログラムですが処理内容は同じです。 ■MS-DOS版HtoXについて■  以下のURLでMS-DOSで動作する16ビット版のHtoXも公開し ています。 http://www.win32lab.com/ コマンドライン(CUI)ベースのプログラムですが処理内容は同じです。 ■使用条件等■ ・このソフトウェアは無料ですが、無保証です。 ■一次配付先■ http://www.win32lab.com/ -------------------------------------------------------------------------------
    テーブルデータでのセルの区切り文字を挿入。 (半角スペース or カンマ or TAB) __________________________________________________