メーリングリストアーカイブ [記事番号:9024]
[windows:9024] Re: ホームページ上に 縦書きに書 かれた文章について教えて下さい
中村 のりつぐ です。
In article <20020804.230235.89224968.mitsugu@argv.org>
Mitsugu SAKAMOTO <mitsugu@argv.org> wrote:
> > 実は 宇多田ヒカルさんのホームページを見ていたら、
> > ロングインタビューと言うのがあって それを読もうとしたら 縦書きの文章な
> > のです。
> ソースを見てみると、<table> と<br> を多量に使って縦書きを表現しているの
> で、もうわれわれは太刀打ちできません。
決めうちで変換するスクリプトを作ってみました。
Perl5 が必要です。
p01.htm から p03.htm と
p05.htm から p25.htm では形式が異なっていたので
2つ作りました。
縦棒を長音に変換する部分は実装していません
(「|」を「ー」に変換する必要あり)
# 夏休みに感謝
ここから p01.htm から p03.htm 用
#!/usr/bin/env perl
#
# for hikki Long Interview
# p01.htm - p03.htm
#
# 2002.08.05
# Noritsugu Nakamura
%kigou = ('kakko1', '「',
'kakko2', '」',
'kakko3', '『',
'kakko4', '』',
'kakko5', '(',
'kakko6', ')',
'kuten', '、',
'touten', '。',
'nami', '〜',
'mmm', '…');
$mode = 0;
while (<>) {
if (/<table\s+bgcolor/i) {
$mode++;
if ($mode >= 2) {
unshift(@text, "$str\n");
print @text;
@text = (); $str = "";
}
}
if (/<TD.+tate">(\S+)<br>/i) {
unshift(@text, "$str\n") if ($str ne "");
$str = $1;
} elsif (/\s+([^<> ]+)<br>/i) {
$tmp = $1;
#$tmp = s/|/ー/g;
$str .= $tmp;
} elsif (/SRC="kigou\/(\w+).gif"/i) {
$kigou = $1;
if (/<TD /) {
unshift(@text, "$str\n");
$str = $kigou{$kigou};
} else {
$str .= $kigou{$kigou};
}
}
}
unshift(@text, "$str\n");
print @text;
ここから p04.htm から p25.htm 用
#!/usr/bin/env perl
#
# for hikki Long Interview
# p04.htm -
#
# 2002.08.05
# Noritsugu Nakamura
%kigou = ('kakko1', '「',
'kakko2', '」',
'kakko3', '『',
'kakko4', '』',
'kakko5', '(',
'kakko6', ')',
'kuten', '、',
'touten', '。',
'nami', '〜',
'mmm', '…');
$mode = 0;
while ($line = <>) {
if ($line =~ /<table\s+bgcolor/i) {
$mode++;
if ($mode >= 2) {
print @text;
@text = ();
}
}
if ($line =~ /<TD /i) {
#print "* $line\n";
chomp($line);
$line =~ s/<[^<>]+SRC="kigou\/(\w+).gif"[^<>]+>/$kigou{$1}/g;
$line =~ s/<[^<>]+>//g;
unshift(@text, "$line\n") unless ($line =~ /^\s*$/);
}
}
print @text;
中村 典嗣 E-mail: nnakamur@mxq.mesh.ne.jp
Received: from rcpt-expgw.biglobe.ne.jp (rcpt-expgw.biglobe.ne.jp [202.225.89.147])
by sl.sakura.ne.jp (8.9.2/[SHINGUJI/SAKURA-990115]) with ESMTP id BAA20786
for <windows@sl.sakura.ne.jp>; Mon, 5 Aug 2002 01:21:18 +0900 (JST)
Received: from smtp-gw.biglobe.ne.jp
by rcpt-expgw.biglobe.ne.jp (mnmy/5508310702) with ESMTP id g74GLDB11576
for <windows@sl.sakura.ne.jp>; Mon, 5 Aug 2002 01:21:13 +0900 (JST)
X-Biglobe-Sender: <nnakamur@mxq.mesh.ne.jp>
Received: from localhost (211.135.191.190 [211.135.191.190]) by smtp-gw.biglobe.ne.jp
id BCHWC0A8274A; Mon, 05 Aug 2002 01:21:11 +0900 (JST)
To: windows@sl.sakura.ne.jp
Subject: [windows:9024] Re:
ホームページ上に 縦書きに書
かれた文章について教えて下さい
In-Reply-To: <20020804.230235.89224968.mitsugu@argv.org>
References: <200208042140.E2MW94BV@m3.kcn.ne.jp>
<20020804.230235.89224968.mitsugu@argv.org>
X-Mailer: Mew version 1.94.2 on Emacs 20.6 / Mule 4.0 (HANANOEN)
Mime-Version: 1.0
Content-Type: Text/Plain; charset=iso-2022-jp
Content-Transfer-Encoding: 7bit
Message-Id: <20020805012506O.nnakamur@mxq.mesh.ne.jp>
Date: Mon, 05 Aug 2002 01:25:06 +0900
From: Noritsugu Nakamura <nnakamur@mxq.mesh.ne.jp>
X-Dispatcher: imput version 20000228(IM140)
Lines: 122
Sender: owner-windows@sl.sakura.ne.jp
X-ML-Sequence: 9024
X-ML-Name: windows
Precedence: bulk
Reply-To: windows@sl.sakura.ne.jp |
(C)SAKURA Internet 1996-1998