• R/O
  • HTTP
  • SSH
  • HTTPS

luatexja: コミット

ソースコードの管理場所


コミットメタ情報

リビジョン315ac00b013e792bfd2a54f8caa0eb13a9f42b40 (tree)
日時2011-04-20 15:19:57
作者Hironori Kitagawa <h_kitagawa2001@yaho...>
コミッターHironori Kitagawa

ログメッセージ

変更されたファイルのコミットをまた忘れていた;

変更サマリ

差分

--- a/doc/s1sty.tex
+++ b/doc/s1sty.tex
@@ -1,4 +1,5 @@
11
2+\font\sevenbf=cmbx7
23
34 % Fonts for 8pt
45 \font\eightrm=cmr8
@@ -43,7 +44,8 @@
4344
4445 \def\big{\bigbf\biggt\xkanjiskip=0.25\zw plus 0.10\zw minus 0.10\zw}
4546
46-\def\normalsize{\def\rm{\textfont0=\tenrm\tenrm\fam0}\def\bf{\tenbf\gt}%
47+\def\normalsize{\def\rm{\textfont0=\tenrm\tenrm\fam0\let\sx=\sevenrm}%
48+ \def\bf{\tenbf\gt\let\sx=\sevenbf}%
4749 \let\it=\tenit \let\sl=\tensl \let\mus=\tenmus
4850 \let\sc=\tensc \def\tt{\tentt\tenjtt}%
4951 \let\mc=\tenmc \let\gt=\tengt
@@ -106,10 +108,10 @@
106108
107109 % itemize
108110 \newcount\enumi\enumi=0
109-\def\item{\par\medskip\leftskip=3\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss$\bullet$\hss}}
110-\def\itemitem{\par\leftskip=5\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss$-$\hss}}
111-\def\itemT{\par\leftskip=7\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss$\bullet$\hss}}
112-\def\enum{\par\medskip\advance\enumi1\leftskip=3\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss\the\enumi.\kern0.5\zw}}
111+\def\item{\par\medskip\leftskip=2\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss$\bullet$\hss}}
112+\def\itemitem{\par\leftskip=4\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss$-$\hss}}
113+\def\itemT{\par\leftskip=6\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss$\bullet$\hss}}
114+\def\enum{\par\medskip\advance\enumi1\leftskip=2\zw\noindent\hskip-1\zw\hbox to 1\zw{\hss\the\enumi.\kern0.5\zw}}
113115 \def\enditem{\medskip\par\enumi=0\leftskip=0pt\parskip=0pt\noindent}
114116
115117 \setjaparameter{cjkxspmode={`★,0}}
Binary files a/doc/sample1.pdf and b/doc/sample1.pdf differ
--- a/doc/sample1.tex
+++ b/doc/sample1.tex
@@ -3,7 +3,7 @@
33
44 \message{BB}
55 \overfullrule=0pt
6-\def\LaTeX{L\kern-.36em\setbox0=\hbox{T}\vbox to\ht0{\hbox{\sevenrm A}\vss}\kern-.15em\TeX}
6+\def\LaTeX{L\kern-.36em\setbox0=\hbox{T}\vbox to\ht0{\hbox{\sx A}\vss}\kern-.15em\TeX}
77 \font\mff=manfnt at 10pt
88 \def\mf{{\mff META{\rm\-}FONT}}
99 \def\textfontii{\the\textfont2 }
@@ -82,51 +82,6 @@
8282 \rm\tenipam abcほげほげ)(あいう本文本文……
8383 \endtt
8484
85-\beginsection 実装解説
86-
87-\beginparagraph attributes, dimensions,$\,\ldots$
88-
89-以下はLua\TeX-jaパッケージ内で使用するattributeやその他の種類のレジスタである.
90-上6つは内部処理用なので利用者が意識することはない.それ以外は,p\TeX に類似の名前の
91-primitiveがあることから,意味は容易にわかるだろう:
92-
93-\item attribute |\luatexja@curjfnt|: 現在の和文フォント番号
94-
95-p\TeX では内部のグローバル変数で「現在の横組/縦組和文フォント」をそれぞれ保持していたが,
96-当然ながら欧文用\TeX ではそのようなことはそのままではできない.
97-node~$p$が保持しているattribute |\luatexja@curjfnt|の値$k$は,
98-「もし$p$の中身が和文文字であれば,そのフォントは$k$番の番号のフォントである」という意味をもつ.
99-
100-\item attribute |\luatexja@charclass|: (和文文字の)文字クラス
101-
102-\item attribute |\luatexja@icflag|: この属性をもつkernはイタリック補正由来である
103-
104-p\TeX では,|\kern|由来のkernと,イタリック補正由来のkernを内部で区別していた.しかし,
105-欧文用の\TeX ではそのような区別はなく,Lua\TeX においても区別がないようである.
106-
107-\item language |\luatexja@japanese|: 「日本語」に対応する|\language|番号
108-
109-\item attribute |\luatexja@yabaselineshift|: 欧文文字ベースラインの補正量.
110-\itemitem {\bf sp$\fam\bffam {}=2^{-16}\,{\bf pt}$単位の整数値}で指定.
111-正の値を指定すると,その分だけ欧文文字は下にずれる.
112-\itemitem 数式中では,boxやruleもこの量だけずれる\hfil\break
113-(よって,行中数式は全体が|\yabaselineshift|だけずれたように見える).
114-\item attribute |\luatexja@ykbaselineshift|: 和文文字ベースラインの補正量.
115-
116-p\TeX では「和文が主」という考えからか,常に和文文字のベースラインが基準であり,
117-欧文文字の方をずらすことになっていた.しかし,「欧文の中に和文をちょっと入れる」ような場合では,
118-逆に和文文字をずらす方が理にかなっているので,和文文字のベースラインもずらせるようにした.
119-
120-また,これを用いることで%
121-{\small 異なる文字サイズの文字を「上下中央揃え」で組む}ことも可能.
122-\item skip |\kanjiskip|: 和文文字同士の間に入る空白量.
123-\item skip |\xkanjiskip|: 和文文字と欧文文字の間に入る空白量.
124-\item count |\jcharwidowpenalty|: {\bf 未実装}
125-\item dimen |\zw|, |\zh|: 現在の和文フォントの「幅」/「高さ」(メトリックから指定)
126-\item dimen |\jQ|, |\jH|${}= 0.25\,{\rm mm}$
127-\enditem
128-
129-
13085 \beginparagraph 和文フォントの定義
13186
13287 Lua\TeX-jaでは,大雑把にいうと
@@ -175,6 +130,55 @@ PSフォント名<PSfont_name>を直接指定することもでき,
175130 (|test01-noembed.pdf|を参照).
176131 \enditem
177132
133+\beginparagraph 「和文文字の範囲」の設定
134+
135+\item |\defcharrange{<name>}{<char_range>}|: 文字範囲の定義.
136+\itemitem <name>: 範囲を参照するためにつけるkey.
137+\itemitem <range>: 文字範囲を|"100-"200, 800, 1701-|のように指定する.
138+\itemT ASCII codeの範囲 (|0x00|--|0x7F|) は指定できない.
139+\itemT 既に他の文字範囲に使われている領域を指定することはできない.
140+また,内部処理の都合上,引数に指定している範囲達はdisjointでなければならない.
141+\item 各「文字範囲」ごとに,以下の5種類の取り扱い方を設定できる.
142+{\bf 下表の3, 4列目の部分についてはまだ未実装である.}
143+
144+\medskip
145+
146+\vbox{\leavevmode\hfill\leftskip=0pt\vbox{\lineskiplimit=\maxdimen\lineskip=0pt\halign{%
147+\quad\hfil#\hskip.5\zw\vrule height 1.38\zh depth 0.62\zh%
148+\hskip.5\zw&\hfil#\hfil\quad&\hfil#\hfil\quad&\hfil#\hfil\quad\cr
149+\noalign{\hrule height 0.8pt}
150+ &\bf 和文文字扱い&|\catcode|&\bf |\jcharwidowpenalty|無視\cr
151+\noalign{\hrule}
152+|punct| &○ &12 &○ \cr
153+\noalign{\hrule}
154+|letter|&○ &12 &NO \cr
155+\noalign{\hrule}
156+|kanji| &○ &11 &NO \cr
157+\noalign{\hrule}
158+|kana| &○ &11 &NO \cr
159+\noalign{\hrule}
160+|noncjk|&NO &|\catcode|依存&---\cr
161+\noalign{\hrule height 0.8pt}
162+}}\hfill\null}
163+
164+Lua\TeX-ja では文字範囲の設定用に5つのattributeを確保しており,
165+{\bf 1つの文書中に設定できる文字範囲の数は49個までである.}
166+
167+\item デフォルトでは,|0x100|以降の文字コードは全部|kanji|扱いであり,さらに文字範囲として,
168+\begintt
169+ \defcharrange{iso88591}{"80-"FF}
170+ \setjaparameter{jcharrange={iso8859-1=noncjk}}
171+\endtt
172+が定義されている{\small(つまり|0x80|--|0xFF|の範囲は欧文扱い)\inhibitglue}.
173+
174+TODO: 「{\setjaparameter{jcharrange={iso8859-1=kanji}}× (|U+00D7|)}」等,ISO 8859-1領域
175+にマッピングされた文字の扱い.
176+「{\setjaparameter{jcharrange={iso8859-1=kanji}}¢ (|U+00A2|)}」はHalfwidth and
177+Fullwidth Formsに全角形(\char"FFE0)があるから%"
178+luaotfloadの置換処理に割り込めばよいが…….
179+\enditem
180+
181+
178182 \beginparagraph 組版パラメタの調整
179183
180184 日本語組版用の各種パラメタの調整には,次の命令を用いる.
@@ -212,9 +216,19 @@ p\TeX の|\inhibitxspcode|に対応した設定項目である.<mode>で許さ
212216 \item |asciixspmode={<chr_code>, <mode>}|★\par\noindent
213217 同様に,p\TeX の|\xspcode|に対応した設定項目である.
214218 \item |yabaselineshift=<dimen>|:
215-欧文文字のベースライン補正量をdimensionで指定する.
219+p\TeX の|\yabaselineshift|に対応したものであり,欧文文字のベースライン補正量をdimensionで指定する.
220+\itemitem 正の値を指定すると,その分だけ欧文文字は下にずれることとなる.
221+\itemitem 数式中では,boxやruleもこの量だけずれる\hfil\break
222+(よって,行中数式は全体が|\yabaselineshift|だけずれたように見える).
216223 \item |ykbaselineshift=<dimen>|:
217224 和文文字のベースライン補正量をdimensionで指定する.
225+p\TeX では「和文が主」という考えからか,常に和文文字のベースラインが基準であり,
226+欧文文字の方をずらすことになっていた.しかし,「欧文の中に和文をちょっと入れる」ような場合では,
227+逆に和文文字をずらす方が理にかなっているので,和文文字のベースラインもずらせるようにした.
228+
229+また,この値を適切に調整することで,%
230+{\small 異なる文字サイズの文字を「上下中央揃え」で組む}ことも可能である.
231+
218232 \item |kanjiskip=<skip>|★\inhibitglue: |\kanjiskip=<skip>|と同じ意味.
219233 \item |xkanjiskip=<skip>|★\inhibitglue: |\xkanjiskip=<skip>|と同じ意味.
220234 \item |jcharwidowpenalty=<penalty>|★\inhibitglue: |\jcharwidowpenalty=<penalty>|と同じ意味.
@@ -234,22 +248,77 @@ glue/kernの計算方法を設定する.
234248 \itemitem {\tt average}: 両者の相加平均.
235249 \itemitem {\tt both}: 両者の合計値の幅をもつglue/kernを挿入する.
236250
251+\item |setjcharrange={<range_name>=<mode>}|:
252+\itemitem <range_name>: |\defcharrange|で定義した「文字コードの範囲」か,|other|を指定する.
253+|other|は,今まで定義した文字範囲の中に属さないような文字コード
254+$c\in [\hbox{\tt 0x100},\infty)$全体の集合を表す.
255+\itemitem <mode>: <range_name>で指定した範囲の文字の取扱を指定.
256+
237257
238258 \enditem
239259
240-\beginparagraph inhibitglue
260+\beginparagraph その他の命令
241261
242-|\inhibitglue|
243-: 指定箇所での和文フォントメトリック由来のglue/kernの挿入を禁止する.
262+\item skip |\kanjiskip|: 和文文字同士の間に入る空白量を指定.p\TeX の同名の命令と同様.
263+\item skip |\xkanjiskip|: 和文文字と欧文文字の間に入る空白量.p\TeX の同名の命令と同様.
264+\item count |\jcharwidowpenalty|: {\bf 未実装}
265+\item dimen |\zw|, |\zh|: 現在の和文フォントの「幅」/「高さ」(メトリックから指定)
266+\item dimen |\jQ|, |\jH|${}= 0.25\,{\rm mm}$.
267+\item |\inhibitglue|:
268+指定箇所でのJFM由来のglue/kernの挿入を禁止する.
244269 内部的には,|user_id|が30111のwhatsit nodeを作成している{\small(メトリック由来の
245270 glue/kern挿入処理で役目を終え,削除される)\inhibitglue}.
271+\enditem
272+
273+\beginsection JFMについて
274+
275+Lua\TeX-jaで用いる和文用のメトリック情報は,次のような構文で書かれたLuaファイルである.
276+見本として,|jfm-ujis.lua|を入れてある.
277+
278+\item |jfm.dir|: 組方向を指定する.将来的にはいずれ縦組(|'tate'|)を実装したいが,
279+現時点では横組(|'yoko'|)のみの対応.
280+\item |jfm.zw|, |jfm.zh|: それぞれ|\zw|, |\zh|のフォントサイズに対する割合を記述する.
281+通常は両方とも1.0となるだろう.
282+\item |jfm.define_char_type(<class>, <chars>)|
283+
284+p\TeX 用{\tt JFM}で言うところの「文字クラス」を定義する.
285+\itemitem <class>は文字クラスを表す1以上$\hbox{\tt0x800}=2048$未満の整数.
286+\itemitem <chars>には,<class>に属する「文字」達のUnicodeにおけるコード番号を
287+リストの形|{...}|で記述する.
288+
289+また,このリストには,以下の「仮想的な文字」も指定可能である.
290+\itemT |'lineend'|: 行末.
291+\itemT |'boxbdd'|: 水平ボックスの先頭/末尾,段落の先頭/末尾.
292+\itemT |'jcharbdd'|: 和文文字達の連続とそれ以外のもの(例えば欧文文字)との境界.
293+\itemT |'diffmet'|: 異なるメトリックの和文文字間に入るglueの計算に使われる.
294+
295+\item |jfm.define_type_dim(<class>,<left>,<down>,<width>,<height>,<depth>,<italic>)|
296+
297+文字クラス<class>ごとに,文字の寸法のフォントサイズに対する割合を記述する.
298+\itemitem <left>: 例えば開き括弧類は組版をする際には半角幅だが,TrueTypeフォント内では
299+左に半角空白が付け加わって全角幅となっていることが多い.このような場合,逆に
300+TrueTypeフォントを基準にすると,「左に半角幅ずらす」ことをしないといけない.
301+<left>はその「左へのずらし量」を指定する.
302+\itemitem <down>: 同様に,「下へのずらし量」を指定する.
303+\itemitem <width>, <height>, <depth>: それぞれ幅,高さ,深さ.
304+\itemitem <italic>: イタリック補正値(未実装).
305+
306+\item |jfm.define_glue(<bclass>, <aclass>, <width>, <stretch>, <shrink>)|
307+
308+文字クラス<bclass>の文字と<aclass>の文字の間に,自然長<width>,伸び<stretch>, 縮み<shrink>
309+(いずれもフォントサイズ基準)のglueを挿入する.
310+
311+\item |jfm.define_kern(<bclass>, <aclass>, <width>)|
312+
313+文字クラス<bclass>の文字と<aclass>の文字の間に,幅<width>のkernを挿入.
246314
315+\enditem
247316
248-\beginparagraph 大まかな処理の流れ
317+\beginsection 大まかな処理の流れ
249318
250-Lua\TeX-jaパッケージでは,次のような流れで処理を行う.
319+Lua\TeX-jaパッケージでは,次のような流れで実際の処理を行っている.
251320
252-\item 行末空白の削除: |process_input_buffer| callback
321+\item {\bf 行末空白の削除: |process_input_buffer| callback}
253322
254323 通常,\TeX において改行は空白とほぼ同じ意味であり,
255324 改行した箇所には自動的に空白が入るようになっている.
@@ -262,7 +331,7 @@ Lua\TeX-jaパッケージでは,次のような流れで処理を行う.
262331 この部分のコードは前田氏のjafontspecパッケージの部分から拝借したが,挿入する文字を|%|から
263332 (通常使用されることはないと思われる)|U+FFFFF|へと変更している.
264333
265-\item 和文フォントへの置換: |hyphenate|, |hpack_filter| callbacks
334+\item {\bf 和文フォントへの置換: |hyphenate|, |hpack_filter| callbacks}
266335
267336 この段階の前では,和文文字であっても,それを内部で表している|glyph_node|~$p$は,
268337 「|\tenrm あ|」のように,欧文フォントが指定されている状態になっている.しかし,
@@ -275,9 +344,9 @@ $p$は「現在の和文フォント」の番号もattribute |\luatexja@curjfnt|
275344 \itemitem $p$の文字の文字クラスを計算し,その値をattribute |\luatexja@charclass|に格納.
276345 これにより,|jp90|等のfeatureによりグリフが置換されても,文字クラスの値は保たれる.
277346
278-\item (luaotfloadパッケージによるグリフ置換等の処理はこの位置で行われる)
347+\item {\bf (luaotfloadパッケージによるグリフ置換等の処理はこの位置で)}
279348
280-\item メトリック由来glue/kernの挿入: |pre_linebreak_filter|, |hpack_filter|
349+\item {\bf JFM由来glue/kernの挿入: |pre_linebreak_filter|, |hpack_filter|}
281350
282351 ここで,メトリックに由来する和文文字間のglue/kernを挿入する.
283352 基本的には連続する和文文字間に挿入するが,
@@ -292,7 +361,7 @@ $p$は「現在の和文フォント」の番号もattribute |\luatexja@curjfnt|
292361 両和文文字からそれぞれglue/kern |gb|, |ga|を計算し,そこから実際に入るglue/kernを
293362 計算している(|\setjaparameter|中の|differentjfm|キーを参照).
294363
295-\item |\kanjiskip|, |\xkanjiskip|の挿入: |pre_linebreak_filter|, |hpack_filter|
364+\item {\bf |\kanjiskip|, |\xkanjiskip|の挿入: |pre_linebreak_filter|, |hpack_filter|}
296365
297366 p\TeX の|adjust_hlist| procedureとほぼ同様の処理を用いて,
298367 和文間glue |\kanjiskip|や和欧文間glue |\xkanjiskip|を
@@ -305,7 +374,7 @@ p\TeX では数字{\tt 0}との間に挿入するかどうかで判定してい
305374 \itemT 「漢」と「ffi」間の空白挿入:「漢」と「f」間に入るかで判断
306375 \itemT 「ffi」と「字」間の空白挿入:「i」と「字」間に入るかで判断
307376
308-\item ベースライン補正: |pre_linebreak_filter|, |hpack_filter|
377+\item {\bf ベースライン補正: |pre_linebreak_filter|, |hpack_filter|}
309378
310379 この段階では,(主として)欧文文字のベースラインをずらす作業を行う.幸いにして,
311380 Lua\TeX で文字を表す|glyph_node|には|y_offset| fieldがあるので,作業は楽である.
@@ -314,12 +383,11 @@ Lua\TeX で文字を表す|glyph_node|には|y_offset| fieldがあるので,
314383 補正量は|\luatexja@ykblshift|の値で指定されるが,以前の「和文フォントへの置換」処理において,
315384 |\luatexja@yablshift|へと値を移し変えているので,この段階では|\luatexja@yablshift|の値のみを気にしている.
316385
317-
318386 さて,実際に補正されるのは次の場合である:
319387 \itemitem 文字 (|glyph_node|)
320388 \itemitem ボックス・rule(文中数式内部).これによって,数式全体が下がったように見えるはず.
321389
322-\item 和文文字の幅の補正: |pre_linebreak_filter|, |hpack_filter|
390+\item {\bf 和文文字の幅の補正: |pre_linebreak_filter|, |hpack_filter|}
323391
324392 例えば,括弧類は「フォント中では全角幅だが,組版では半角幅として扱う」ことが多いが,このように
325393 文字幅を補正する処理を最後に行う.jafontspecパッケージのように,補正対象となる|glyph_node|~$p$%
@@ -327,59 +395,14 @@ Lua\TeX で文字を表す|glyph_node|には|y_offset| fieldがあるので,
327395
328396 \enditem
329397
330-\beginparagraph 和文フォントメトリックについて
331-
332-Lua\TeX-jaで用いる和文用のメトリック情報は,次のような構文で書かれたLuaファイルである.
333-見本として,|luatj-ujis.lua|を入れてある.
334-
335-\item |jfm.dir|: 組方向を指定する.将来的にはいずれ縦組(|'tate'|)を実装したいが,
336-現時点では横組(|'yoko'|)のみの対応.
337-\item |jfm.zw|, |jfm.zh|: それぞれ|\zw|, |\zh|のフォントサイズに対する割合を記述する.
338-通常は両方とも1.0となるだろう.
339-\item |jfm.define_char_type(<class>, <chars>)|
340-
341-p\TeX 用{\tt JFM}で言うところの「文字クラス」を定義する.
342-\itemitem <class>は文字クラスを表す1以上$\hbox{\tt0x800}=2048$未満の整数.
343-\itemitem <chars>には,<class>に属する「文字」達のUnicodeにおけるコード番号を
344-リストの形|{...}|で記述する.
345-
346-また,このリストには,以下の「仮想的な文字」も指定可能である.
347-\itemT |'boxbdd'|: 水平ボックスの先頭/末尾,段落の先頭/末尾.
348-\itemT |'jcharbdd'|: 和文文字達の連続の境界.
349-\itemT |'diffmet'|: 異なるメトリックの和文文字間に入るglueの計算に使われる.
350-
351-\item |jfm.define_type_dim(<class>,<left>,<down>,<width>,<height>,<depth>,<italic>)|
352-
353-文字クラス<class>ごとに,文字の寸法のフォントサイズに対する割合を記述する.
354-\itemitem <left>: 例えば開き括弧類は組版をする際には半角幅だが,TrueTypeフォント内では
355-左に半角空白が付け加わって全角幅となっていることが多い.このような場合,逆に
356-TrueTypeフォントを基準にすると,「左に半角幅ずらす」ことをしないといけない.
357-<left>はその「左へのずらし量」を指定する.
358-\itemitem <down>: 同様に,「下へのずらし量」を指定する.
359-\itemitem <width>, <height>, <depth>: それぞれ幅,高さ,深さ.
360-\itemitem <italic>: イタリック補正値(未実装).
361-
362-\item |jfm.define_glue(<bclass>, <aclass>, <width>, <stretch>, <shrink>)|
363-
364-文字クラス<bclass>の文字と<aclass>の文字の間に,自然長<width>,伸び<stretch>, 縮み<shrink>
365-(いずれもフォントサイズ基準)のglueを挿入する.
366-
367-\item |jfm.define_kern(<bclass>, <aclass>, <width>)|
368-
369-文字クラス<bclass>の文字と<aclass>の文字の間に,幅<width>のkernを挿入.
370-
371-\enditem
372-
373-
374-
375398 \vfill\eject
376399 \leftline{{\big 組版サンプル}\hfill
377400 \noindent 出典: 日本語Wikipediaの「\TeX」の項,2011/3/10}
378401
379402 \bigskip
380403 %% sample
381-\TeX(読み方については、「読み方」の小節を参照)は数学者・計算機科学者である
382-ドナルド・クヌース (Donald~E. Knuth) により作られた組版処理ソフトウェアである。
404+{\bf\TeX}(読み方については、「読み方」の小節を参照)は数学者・計算機科学者である
405+ドナルド・クヌース (Donald~E. {\sc Knuth}) により作られた組版処理ソフトウェアである。
383406
384407 \beginsection 名称について
385408
@@ -387,7 +410,7 @@ TrueTypeフォントを基準にすると,「左に半角幅ずらす」こと
387410
388411 \beginparagraph 表記法
389412
390-正しくは“\TeX”と表記するが、それができない場合には
413+正しくは“{\bf\TeX}”と表記するが、それができない場合には
391414 “{\tt TeX}”と表記する(“{\tt TEX}”と表記するのは誤り)。
392415
393416 \beginparagraph 読み方
@@ -402,7 +425,7 @@ TrueTypeフォントを基準にすると,「左に半角幅ずらす」こと
402425 \TeX はマークアップ言語処理系であり、チューリング完全性を備えた関数型言語でもある。
403426 文章そのものと、文章の構造を指定する命令とが混在して記述されたテキストファイルを読み込み、
404427 そこに書かれた命令に従って文章を組版して、組版結果を{\tt DVI}形式のファイルに書き出す。
405-{\tt DVI}形式というのは、装置に依存しない (device-independent) 中間形式である。
428+{\tt DVI}形式というのは、装置に依存しない ({\bf d}e{\bf v}ice-{\bf i}ndependent) 中間形式である。
406429
407430 {\tt DVI}ファイルには紙面のどの位置にどの文字を配置するかといった情報が書き込まれている。
408431 実際に紙に印刷したりディスプレイ上に表示したするためには、{\tt DVI}ファイルを解釈する
@@ -422,7 +445,7 @@ Post\-Scriptなど他のページ記述言語へのトランスレータ、プ
422445 比較的よく知られている\TeX 上のマクロパッケージには、クヌース自身による plain \TeX、
423446 一般的な文書記述に優れた\LaTeX\ ({\tt LaTeX})、数学的文書用の\AmS-\TeX などがある。
424447 一般の使用者は、\TeX を直接使うよりも、\TeX に何らかのマクロパッケージを読み込ませたものを
425-使うことの方が多い。そのため、これらのマクロパッケージのことも “\TeX” と呼ぶ場合があるが、
448+使うことの方が多い。そのため、これらのマクロパッケージのことも“\TeX”と呼ぶ場合があるが、
426449 本来は誤用である。
427450
428451 \TeX のマクロパッケージには、他にも次のようなものなどがある。
@@ -435,8 +458,8 @@ Post\-Scriptなど他のページ記述言語へのトランスレータ、プ
435458 \item MusiX\TeX\ ({\tt MusiXTeX}) ……楽譜の記述に用いる。
436459 \enditem
437460
438-\TeX とそれに関連するプログラム、および\TeX のマクロパッケージなどは CTAN(Comprehensive TeX Archive Network、
439-包括 TeX アーカイブネットワーク)からダウンロードできる。
461+\TeX とそれに関連するプログラム、および\TeX のマクロパッケージなどは CTAN({\bf C}omprehensive \TeX {\bf A}rchive {\bf N}etwork、
462+包括\TeX アーカイブネットワーク)からダウンロードできる。
440463
441464
442465 \beginsection 数式の表示例
@@ -462,7 +485,7 @@ $$
462485
463486 \beginsection 生い立ち
464487
465-\TeX は、クヌースが自身の著書The Art of Computer Programmingを書いたときに、組版の汚さに憤慨し、
488+\TeX は、クヌースが自身の著書{\it The Art of Computer Programming\/}を書いたときに、組版の汚さに憤慨し、
466489 自分自身で心行くまで組版を制御するために作成したとされている。開発にあたって、伝統的な組版および
467490 その関連技術に対する広範囲にわたる調査を行った。その調査結果を取り入れることで、\TeX は
468491 商業品質の組版ができる柔軟で強力な組版システムになった。
@@ -491,12 +514,12 @@ $$
491514 \beginsection \TeX の日本語化
492515
493516 日本語組版処理のできる日本語版の\TeX および\LaTeX には、アスキー・メディアワークスによるp\TeX\
494-(pTeX) およびp\LaTeX\ (pLaTeX) と、NTTの斉藤康己によるNTT J\TeX\ (NTT JTeX) およびNTT J\LaTeX\
495-(NTT JLaTeX) などがある。
517+({\tt pTeX}) およびp\LaTeX\ ({\tt pLaTeX}) と、NTTの斉藤康己によるNTT J\TeX\ ({\tt NTT JTeX}) およびNTT J\LaTeX\
518+({\tt NTT JLaTeX}) などがある。
496519
497520 \TeX の日本語対応において技術的に最も大きな課題は、複数バイト文字コードへの対応である。
498521 p\TeX(および前身の日本語\TeX)は、JIS X 0208を文字集合とした文字コード(ISO-2022-JP、EUC-JP、
499-およびShift\_JIS)を直接扱う。DVIフォーマットは元々16ビット以上の文字コードを格納できる仕様が
522+およびShift\_\thinspace JIS)を直接扱う。DVIフォーマットは元々16ビット以上の文字コードを格納できる仕様が
500523 含まれていた。しかしオリジナルの英語版では使われていなかったため、既存プログラムの多くはp\TeX が
501524 出力するDVIファイルを処理できない。またフォントに関係するファイルフォーマットが拡張されている。
502525 これに対してNTT J\TeX は、複数の1バイト文字セットに分割することで対応している。例えば、
--- a/src/jfm-ujis.lua
+++ b/src/jfm-ujis.lua
@@ -35,9 +35,9 @@ jfm.define_char_type(7, {
3535
3636
3737 -- 'boxbdd' matches
38--- o the beginning of paragraphs and hboxes
39--- o the ending of paragraphs and hboxes
40--- o just after the hbox created by \parindent
38+-- o the beginning of paragraphs and hboxes,
39+-- o the ending of paragraphs and hboxes,
40+-- o just after the hbox created by \parindent.
4141
4242 -- 'jcharbdd' matches the boundary between two Japanese characters whose metrics (or sizes)
4343 -- are different.
@@ -45,6 +45,8 @@ jfm.define_char_type(7, {
4545 -- 'diffmet' matches the boundary between a Japanese character
4646 -- and a material which is not a Japanese character.
4747
48+-- 'lineend' matches the ending of a line.
49+
4850 -- dimension
4951 -- jfm.define_type_dim(<type>, <left>, <down>, <width>,
5052 -- <height>, <depth>, <italic correction>)
--- a/src/luatexja-core-aux.lua
+++ b/src/luatexja-core-aux.lua
@@ -1,19 +1,4 @@
11
2--- 和文文字と満たす unicode の範囲(適当)
3-function ltj.is_ucs_in_japanese_char(c)
4- if (c>=0x2000)and(c<=0x27FF) then return true
5- elseif (c>=0x2900)and(c<=0x29FF) then return true
6- elseif (c>=0x3000)and(c<=0x30FF) then return true
7- elseif (c>=0x31F0)and(c<=0x4DBF) then return true
8- elseif (c>=0x4E00)and(c<=0x9FFF) then return true
9- elseif (c>=0xF900)and(c<=0xFAFF) then return true
10- elseif (c>=0xFF00)and(c<=0xFFEF) then return true
11- elseif (c>=0x20000)and(c<=0xDFFFF) then return true
12- else return false
13- end
14-end
15-
16-
172 -- gb: 前側の和文文字 b 由来の glue/kern (maybe nil)
183 -- ga: 後側の和文文字 a 由来の glue/kern (maybe nil)
194 -- 両者から,b と a の間に入る glue/kern を計算する
--- a/src/luatexja-core.lua
+++ b/src/luatexja-core.lua
@@ -1,3 +1,19 @@
1+local node_type = node.type
2+local has_attr = node.has_attribute
3+local node_insert_before = node.insert_before
4+local node_insert_after = node.insert_after
5+local node_hpack = node.hpack
6+local round = tex.round
7+local node_new = node.new
8+local id_glyph = node.id('glyph')
9+local id_glue_spec = node.id('glue_spec')
10+local id_glue = node.id('glue')
11+local id_whatsit = node.id('whatsit')
12+local next_node = node.next
13+local attr_jchar_class = luatexbase.attributes['luatexja@charclass']
14+local attr_curjfnt = luatexbase.attributes['luatexja@curjfnt']
15+local attr_yablshift = luatexbase.attributes['luatexja@yablshift']
16+
117 -- error messages
218 function ltj.error(s,t)
319 tex.error('LuaTeX-ja error: ' .. s ,t)
@@ -47,9 +63,9 @@ return out
4763 end
4864
4965 -- return true if and only if p is a Japanese character node
50-function ltj.is_japanese_glyph_node(p)
51- return p and (node.type(p.id)=='glyph')
52- and (p.font==node.has_attribute(p,luatexbase.attributes['luatexja@curjfnt']))
66+local function is_japanese_glyph_node(p)
67+ return p and (p.id==id_glyph)
68+ and (p.font==has_attr(p,attr_curjfnt))
5369 end
5470
5571 ---------- Stack table
@@ -59,7 +75,7 @@ end
5975
6076 ltj.stack_ch_table={}; ltj.stack_ch_table[0]={}
6177
62-function ltj.new_stack_level()
78+local function new_stack_level()
6379 local i = tex.getcount('ltj@stack@pbp')
6480 if tex.currentgrouplevel > tex.getcount('ltj@group@level@pbp') then
6581 i = i+1 -- new stack level
@@ -73,7 +89,7 @@ function ltj.new_stack_level()
7389 return i
7490 end
7591 function ltj.set_ch_table(g,m,c,p)
76- local i = ltj.new_stack_level()
92+ local i = new_stack_level()
7793 if not ltj.stack_ch_table[i][c] then ltj.stack_ch_table[i][c] = {} end
7894 ltj.stack_ch_table[i][c][m] = p
7995 if g=='global' then
@@ -84,14 +100,14 @@ function ltj.set_ch_table(g,m,c,p)
84100 end
85101 end
86102
87-function ltj.get_penalty_table(m,c)
103+local function get_penalty_table(m,c)
88104 local i = tex.getcount('ltj@stack@pbp')
89105 i = ltj.stack_ch_table[i][c]
90106 if i then i=i[m] end
91107 return i or 0
92108 end
93109
94-function ltj.get_inhibit_xsp_table(c)
110+local function get_inhibit_xsp_table(c)
95111 local i = tex.getcount('ltj@stack@pbp')
96112 i = ltj.stack_ch_table[i][c]
97113 if i then i=i.xsp end
@@ -131,18 +147,18 @@ end
131147
132148 function ltj.out_ja_parameter_two(k,c)
133149 if k == 'prebreakpenalty' then
134- tex.write(ltj.get_penalty_table('pre',c))
150+ tex.write(get_penalty_table('pre',c))
135151 elseif k == 'postbreakpenalty' then
136- tex.write(ltj.get_penalty_table('post',c))
152+ tex.write(get_penalty_table('post',c))
137153 elseif k == 'cjkxspmode' then
138- local i = ltj.get_inhibit_xsp_table(c)
154+ local i = get_inhibit_xsp_table(c)
139155 if i==0 then tex.write('inhibit')
140156 elseif i==1 then tex.write('postonly')
141157 elseif i==2 then tex.write('preonly')
142158 else tex.write('allow')
143159 end
144160 elseif k == 'asciixspmode' then
145- local i = ltj.get_inhibit_xsp_table(c)
161+ local i = get_inhibit_xsp_table(c)
146162 if i==0 then tex.write('inhibit')
147163 elseif i==2 then tex.write('postonly')
148164 elseif i==1 then tex.write('preonly')
@@ -158,92 +174,92 @@ function ltj.print_global()
158174 end
159175
160176 function ltj.create_ihb_node()
161- local g=node.new(node.id('whatsit'), node.subtype('user_defined'))
177+ local g=node_new(id_whatsit, node.subtype('user_defined'))
162178 g.user_id=30111; g.type=number; g.value=1
163179 node.write(g)
164180 end
165181
166182
167-function ltj.find_size_metric(px)
168- if ltj.is_japanese_glyph_node(px) then
183+local function find_size_metric(px)
184+ if is_japanese_glyph_node(px) then
169185 return ltj.font_metric_table[px.font].size, ltj.font_metric_table[px.font].jfm
170186 else
171187 return nil, nil
172188 end
173189 end
174190
175-function ltj.new_jfm_glue(size,mt,bc,ac)
191+local function new_jfm_glue(size,mt,bc,ac)
176192 -- mt: metric key, bc, ac: char classes
177193 local g=nil
178194 local h
179195 local w=bc*0x800+ac
180196 if ltj.metrics[mt].glue[w] then
181- h=node.new(node.id('glue_spec'))
182- h.width =tex.round(size*ltj.metrics[mt].glue[w].width)
183- h.stretch=tex.round(size*ltj.metrics[mt].glue[w].stretch)
184- h.shrink =tex.round(size*ltj.metrics[mt].glue[w].shrink)
197+ h=node_new(id_glue_spec)
198+ h.width =round(size*ltj.metrics[mt].glue[w].width)
199+ h.stretch=round(size*ltj.metrics[mt].glue[w].stretch)
200+ h.shrink =round(size*ltj.metrics[mt].glue[w].shrink)
185201 h.stretch_order=0; h.shrink_order=0
186- g=node.new(node.id('glue'))
202+ g=node_new(id_glue)
187203 g.subtype=0; g.spec=h; return g
188204 elseif ltj.metrics[mt].kern[w] then
189- g=node.new(node.id('kern'))
190- g.subtype=0; g.kern=tex.round(size*ltj.metrics[mt].kern[w]); return g
205+ g=node_new(node.id('kern'))
206+ g.subtype=0; g.kern=round(size*ltj.metrics[mt].kern[w]); return g
191207 else
192208 return nil
193209 end
194210 end
195211
196212
197-function ltj.calc_between_two_jchar(q,p)
213+function calc_between_two_jchar(q,p)
198214 -- q, p: node (possibly null)
199215 local ps,pm,qs,qm,g,h
200216 if not p then -- q is the last node
201- qs, qm = ltj.find_size_metric(q)
217+ qs, qm = find_size_metric(q)
202218 if not qm then
203219 return nil
204220 else
205- g=ltj.new_jfm_glue(qs,qm,
206- node.has_attribute(q,luatexbase.attributes['luatexja@charclass']),
221+ g=new_jfm_glue(qs,qm,
222+ has_attr(q,attr_jchar_class),
207223 ltj.find_char_type('boxbdd',qm))
208224 end
209225 elseif not q then
210226 -- p is the first node etc.
211- ps, pm = ltj.find_size_metric(p)
227+ ps, pm = find_size_metric(p)
212228 if not pm then
213229 return nil
214230 else
215- g=ltj.new_jfm_glue(ps,pm,
231+ g=new_jfm_glue(ps,pm,
216232 ltj.find_char_type('boxbdd',pm),
217- node.has_attribute(p,luatexbase.attributes['luatexja@charclass']))
233+ has_attr(p,attr_jchar_class))
218234 end
219235 else -- p and q are not nil
220- qs, qm = ltj.find_size_metric(q)
221- ps, pm = ltj.find_size_metric(p)
236+ qs, qm = find_size_metric(q)
237+ ps, pm = find_size_metric(p)
222238 if (not pm) and (not qm) then
223239 -- Both p and q are NOT Japanese glyph node
224240 return nil
225241 elseif (qs==ps) and (qm==pm) then
226242 -- Both p and q are Japanese glyph node, and same metric and size
227- g=ltj.new_jfm_glue(ps,pm,
228- node.has_attribute(q,luatexbase.attributes['luatexja@charclass']),
229- node.has_attribute(p,luatexbase.attributes['luatexja@charclass']))
243+ g=new_jfm_glue(ps,pm,
244+ has_attr(q,attr_jchar_class),
245+ has_attr(p,attr_jchar_class))
230246 elseif not qm then
231247 -- q is not Japanese glyph node
232- g=ltj.new_jfm_glue(ps,pm,
248+ g=new_jfm_glue(ps,pm,
233249 ltj.find_char_type('jcharbdd',pm),
234- node.has_attribute(p,luatexbase.attributes['luatexja@charclass']))
250+ has_attr(p,attr_jchar_class))
235251 elseif not pm then
236252 -- p is not Japanese glyph node
237- g=ltj.new_jfm_glue(qs,qm,
238- node.has_attribute(q,luatexbase.attributes['luatexja@charclass']),
253+ g=new_jfm_glue(qs,qm,
254+ has_attr(q,attr_jchar_class),
239255 ltj.find_char_type('jcharbdd',qm))
240256 else
241- g=ltj.new_jfm_glue(qs,qm,
242- node.has_attribute(q,luatexbase.attributes['luatexja@charclass']),
257+ g=new_jfm_glue(qs,qm,
258+ has_attr(q,attr_jchar_class),
243259 ltj.find_char_type('diffmet',qm))
244- h=ltj.new_jfm_glue(ps,pm,
260+ h=new_jfm_glue(ps,pm,
245261 ltj.find_char_type('diffmet',pm),
246- node.has_attribute(p,luatexbase.attributes['luatexja@charclass']))
262+ has_attr(p,attr_jchar_class))
247263 g=ltj.calc_between_two_jchar_aux(g,h)
248264 end
249265 end
@@ -256,37 +272,37 @@ end
256272 -- o a whatsit node which contains local paragraph materials.
257273 -- When we insert jfm glues, we ignore these nodes.
258274 function ltj.is_parindent_box(p)
259- if node.type(p.id)=='hlist' then
275+ if node_type(p.id)=='hlist' then
260276 return (p.subtype==3)
261277 -- hlist (subtype=3) is a box by \parindent
262- elseif node.type(p.id)=='whatsit' then
278+ elseif p.id==id_whatsit then
263279 return (p.subtype==node.subtype('local_par'))
264280 end
265281 end
266282
267-function ltj.add_kinsoku_penalty(head,p)
283+local function add_kinsoku_penalty(head,p)
268284 local c = p.char
269- local e = ltj.get_penalty_table('pre',c)
285+ local e = get_penalty_table('pre',c)
270286 if e~=0 then
271287 local q = node.prev(p)
272- if q and node.type(q.id)=='penalty' then
288+ if q and node_type(q.id)=='penalty' then
273289 q.penalty=q.penalty+e
274290 else
275- q=node.new(node.id('penalty'))
291+ q=node_new(node.id('penalty'))
276292 q.penalty=e
277- node.insert_before(head,p,q)
293+ node_insert_before(head,p,q)
278294 end
279295 end
280- e = ltj.get_penalty_table('post',c)
296+ e = get_penalty_table('post',c)
281297 if e~=0 then
282- local q = node.next(p)
283- if q and node.type(q.id)=='penalty' then
298+ local q = next_node(p)
299+ if q and node_type(q.id)=='penalty' then
284300 q.penalty=q.penalty+e
285301 return false
286302 else
287- q=node.new(node.id('penalty'))
303+ q=node_new(node.id('penalty'))
288304 q.penalty=e
289- node.insert_after(head,p,q)
305+ node_insert_after(head,p,q)
290306 return true
291307 end
292308 end
@@ -294,39 +310,45 @@ end
294310
295311 -- Insert jfm glue: main routine
296312
297-function ltj.insert_jfm_glue(head)
313+local function insert_jfm_glue(head)
298314 local p = head
299315 local q = nil -- the previous node of p
300316 local g
301317 local ihb_flag = false
318+ local inserted_after_penalty = false
302319 if not p then
303320 return head
304321 end
305- while p and ltj.is_parindent_box(p) do p=node.next(p) end
322+ while p and ltj.is_parindent_box(p) do p=next_node(p) end
306323 while p do
307- if node.type(p.id)=='whatsit' and p.subtype==node.subtype('user_defined')
324+ if p.id==id_whatsit and p.subtype==node.subtype('user_defined')
308325 and p.user_id==30111 then
309- g=p; p=node.next(p);
326+ g=p; p=next_node(p);
310327 ihb_flag=true; head,p=node.remove(head, g)
311328 else
312- g=ltj.calc_between_two_jchar(q,p)
329+ g=calc_between_two_jchar(q,p)
313330 if g and (not ihb_flag) then
314- h = node.insert_before(head,p,g)
331+ h = node_insert_before(head,p,g)
315332 if not q then head=h end
316333 -- If p is the first node (=head), the skip is inserted
317334 -- before head. So we must change head.
318335 end
319- q=p; ihb_flag=false
320- if ltj.is_japanese_glyph_node(p)
321- and ltj.add_kinsoku_penalty(head,p) then
322- p=node.next(p)
336+ --if is_japanese_glyph_node(q) then
337+ -- node.insert(q, inserted_after_penalty)
338+ --end
339+ q=p; ihb_flag=false;
340+ if is_japanese_glyph_node(p)
341+ and add_kinsoku_penalty(head,p) then
342+ p=next_node(p); inserted_after_penalty = true
343+ else
344+ inserted_after_penalty = false
323345 end
324- p=node.next(p)
346+ p=next_node(p)
325347 end
326348 end
327349 -- Insert skip after the last node
328- g=ltj.calc_between_two_jchar(q,nil)
329- if g then h = node.insert_after(head,q,g) end
350+ g=calc_between_two_jchar(q,nil)
351+ if g then h = node_insert_after(head,q,g) end
330352 return head
331353 end
332354
@@ -342,59 +364,43 @@ local no_skip=0
342364 local after_schar=1
343365 local after_wchar=2
344366 local insert_skip=no_skip
345-function ltj.insert_kanji_skip(head)
346- if ltj.auto_spacing then
347- kanji_skip=tex.skip['kanjiskip']
348- else
349- kanji_skip=node.new(node.id('glue_spec'))
350- kanji_skip.width=0; kanji_skip.stretch=0; kanji_skip.shrink=0
367+
368+
369+-- In the next two function, cx is the Kanji code.
370+local function insert_akxsp(head,q)
371+ if get_inhibit_xsp_table(cx)<=1 then return end
372+ local g = node_new(id_glue)
373+ g.subtype=0; g.spec=node.copy(xkanji_skip)
374+ node_insert_after(head,q,g)
375+end
376+
377+local function insert_kaxsp(head,q,p)
378+ local g=true
379+ local c=p.char
380+ while p.components and p.subtype
381+ and math.floor(p.subtype/2)%2==1 do
382+ p=p.components; c = p.char
351383 end
352- if ltj.auto_xspacing then
353- xkanji_skip=tex.skip['xkanjiskip']
354- else
355- xkanji_skip=node.new(node.id('glue_spec'))
356- xkanji_skip.width=0; xkanji_skip.stretch=0; xkanji_skip.shrink=0
384+ if get_inhibit_xsp_table(c)%2 == 1 then
385+ if get_inhibit_xsp_table(cx)%2==0 then g=false end
386+ else
387+ g=false
357388 end
358- local p=head -- 「現在のnode」
359- local q=nil -- pの一つ前
360- insert_skip=no_skip
361- while p do
362- if node.type(p.id)=='glyph' then
363- repeat
364- ltj.insks_around_char(head,q,p)
365- q=p; p=node.next(p)
366- until (not p) or node.type(p.id)~='glyph'
367- else
368- if node.type(p.id) == 'hlist' then
369- ltj.insks_around_hbox(head,q,p)
370- elseif node.type(p.id) == 'penalty' then
371- ltj.insks_around_penalty(head,q,p)
372- elseif node.type(p.id) == 'kern' then
373- ltj.insks_around_kern(head,q,p)
374- elseif node.type(p.id) == 'math' then
375- ltj.insks_around_math(head,q,p)
376- elseif node.type(p.id) == 'ins' or node.type(p.id) == 'mark'
377- or node.type(p.id) == 'adjust'
378- or node.type(p.id) == 'whatsit' then
379- -- do nothing
380- p=p
381- else
382- -- rule, disc, glue, margin_kern
383- insert_skip=no_skip
384- end
385- q=p; p=node.next(p)
386- end
389+ if g then
390+ g = node_new(id_glue)
391+ g.subtype=0; g.spec=node.copy(xkanji_skip)
392+ node_insert_after(head,q,g)
387393 end
388- return head
389394 end
390395
391-function ltj.set_insert_skip_after_achar(p)
396+
397+local function set_insert_skip_after_achar(p)
392398 local c=p.char
393399 while p.components and p.subtype
394400 and math.floor(p.subtype/2)%2==1 do
395401 p=node.tail(p.components); c = p.char
396402 end
397- if ltj.get_inhibit_xsp_table(c)>=2 then
403+ if get_inhibit_xsp_table(c)>=2 then
398404 insert_skip=after_schar
399405 else
400406 insert_skip=no_skip
@@ -402,50 +408,22 @@ function ltj.set_insert_skip_after_achar(p)
402408 end
403409
404410 -- Insert \xkanjiskip before p, a glyph node
405-function ltj.insks_around_char(head,q,p)
406- local a=ltj.get_inhibit_xsp_table(p.char)
407- if ltj.is_japanese_glyph_node(p) then
411+local function insks_around_char(head,q,p)
412+ if is_japanese_glyph_node(p) then
408413 cx=p.char
409- if ltj.is_japanese_glyph_node(q) then
410- local g = node.new(node.id('glue'))
414+ if is_japanese_glyph_node(q) then
415+ local g = node_new(id_glue)
411416 g.subtype=0; g.spec=node.copy(kanji_skip)
412- node.insert_before(head,p,g)
417+ node_insert_before(head,p,g)
413418 elseif insert_skip==after_schar then
414- ltj.insert_akxsp(head,q)
419+ insert_akxsp(head,q)
415420 end
416421 insert_skip=after_wchar
417422 else
418423 if insert_skip==after_wchar then
419- ltj.insert_kaxsp(head,q,p)
424+ insert_kaxsp(head,q,p)
420425 end
421- ltj.set_insert_skip_after_achar(p)
422- end
423-end
424-
425--- In the next two function, cx is the Kanji code.
426-function ltj.insert_akxsp(head,q)
427- if ltj.get_inhibit_xsp_table(cx)<=1 then return end
428- local g = node.new(node.id('glue'))
429- g.subtype=0; g.spec=node.copy(xkanji_skip)
430- node.insert_after(head,q,g)
431-end
432-
433-function ltj.insert_kaxsp(head,q,p)
434- local g=true
435- local c=p.char
436- while p.components and p.subtype
437- and math.floor(p.subtype/2)%2==1 do
438- p=p.components; c = p.char
439- end
440- if ltj.get_inhibit_xsp_table(c)%2 == 1 then
441- if ltj.get_inhibit_xsp_table(cx)%2==0 then g=false end
442- else
443- g=false
444- end
445- if g then
446- g = node.new(node.id('glue'))
447- g.subtype=0; g.spec=node.copy(xkanji_skip)
448- node.insert_after(head,q,g)
426+ set_insert_skip_after_achar(p)
449427 end
450428 end
451429
@@ -453,31 +431,32 @@ end
453431 local first_char = nil
454432 local last_char = nil
455433 local find_first_char = nil
456-function ltj.check_box(bp)
434+local function check_box(bp)
457435 local p = bp; local flag = false
458436 while p do
459- if node.type(p.id)=='glyph' then
437+ local pt = node_type(p.id)
438+ if pt=='glyph' then
460439 repeat
461440 if find_first_char then
462441 first_char=p; find_first_char=false
463442 end
464- last_char=p; flag=true; p=node.next(p)
443+ last_char=p; flag=true; p=next_node(p)
465444 if not p then return flag end
466- until node.type(p.id)~='glyph'
445+ until p.id~=id_glyph
467446 end
468- if node.type(p.id)=='hlist' then
447+ if pt=='hlist' then
469448 flag=true
470449 if p.shift==0 then
471- if ltj.check_box(p.head) then flag=true end
450+ if check_box(p.head) then flag=true end
472451 else if find_first_char then
473452 find_first_char=false
474453 else
475454 last_char=nil
476455 end
477456 end
478- elseif node.type(p.id) == 'ins' or node.type(p.id) == 'mark'
479- or node.type(p.id) == 'adjust'
480- or node.type(p.id) == 'whatsit' or node.type(p.id) == 'penalty' then
457+ elseif pt == 'ins' or pt == 'mark'
458+ or pt == 'adjust'
459+ or pt == 'whatsit' or pt == 'penalty' then
481460 p=p
482461 else
483462 flag=true
@@ -487,44 +466,44 @@ function ltj.check_box(bp)
487466 last_char=nil
488467 end
489468 end
490- p=node.next(p)
469+ p=next_node(p)
491470 end
492471 return flag
493472 end
494473
495474 -- Insert \xkanjiskip around p, an hbox
496-function ltj.insks_around_hbox(head,q,p)
475+local function insks_around_hbox(head,q,p)
497476 if p.shift==0 then
498477 find_first_char=true; first_char=nil; last_char=nil
499- if ltj.check_box(p.head) then
478+ if check_box(p.head) then
500479 -- first char
501- if ltj.is_japanese_glyph_node(first_char) then
480+ if is_japanese_glyph_node(first_char) then
502481 cx=first_char.char
503482 if insert_skip==after_schar then
504- ltj.insert_akxsp(head,q)
483+ insert_akxsp(head,q)
505484 elseif insert_skip==after_wchar then
506- local g = node.new(node.id('glue'))
485+ local g = node_new(id_glue)
507486 g.subtype=0; g.spec=node.copy(kanji_skip)
508- node.insert_before(head,p,g)
487+ node_insert_before(head,p,g)
509488 end
510489 insert_skip=after_wchar
511490 elseif first_char then
512491 cx=first_char.char
513492 if insert_skip==after_wchar then
514- ltj.insert_kaxsp(head,q,first_char)
493+ insert_kaxsp(head,q,first_char)
515494 end
516- ltj.set_insert_skip_after_achar(first_char)
495+ set_insert_skip_after_achar(first_char)
517496 end
518497 -- last char
519- if ltj.is_japanese_glyph_node(last_char) then
520- if ltj.is_japanese_glyph_node(node.next(p)) then
521- local g = node.new(node.id('glue'))
498+ if is_japanese_glyph_node(last_char) then
499+ if is_japanese_glyph_node(next_node(p)) then
500+ local g = node_new(id_glue)
522501 g.subtype=0; g.spec=node.copy(kanji_skip)
523- node.insert_after(head,p,g)
502+ node_insert_after(head,p,g)
524503 end
525504 insert_skip=after_wchar
526505 elseif last_char then
527- ltj.set_insert_skip_after_achar(last_char)
506+ set_insert_skip_after_achar(last_char)
528507 else insert_skip=no_skip
529508 end
530509 else insert_skip=no_skip
@@ -534,115 +513,205 @@ function ltj.insks_around_hbox(head,q,p)
534513 end
535514
536515 -- Insert \xkanjiskip around p, a penalty
537-function ltj.insks_around_penalty(head,q,p)
538- local r=node.next(p)
539- if r and node.type(r.id)=='glyph' then
540- if ltj.is_japanese_glyph_node(r) then
516+local function insks_around_penalty(head,q,p)
517+ local r=next_node(p)
518+ if r and r.id==id_glyph then
519+ if is_japanese_glyph_node(r) then
541520 cx=r.char
542- if ltj.is_japanese_glyph_node(p) then
543- local g = node.new(node.id('glue'))
521+ if is_japanese_glyph_node(p) then
522+ local g = node_new(id_glue)
544523 g.subtype=0; g.spec=node.copy(kanji_skip)
545- node.insert_before(head,r,g)
524+ node_insert_before(head,r,g)
546525 elseif insert_skip==insert_schar then
547- ltj.insert_akxsp(head,p)
526+ insert_akxsp(head,p)
548527 end
549- q=p; p=node.next(p)
528+ q=p; p=next_node(p)
550529 insert_skip=after_wchar
551530 else
552531 if insert_skip==after_wchar then
553- ltj.insert_kaxsp(head,p,r)
532+ insert_kaxsp(head,p,r)
554533 end
555- ltj.set_insert_skip_after_achar(r)
534+ set_insert_skip_after_achar(r)
556535 end
557536 end
558537 end
559538
560539 -- Insert \xkanjiskip around p, a kern
561-function ltj.insks_around_kern(head,q,p)
540+local function insks_around_kern(head,q,p)
562541 if p.subtype==1 then -- \kern or \/
563- if node.has_attribute(p,luatexbase.attributes['luatexja@icflag']) then
564- p=p -- p is a kern from \/: do nothing
565- else
542+ if not has_attr(p,luatexbase.attributes['luatexja@icflag']) then
566543 insert_skip=no_skip
567544 end
568545 elseif p.subtype==2 then -- \accent: We ignore the accent character.
569- local v = node.next(node.next(node.next(p)))
570- if v and node.type(v.id)=='glyph' then
571- ltj.insks_around_char(head,q,v)
546+ local v = next_node(next_node(next_node(p)))
547+ if v and v.id==id_glyph then
548+ insks_around_char(head,q,v)
572549 end
573550 end
574551 end
575552
576553 -- Insert \xkanjiskip around p, a math_node
577-function ltj.insks_around_math(head,q,p)
554+local function insks_around_math(head,q,p)
578555 local g = { char = -1 }
579556 if (p.subtype==0) and (insert_skip==after_wchar) then
580- ltj.insert_kaxsp(head,q,g)
557+ insert_kaxsp(head,q,g)
581558 insert_skip=no_skip
582559 else
583- ltj.set_insert_skip_after_achar(g)
560+ set_insert_skip_after_achar(g)
584561 end
585562 end
586563
564+local function insert_kanji_skip(head)
565+ if ltj.auto_spacing then
566+ kanji_skip=tex.skip['kanjiskip']
567+ else
568+ kanji_skip=node_new(id_glue_spec)
569+ kanji_skip.width=0; kanji_skip.stretch=0; kanji_skip.shrink=0
570+ end
571+ if ltj.auto_xspacing then
572+ xkanji_skip=tex.skip['xkanjiskip']
573+ else
574+ xkanji_skip=node_new(id_glue_spec)
575+ xkanji_skip.width=0; xkanji_skip.stretch=0; xkanji_skip.shrink=0
576+ end
577+ local p=head -- 「現在のnode」
578+ local q=nil -- pの一つ前
579+ insert_skip=no_skip
580+ while p do
581+ local pt = node_type(p.id)
582+ if pt=='glyph' then
583+ repeat
584+ insks_around_char(head,q,p)
585+ q=p; p=next_node(p)
586+ until (not p) or p.id~=id_glyph
587+ else
588+ if pt == 'hlist' then
589+ insks_around_hbox(head,q,p)
590+ elseif pt == 'penalty' then
591+ insks_around_penalty(head,q,p)
592+ elseif pt == 'kern' then
593+ insks_around_kern(head,q,p)
594+ elseif pt == 'math' then
595+ insks_around_math(head,q,p)
596+ elseif pt == 'ins' or pt == 'mark'
597+ or pt == 'adjust'
598+ or pt == 'whatsit' then
599+ -- do nothing
600+ p=p
601+ else
602+ -- rule, disc, glue, margin_kern
603+ insert_skip=no_skip
604+ end
605+ q=p; p=next_node(p)
606+ end
607+ end
608+ return head
609+end
610+
587611 -- Shift baseline
588-function ltj.baselineshift(head)
612+local function baselineshift(head)
589613 local p=head
590614 local m=false -- is in math mode?
591615 while p do
592- local v=node.has_attribute(p,luatexbase.attributes['luatexja@yablshift'])
616+ local v=has_attr(p,attr_yablshift)
593617 if v then
594- if node.type(p.id)=='glyph' then
618+ local pt = node_type(p.id)
619+ if pt=='glyph' then
595620 p.yoffset=p.yoffset-v
596- elseif node.type(p.id)=='math' then
621+ elseif pt=='math' then
597622 m=(p.subtype==0)
598623 end
599624 if m then -- boxes and rules are shifted only in math mode
600- if node.type(p.id)=='hlist' or node.type(p.id)=='vlist' then
625+ if pt=='hlist' or pt=='vlist' then
601626 p.shift=p.shift+v
602- elseif node.type(p.id)=='rule' then
627+ elseif pt=='rule' then
603628 p.height=p.height-v; p.depth=p.depth+v
604629 end
605630 end
606631 end
607- p=node.next(p)
632+ p=next_node(p)
608633 end
609634 return head
610635 end
611636
612637
638+--====== Adjust the width of Japanese glyphs
639+
640+-- TeX's \hss
641+local function get_hss()
642+ local hss = node_new(id_glue)
643+ local hss_spec = node_new(id_glue_spec)
644+ hss_spec.width = 0
645+ hss_spec.stretch = 65536
646+ hss_spec.stretch_order = 2
647+ hss_spec.shrink = 65536
648+ hss_spec.shrink_order = 2
649+ hss.spec = hss_spec
650+ return hss
651+end
652+
653+local function set_ja_width(head)
654+ local p = head
655+ local t,s,th, g, q,a
656+ while p do
657+ if is_japanese_glyph_node(p) then
658+ t=ltj.metrics[ltj.font_metric_table[p.font].jfm]
659+ s=t.char_type[has_attr(p,attr_jchar_class)]
660+ if not(s.left==0.0 and s.down==0.0
661+ and round(s.width*ltj.font_metric_table[p.font].size)==p.width) then
662+ -- must be encapsuled by a \hbox
663+ head, q = node.remove(head,p)
664+ p.next=nil
665+ p.yoffset=round(p.yoffset-ltj.font_metric_table[p.font].size*s.down)
666+ p.xoffset=round(p.xoffset-ltj.font_metric_table[p.font].size*s.left)
667+ node_insert_after(p,p,get_hss())
668+ g=node_hpack(p, round(ltj.font_metric_table[p.font].size*s.width)
669+ , 'exactly')
670+ g.height=round(ltj.font_metric_table[p.font].size*s.height)
671+ g.depth=round(ltj.font_metric_table[p.font].size*s.depth)
672+ head,p = node_insert_before(head,q,g)
673+ p=q
674+ else p=next_node(p)
675+ end
676+ else p=next_node(p)
677+ end
678+ end
679+ return head
680+end
681+
613682 -- main process
614-function ltj.main_process(head)
683+local function main_process(head)
615684 local p = head
616- p = ltj.insert_jfm_glue(p)
617- p = ltj.insert_kanji_skip(p)
618- p = ltj.baselineshift(p)
619- p = ltj.set_ja_width(p)
685+ p = insert_jfm_glue(p)
686+ p = insert_kanji_skip(p)
687+ p = baselineshift(p)
688+ p = set_ja_width(p)
620689 return p
621690 end
622691
623692 -- debug
624693 local depth=""
625694 function ltj.show_node_list(head)
626- local p =head; local k = depth; local s
695+ local p =head; local k = depth
627696 depth=depth .. '.'
628697 while p do
629- s=node.type(p.id)
630- if s == 'glyph' then
698+ local pt=node_type(p.id)
699+ if pt == 'glyph' then
631700 print(depth .. ' glyph', p.subtype, utf.char(p.char), p.font)
632- elseif s=='hlist' then
701+ elseif pt=='hlist' then
633702 print(depth .. ' hlist', p.subtype, '(' .. print_scaled(p.height)
634703 .. '+' .. print_scaled(p.depth)
635704 .. ')x' .. print_scaled(p.width) )
636705 ltj.show_node_list(p.head)
637706 depth=k
638- elseif s=='whatsit' then
707+ elseif pt == 'whatsit' then
639708 print(depth .. ' whatsit', p.subtype)
640- elseif s=='glue' then
709+ elseif pt == 'glue' then
641710 print(depth .. ' glue', p.subtype, print_spec(p.spec))
642711 else
643712 print(depth .. ' ' .. s, s.subtype)
644713 end
645- p=node.next(p)
714+ p=next_node(p)
646715 end
647716 end
648717
@@ -650,9 +719,12 @@ end
650719
651720 --- the following function is modified from jafontspec.lua (by K. Maeda).
652721 --- Instead of "%", we use U+FFFFF for suppressing spaces.
653-function ltj.process_input_buffer(buffer)
722+local function process_input_buffer(buffer)
723+ local c = utf.byte(buffer, utf.len(buffer))
724+ local p = node.new(id_glyph)
725+ p.char = c
654726 if utf.len(buffer) > 0
655- and ltj.is_ucs_in_japanese_char(utf.byte(buffer, utf.len(buffer))) then
727+ and ltj.is_ucs_in_japanese_char(p) then
656728 buffer = buffer .. string.char(0xF3,0xBF,0xBF,0xBF) -- U+FFFFF
657729 end
658730 return buffer
@@ -660,26 +732,27 @@ end
660732
661733
662734 ---------- Hyphenate
663-function ltj.suppress_hyphenate_ja(head)
664- local p=head
665- while p do
666- if node.type(p.id)=='glyph' and ltj.is_ucs_in_japanese_char(p.char) then
667- local v = node.has_attribute(p,luatexbase.attributes['luatexja@curjfnt'])
668- if v then
669- p.font=v
670- local l=ltj.find_char_type(p.char,ltj.font_metric_table[v].jfm)
671- if not l then l=0 end
672- node.set_attribute(p,luatexbase.attributes['luatexja@charclass'],l)
673- end
674- v=node.has_attribute(p,luatexbase.attributes['luatexja@ykblshift'])
675- if v then
676- node.set_attribute(p,luatexbase.attributes['luatexja@yablshift'],v)
677- else
678- node.unset_attribute(p,luatexbase.attributes['luatexja@yablshift'])
735+local function suppress_hyphenate_ja(head)
736+ local p
737+ for p in node.traverse(head) do
738+ if p.id == id_glyph then
739+ local pc=p.char
740+ if ltj.is_ucs_in_japanese_char(p) then
741+ local v = has_attr(p,attr_curjfnt)
742+ if v then
743+ p.font=v
744+ local l=ltj.find_char_type(pc,ltj.font_metric_table[v].jfm) or 0
745+ node.set_attribute(p,attr_jchar_class,l)
746+ end
747+ v=has_attr(p,luatexbase.attributes['luatexja@ykblshift'])
748+ if v then
749+ node.set_attribute(p,attr_yablshift,v)
750+ else
751+ node.unset_attribute(p,attr_yablshift)
752+ end
753+ p.lang=ltj.ja_lang_number
679754 end
680- p.lang=ltj.ja_lang_number
681755 end
682- p=node.next(p)
683756 end
684757 lang.hyphenate(head)
685758 return head -- 共通化のため値を返す
@@ -688,24 +761,24 @@ end
688761 -- callbacks
689762 luatexbase.add_to_callback('process_input_buffer',
690763 function (buffer)
691- return ltj.process_input_buffer(buffer)
764+ return process_input_buffer(buffer)
692765 end,'ltj.process_input_buffer')
693766
694767 luatexbase.add_to_callback('pre_linebreak_filter',
695768 function (head,groupcode)
696- return ltj.main_process(head)
769+ return main_process(head)
697770 end,'ltj.pre_linebreak_filter',2)
698771 luatexbase.add_to_callback('hpack_filter',
699772 function (head,groupcode,size,packtype)
700- return ltj.main_process(head)
773+ return main_process(head)
701774 end,'ltj.hpack_filter',2)
702775
703776 --insert before callbacks from luaotfload
704777 luatexbase.add_to_callback('hpack_filter',
705778 function (head,groupcode,size,packtype)
706- return ltj.suppress_hyphenate_ja(head)
779+ return suppress_hyphenate_ja(head)
707780 end,'ltj.hpack_filter_pre',0)
708781 luatexbase.add_to_callback('hyphenate',
709782 function (head,tail)
710- return ltj.suppress_hyphenate_ja(head)
783+ return suppress_hyphenate_ja(head)
711784 end,'ltj.hyphenate')
--- a/src/luatexja-core.sty
+++ b/src/luatexja-core.sty
@@ -24,6 +24,24 @@
2424 \newdimen\jQ \jQ=0.25mm
2525 \newdimen\jH \jH=0.25mm
2626
27+%%%%%%%% Attributes for Japanese typesetting.
28+\newluatexattribute\luatexja@curjfnt % index for ``current Japanese font''
29+\newluatexattribute\luatexja@charclass %
30+\newluatexattribute\luatexja@yablshift % attribute for \yabaselineshift
31+\newluatexattribute\luatexja@ykblshift % attribute for \ykbaselineshift
32+\newluatexattribute\luatexja@icflag % attribute for italic correction
33+\newlanguage\luatexja@japanese
34+\expandafter\newluatexattribute\csname luatexja@kcat0\endcsname
35+\expandafter\newluatexattribute\csname luatexja@kcat1\endcsname
36+\expandafter\newluatexattribute\csname luatexja@kcat2\endcsname
37+\expandafter\newluatexattribute\csname luatexja@kcat3\endcsname
38+\expandafter\newluatexattribute\csname luatexja@kcat4\endcsname
39+\csname luatexja@kcat0\endcsname='0
40+\csname luatexja@kcat1\endcsname='0
41+\csname luatexja@kcat2\endcsname=0
42+\csname luatexja@kcat3\endcsname=0
43+\csname luatexja@kcat4\endcsname=0
44+
2745 %%%%%%%% Loading lua files
2846 \directlua{%
2947 utf = unicode.utf8
@@ -40,16 +58,9 @@
4058 ltj.loadlua('luatexja-core.lua')
4159 ltj.loadlua('luatexja-jfont.lua')
4260 ltj.loadlua('luatexja-core-aux.lua')
61+ ltj.ja_lang_number=\the\luatexja@japanese
4362 }
4463
45-%%%%%%%% Attributes for Japanese typesetting.
46-\newluatexattribute\luatexja@curjfnt % index for ``current Japanese font''
47-\newluatexattribute\luatexja@charclass %
48-\newluatexattribute\luatexja@yablshift % attribute for \yabaselineshift
49-\newluatexattribute\luatexja@ykblshift % attribute for \ykbaselineshift
50-\newluatexattribute\luatexja@icflag % attribute for italic correction
51-\newlanguage\luatexja@japanese\directlua{ltj.ja_lang_number=\the\luatexja@japanese}
52-
5364 %%%%%%%% \asluastring
5465 \def\asluastring#1{'\luaescapestring{\detokenize{#1}}'}
5566
@@ -64,6 +75,27 @@
6475 %%%%%%%% \inhibitglue
6576 \def\inhibitglue{\directlua{ltj.create_ihb_node()}}
6677
78+%%%%%%%% \defcharrange<name>{100-200,3000-,5000,...}
79+\def\defcharrange#1#2{%
80+ \def\ltj@nametemp{#1}\expandafter\ltj@dcrange#2,,\relax
81+ \ltj@defcrkey{#1}\relax}
82+\def\ltj@dcrange#1,{\def\ltj@temp{#1}%
83+ \ifx\ltj@temp\empty\let\@next=\relax\else
84+ \ltj@@dcrange{#1}\let\@next=\ltj@dcrange\fi\@next}
85+\def\ltj@@dcrange#1{\ltj@enexist#1--\@nil}
86+\def\ltj@enexist#1-#2-#3\@nil{\def\ltj@temp{#3}%
87+ \ifx\ltj@temp\empty
88+ \luatexja@tempcnta=#1 \luatexja@tempcntb=\luatexja@tempcnta
89+ \else
90+ \def\ltj@temp{#1}%
91+ \ifx\ltj@temp\empty\luatexja@tempcnta='200 \else\luatexja@tempcnta=#1 \fi
92+ \def\ltj@temp{#2}%
93+ \ifx\ltj@temp\empty\luatexja@tempcntb="10FFFF \else\luatexja@tempcntb=#2 \fi%"
94+ \fi
95+ \directlua{ltj.def_jchar_range(\the\luatexja@tempcnta,\the\luatexja@tempcntb,
96+ '\ltj@nametemp')}%
97+ }
98+
6799 %%%%%%%% \setjaparameter
68100 \newcount\ltj@stack@pbp\newcount\ltj@group@level@pbp
69101 \ltj@group@level@pbp=0 \ltj@stack@pbp=0
@@ -147,16 +179,23 @@
147179 \directlua{ltj.print_global()}\jcharwidowpenalty=#1 }
148180
149181 % differentjfm = { large | small | average | both }
150-\define@choicekey*+[ltj]{japaram}{differentjfm}[\ltj@temp\ltj@tempcnta]%
182+\define@choicekey*+[ltj]{japaram}{differentjfm}[\ltj@temp\ltj@result]%
151183 {large,small,average,both}{%
152- \ifcase\ltj@tempcnta
184+ \ifcase\ltj@result
153185 \directlua{ltj.calc_between_two_jchar_aux=ltj.calc_between_two_jchar_aux_large}\or
154186 \directlua{ltj.calc_between_two_jchar_aux=ltj.calc_between_two_jchar_aux_small}\or
155187 \directlua{ltj.calc_between_two_jchar_aux=ltj.calc_between_two_jchar_aux_average}\or
156188 \directlua{ltj.calc_between_two_jchar_aux=ltj.calc_between_two_jchar_aux_both}%
157189 \fi
158190 }{\@PackageWarning{luatexja}{ignored invalid argument '#1' for 'differentjfm'}}
159- % large, small, average(OK), both(OK)
191+ % large, small, average, both
192+
193+
194+% jcharrange = { <range_name> = { kanji | kana | letter | punct | noncjk} }
195+\def\ltj@defcrkey#1{\message{(#1)}\define@choicekey*+[ltj]{charrange}{#1}[\ltj@temp\ltj@result]%
196+ {kanji,kana,letter,punct,noncjk}{%
197+ \directlua{ltj.set_jchar_range(ltj.isglobal, '#1',\ltj@result)}}\relax}
198+\define@key[ltj]{japaram}{jcharrange}{\setkeys[ltj]{charrange}{#1}}
160199
161200 \def\setjaparameter#1{\directlua{ltj.isglobal=''}%
162201 \setkeys[ltj]{japaram}{#1}}
--- a/src/luatexja-jfont.lua
+++ b/src/luatexja-jfont.lua
@@ -1,3 +1,6 @@
1+local has_attr = node.has_attribute
2+local jfmfname
3+
14 --====== METRIC
25 jfm={}; jfm.char_type={}; jfm.glue={}; jfm.kern={}
36
@@ -26,35 +29,50 @@ end
2629 ltj.metrics={} -- this table stores all metric informations
2730 ltj.font_metric_table={}
2831
29-function ltj.search_metric(key)
32+local function search_metric(key)
3033 for i,v in ipairs(ltj.metrics) do
3134 if v.name==key then return i end
3235 end
3336 return nil
3437 end
3538
39+-- return nil iff ltj.metrics[ind] is a bad metric
40+local function consistency_check(ind)
41+ local t = ltj.metrics[ind]
42+ local r = ind
43+ if t.dir~='yoko' then -- TODO: tate?
44+ r=nil
45+ elseif type(t.zw)~='number' or type(t.zh)~='number' then
46+ r=nil -- .zw, .zh must be present
47+ else
48+ local lbt = ltj.find_char_type('lindend',ind)
49+ if lbt~=0 and t.char_type[lbt].chars~={'linebdd'} then
50+ r=nil -- 'linebdd' must be isolated char_type
51+ end
52+ end
53+ if not r then ltj.metrics[ind] = nil end
54+ return r
55+end
56+
3657 function ltj.load_jfont_metric()
37- if ltj.jfmfname=='' then
38- ltj.error('no JFM specified',
39- {[1]='To load and define a Japanese font, the name of JFM must be specified.',
40- [2]="The JFM 'ujis' will be used for now."})
41- ltj.jfmfname='ujis'
42- end
43- jfm.name=ltj.jfmfname .. ':' .. ltj.jfmvar;
44- local i = ltj.search_metric(jfm.name)
45- local t = {}
46- if i then return i end
47- jfm.char_type={}; jfm.glue={}; jfm.kern={}
48- ltj.loadlua('jfm-' .. ltj.jfmfname .. '.lua');
49- if jfm.dir~='yoko' then
50- ltj.error("jfm.dir must be 'yoko'", {}); return nil
58+ if jfmfname=='' then
59+ ltj.error('no JFM specified',
60+ {[1]='To load and define a Japanese font, the name of JFM must be specified.',
61+ [2]="The JFM 'ujis' will be used for now."})
62+ jfmfname='ujis'
5163 end
64+ jfm.name=jfmfname .. ':' .. ltj.jfmvar
65+ local i = search_metric(jfm.name)
66+ local t = {}
67+ if i then return i end
68+ jfm.char_type={}; jfm.glue={}; jfm.kern={}
69+ ltj.loadlua('jfm-' .. jfmfname .. '.lua')
5270 t.name=jfm.name
5371 t.dir=jfm.dir; t.zw=jfm.zw; t.zh=jfm.zh
5472 t.char_type=jfm.char_type
5573 t.glue=jfm.glue; t.kern=jfm.kern
5674 table.insert(ltj.metrics,t)
57- return #ltj.metrics
75+ return consistency_check(#ltj.metrics)
5876 end
5977
6078 function ltj.find_char_type(c,m)
@@ -84,6 +102,12 @@ function ltj.jfontdefY() -- for horizontal font
84102 local j=ltj.load_jfont_metric()
85103 local fn=font.id(ltj.cstemp)
86104 local f = font.fonts[fn]
105+ if not j then
106+ ltj.error("bad JFM '" .. jfmfname .. "'",
107+ {[1]='The JFM file you specified is not valid JFM file.',
108+ [2]='Defining Japanese font is cancelled.'})
109+ return
110+ end
87111 ltj.font_metric_table[fn]={}
88112 ltj.font_metric_table[fn].jfm=j; ltj.font_metric_table[fn].size=f.size
89113 tex.sprint(ltj.is_global .. '\\protected\\expandafter\\def\\csname '
@@ -101,11 +125,11 @@ function fonts.define.read(name, size, id)
101125 return fontdata
102126 end
103127
104--- extract ltj.jfmfname and ltj.jfmvar
128+-- extract jfmfname and ltj.jfmvar
105129 function ltj.extract_metric(name)
106130 local basename=name
107131 local tmp = utf.sub(basename, 1, 5)
108- ltj.jfmfname = ''
132+ jfmfname = ''
109133 ltj.jfmvar = ''
110134 if tmp == 'file:' or tmp == 'name:' or tmp == 'psft:' then
111135 basename = utf.sub(basename, 6)
@@ -121,7 +145,7 @@ function ltj.extract_metric(name)
121145 while p do
122146 local q= utf.find(basename, ";",p+1) or utf.len(basename)+1
123147 if utf.sub(basename,p,p+3)=='jfm=' and q>p+4 then
124- ltj.jfmfname = utf.sub(basename,p+4,q-1)
148+ jfmfname = utf.sub(basename,p+4,q-1)
125149 elseif utf.sub(basename,p,p+6)=='jfmvar=' and q>p+6 then
126150 ltj.jfmvar = utf.sub(basename,p+7,q-1)
127151 end
@@ -131,46 +155,108 @@ function ltj.extract_metric(name)
131155 end
132156
133157
134---====== Adjust the width of Japanese glyphs
158+--====== Range of Japanese characters.
159+local threshold = 0x100 -- must be >=0x100
160+-- below threshold: kcat_table_main[chr_code] = index
161+-- above threshold: kcat_table_range =
162+-- { [1] = {b_1, b_2, ...},
163+-- [2] = {i_1, i_2, ...} }
164+-- ( Characters b_i<=chr_code <b_{i+1} have the index i_i )
165+-- kcat_table_index = index1, index2, ...
166+
167+-- init
168+local ucs_out = 0x110000
169+local kcat_table_main = {}
170+kcat_table_range = { [1] = {threshold,ucs_out}, [2] = {0,-1} }
171+kcat_table_index = { [0] = 'other' ,
172+ [1] = 'iso8859-1'}
135173
136--- TeX's \hss
137-function ltj.get_hss()
138- local hss = node.new(node.id("glue"))
139- local hss_spec = node.new(node.id("glue_spec"))
140- hss_spec.width = 0
141- hss_spec.stretch = 65536
142- hss_spec.stretch_order = 2
143- hss_spec.shrink = 65536
144- hss_spec.shrink_order = 2
145- hss.spec = hss_spec
146- return hss
174+local kc_kanji = 0
175+local kc_kana = 1
176+local kc_letter = 2
177+local kc_punct = 3
178+local kc_noncjk = 4
179+
180+for i=0x80,0xFF do
181+ kcat_table_main[i]=1
182+end
183+for i=0x100,threshold-1 do
184+ kcat_table_main[i]=0
147185 end
148186
149-function ltj.set_ja_width(head)
150- local p = head
151- local t,s,th, g, q,a
152- while p do
153- if ltj.is_japanese_glyph_node(p) then
154- t=ltj.metrics[ltj.font_metric_table[p.font].jfm]
155- s=t.char_type[node.has_attribute(p,luatexbase.attributes['luatexja@charclass'])]
156- if not(s.left==0.0 and s.down==0.0
157- and tex.round(s.width*ltj.font_metric_table[p.font].size)==p.width) then
158- -- must be encapsuled by a \hbox
159- head, q = node.remove(head,p)
160- p.next=nil
161- p.yoffset=tex.round(p.yoffset-ltj.font_metric_table[p.font].size*s.down)
162- p.xoffset=tex.round(p.xoffset-ltj.font_metric_table[p.font].size*s.left)
163- node.insert_after(p,p,ltj.get_hss())
164- g=node.hpack(p, tex.round(ltj.font_metric_table[p.font].size*s.width)
165- , 'exactly')
166- g.height=tex.round(ltj.font_metric_table[p.font].size*s.height)
167- g.depth=tex.round(ltj.font_metric_table[p.font].size*s.depth)
168- head,p = node.insert_before(head,q,g)
169- p=q
170- else p=node.next(p)
187+local function add_jchar_range(b,e,ind)
188+ -- We assume that e>=b
189+ if b<threshold then
190+ for i=math.max(0x80,b),math.min(threshold-1,e) do
191+ kcat_table_main[i]=ind
192+ end
193+ if e<threshold then return true else b=threshold end
194+ end
195+ local insp
196+ for i,v in ipairs(kcat_table_range[1]) do
197+ if v>e then
198+ insp = i-1; break
199+ end
200+ end
201+ if kcat_table_range[1][insp]>b or kcat_table_range[2][insp]>1 then
202+ ltj.error("Bad character range",{}); return nil -- error
203+ end
204+ if kcat_table_range[1][insp]<b then
205+ -- now [insp]← <b .. b .. [insp+1]← >e
206+ table.insert(kcat_table_range[1],insp+1,b)
207+ table.insert(kcat_table_range[2], insp+1, kcat_table_range[2][insp])
208+ insp=insp+1
209+ end
210+ -- [insp]← =b .. e .. [insp+1]← >e
211+ table.insert(kcat_table_range[1], insp+1,e+1)
212+ table.insert(kcat_table_range[2], insp+1, kcat_table_range[2][insp])
213+ kcat_table_range[2][insp]=ind
214+end
215+
216+function ltj.def_jchar_range(b,e,name)
217+ local ind = #kcat_table_index+1
218+ for i,v in pairs(kcat_table_index) do
219+ if v==name then ind=i; break end
220+ end
221+ if ind>=50 then
222+ ltj.error("No room for new character range",{}); return -- error
223+ end
224+ if ind == #kcat_table_index+1 then
225+ table.insert(kcat_table_index, name)
226+ print('New char range: ' .. name, ind)
227+ end
228+ add_jchar_range(b,e,ind)
229+end
230+
231+local function get_char_kcatcode(p)
232+ local i
233+ local c = p.char
234+ if c<0x80 then return kc_noncjk
235+ elseif c<threshold then i=kcat_table_main[c]
236+ else
237+ for j,v in ipairs(kcat_table_range[1]) do
238+ if v>c then
239+ i = kcat_table_range[2][j-1]; break
171240 end
172- else p=node.next(p)
173241 end
174242 end
175- return head
243+ return math.floor(has_attr(p,
244+ luatexbase.attributes['luatexja@kcat'..math.floor(i/10)])
245+ /math.pow(8, i%10))%8
246+end
247+
248+-- 和文文字と認識する unicode の範囲
249+function ltj.is_ucs_in_japanese_char(p)
250+ return (get_char_kcatcode(p)~=kc_noncjk)
176251 end
252+
253+function ltj.set_jchar_range(g, name,kc)
254+ local ind = 0
255+ for i,v in pairs(kcat_table_index) do
256+ if v==name then ind=i; break end
257+ end
258+ local attr = luatexbase.attributes['luatexja@kcat'..math.floor(ind/10)]
259+ local a = tex.getattribute(attr)
260+ local k = math.pow(8, ind%10)
261+ tex.setattribute(g,attr,(math.floor(a/k/8)*8+kc)*k+a%k)
262+end
\ No newline at end of file
--- a/src/luatexja-plain.tex
+++ b/src/luatexja-plain.tex
@@ -10,6 +10,8 @@
1010 \let\mc=\tenmin
1111 \let\gt=\tengt
1212 \mc
13+\catcode`\@=11\ltj@defcrkey{other} \ltj@defcrkey{iso8859-1}\catcode`\@=12
14+\setjaparameter{jcharrange={iso8859-1=noncjk}}
1315 \setjaparameter{kanjiskip=0pt plus 0.4pt minus 0.4pt,
1416 xkanjiskip=.25\zw plus 1pt minus 1pt,
1517 autospacing, autoxspacing,
--- a/src/luatexja-rmlgbm.lua
+++ b/src/luatexja-rmlgbm.lua
@@ -1,5 +1,6 @@
1-function ltj.mk_rml(name, size, id)
2- ltj.rmlgbm_data = ltj.rmlgbm_data or require('luatexja-rmlgbm-data')
1+local rmlgbm_data = require('luatexja-rmlgbm-data')
2+
3+local function mk_rml(name, size, id)
34
45 local specification = fonts.define.analyze(name,size)
56 specification = fonts.define.specify[':'](specification)
@@ -7,7 +8,7 @@ function ltj.mk_rml(name, size, id)
78
89 local fontdata = {}
910 local cachedata = {}
10- for k, v in pairs(ltj.rmlgbm_data) do
11+ for k, v in pairs(rmlgbm_data) do
1112 fontdata[k] = v
1213 cachedata[k] = v
1314 end
@@ -16,7 +17,7 @@ function ltj.mk_rml(name, size, id)
1617 fontdata.shared = nil
1718 cachedata.shared = {}
1819 local shared = cachedata.shared
19- for k, v in pairs(ltj.rmlgbm_data.shared) do
20+ for k, v in pairs(rmlgbm_data.shared) do
2021 shared[k] = v
2122 end
2223
@@ -25,10 +26,10 @@ function ltj.mk_rml(name, size, id)
2526
2627 -- characters & scaling
2728 local characters = {}
28- local orig_chars = ltj.rmlgbm_data.characters
29+ local orig_chars = rmlgbm_data.characters
2930 if size < 0 then size = -size * 655.36 end
3031 local scale = size / 655360
31- local size_cache = {}
32+ -- local size_cache = {}
3233 for k, v in pairs(orig_chars) do
3334 characters[k] = {}
3435 characters[k].index = v.index
@@ -39,7 +40,7 @@ function ltj.mk_rml(name, size, id)
3940 cachedata.characters = characters
4041
4142 local parameters = {}
42- for k, v in pairs(ltj.rmlgbm_data.parameters) do
43+ for k, v in pairs(rmlgbm_data.parameters) do
4344 parameters[k] = v * scale
4445 end
4546 fontdata.parameters = parameters
@@ -78,9 +79,8 @@ end
7879 local dr_orig = fonts.define.read
7980 function fonts.define.read(name, size, id)
8081 local p = utf.find(name, ":") or utf.len(name)+1
81- local tmp = utf.sub(name, 1, p-1)
82- if tmp == 'psft' then
83- return ltj.mk_rml(utf.sub(name,p+1), size, id)
82+ if utf.sub(name, 1, p-1) == 'psft' then
83+ return mk_rml(utf.sub(name,p+1), size, id)
8484 else
8585 return dr_orig(name, size, id)
8686 end
Binary files a/test/test01.pdf and b/test/test01.pdf differ
Binary files a/test/test04-jfm.pdf and b/test/test04-jfm.pdf differ
--- a/test/test04-jfm.tex
+++ b/test/test04-jfm.tex
@@ -10,5 +10,7 @@
1010 \jfont\rml={file:KozMinPr6N-Regular.otf:jfm=ujis} at 10pt
1111 \rml あ\inhibitglue\char"201Cあ←KozMinPr6N-Regular
1212
13-あ\discretionary{.\inhibitglue\kern-1\zw}{}{.}あ
13+\scrollmode
14+\jfont\rml={psft:GothicBBB-Medium:jfm=bad} at 10pt
15+\rml あ
1416 \end
旧リポジトリブラウザで表示