2013年9月23日月曜日

Delphi for Lex(6)

メモです。
集合型の演算でマッチングの文字列を計算していることがわかり、Unicodeの多彩な文字をどうやって吸収するか検討しています。アイディアとしては、
  • パターンを保持する集合型を文字列に変える
  • パターンを保持する集合型を正規表現に変える
  • 今のCClassを拡張して日本語の文字を識別する部分を作る
Unicodeの文字を判定する、IsControlやIsNumberを試してみたが、"1"も"1"同じ数値として判定されてしまう。if ByteType(S, i) <> mbSingleByte という条件判定で使うが、SをAnsiStringに型変換する必要がある。

0 件のコメント :

コメントを投稿