2009年8月1日土曜日

ボトルネック解析 データ量の可視化

新しくボトルネック解析の手法をSAS Log Utilityに組み込むことを検討しています。
効率の悪いロジックは、大量のデータを転がして、雪だるまのように大きくします。結果に含めない無駄な変数、OBSは早い段階で削除しておく方が効率が良いです。

SASログには、OBS数、変数の数、データセットのページ数が含まれています。これを直感的に分かりやすく表示して、無駄にデータを読んでいるところを見つけられる仕掛けを考えています。処理の最後で、ガクッとデータ数、変数が減っているところに、性能改善の可能性があるはずです。

直感的にデータの量が分かる。例えば、色、線の太さ、図形の大きさとか。思案中です。

バグ修正 入力ファイルがシングルクォーツで囲まれているとき

SAS 8.2のログを検証していて、バグを見つけました。
入力ファイル名がシングルクォートで囲まれているときに、ファイル名が取れずに空白になっていました。

SAS8.2 -> NOTE: 100 レコードを入力ファイル 'c:\temp\foo.txt' から読み込みました。
SAS9.1.3 ->NOTE: 100 レコードを入力ファイル "c:\temp\foo.txt" から読み込みました。

次のリリースで直します。